企業引入人工智能正跨越新的分水嶺。如今,市場的關注點已不再侷限於是否投資AI,而是轉向瞭如何為不同業務部署合適的半導體和基礎設施,以最大化成本效益。特別是隨著“代理型AI”任務的快速增加以及推理成本的上升,對於大企業而言,核心課題已不再是盲目選擇最高性能的設備,而是根據目標挑選合適的計算資源,即做出“選擇”。
在這一變化背景下,AMD與紅帽的合作再度受到關注。AMD全球企業技術銷售副總裁約翰·漢普頓在波士頓舉行的“紅帽峰會2026”現場指出,企業希望在混合環境整體中獲得更靈活的AI基礎設施。他提到,近期許多客戶為應對AI需求而倉促建設了大規模GPU集群,但在實際運營階段卻面臨著遠超預期的成本壓力。
AI推理成本急劇上升……企業重新審視大型GPU單一策略
據漢普頓介紹,許多企業為了不在初期AI競爭中落後,曾集中精力大量採購高性能GPU。問題在於,隨著服務規模擴大,每次AI查詢所產生的成本不斷累積,迅速加劇了預算壓力。業界將這種現象稱為“Token經濟學”,意指隨著生成式AI使用量的增加,令牌處理成本也隨之上升,直接影響到企業的盈利能力。
他表示:“企業最初為AI大量採購了大型GPU集群,但現在出現了難以承受的反應。雖然AI應用在增長,但成本的過快膨脹引發了巨大擔憂。”這最終意味著企業AI戰略的核心正在從“確保最高性能設備”轉向“針對任務進行優化部署”。
AMD與紅帽:提供從CPU到GPU的“全頻譜”解決方案
為應對這一趨勢,AMD推出了涵蓋CPU、高性價比GPU以及高性能加速器的“全頻譜”產品組合。其戰略是將這些硬件與紅帽基於開源軟件的堆棧相結合,支持企業在不依賴特定供應商的情況下,在混合雲環境中靈活地運營AI任務。
以AMD Instinct MI350P為例,它被介紹為一款基於PCIe接口的GPU,可相對容易地集成到現有服務器中。其特點是採用風冷設計以提高成本效益。紅帽AI則作為企業級平臺,在此類硬件上支持AI代理的部署與擴展。此外,利用AMD EPYC CPU和紅帽虛擬化工具,還能實現服務器整合,進而幫助減少數據中心的空間佔用和電力消耗。
核心在於“開放架構”……同時推進AI預算控制與基礎設施現代化
本次傳遞的核心信息是“開放性”與“選擇性”。AMD連同紅帽強調,相較於封閉生態系統,企業應通過開放架構,能夠針對不同的AI工作負載,從CPU、低功耗GPU和高性能加速器中挑選出最合適的資源。並非所有推理任務都需要部署在昂貴的設備上。
這種方法的益處不僅限於降低成本。對企業而言,可以在充分利用現有基礎設施的同時,不減緩AI引入的速度,並且能將節省下來的預算和電力資源重新投入到新的AI項目中。這在實務上意義重大,使得AI基礎設施現代化與預算控制得以同時實現。
漢普頓預測,未來的AI市場評價標準很可能不再是“買了什麼”,而是“如何部署”。隨著企業的AI競爭正式進入運營階段,有分析認為,未來的勝負關鍵將不在於性能展示,而在於能否精巧地平衡總擁有成本與實際成效。
TP AI 注意事項本文基於TokenPost.ai的語言模型對文章進行了摘要。正文的主要信息可能被遺漏或與事實存在出入。




