
商傳媒|林昭衡/綜合外電報導
研究顧問機構 Gartner 今日(30日)發布警告指出,儘管人工智慧(AI)推論(inference)代幣的單位價格預計將大幅下滑,但由於 AI 應用模式的改變,企業在 AI 方面的總體支出負擔恐將持續存在,甚至不減反增。
Gartner 預計,到 2030 年,一個具有一兆參數的大型語言模型(LLM)的推論費用,相較於 2025 年將下降超過 90%。同時,相同規模模型的效率預計可提高達百倍。Gartner 高級總監分析師 Will Sommer 表示,這項成本效益的提升主要歸因於半導體與基礎設施效率的改進、模型設計的創新、晶片利用率的提高,以及推論專用半導體的擴展和邊緣裝置的廣泛應用。
然而,Gartner 強調,單一 AI 代幣單位價格的下跌,並不直接等同於企業 AI 總成本的降低。主要原因是 AI 代理(agent)的普及正在重塑整體支出結構。目前,每項任務的 AI 代幣使用量已比過去增加 5 到 30 倍。這意味著,儘管單位成本下降,但總體使用量的激增可能導致企業的推論費用總額反而上升。
分析師 Sommer 進一步指出,基本的 AI 功能正朝向幾乎零成本的方向發展,但用於進階推論(advanced reasoning)的運算資源和系統仍然有限。他警示企業不應將架構上的效率不足,誤解為通用代幣價格下跌就代表進階推論能力普及。若企業僅依賴便宜的代幣成本來掩蓋系統架構的缺陷,未來在代理導向的 AI 擴展階段恐將面臨發展限制。
Gartner 建議,未來的 AI 競爭力將取決於「多模型協作」(multi-model orchestration)策略,而非單一模型。企業應採行一種分層架構,將重複性且簡單的任務分配給小型或特定領域模型處理,而高成本、高效能的模型則應選擇性地僅用於複雜且高附加價值的工作,以同時實現成本效益與性能表現。


