發布2026年3月31日 00:10·文｜商傳媒

Gartner預測：AI模型Token單價趨零企業營運成本恐不減反增 — 圖／本報資料庫

商傳媒｜何映辰／台北報導

根據國際研究暨顧問機構Gartner今日發布的最新報告預測，到2030年，人工智慧（AI）模型的關鍵運算單位「Token」單價將趨近於「零」。儘管單價大幅下降，但隨著AI技術的快速演進與應用普及，企業的整體AI推論成本（inference cost）反而可能不減反增。

Gartner指出，大型語言模型（LLM）的推論成本將在2030年之前降低逾90%，而模型效率則有望提升高達100倍。以具備1兆參數的LLM為例，其推論成本相較於2025年將減少超過90%。報告將此效率提升歸因於半導體與基礎設施的改進、模型設計的創新，以及專為推論優化的半導體擴張。報告中，一個AI Token被定義為約3.5位元組（約四個字元）的數據量。

然而，Token單價的下降並非意味著企業AI營運負擔的減輕。Gartner資深總監分析師威爾·索默（Will Sommer）表示，企業採購長（CPO）不應將通用Token價格的下跌誤解為進階推理能力已普及。基礎AI功能正逐漸趨近零成本，但支援複雜推理所需的運算資源與系統依然稀缺。隨著AI技術發展，對Token的需求量將大幅飆升，抵銷單價下降所帶來的成本效益。

特別是AI代理程式（AI agents）等更先進的技術，每項任務所需消耗的Token量，比傳統簡易聊天機器人多出至少5倍至30倍。因此，即便Token單價降低，龐大的總使用量仍將導致企業的整體AI推論成本增加。

Gartner強調，未來的AI競爭力核心不在於單一模型的效能，而是「多模型協調策略」（multi-model orchestration）。這意味著企業需具備精密的營運能力，運用小型語言模型（sLLM）或特定領域模型處理重複且頻繁的任務，並將最尖端的模型僅用於高價值的複雜推理，這將是企業在未來AI發展階段能否生存的關鍵。

Gartner預測：AI模型Token單價趨零企業營運成本恐不減反增

最新新聞

南華大學企管系落實學用合一　5位學生通過TIMS行銷專業認證

百蓮好荷迎盛夏賞蓮趣　王明鉅邀全民暢遊桃園蓮花季

2026「超行星盃」全國桌球錦標賽　　一千多名選手熱鬧激戰

杏德護理之家攜手救國團　「佳節送暖」80位長者共享溫馨

「破獲社區竊案」　基二警查獲通緝犯再起獲毒品

追蹤我們