token帳單失控 AI商業化遭重擊

今年前6月尖端模型的token定價累計上漲40% 其背後是硬體受限、能源成本及需求成長的共同作用

更新： 2026年06月29日

AI的商業化進程正經歷「壓力測試」，隨著使用成本提高，無限消耗token的模式宣告終結。示意圖。（Shutterstock）

文／記者程木蘭

2026年，曾經狂飆突進的人工智慧（AI）產業，正遭遇一記沉重的財務重拳。

隨著各大AI模型開發商不再大幅補貼調用「token」（詞元或語元，指AI理解人類語言的最小單位）的成本，一場由成本激增引發的連鎖反應，正從矽谷科技巨頭蔓延至華爾街的交易大廳，企業與投資人被迫面對高昂算力成本與實際投資報酬率之間的巨大鴻溝。

從微軟（Microsoft ）緊急叫停內部激勵專案，到優步（Uber）的數十億美元預算在短短幾月內灰飛煙滅，AI的商業化進程正經歷一場嚴峻的「壓力測試」，token消耗的野蠻成長時代正宣告終結。

這輪成本危機的直接導火線，是衡量AI 輸入與輸出的基本單位「token」的價格急劇攀升。

中文財經媒體「智通財經」6月10日報導，過去六個月裡，針對尖端模型的高品質推理服務token定價，累計已上漲約40%。這背後是高性能GPU（圖形處理器）持續受限、數據中心能源消耗成本上漲15%至20%，及需求端爆炸式成長的共同作用。

以OpenAI為例，近期發布的GPT-5.5直接將token價格翻倍，達到每百萬輸入token收費5美元、輸出收費30美元；谷歌（Google）新推出的Gemini Flash 3.5模型價格也是前代的3至6倍。

儘管模型供應商在一年內將效率提升約2倍，但同期token的溢價幅度高達40%至50%，導致依賴外部API（應用程式介面，即呼叫模型的軟體）的企業淨成本實際暴增20%至30%。

科技巨頭的財務災難

不期而至的成本高峰率先沖垮了科技巨頭們的內部預算防線。據科技媒體The Verge報導，微軟在今年5月下旬做了一項罕見的決定：宣布將於6月30日終止其內部「體驗與設備」部門對Claude Code的集體許可。

該測試計畫於2025年12月高調推出，卻因token消耗量帶來的帳單完全超出預期而迅速崩盤，微軟不得不強制下令工程師改變習慣，使用自家成本更可控的模型GitHub Copilot CLI。

Uber的遭遇更是一場AI財政災難。其技術長納加（Praveen Neppalli Naga）近期坦承，公司在2026年為AI撥備的34億美元年度預算，竟在今年4月便已全部耗盡。

在向公司5千名工程師推出Claude Code後，月度活躍使用率飆升至85%至95%，每名工程師的月均API調用成本高達500至2,000美元。

警訊：運算成本遠超人力成本

華爾街對此迅速拉響警報。富國銀行首席股票策略師權五星（Ohsung Kwon）指出，這顆地雷的核心正終結矽谷工程師興起的「token消耗最大化」（tokenmaxxing）風潮。

此前許多企業將AI工具的使用量納入內部考核體系，甚至建立排行榜，鼓勵員工多使用AI token，以此作為衡量創新能力的指標。然而，這種盲目追求使用率的策略已演變為嚴重的資源浪費。

權五星警告，如果AI需求開始趨於平穩，對AI交易而言將是重大的利空；基於此判斷，富國銀行已將其整體立場從今年4月的「看多」轉向「堅定中性」。

輝達（Nvidia）執行長黃仁勳曾表示，如果高薪工程師幾乎不用AI token，代表生產力出問題；如果用量低得離譜，他會很不滿，甚至非常生氣。

不過輝達應用深度學習副總裁卡坦察羅（Bryan Catanzaro）在接受採訪時也承認了行業的普遍焦慮：「在我帶領的團隊中，運算成本已經遠遠超過了人員成本。」

「吃到飽」退場：企業急拉手煞車

如果說2026年初的冬天，各公司還在大啖「AI吃到飽」，那麼夏天就是開始計算卡路里的時候。

美國《商業內幕》（Business Insider）報導，今年3月至6月，OpenAI、Anthropic和GitHub各自調整了定價模式，相繼從固定費率轉向依據token使用量向客戶收費。

「廉價的『AI吃到飽』時代已經結束，」國際會計師事務所德勤（Deloitte）的一位資深軟體工程師表示，GitHub定價模式的變更讓工作預期大亂。他估計，在以量計費的制度下，一個可能讓模型工作數小時的高度詳細提示，單次費用將超過100美元。

GitHub產品長羅德里格斯（Mario Rodriguez）解釋，在舊模式下，一個閒聊問題與長達數小時的自主程式碼工作費用相同，這種補貼「已不可持續」。

面對計費規則大幅改變，企業界迅速改變方向。美國零售商沃爾瑪（Walmart）就對內部程式設計工具設定了使用上限；亞馬遜（Amazon）在5月關閉了內部的「tokenmaxxing」排行榜，因為他們發現員工為了不必要的操作人為提高得分，導致算力成本無謂上升。

部分企業甚至被迫設定嚴格的配額制度。加密貨幣交易所Coinbase高層主管指出，自今年2月Claude Opus 4.6推出後，內部使用量呈拋物線式暴增。如今，交易所建立了一套精密的每週費用上限系統，依據員工職級設定從500美元到5,000美元不等的上限。

他舉了一個極端的例子：若用最先進的模型掃描公司所有程式碼找漏洞，每次可能要花5萬到10萬美元，「如果有100人各自這麼做，你就要花上1千萬美元」。

科技界的這股焦慮被Priceline IT財務資深總監里德（Chris Reed）形容為一場「快克古柯鹼（crack-cocaine）的成癮疫情」。他直言：「他們讓你先試，讓你上癮，然後你就被綁住了。」

企業的實際操作發現，token使用量暴增，不等於效率的高速提升，這引發華爾街警覺。示意圖。（CHARLY TRIBALLEAU / AFP via Getty Images）

檢驗投資報酬率：燒錢但無效

企業大規模投入AI，為何換不來預期中的產出？中國《第一財經》的深度調查揭開了企業爭相擁抱AI的另一面。

一位科技大廠員工王昊（化名）吐槽：「一個部門二十來人，一個月消耗5萬元token，什麼也沒搞出來。」這5萬元化作無形的消耗，卻因團隊各自選用不同工具，如開源Hermes Agent或第三方工具，形成了一個個無法串聯的「AI孤島」，最終只能推倒重來。

這裡指的是一個軟體專案被分拆成多個步驟或分工，負責不同步驟的工程師選用的工具、框架、格式完全不同，以致於無法整合成一個系統。

工程營運平台Faros AI執行長高爾登（Vitaly Gordon）分享了一個極端案例：一位技術長發現手下一名工程師在一個月內燒掉了4萬美元的token，卻不知該制止還是該鼓勵。

工程管理平台Jellyfish的研究數據進一步量化了這種矛盾：受自主代理功能（Agent）的驅動，每位開發者的token消耗量在9個月內上升了約18.6倍；使用最多token的工程師生產力大約是低度使用者的兩倍，但他們為此消耗的token數量卻是後者的10倍。

在自主模式下，AI工具能「自主讀取、規劃、撰寫及測試」，因此消耗的token遠大於一問一答的傳統模式。

諮詢機構貝恩（Bain）6月發布的報告揭示了殘酷的商業現實：在能夠量化AI降低成本效果的企業中，高達40%的企業實際成本降幅在10%及以下；原本有37%的企業將降低成本目標設定在11%至20%區間，但最終達標的僅有31%。

艾媒諮詢執行長張毅分析，許多企業陷入了基於「錯失恐懼」的豪賭，只計算了顯性的API調用費，卻完全忽視了提示詞工程、輸出校驗、數據治理（Data Governance）等龐大的隱性工程成本。

精緻化管理與「平行替代」

當「魔法思維的時代結束」，務實的功利主義開始主導2026年的夏天，企業高階主管已開始將token浪費視為財務上的不負責任。

一場針對AI成本的重新審視，正在企業內部悄然展開。

《第一財經》獲悉，騰訊近期已調整了員工的token分配機制，不再「吃大鍋飯」，而是由部門管理者按職務職能動態分配。騰訊內部表態，衡量AI成效看的是效率提升與價值，絕不單純看token消耗量。

Salesforce技術長哈里斯（Parker Harris）也指出，由於2026財年的token支出「遠超」計畫，公司正推出名為「有效產出分數」（Effective Output score）的指標，以預測回報並控制支出。

與此同時，尋求更便宜的「平行替代模型」成為新趨勢。Coinbase在內的企業已開始將基礎工作轉移給中國的輕量級模型。程式碼代理新創公司Command Code透露，因市場對廉價模型的需求激增，其公司在30天內新增了1萬名客戶。

軟體新創Harness的資深副總裁史都爾特（Trevor Stuart）將這種轉變比喻得十分貼切：「若使用頂尖AI模型來做基本的文字摘要工作，就像是開法拉利（Ferrari）去買菜。」

為了在宏觀層面建立標準，一個全新的市場與規範組織應運而生。Linux基金會宣布，今年7月將正式成立「token經濟（tokenomics）」基金會，獲得IBM、甲骨文和摩根大通等巨頭支持。

FinOps基金會執行董事史托蒙特（J.R. Storment）指出，追蹤雲端成本是每月數億行的數據，而追蹤token成本則是「每月數兆行數據的問題」。該基金會旨在建立「每單位智慧成本」與「每瓦token數」等新指標，將粗放的AI支出納入如同雲端運算般的財務紀律中。

算力硬體與AI代理的賽跑

面對成本烈火，行業的目光自然投向了下一代硬體。然而，「智通財經」指出，儘管輝達收購了晶片新創公司Groq，且AMD、英特爾等均在重新設計AI加速器，以降低單次token成本，但絕大多數硬體要到今年下半年才會發布，大規模部署緩解供需至少要等到2027年初至中期，遠水難救近火。

面對人工智慧的成本烈火，行業的目光自然投向下一代硬體。圖為輝達產品，示意圖。（Alex Wong/Getty Images）

即使硬體成本最終下降，AI代理的爆發式成長仍可能抵消這些紅利。黃仁勳曾描繪過「每位員工身旁有100個AI代理協同工作」的宏大願景。高盛（Goldman Sachs）更預測，到2030年，全球token使用量將暴增24倍，達到每月120千兆（quadrillion）個。

然而，研究機構顧能（Gartner）總監分析師薩默斯（Will Sommer）警告，雖然到2030年大型語言模型的推論成本將比2025年便宜近90%，但「產品長們不應將商品token的通貨緊縮，與尖端推理的普及化混為一談。」因為代理式模型完成任務所需的token量遠大於標準模型，消耗量的增速極可能超過單位成本的降速。

2026年的這場token成本危機是AI泡沫化，還是其商業模式走向成熟的必經陣痛？

一位AI公司高層主管說，當成本攀升的速度壓倒了一切效率提升，擺在產業面前的問題已不再是AI能否改變世界，而是企業如何在技術狂熱與商業現實之間找到平衡。

這場「去偽存真」的壓力測試，將決定誰能真正在未來的AI浪潮中生存並獲利。◇

大紀元時報 - 台灣(The Epoch Times - Taiwan)