1300000000000000!
1.3千萬億,一個(gè)令人咂舌的數(shù)字。這就是谷歌每月處理的Tokens用量。
據(jù)谷歌“宣傳委員”Logan Kilpatrick透露,這一數(shù)據(jù)來自谷歌對(duì)旗下各平臺(tái)的內(nèi)部統(tǒng)計(jì)。
![]()
假如參考DeepSeek API文檔中給出的標(biāo)準(zhǔn):
- 1 個(gè)英文字符 ≈ 0.3 個(gè) Token
- 1 個(gè)中文字符 ≈ 0.6 個(gè) Token
那么在中文世界里,1.3千萬億Tokens約2.17千萬億漢字。換算成對(duì)話量,一本《紅樓夢(mèng)》的字?jǐn)?shù)在70-80萬左右,相當(dāng)于一個(gè)月內(nèi)所有人和谷歌AI聊了近30億本《紅樓夢(mèng)》的內(nèi)容。
![]()
更可怕的是,假如按照谷歌最近幾個(gè)月的增速來看,這個(gè)數(shù)字再往下恐怕……
- 5月份,月均處理480萬億個(gè);
- 7月份,月均處理980萬億個(gè);
- 10月份,月均處理1.3千萬億個(gè)。
而且需要注意的是,不止谷歌看重“Tokens消耗量”這一指標(biāo),OpenAI最近也首次公布了30家Tokens消耗破萬億的“大金主”。
![]()
所以,為什么這個(gè)指標(biāo)重要?它背后又意味著什么?
咱們接著看——
今年已連續(xù)暴漲,扛起千萬億大旗
以谷歌為例,它在這個(gè)指標(biāo)上取得的最新成績無疑是谷歌AI實(shí)力的具象化體現(xiàn)。
根據(jù)谷歌CEO皮猜在今年I/O大會(huì)上公布的一張圖,一年前谷歌月均處理的Tokens數(shù)量才9.7萬億,如今卻已突破千萬億級(jí)大關(guān)。
![]()
并且,從大會(huì)結(jié)束到現(xiàn)在,根據(jù)Logan Kilpatrick(真實(shí)身份為谷歌AI Studio負(fù)責(zé)人)提供的內(nèi)部數(shù)據(jù),谷歌每月處理的Tokens用量還在連續(xù)暴漲,且暫未看到任何放緩跡象。
![]()
單看谷歌可能沒感覺,那橫向?qū)Ρ葋砜纯茨兀?/p>
根據(jù)艾倫AI研究所研究員Nathan Lambert撰寫的一篇博客,目前國內(nèi)外主要大廠的Tokens用量如下:
先說微軟。根據(jù)微軟今年公布的三季度財(cái)報(bào),CEO納德拉曾表示:
- 本季度我們處理了超過100萬億個(gè)Tokens,同比增長5倍,其中僅上個(gè)月就創(chuàng)下了50萬億個(gè)Tokens的記錄。
據(jù)此分析,微軟的Tokens處理能力還遠(yuǎn)夠不上千萬億級(jí)別。而且你別忘了,微軟早期就與OpenAI有過合作(負(fù)責(zé)托管OpenAI模型),起步比谷歌更早。
而現(xiàn)在,谷歌卻在這一指標(biāo)上將微軟甩在了身后。
此外,像OpenAI、國內(nèi)的字節(jié)跳動(dòng)、百度等公司,文章指出目前這些公司均達(dá)到了日均萬億Tokens的處理量級(jí)。
不過這里要插一句,在剛剛過去的開發(fā)者日上,OpenAI公布其API調(diào)用量為每分鐘60億Tokens,這串?dāng)?shù)字換算成月度總量是260萬億Tokens。
當(dāng)然這還只是API的部分,如果加上Tokens消耗量更大的ChatGPT訂閱業(yè)務(wù),這一數(shù)字還會(huì)更大,但具體是多少目前則缺少官方數(shù)據(jù)。
整體而言,僅按公開可查的確切數(shù)據(jù)來看,谷歌在“千萬億”這一級(jí)確實(shí)是獨(dú)一檔的存在。
![]()
當(dāng)然,Tokens用量還只是谷歌AI實(shí)力的冰山一隅。
幾乎同一時(shí)間,谷歌云還公布了一組最新數(shù)據(jù),里面除了提到1.3千萬億這個(gè)數(shù)字,還表示:
- 超過1300萬開發(fā)者使用谷歌模型進(jìn)行開發(fā);
- Gemini模型目前已生成2.3億個(gè)視頻和130億張圖像;
- 使用谷歌AI概覽的用戶達(dá)到20億;
- 65%的客戶已經(jīng)在使用谷歌的AI產(chǎn)品。
![]()
Anyway,即使拋開數(shù)據(jù)不談,想必大家也對(duì)谷歌AI今年的崛起之勢(shì)感受頗為明顯。
別的不說,傳說中的Gemini 3應(yīng)該快了(坊間傳聞原計(jì)劃于10月9日上線,截至發(fā)稿前未正式官宣)。
![]()
Tokens消耗量已成新的競爭指標(biāo)
說完谷歌,最后回到“Tokens消耗量”這個(gè)指標(biāo)本身。
為什么要看Tokens消耗量?
實(shí)際上,Token作為單位能衡量的東西很多,包括預(yù)訓(xùn)練語料規(guī)模、上下文長度、推理長度……甚至是商業(yè)價(jià)值。
模型預(yù)訓(xùn)練用了多少Token語料,代表了它的基礎(chǔ)知識(shí)儲(chǔ)備含量。
模型能夠理解多少Token的輸入和輸出,反映了它的理解能力。
此外,Token還是大模型推理算力的計(jì)量單位。比如底層芯片廠商如今都會(huì)通過“每秒生成Token的數(shù)量”來證明自家產(chǎn)品的硬件能力。甚至如果有的模型參數(shù)未公開,也能通過它的Token生成速度來倒推模型規(guī)模(在相同硬件上即可推算)。
當(dāng)然更重要的是,Token也成為大模型API的定價(jià)單位。一旦使用平臺(tái)的Token數(shù)量越多,廠商能夠獲得的商業(yè)價(jià)值以及行業(yè)影響力自然也越多。
值得一提的是,今年年初,行業(yè)圍繞Tokens消耗量還誕生了一條新的價(jià)值紅線——不看融資估值獨(dú)角獸,看10億Tokens日均消耗。
作為“入門級(jí)”檢驗(yàn)標(biāo)準(zhǔn),10億Tokens日均消耗背后意味著:
第一,它代表大模型應(yīng)用落地新趨勢(shì),企業(yè)擁抱大模型紅利,要朝著這一數(shù)字前進(jìn)。
第二,它成為大模型應(yīng)用落地新階段的門檻,AI業(yè)務(wù)真正跑通了嗎?需求真實(shí)存在嗎?都可以此為參考系找回答。
第三,日均10億Tokens消耗也只是大模型落地“入門級(jí)水準(zhǔn)”,單客戶百萬億、千萬億Tokens消耗是更值得期待的星辰大海。
而如今,遠(yuǎn)超日均10億Tokens消耗,谷歌已經(jīng)為所有玩家樹立了新的標(biāo)桿。
不知道下一個(gè)“千萬億玩家”又會(huì)是誰呢?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.