亚洲一区图片,青青青国产在线,国产色婷婷精品综合在线观看,色综合天天,亚洲福利视频一区二区三区,国产在线视频专区,午夜精品区

首頁 > 產(chǎn)業(yè)市場(chǎng) > 即時(shí)新聞

“龍蝦”揮鉗,算力吃緊

2026-04-02 07:42 來源:科技日?qǐng)?bào)
查看余下全文
首頁 > 產(chǎn)業(yè)市場(chǎng) > 即時(shí)新聞

“龍蝦”揮鉗,算力吃緊

2026年04月02日 07:42 來源:科技日?qǐng)?bào)
[字號(hào) ]

◎本報(bào)記者 崔 爽

  “龍蝦”揮舞的雙鉗下,是一個(gè)深不見底的算力黑洞。

  有機(jī)構(gòu)算了一筆賬:相比傳統(tǒng)聊天機(jī)器人,智能體的Token(詞元)消耗動(dòng)輒放大數(shù)十倍,一個(gè)稍微復(fù)雜一點(diǎn)的任務(wù),背后吃掉的算力,甚至可能是普通對(duì)話的百倍、千倍。有科技博主實(shí)測(cè),如果真把“龍蝦”當(dāng)成生產(chǎn)工具放開用,一周下來,費(fèi)用接近萬元。

  數(shù)據(jù)是最直觀的注腳。“養(yǎng)蝦”火起來之后,模型調(diào)用量極速攀升。全球API聚合平臺(tái)OpenRouter的數(shù)據(jù)顯示:3月16日至22日,全球大模型調(diào)用量已經(jīng)達(dá)到20.4萬億Token,一周漲了兩成多。其中,中國(guó)大模型的周調(diào)用量漲幅更是超過五成,并且已經(jīng)連續(xù)第三周超過美國(guó)。當(dāng)周全球調(diào)用量排名前四的模型,也全部是“中國(guó)造”。

  國(guó)家數(shù)據(jù)局公布的數(shù)據(jù)顯示,今年3月,中國(guó)日均Token調(diào)用量已突破140萬億,兩年增長(zhǎng)了上千倍。

  在不少業(yè)內(nèi)人士看來,這樣的增長(zhǎng)既令人興奮,也暗含隱憂。

  3月27日中關(guān)村論壇年會(huì)的一場(chǎng)AI主題論壇上,算力缺口幾乎成了繞不開的話題?!癘penClaw帶來算力需求的暴增。”無問芯穹CEO夏立雪觀察到,“上次見到這樣的增速,還是當(dāng)年3G手機(jī)剛普及,手機(jī)流量不夠用的時(shí)候。以后我們的手機(jī)里可能會(huì)有兩張卡,一張是SIM卡,一張就是‘Token卡’?!?/p>

  問題在于,需求的曲線已經(jīng)陡峭起來,供給卻還沒完全跟上。“讓更聰明的模型執(zhí)行更復(fù)雜的任務(wù),資源消耗極大。如果算力不夠,一個(gè)問題丟進(jìn)去半天沒有響應(yīng),一切體驗(yàn)都是空談?!敝亲V華章CEO張鵬說得直白。在他看來,推理需求正以百倍級(jí)別爆發(fā),算力很可能成為制約行業(yè)發(fā)展的核心瓶頸。

  夏立雪認(rèn)為,當(dāng)前階段,與其單純擴(kuò)張算力規(guī)模,不如把已有資源用到極致。圍繞這個(gè)目標(biāo),他提出,應(yīng)加快構(gòu)建更高效、標(biāo)準(zhǔn)化的“Token工廠”,提供持續(xù)穩(wěn)定、規(guī)?;腡oken服務(wù),使頂尖模型能力高效賦能海量下游場(chǎng)景,盡可能提升每一個(gè)Token的轉(zhuǎn)化效率,讓算力“花得值”。

  再往遠(yuǎn)一點(diǎn)看,未來的基礎(chǔ)設(shè)施本身也會(huì)走向智能化,可以自我調(diào)度、自主優(yōu)化,甚至內(nèi)置Agent來充當(dāng)“管理者”,讓算法與算力系統(tǒng)形成更緊密的深度協(xié)同。

  面對(duì)“算力焦慮”,也有人重申架構(gòu)創(chuàng)新的價(jià)值。

  小米MiMo大模型負(fù)責(zé)人羅福莉回憶,兩年前,在算力受限的情況下,中國(guó)團(tuán)隊(duì)依然通過模型架構(gòu)創(chuàng)新,“逼出”更高效率,比如DeepSeek的探索,“這給了我們勇氣和信心”。

  如今,雖然硬件條件已經(jīng)改善,國(guó)產(chǎn)芯片不再受限,但這種對(duì)更低推理成本、更高算力效率的探索,依然會(huì)在智能體時(shí)代成為未來競(jìng)爭(zhēng)的關(guān)鍵。

(責(zé)任編輯:王婉瑩)