AI時代,你提的每一個問題,“龍蝦”為你做的每一件事情,都是詞元在背后“跑腿”。
AI工具每生成一個詞元,都需要調(diào)用數(shù)據(jù)中心的算力,并伴隨著電力消耗。
越來越多人用上AI工具,首先迎來的是詞元調(diào)用量的激增,同步增長的,還有對算力的消耗。
設(shè)想一下:如果你正在使用AI工具,但半天沒有收到AI的回復(fù),你會作何感受?
當(dāng)我們看到新聞中不斷傳出消息,詞元調(diào)用量又增加了多少,相信不少人跟筆者有一樣的擔(dān)憂:照這個速度發(fā)展下去,我們的算力還夠用嗎?
就像高速公路上的車流量——車多了,道路會擁堵。詞元調(diào)用量大了,算力也會面臨壓力。
最近,云廠商密集提價,紛紛調(diào)高AI算力租賃價格。背后的原因很明顯——需求激增,供給偏緊,價格跟著上漲。
市場對GPU算力的需求持續(xù)強勁。市面上,有GPU芯片的租賃價格自2025年10月的每小時1.7美元上漲至今年3月的每小時2.35美元,漲幅近40%。
算力的需求曲線突然陡峭起來,算力供給還沒來得及完全跟上。更聰明的AI智能體模型能執(zhí)行更復(fù)雜的任務(wù),但對算力的消耗量明顯增大,如果算力不夠,一個問題丟進(jìn)去半天沒有響應(yīng),一切體驗都是空談。
既然這樣,如何破解?
其實,市場也已經(jīng)在給出回應(yīng)了。
先說開源。
以前,我們用的GPU芯片,許多依賴進(jìn)口,也就是說,我們算力的“命門”掌握在別人手中。而現(xiàn)在,華為昇騰910B等國產(chǎn)AI芯片逐步量產(chǎn),且產(chǎn)能不斷提升,算力硬件供給走向多元化,避免了對單一外資芯片的過度依賴。
從這一點上看,因為硬件導(dǎo)致算力短缺的可能性正在慢慢降低。
不僅是硬件在不斷突破,數(shù)據(jù)中心REITs等金融創(chuàng)新正在將算力資產(chǎn)證券化,吸引更多資本進(jìn)入算力建設(shè)領(lǐng)域,也就是說,未來將有越來越多的算力設(shè)施能為大家服務(wù)。
說完開源,再看節(jié)流。
提升詞元的轉(zhuǎn)化效率,其實也是提高算力的使用效率,也是從另一個角度擴(kuò)容算力“池子”。
最近,就有人提出,要構(gòu)建更高效、標(biāo)準(zhǔn)化的“詞元工廠”,提供持續(xù)穩(wěn)定、規(guī)?;脑~元服務(wù),讓頂尖模型能力高效賦能海量下游場景,盡可能提升每一個詞元的轉(zhuǎn)化效率,讓算力“花得值”。
近期,也有不少企業(yè)加快了高性能算力的創(chuàng)新布局,其中以超節(jié)點為代表的架構(gòu)創(chuàng)新,成為提升算力效率的重要路徑。
如果再往遠(yuǎn)一點看,未來,算力設(shè)施的智能化水平也會不斷提升,算法和算力系統(tǒng)之間的協(xié)同配合也會更默契,算力使用將更加高效。
算力緊張的確存在,但在筆者看來,這是階段性的。就像剛開始普及3G的時候,大家感覺手機(jī)的流量總是不夠用,而現(xiàn)在,大家可以隨便刷視頻。相信隨著技術(shù)迭代、產(chǎn)能擴(kuò)張和商業(yè)模式創(chuàng)新,算力的供需關(guān)系會逐步走向平衡。
而當(dāng)下,除了關(guān)注算力的規(guī)模本身,我們也要更多關(guān)注如何更高效、更公平地調(diào)度和使用算力。