中國儲能網(wǎng)訊:結(jié)構(gòu)不平衡,供需錯位。
2022年11月,基于A100GPU系列訓(xùn)練的GPT3.5與ChatGPT迅速吸引了全世界對AI的想象,并開啟了AI競賽,之后一卡難求。而今,英偉達(dá)兩款熱門芯片租賃價在10個月內(nèi)雙雙降了50%,多家產(chǎn)業(yè)鏈人士表示,算卡的價格已經(jīng)貼近銷售成本,AI算力供給端短缺情況緩解。與此同時,2024年前7月,國內(nèi)出現(xiàn)140個智算中心項目,引發(fā)關(guān)于算力過剩的思考。
“整體上的算力不足確實是問題,但同時,算力的結(jié)構(gòu)性短缺也是客觀存在。也就是說,在算力供給緊張的同時,還有著大量算力未能得到有效利用?!辟惖涎芯吭焊笨偣こ處煱矔煴硎?。
算力供給不足的三個原因
目前,我國算力發(fā)展存在算力供需的品種錯位問題,算力規(guī)模雖不斷增長,但面向人工智能、高性能計算等高端應(yīng)用的算力缺口大。據(jù)有關(guān)報告,2023年,中國智能算力需求達(dá)到123.6EFLOPS,但供給規(guī)模僅為57.9EFLOPS,供需缺口顯著。
在算力的使用過程中,由于現(xiàn)有的供給結(jié)構(gòu)與用戶實際的算力需求不平衡、不匹配,出現(xiàn)供需錯位,這也導(dǎo)致了大量的算力閑置和浪費(fèi)。其中,存在多方面錯位。如品類錯位,國內(nèi)算力產(chǎn)業(yè)鏈企業(yè)相對分散,大多芯片廠商與AI技術(shù)企業(yè)的技術(shù)路徑不同,造成了芯片與AI應(yīng)用之間不匹配;空間錯位,如我國中西部地區(qū)算力過剩,應(yīng)用需求不足,導(dǎo)致供給失衡。
造成算力供給短缺的因素主要包括AI的發(fā)展、地區(qū)發(fā)展不平衡,以及核心技術(shù)缺乏等。隨著AI大模型的廣泛應(yīng)用,原有的通用算力已無法滿足高端、復(fù)雜應(yīng)用場景的需求。智能算力等先進(jìn)算力成為新的需求熱點,但供給卻未能及時跟上。
地區(qū)間的經(jīng)濟(jì)發(fā)展水平和產(chǎn)業(yè)結(jié)構(gòu)差異也導(dǎo)致了算力需求的差異。東部地區(qū)由于數(shù)字化程度高,算力需求更為旺盛,而供給卻相對不足,尤其是在高峰時段或特定應(yīng)用場景下,算力短缺問題尤為突出。
我國在高性能計算和AI硬件方面存在的技術(shù)差距,也是算力供給短缺的重要原因之一。算力芯片作為算力基礎(chǔ)設(shè)施的核心部件,其成本占據(jù)了服務(wù)器成本的絕大部分。然而,目前算力芯片領(lǐng)域,中國廠商在研發(fā)實力上與國外廠商相比存在一定差距,前期開發(fā)成本較高。這不僅導(dǎo)致算力服務(wù)售價昂貴,也使得算力供給難以快速增加。高性能GPU等AI硬件主要依賴進(jìn)口,這增加了算力供給的不確定性。一旦進(jìn)口渠道受阻或價格波動,將直接影響算力供給的穩(wěn)定性。
算力利用率低
與算力供給不足相對應(yīng)的是算力利用效率低的問題。據(jù)IDC數(shù)據(jù),以企業(yè)為主要用戶的通用算力中心利用率,目前僅為10%~15%,這表明小型或企業(yè)級的算力中心利用率相對較低。而國家級、大廠級的智算中心資源利用率也高低不一,例如,西安昇騰智能科技有限公司的人工智算中心算力使用率高達(dá)98.5%,國家超級計算深圳中心和國家超級計算濟(jì)南中心的資源利用率也較高。但這些在我國算力中心只占少數(shù)。
業(yè)內(nèi)人士分析稱,大多數(shù)算力中心在“建設(shè)、應(yīng)用、生態(tài)”三個維度上仍面臨著“規(guī)模優(yōu)先,架構(gòu)單一;重視硬件發(fā)展疏忽軟件建設(shè),技術(shù)與場景需求割裂;兼容性與協(xié)同性不足”等問題,造成了我國近乎50%的算力中心算力分布管理不均,利用率難以跟上。
盲目投資是造成算力過剩的原因之一。一些地方政府和企業(yè)盲目投入智算中心建設(shè),這些智算中心在建成后缺乏足夠的應(yīng)用場景和市場需求,導(dǎo)致算力資源浪費(fèi)。在今年9月舉行的中國高性能計算學(xué)術(shù)年會上,中國計算機(jī)學(xué)會 (CCF)副理事長陳健指出,如果只是一味地增加硬件資源而不考慮其實用效能,未能確保需求方能夠方便快捷地獲得優(yōu)質(zhì)的計算能力,那這樣的做法無異于對資源和財力的巨大浪費(fèi)。他表示,目前除了緊缺的單一大規(guī)模算力集群以外,用于AI推理的算力供給實際上可以滿足或基本覆蓋需求,關(guān)鍵在于如何更有效地開發(fā)和利用現(xiàn)有資源。
此外,算力租賃市場低迷,導(dǎo)致算力資源無法得到有效利用。一些企業(yè)因缺乏應(yīng)用場景而閑置算力資源,造成浪費(fèi)。例如,某云計算平臺在初期投入大量資金建設(shè)了高性能計算集群,但由于市場需求不足,該集群的算力資源長期閑置。為了降低運(yùn)營成本,該平臺不得不將部分算力資源出租給第三方,但出租價格遠(yuǎn)低于成本價,導(dǎo)致盈利困難。
算力過剩是否成為常態(tài)?
算力過剩是否成為常態(tài)?業(yè)內(nèi)人士分析,從目前的市場狀況和價格趨勢來看,算力市場總體上是過剩的。
這種過??赡軙谖磥韼啄陜?nèi)導(dǎo)致價格競爭加劇,影響一些算力供應(yīng)商的利潤空間。
在具體的應(yīng)用層面,如大型語言模型(LLM)的訓(xùn)練和推理中,目前的算力供應(yīng)基本滿足需求。一些規(guī)劃中的算力中心可能最終不會完全投入使用,造成資源的浪費(fèi)。在價格趨勢方面,當(dāng)前,算力卡的價格已經(jīng)接近或低于其銷售成本,這表明市場上的供應(yīng)過剩。預(yù)計這種價格趨勢將持續(xù),導(dǎo)致一些算力供應(yīng)商面臨降價壓力。
算力供需銜接存在困難,是未來算力發(fā)展的主要瓶頸。受我國經(jīng)濟(jì)、社會發(fā)展格局影響,全國范圍內(nèi)分散部署的算力資源與東部地區(qū)較為集約的算力需求不能完全匹配。同時,受算力節(jié)點通過網(wǎng)絡(luò)靈活高效調(diào)配資源能力的制約,導(dǎo)致供需銜接不當(dāng),進(jìn)而出現(xiàn)“資源閑置”和“算力難求”現(xiàn)象并存。
近日,青云科技CEO林源表示,大家最早的忐忑“算力會否過剩”,短期供需一定會有波動,所有的應(yīng)用落地都需要時間,但中長期,它的上一輪供給一定是有需求的。AI的發(fā)展是有階段的,最早的階段比較簡單粗暴,就是解決算力的問題。從去年第四季度開始,客戶發(fā)生變化,客戶要的不僅僅是資源,得有平臺能把資源管理起來。
從更長遠(yuǎn)看,算力成為與水和電一樣帶動經(jīng)濟(jì)發(fā)展的重要因素,將不可逆。而需求和供給已經(jīng)進(jìn)入了互相推動的狀態(tài),算力的富足會讓模型進(jìn)步更快,模型的進(jìn)步會需要更多的算力。局部、短時間、結(jié)構(gòu)性的算力過剩或者緊張,將成為AI發(fā)展中的一段插曲。