中國儲(chǔ)能網(wǎng)訊:結(jié)構(gòu)不平衡,供需錯(cuò)位。
2022年11月,基于A100GPU系列訓(xùn)練的GPT3.5與ChatGPT迅速吸引了全世界對(duì)AI的想象,并開啟了AI競(jìng)賽,之后一卡難求。而今,英偉達(dá)兩款熱門芯片租賃價(jià)在10個(gè)月內(nèi)雙雙降了50%,多家產(chǎn)業(yè)鏈人士表示,算卡的價(jià)格已經(jīng)貼近銷售成本,AI算力供給端短缺情況緩解。與此同時(shí),2024年前7月,國內(nèi)出現(xiàn)140個(gè)智算中心項(xiàng)目,引發(fā)關(guān)于算力過剩的思考。
“整體上的算力不足確實(shí)是問題,但同時(shí),算力的結(jié)構(gòu)性短缺也是客觀存在。也就是說,在算力供給緊張的同時(shí),還有著大量算力未能得到有效利用?!辟惖涎芯吭焊笨偣こ處煱矔煴硎?。
算力供給不足的三個(gè)原因
目前,我國算力發(fā)展存在算力供需的品種錯(cuò)位問題,算力規(guī)模雖不斷增長,但面向人工智能、高性能計(jì)算等高端應(yīng)用的算力缺口大。據(jù)有關(guān)報(bào)告,2023年,中國智能算力需求達(dá)到123.6EFLOPS,但供給規(guī)模僅為57.9EFLOPS,供需缺口顯著。
在算力的使用過程中,由于現(xiàn)有的供給結(jié)構(gòu)與用戶實(shí)際的算力需求不平衡、不匹配,出現(xiàn)供需錯(cuò)位,這也導(dǎo)致了大量的算力閑置和浪費(fèi)。其中,存在多方面錯(cuò)位。如品類錯(cuò)位,國內(nèi)算力產(chǎn)業(yè)鏈企業(yè)相對(duì)分散,大多芯片廠商與AI技術(shù)企業(yè)的技術(shù)路徑不同,造成了芯片與AI應(yīng)用之間不匹配;空間錯(cuò)位,如我國中西部地區(qū)算力過剩,應(yīng)用需求不足,導(dǎo)致供給失衡。
造成算力供給短缺的因素主要包括AI的發(fā)展、地區(qū)發(fā)展不平衡,以及核心技術(shù)缺乏等。隨著AI大模型的廣泛應(yīng)用,原有的通用算力已無法滿足高端、復(fù)雜應(yīng)用場(chǎng)景的需求。智能算力等先進(jìn)算力成為新的需求熱點(diǎn),但供給卻未能及時(shí)跟上。
地區(qū)間的經(jīng)濟(jì)發(fā)展水平和產(chǎn)業(yè)結(jié)構(gòu)差異也導(dǎo)致了算力需求的差異。東部地區(qū)由于數(shù)字化程度高,算力需求更為旺盛,而供給卻相對(duì)不足,尤其是在高峰時(shí)段或特定應(yīng)用場(chǎng)景下,算力短缺問題尤為突出。
我國在高性能計(jì)算和AI硬件方面存在的技術(shù)差距,也是算力供給短缺的重要原因之一。算力芯片作為算力基礎(chǔ)設(shè)施的核心部件,其成本占據(jù)了服務(wù)器成本的絕大部分。然而,目前算力芯片領(lǐng)域,中國廠商在研發(fā)實(shí)力上與國外廠商相比存在一定差距,前期開發(fā)成本較高。這不僅導(dǎo)致算力服務(wù)售價(jià)昂貴,也使得算力供給難以快速增加。高性能GPU等AI硬件主要依賴進(jìn)口,這增加了算力供給的不確定性。一旦進(jìn)口渠道受阻或價(jià)格波動(dòng),將直接影響算力供給的穩(wěn)定性。
算力利用率低
與算力供給不足相對(duì)應(yīng)的是算力利用效率低的問題。據(jù)IDC數(shù)據(jù),以企業(yè)為主要用戶的通用算力中心利用率,目前僅為10%~15%,這表明小型或企業(yè)級(jí)的算力中心利用率相對(duì)較低。而國家級(jí)、大廠級(jí)的智算中心資源利用率也高低不一,例如,西安昇騰智能科技有限公司的人工智算中心算力使用率高達(dá)98.5%,國家超級(jí)計(jì)算深圳中心和國家超級(jí)計(jì)算濟(jì)南中心的資源利用率也較高。但這些在我國算力中心只占少數(shù)。
業(yè)內(nèi)人士分析稱,大多數(shù)算力中心在“建設(shè)、應(yīng)用、生態(tài)”三個(gè)維度上仍面臨著“規(guī)模優(yōu)先,架構(gòu)單一;重視硬件發(fā)展疏忽軟件建設(shè),技術(shù)與場(chǎng)景需求割裂;兼容性與協(xié)同性不足”等問題,造成了我國近乎50%的算力中心算力分布管理不均,利用率難以跟上。
盲目投資是造成算力過剩的原因之一。一些地方政府和企業(yè)盲目投入智算中心建設(shè),這些智算中心在建成后缺乏足夠的應(yīng)用場(chǎng)景和市場(chǎng)需求,導(dǎo)致算力資源浪費(fèi)。在今年9月舉行的中國高性能計(jì)算學(xué)術(shù)年會(huì)上,中國計(jì)算機(jī)學(xué)會(huì) (CCF)副理事長陳健指出,如果只是一味地增加硬件資源而不考慮其實(shí)用效能,未能確保需求方能夠方便快捷地獲得優(yōu)質(zhì)的計(jì)算能力,那這樣的做法無異于對(duì)資源和財(cái)力的巨大浪費(fèi)。他表示,目前除了緊缺的單一大規(guī)模算力集群以外,用于AI推理的算力供給實(shí)際上可以滿足或基本覆蓋需求,關(guān)鍵在于如何更有效地開發(fā)和利用現(xiàn)有資源。
此外,算力租賃市場(chǎng)低迷,導(dǎo)致算力資源無法得到有效利用。一些企業(yè)因缺乏應(yīng)用場(chǎng)景而閑置算力資源,造成浪費(fèi)。例如,某云計(jì)算平臺(tái)在初期投入大量資金建設(shè)了高性能計(jì)算集群,但由于市場(chǎng)需求不足,該集群的算力資源長期閑置。為了降低運(yùn)營成本,該平臺(tái)不得不將部分算力資源出租給第三方,但出租價(jià)格遠(yuǎn)低于成本價(jià),導(dǎo)致盈利困難。
算力過剩是否成為常態(tài)?
算力過剩是否成為常態(tài)?業(yè)內(nèi)人士分析,從目前的市場(chǎng)狀況和價(jià)格趨勢(shì)來看,算力市場(chǎng)總體上是過剩的。
這種過??赡軙?huì)在未來幾年內(nèi)導(dǎo)致價(jià)格競(jìng)爭(zhēng)加劇,影響一些算力供應(yīng)商的利潤空間。
在具體的應(yīng)用層面,如大型語言模型(LLM)的訓(xùn)練和推理中,目前的算力供應(yīng)基本滿足需求。一些規(guī)劃中的算力中心可能最終不會(huì)完全投入使用,造成資源的浪費(fèi)。在價(jià)格趨勢(shì)方面,當(dāng)前,算力卡的價(jià)格已經(jīng)接近或低于其銷售成本,這表明市場(chǎng)上的供應(yīng)過剩。預(yù)計(jì)這種價(jià)格趨勢(shì)將持續(xù),導(dǎo)致一些算力供應(yīng)商面臨降價(jià)壓力。
算力供需銜接存在困難,是未來算力發(fā)展的主要瓶頸。受我國經(jīng)濟(jì)、社會(huì)發(fā)展格局影響,全國范圍內(nèi)分散部署的算力資源與東部地區(qū)較為集約的算力需求不能完全匹配。同時(shí),受算力節(jié)點(diǎn)通過網(wǎng)絡(luò)靈活高效調(diào)配資源能力的制約,導(dǎo)致供需銜接不當(dāng),進(jìn)而出現(xiàn)“資源閑置”和“算力難求”現(xiàn)象并存。
近日,青云科技CEO林源表示,大家最早的忐忑“算力會(huì)否過剩”,短期供需一定會(huì)有波動(dòng),所有的應(yīng)用落地都需要時(shí)間,但中長期,它的上一輪供給一定是有需求的。AI的發(fā)展是有階段的,最早的階段比較簡(jiǎn)單粗暴,就是解決算力的問題。從去年第四季度開始,客戶發(fā)生變化,客戶要的不僅僅是資源,得有平臺(tái)能把資源管理起來。
從更長遠(yuǎn)看,算力成為與水和電一樣帶動(dòng)經(jīng)濟(jì)發(fā)展的重要因素,將不可逆。而需求和供給已經(jīng)進(jìn)入了互相推動(dòng)的狀態(tài),算力的富足會(huì)讓模型進(jìn)步更快,模型的進(jìn)步會(huì)需要更多的算力。局部、短時(shí)間、結(jié)構(gòu)性的算力過?;蛘呔o張,將成為AI發(fā)展中的一段插曲。