中國儲能網(wǎng)訊:蓄“力”AI爆發(fā)。
隨著全國一體化算力網(wǎng)絡國家樞紐節(jié)點的部署和“東數(shù)西算”工程的推進,我國算力基礎設施建設和應用保持快速發(fā)展。如何充分發(fā)揮智算中心的技術優(yōu)勢,構(gòu)筑數(shù)字經(jīng)濟算網(wǎng)新底座,助力產(chǎn)業(yè)數(shù)字化發(fā)展,是產(chǎn)業(yè)鏈最為關注的話題之一。
AI,先智算
國家信息中心發(fā)布的《智能計算中心創(chuàng)新發(fā)展指南》指出,“十四五”期間,在智算中心實現(xiàn)80%應用水平的情況下,城市對智算中心的投資可帶動人工智能核心產(chǎn)業(yè)增長2.9倍至3.4倍,帶動相關產(chǎn)業(yè)增長36倍至42倍。
近兩年,AI大模型給產(chǎn)業(yè)帶來了巨大的影響,以GPU為核心的智算逐步成為算力的主要發(fā)展方向。據(jù)工信部規(guī)劃,中國智能算力的占比將在2025年達到35%,年復合增長率在30%以上,這意味著智算中心將引領數(shù)據(jù)中心建設的潮流。此外,在技術趨勢上,由于AI算力單位能源消耗高,其機柜比傳統(tǒng)的機柜有數(shù)倍的耗能需求,智算中心可以通過發(fā)展節(jié)能技術、算力調(diào)度等方式降低能耗,滿足低碳發(fā)展要求。
智算中心是指基于智能化技術和算法的數(shù)據(jù)中心,它不僅具備通用數(shù)據(jù)中心的計算、存儲和網(wǎng)絡等基礎功能,更加注重數(shù)據(jù)的智能化處理和應用,以實現(xiàn)更高效、更智能的數(shù)據(jù)管理和應用服務。“由于最終業(yè)務需求差異,即AI算力對比通用算力對網(wǎng)絡架構(gòu)的訴求不同,使得智算中心和通用數(shù)據(jù)中心的網(wǎng)絡特征出現(xiàn)了較大差異?!碧旖蛞苿右?guī)劃技術部算網(wǎng)能力室經(jīng)理李強在接受《通信產(chǎn)業(yè)報》全媒體記者采訪時表示。
青云科技副總裁廖洋表示,智算中心包括了專為AI設計和優(yōu)化的基礎設施,能夠提供強大的計算資源,滿足機器學習、深度學習等復雜模型訓練與推理的需求,支持了一些傳統(tǒng)數(shù)據(jù)中心不擅長或者是無法提供服務的場景,成為支持經(jīng)濟數(shù)智化、社會數(shù)智化必不可少的基礎設施。
“智算中心旨在支撐數(shù)據(jù)開放共享、智能生態(tài)建設、產(chǎn)業(yè)創(chuàng)新聚集,促進AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化,及政府治理智能化?!冰i博士集團副總工程師、鵬博士研究院負責人侯興澤告訴《通信產(chǎn)業(yè)報》全媒體記者,智算中心由于需要處理大量的數(shù)據(jù)和運行復雜的AI模型,對能源和制冷的需求更高,液冷技術在智算中心中的應用更為普遍,以支持高功率密度的設備并有效管理散熱問題。
此外,智算中心往往需要部署大量的高性能計算設備,如GPU、TPU和FPGA等,這些設備通常具有較高的功耗。因此,智算中心的單機柜功率密度通常會高于傳統(tǒng)數(shù)據(jù)中心。根據(jù)調(diào)研,智算中心的單機柜功率密度需要超過30kW,甚至達到100kW以上,而傳統(tǒng)數(shù)據(jù)中心的單機柜功率密度一般在6kW~15kW之間。
隨著AI產(chǎn)業(yè)和產(chǎn)業(yè)AI的不斷發(fā)展,智算基礎設施建設熱度持續(xù)升高。與傳統(tǒng)的數(shù)據(jù)中心相比,智算中心在當?shù)匕l(fā)展產(chǎn)業(yè)經(jīng)濟可能會帶來更明顯的作用,如何建好、管好、用好智算中心是一個持續(xù)迭代更新的命題。
進度如何?
智能算力需求的快速增長讓智算中心的建設也進入了高速發(fā)展時期。目前,各地也開始逐步出臺關于整體建設的指引以及相關指標,這主要還是為了引導智算中心向著“重質(zhì)量”“綠色”的方向健康發(fā)展。
相關數(shù)據(jù)統(tǒng)計,截至2023年底,全國帶有“智算中心”的項目有129個,其中83個項目有規(guī)模披露,規(guī)??偤统^7.7萬P,在建規(guī)模4.9萬P。這些智算中心標準不一、規(guī)模各樣,算力規(guī)模一般在50P、100P、500P、1000P,有的甚至達到12,000P以上。
截至2023年8月,我國智算中心集中于東部地區(qū)和中部地區(qū)。其中,東部地區(qū)智算中心數(shù)量達25個,占比62.5%,排名第一,以京津冀和長三角地區(qū)為主;中部地區(qū)占比17.5%,排名第二;西部和東北地區(qū)的智算中心數(shù)量占比分別為12.5%和7.5%。
在侯興澤看來,智算中心是個復雜的系統(tǒng)工程,從各方面來看都處在積極演進過程中,隨著主流廠商系統(tǒng)架構(gòu)的快速演進迭代升級,不同建設時期的算力中心有很大不同,第一代、第二代智算中心普遍進入運營期,第三代智算中心基本在建設階段,更新的智算中心還處于設計預研過程中。
已經(jīng)投產(chǎn)運營的第一代算力中心單機電源功率在6.5kw左右,單機可提供5P算力,普遍采用風冷散熱模式。到第二代算力中心單機電源功率提升至10.5kw,單機可以提供15P算力,開始出現(xiàn)氣液混合制冷散熱模式。到第三段算力中心單機電源功率可達24kw,單機可提供225P算力,普遍采用板式液冷散熱模式。可以預見,未來采用浸沒液冷的算力中心單機柜功率密度達到60kw~240kw,單機算力超過1440P指日可待。
總體來看,當前,智算中心的建設仍處于初期階段,要從開放、融合、綠色、普惠、服務等方面進行智算基礎設施的建設,提高智算中心的運營效益。
誰在領跑?
從智算中心的建設與運營角度來看,一個智算中心需要多種技術和產(chǎn)業(yè)鏈企業(yè)的支撐,以確保其順利運行并滿足各種復雜的計算需求。至少需要物理基礎設施(電力等)、硬件基礎設施(服務器、存儲、網(wǎng)絡等)、軟件平臺與工具(調(diào)度管理、運營運維、應用框架、大數(shù)據(jù)工具等)、算法和模型服務企業(yè)。
目前,我國智算產(chǎn)業(yè)鏈已經(jīng)初步形成,涵蓋由芯片、軟件、硬件供應商構(gòu)成的上游產(chǎn)業(yè),由云商、電信運營商、第三方數(shù)據(jù)中心服務商等構(gòu)成的中游產(chǎn)業(yè),以及由互聯(lián)網(wǎng)、交通、金融、工業(yè)等行業(yè)的用戶構(gòu)成的下游產(chǎn)業(yè)。
其中,國產(chǎn)硬件廠商持續(xù)突破AI芯片性能,提升市場競爭力。華為推出昇騰910,性能對標英偉達A100,可用于智能手機、云計算、自動駕駛等領域,同時推出AI開源計算框架 MindSpore,支持用戶進行AI開發(fā)。
大型云商自研AI芯片,以擺脫對國外技術依賴。阿里巴巴面向自身電商、汽車、家電等領域需求自研AI芯片,基于RISC-V架構(gòu)和自研算法推出含光800 NPU,支持TFlops級別浮點運算。百度面向搜索、智能交通等領域的深度學習運算需求,推出昆侖系列AI芯片,用于大模型推理。騰訊依靠蓬萊實驗室推出AI推理芯片“紫霄”,已用于騰訊會議等多個內(nèi)部業(yè)務。
作為算力網(wǎng)絡建設、運營的國家隊和主力軍,三大運營商2024年資本開支焦點正在轉(zhuǎn)移,預算皆有下降,但算力成為運營商投資新熱點,將大幅度增加智能算力方面的投資。2024年,中國電信云/算力投資計劃180億元,智算算力累計超過21EFLOPS,全面打造面向智算靈活、彈性、綠色的AIDC。中國移動算力開支計劃為475億元,較2023年上漲21.5%,占資本開支預算總額的27.5%。在算力方面,中國移動計劃加快算力多元供給,計劃通用算力累計達到9EFLOPS,智算算力累計超過17EFLOPS,確保規(guī)模行業(yè)領先。中國聯(lián)通在算網(wǎng)數(shù)智投資方面將堅持適度超前、加快布局。
未來,國產(chǎn)多元異構(gòu)算力融合推動智算長效發(fā)展,智算從單節(jié)點向區(qū)域化協(xié)同、邊端部署演變,普惠泛在的智算服務生態(tài)正逐步構(gòu)建,確定性、高性能網(wǎng)絡助推大規(guī)模智算集群構(gòu)建,低碳化發(fā)展格局需創(chuàng)新智算-電網(wǎng)協(xié)同模式。要打破傳統(tǒng)IDC產(chǎn)業(yè)的思維,建設符合市場真正需求、支持良性商業(yè)發(fā)展的重運營、重服務的智算中心,還是需要整個產(chǎn)業(yè)鏈的生態(tài)合作。