精品人妻系列无码人妻漫画,久久精品国产一区二区三区,国产精品无码专区,无码人妻少妇伦在线电影,亚洲人妻熟人中文字幕一区二区,jiujiuav在线,日韩高清久久AV

中國儲能網(wǎng)歡迎您!
當(dāng)前位置: 首頁 >新聞動態(tài) 返回

后DeepSeek時代,算力芯片市場的變與不變

作者:姬曉婷 來源:中國電子報 發(fā)布時間:2025-04-11 瀏覽:

中國儲能網(wǎng)訊:算力集群Scaling Law(尺度規(guī)律)還奏效嗎?萬卡級智算集群還是全球AI大模型競爭的“入場券”嗎?十萬卡智算集群仍然是算力備戰(zhàn)的目標(biāo)嗎?

今年年初,DeepSeek-V3訓(xùn)練只使用了2048張H800GPU的消息傳出,就像一顆核彈,給長期信奉規(guī)模取勝的智能算力市場帶來了不小的震撼。智算行業(yè)曾經(jīng)堅信的尺度規(guī)律——智算集群規(guī)模將沿著千卡、萬卡、十萬卡順序部署的路線發(fā)展,也因此產(chǎn)生了動搖。幾個月過去,記者發(fā)現(xiàn),DeepSeek的出現(xiàn)的確給算力芯片市場帶來了不小的變化,但業(yè)界對尺度規(guī)律的認(rèn)可度仍然堅挺。

推理算力市場迎激增

毫無疑問,DeepSeek給推理芯片和推理算力市場注入了一針強心劑。

某業(yè)內(nèi)人士表示,2024年,多地建設(shè)的智算中心普遍存在空置的現(xiàn)象。但在DeepSeek發(fā)布后,各地算力中心資源的利用率實現(xiàn)了大幅提升。

中國人工智能服務(wù)器工作負(fù)載預(yù)測(2024—2028年)

來源:2025 中國人工智能計算力發(fā)展評估報告

市場分析機構(gòu)發(fā)布的數(shù)據(jù)顯示,中國人工智能服務(wù)器工作負(fù)載中,推理算力的占比將在未來幾年大幅增長,預(yù)計到2028年中國推理算力的市場份額將從2024年的65%增長到73%。

浪潮高級副總裁劉軍也表示:“在DeepSeek發(fā)布后,推理算力的需求量正在迅速超過訓(xùn)練算力,市場結(jié)構(gòu)發(fā)生了根本性變化?!?/span>

感受到市場需求的牽引,多家國產(chǎn)算力芯片公司今年將業(yè)務(wù)發(fā)展重點放在了推理領(lǐng)域。例如,今年2月,燧原科技宣布其慶陽智算中心部署的萬卡集群為美圖AI推理業(yè)務(wù)提供算力;今年3月,沐曦科技宣布聯(lián)合清華大學(xué)KVCache.AI團(tuán)隊加速DeepSeek滿血版單卡C500異構(gòu)推理等。

但截至目前,推理市場實際上并不存在對“真萬卡集群”的剛需。根據(jù)阿里研究院副院長安筱鵬的理解,只有一萬張AI加速卡部署在同一個數(shù)據(jù)中心,并且能通過大規(guī)模資源調(diào)度技術(shù),讓萬卡作為“一臺”計算機,支持單一模型在一萬張卡上同時進(jìn)行訓(xùn)練,才能被認(rèn)為是“真萬卡集群”。但推理任務(wù)更多是通過分布式實現(xiàn)的,其算力規(guī)模需求遠(yuǎn)低于萬卡。

萬卡集群跟不上大模型腳步?

“大模型本地部署有望成為國產(chǎn)算力芯片的重要增長拉動力。” 聯(lián)通元景大模型負(fù)責(zé)人在接受《中國電子報》記者采訪時如是說。

DeepSeek之所以能撬動巨大的推理算力市場,本質(zhì)上得益于其底層基礎(chǔ)模型V3的高質(zhì)量訓(xùn)練。而強大的算力,是支撐該模型乃至后續(xù)其他模型迭代的基礎(chǔ)。

聯(lián)通云相關(guān)負(fù)責(zé)人介紹,大模型參數(shù)規(guī)模從千億級邁向萬億級,訓(xùn)練數(shù)據(jù)量也呈指數(shù)級增長。大規(guī)模訓(xùn)練集群能夠通過并行計算和分布式處理,顯著縮短訓(xùn)練周期,為模型快速迭代提供基礎(chǔ)設(shè)施支撐。但從當(dāng)前的情況來看,萬卡集群在訓(xùn)練效率上已經(jīng)不足以支持大模型的迭代速度。而十萬卡集群,能夠通過更高的并行度和分布式優(yōu)化,在萬卡集群基礎(chǔ)上實現(xiàn)訓(xùn)練效率的再度提升。

但建設(shè)大規(guī)模訓(xùn)練集群,仍存在諸多待解的技術(shù)問題。多地域部署、多芯混訓(xùn)、集群穩(wěn)定性都給集群建設(shè)帶來了挑戰(zhàn)。集群穩(wěn)定性要求高,快速容錯和恢復(fù)是關(guān)鍵;能耗與散熱、數(shù)據(jù)管理和運維管理等問題同樣重要——集群每日能耗甚至將高達(dá)300萬千瓦時,與一個小型機械廠一年的用電量相當(dāng)。

在中國聯(lián)通相關(guān)業(yè)務(wù)人員看來,綜合考慮企業(yè)需求、行業(yè)應(yīng)用和區(qū)域分布,中國可能需要3~5個“真十萬卡集群”,這些集群應(yīng)具備高效能、低能耗、高穩(wěn)定性的特點,并支持多任務(wù)并發(fā)和動態(tài)資源調(diào)度,以最大化利用算力。

算力集群部署“雙軌并行”

可以預(yù)見,未來的算力集群部署,將以訓(xùn)練與推理為界,形成巨大分野,呈現(xiàn)出“雙軌并行”新格局:

一方面,頭部企業(yè)持續(xù)加碼超大規(guī)模集群,集中力量實現(xiàn)訓(xùn)練性能突破。調(diào)度方面,百度、騰訊等企業(yè)開發(fā)了面向超大集群的自動切分、任務(wù)容錯系統(tǒng);能源管理上,液冷、浸沒式等新型冷卻技術(shù)成為數(shù)據(jù)中心標(biāo)配,PUE(能源利用效率)持續(xù)優(yōu)化;多芯融合層面,一些平臺已實現(xiàn)“國產(chǎn)+進(jìn)口”GPU、NPU、ASIC的調(diào)度統(tǒng)一,個別廠商甚至宣布支持六芯異構(gòu)協(xié)同訓(xùn)練。

與此同時,“以訓(xùn)練反哺調(diào)度優(yōu)化”成為技術(shù)演進(jìn)的新方向。通過AI自身參與任務(wù)調(diào)度、負(fù)載均衡,集群可以實現(xiàn)自動化資源編排——這正是AI基礎(chǔ)設(shè)施向“智能化操作系統(tǒng)”演進(jìn)的表現(xiàn)。某種意義上,十萬卡不再只是“計算力的集合”,而是“算力+AI控制力”的聯(lián)合體。“十萬卡集群”的比拼,最終將落腳于如何將堆卡用好、用足、用出性價比。

另一方面,各地方、中小企業(yè)在智算賽道的著眼點將轉(zhuǎn)向算法高效化與推理優(yōu)化。越來越多的企業(yè)開始選擇用數(shù)百張卡構(gòu)建私有化小型訓(xùn)練集群,結(jié)合開源模型做定制化微調(diào)。通過模型蒸餾、芯片定制和邊緣算力部署,在特定場景下以更低成本參與競爭,推動AI技術(shù)下沉至垂直領(lǐng)域。

分享到:

關(guān)鍵字:算力

中國儲能網(wǎng)版權(quán)說明:

1、凡注明來源為“中國儲能網(wǎng):xxx(署名)”,除與中國儲能網(wǎng)簽署內(nèi)容授權(quán)協(xié)議的網(wǎng)站外,未經(jīng)本網(wǎng)授權(quán),任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用上述作品。

2、凡本網(wǎng)注明“來源:xxx(非中國儲能網(wǎng))”的作品,均轉(zhuǎn)載與其他媒體,目的在于傳播更多信息,但并不代表中國儲能網(wǎng)贊同其觀點、立場或證實其描述。其他媒體如需轉(zhuǎn)載,請與稿件來源方聯(lián)系,如產(chǎn)生任何版權(quán)問題與本網(wǎng)無關(guān)。

3、如因作品內(nèi)容、版權(quán)以及引用的圖片(或配圖)內(nèi)容僅供參考,如有涉及版權(quán)問題,可聯(lián)系我們直接刪除處理。請在30日內(nèi)進(jìn)行。

4、有關(guān)作品版權(quán)事宜請聯(lián)系:13661266197、 郵箱:[email protected]