中國(guó)儲(chǔ)能網(wǎng)訊:當(dāng)今科技發(fā)展的浪潮中,智算中心站在了時(shí)代的風(fēng)口,成為眾人矚目的焦點(diǎn),算力作為智算中心的核心指標(biāo)決定了其處理數(shù)據(jù)和執(zhí)行任務(wù)的能力,算效則反映了算力資源的利用效率,下面我們來學(xué)習(xí)數(shù)據(jù)中心算力與算效的計(jì)算方法。
一、算力的定義
算力(CP,ComputationaPower)即數(shù)據(jù)中心的計(jì)算能力。
指數(shù)據(jù)中心的服務(wù)器通過對(duì)數(shù)據(jù)進(jìn)行處理后實(shí)現(xiàn)結(jié)果輸出的一種能力,是衡量數(shù)據(jù)中心計(jì)算能力的一個(gè)綜合指標(biāo),數(shù)值越大代表綜合計(jì)算能力越強(qiáng)。算力應(yīng)是數(shù)據(jù)中心內(nèi)所有服務(wù)器的算力加和,即:
二、算力的分類
算力(CP)的核心要素包括通用算力(即CP-Nomal,簡(jiǎn)寫CPN)和智能算力(即CP-Tuto,簡(jiǎn)寫CPT)。通用算力是指數(shù)據(jù)中心服務(wù)器僅包含CPU的算力。智能算力是指數(shù)據(jù)中心服務(wù)器不僅包含CPU,也包含GPU或AI芯片的算力。因此數(shù)據(jù)中心的算力(CP):
三、算力的單位與精度
算力(CP)最常用的單位是FLOPS(Floatimng point OperationsPer Secnd,每秒浮點(diǎn)運(yùn)算次數(shù))。事實(shí)上,F(xiàn)LOPS已成為各種設(shè)施(如計(jì)算機(jī)、超算機(jī)、服務(wù)器等)衡量計(jì)算性能的代名詞。FLOPS是一個(gè)基本單位,它的更大的數(shù)值單位有K(千)、M(兆)、G(吉)、T(太)、P(拍)、E(艾)等。
表1 算力常見單位
算力精度不同,實(shí)際算力水平差別巨大。如果因此衡量算力水平,單一采用運(yùn)算次數(shù)指標(biāo)是不夠的,還應(yīng)考慮算力精度。
根據(jù)參與運(yùn)算數(shù)據(jù)精度的不同,可把算力分為:雙精度算力(64位,F(xiàn)P64)、單精度算力(32位,F(xiàn)P32)、半精度算力(16位,F(xiàn)P16)及整型算力(INT8、INT4)。數(shù)字位數(shù)越高,意味著精度越高、可支持的運(yùn)算復(fù)雜程度越高、適配應(yīng)用場(chǎng)景越廣。
表2 算力精度適用場(chǎng)景
但是一般情況下,算力規(guī)模測(cè)算時(shí)統(tǒng)一折算為單精度浮點(diǎn)數(shù)(FP32)算力進(jìn)行統(tǒng)計(jì)。
四、算力(CP)的計(jì)算方法
通過上面我們知道算力是通過數(shù)據(jù)中心內(nèi)所有服務(wù)器的算力加和來統(tǒng)計(jì)的。如果我們僅知道IT電力容量時(shí),怎么去估算數(shù)據(jù)中心(智算中心)的算力呢?
首先我們應(yīng)選定一款A(yù)I服務(wù)器,查看它的用電功率。以H100 GPU 服務(wù)器為例:CPU耗電約 300W*2,內(nèi)存16根耗電約 250W,硬盤6塊盤約200W,風(fēng)扇耗電約150W,H100GPU卡耗電約700W*8,按理論計(jì)算最大耗電量約為6800W。而以H100模組整機(jī)服務(wù)器滿配的情況下,單臺(tái)約功率約10kW。例如數(shù)據(jù)中心的IT總?cè)萘繛?000kW,計(jì)算服務(wù)器臺(tái)數(shù):
從上公式,計(jì)算出本數(shù)據(jù)中心可布置800臺(tái)H100 GPU 服務(wù)器。然后計(jì)算服務(wù)器的GPU算力。
表3 H100 SXM算力參數(shù)
通過上表查出,H100 GPU單卡算力為67TFLOPS, 單臺(tái)服務(wù)器共有8張GPU卡。在忽略CPU算力的情況下,可計(jì)算出數(shù)據(jù)中心中心的算力規(guī)模為:
由上公式,可以算出428,800TFLOPS(半精度FP32),即428.8PFLOPS(半精度FP32)。一般情況下,建議在后面加上算力精度,避免產(chǎn)生歧義。
五、算效(CP)的計(jì)算方法
算效(CE,ComputationalEmciency)是指數(shù)據(jù)中心算力與功率的比值,即“數(shù)據(jù)中心每瓦功率所產(chǎn)生的算力”,是同時(shí)考慮數(shù)據(jù)中心計(jì)算性能與功率的種效率。數(shù)值越大,代表單位功率的算力越強(qiáng),效能越高。若CP為以單精度浮點(diǎn)數(shù)(FP32)的數(shù)據(jù)中心的算力,PC為數(shù)據(jù)中心IT設(shè)備的整體功率,其單位為瓦(W),則算效CE的計(jì)算公式為:
再以上面的數(shù)據(jù)中心為例,代入算力428,800TFLOPS(半精度FP32)與IT總?cè)萘?000kW進(jìn)行計(jì)算:
計(jì)算出數(shù)據(jù)中心的算效為5350FLOPS/W。