日前,AMD發(fā)布了新一代計算加速卡Instinct MI250、MI250X,基于6nm工藝、CNDA2架構(gòu),內(nèi)部封裝兩顆GPU、八顆HBM2e,最多14080個計算核心、880個矩陣核心、128GB顯存內(nèi)存。
作為AMD的第一款百億億次計算級別產(chǎn)品,MI250系列已經(jīng)得到了很多客戶方案,尤其是聯(lián)合美國能源部的超算“Frontier”,已經(jīng)整裝待發(fā),峰值性能超過150億億次。
這就是MI250X加速卡的真容,中間兩顆大的芯片自然是MI200計算模塊,周邊八顆小的就是HBM2e內(nèi)存,單顆32GB,通過2.5D EFB橋接技術(shù)彼此互連。
整卡采用OAM形態(tài),也就是基于開放計算項(xiàng)目(OCP)指定的加速卡模組標(biāo)準(zhǔn),NVIDIA、Intel也都采納。
這是1U半高刀片規(guī)格的單個節(jié)點(diǎn),集成八塊MI250X,另有兩顆霄龍?zhí)幚砥鳎?ldquo;Trento”,基于三代霄龍7003 Milan的定制版,主要加強(qiáng)了Infinity Fabric IO部分,便于控制八路加速卡。
MI250X單卡功耗就有560W,Trento霄龍暫無具體規(guī)格估計也在280W左右,那么這一個節(jié)點(diǎn)的整體功耗,就在5000W左右,一小時就是5度電,散熱上風(fēng)冷也不夠了,全部都是水冷。
而且,這還沒算上12通道內(nèi)存、硬盤、網(wǎng)絡(luò)等等。
美國的三大百億億次超級計算機(jī)中,除了AMD Frontier,Intel承接了“Aurora”,采用超過1.8萬顆下一代可擴(kuò)展至強(qiáng)Sapphire Rapids、超過5.4萬塊全新加速卡Ponte Vecchio,每個節(jié)點(diǎn)雙路CPU加六路GPU,號稱性能超過200億億次,但進(jìn)度最慢。
NVIDIA則利用自己的A100加速卡,聯(lián)合AMD第三代霄龍,打造了“Polaris”,分別有1120顆、2240塊,每個節(jié)點(diǎn)雙路配四塊卡,性能相對最低,但因?yàn)槎际浅墒煊布M(jìn)度是最快的,今年年內(nèi)上線,明年還會升級一次。
評論