英偉達(dá)AI芯片勁敵來了!AMD推出MI300X,可運(yùn)行多達(dá)800億參數(shù)模型 |世界熱推薦
發(fā)布時(shí)間:2023-06-14 05:53:32 文章來源:搜狐號(hào)-南財(cái)快訊
蘇姿豐稱,適用于CPU和GPU的版本MI300A現(xiàn)在就已出樣,MI300X和八個(gè)GPU

憑借發(fā)布的新品,AMD正式向英偉達(dá)的AI芯片王者地位發(fā)起挑戰(zhàn)。

美東時(shí)間6月13日周二,AMD舉行了新品發(fā)布會(huì),其中最重磅的新品當(dāng)屬性用于訓(xùn)練大模型的ADM最先進(jìn)GPU Instinct MI300。


(資料圖片)

AMD CEO蘇姿豐介紹,生成式AI和大語言模型(LLM)需要電腦的算力和內(nèi)存大幅提高。她預(yù)計(jì),今年,數(shù)據(jù)中心AI 加速器的市場將達(dá)到300億美元左右,到2027 年將超過1500 億美元,復(fù)合年增長率超過 50%。

蘇姿豐演示介紹,AMD的Instinct MI300A號(hào)稱全球首款針對(duì)AI和高性能計(jì)算(HPC)的加速處理器(APU)加速器。在13個(gè)小芯片中遍布1460億個(gè)晶體管。

它采用CDNA 3 GPU架構(gòu)和24個(gè)Zen 4 CPU內(nèi)核,配置128GB的HBM3內(nèi)存。相比前代MI250,MI300的性能提高八倍,效率提高五倍。AMD在發(fā)布會(huì)稍早介紹,新的Zen 4c內(nèi)核比標(biāo)準(zhǔn)的Zen 4內(nèi)核密度更高,比標(biāo)準(zhǔn)Zen 4的內(nèi)核小35%,同時(shí)保持100%的軟件兼容性。

AMD推出一款GPU專用的MI300,即MI300X,該芯片是針對(duì)LLM的優(yōu)化版,擁有192GB的HBM3內(nèi)存、5.2TB/秒的帶寬和 896GB/秒的Infinity Fabric 帶寬。AMD將1530億個(gè)晶體管集成在共12個(gè)5納米的小芯片中。

AMD稱,MI300X提供的HBM密度最高是英偉達(dá)AI芯片H100的2.4倍,其HBM帶寬最高是H100的1.6倍。這意味著,AMD的芯片可以運(yùn)行比英偉達(dá)芯片更大的模型。

Lisa Su介紹,MI300X可以支持400億個(gè)參數(shù)的Hugging Face AI 模型運(yùn)行,并演示了讓這個(gè)LLM寫一首關(guān)于舊金山的詩。這是全球首次在單個(gè)GPU上運(yùn)行這么大的模型。單個(gè)MI300X可以運(yùn)行一個(gè)參數(shù)多達(dá)800億的模型。

LLM需要的GPU更少,給開發(fā)者帶來的直接好處就是,可以節(jié)約成本。

AMD還發(fā)布了AMD Instinct 平臺(tái),它擁有八個(gè)MI300X,采用行業(yè)標(biāo)準(zhǔn)OCP設(shè)計(jì),提供總計(jì)1.5TB 的HBM3 內(nèi)存。

蘇姿豐稱,適用于CPU和GPU的版本MI300A現(xiàn)在就已出樣,MI300X和八個(gè)GPU的Instinct 平臺(tái)將在今年第三季度出樣,第四季度正式推出。

亞馬遜、微軟、Meta已經(jīng)或?qū)⒁\(yùn)用AMD新品

除了AI芯片,AMD此次發(fā)布會(huì)還介紹了第四代EPYC(霄龍)處理器,特別是在全球可用的云實(shí)例方面的進(jìn)展。

AMD第四代EPYC(霄龍)在云工作負(fù)載的性能是英特爾競品處理器的1.8倍,在企業(yè)工作負(fù)載中的處理速度是英特爾競品的1.9倍。

AMD稱,第四代EPYC(霄龍)啟用新的Zen 4c內(nèi)核,比英特爾Xeon 8490H的效率高1.9倍。由于絕大多數(shù)AI在CPU上運(yùn)行,AMD在CPU AI領(lǐng)域具有絕對(duì)的領(lǐng)先優(yōu)勢。

亞馬遜周二宣布,在用AWS Nitro和第四代EPYC 處理器打造新的實(shí)例。亞馬遜云的EC2 M7a實(shí)例現(xiàn)已提供預(yù)覽版,性能比M6a實(shí)例高50%。

AMD也將在內(nèi)部工作中運(yùn)用EC2 M7a實(shí)例,包括芯片設(shè)計(jì)的EDA軟件。AMD還宣布,今年7月,甲骨文將推出Genoa E5實(shí)例。

AMD發(fā)布的EPYC Bergamo處理器是業(yè)界首款x86原生CPU,有128個(gè)內(nèi)核,每個(gè)插槽256個(gè)線程。這意味著一個(gè)普通的2U 4 節(jié)點(diǎn)平臺(tái)將有 2048 個(gè)線程。

Bergamo比前代Milan的性能高2.5倍,現(xiàn)在就可以向AMD的云客戶發(fā)貨。

Meta的公司代表介紹,Meta在基礎(chǔ)設(shè)施中使用EPYC處理器。Meta也對(duì)基于AMD的處理器設(shè)計(jì)開源。Meta方面稱,計(jì)劃為其基礎(chǔ)設(shè)施使用云處理器Bergamo,還要將Bergamo用于其存儲(chǔ)平臺(tái)。

AMD同時(shí)推出本周二上市的CPU Genoa-X。它將增加超過1GB 的96核L3緩存。它共有四個(gè)SKU,16到 96 個(gè)內(nèi)核。因?yàn)镾P5插槽兼容,所以它可以與現(xiàn)有的EPYC 平臺(tái)一起使用。

微軟的公司代表和AMD一道展示了微軟云Azure HPC的性能,在EPYC處理器的幫助下,Azure四年內(nèi)的性能提升四倍。

Azure宣布,搭載Genoa-X的HBv4和HX系列實(shí)例、以及新的HBv3實(shí)例全面上市。Azure還稱,性能最高可較市面基準(zhǔn)提升5.7倍。

AMD此前通過收購Pensando獲得DPU技術(shù)。此次AMD稱,其P4 DPU架構(gòu)是世界上最智能的DPU,它能減少數(shù)據(jù)中心的網(wǎng)絡(luò)開銷,并提高了服務(wù)器的可管理性。AMD的Pensando SmartNICs是這種新數(shù)據(jù)中心架構(gòu)不可或缺的組成部分。

AMD還提到有自己的AI芯片軟件,名為ROCm。AMD總裁Victor Peng稱,在構(gòu)建強(qiáng)大的軟件堆棧方面,AMD取得了真正的巨大進(jìn)步,ROCm軟件棧可與模型、庫、框架和工具的開放生態(tài)系統(tǒng)配合使用。

標(biāo)簽:

資訊播報(bào)

樂活HOT

娛樂LOVE

精彩推送