Intel大型神經(jīng)擬態(tài)系統(tǒng)Hala Point集成11.5億神經(jīng)元：可比人腦快200倍

來源：快科技編輯：非小米時(shí)間：2024-04-18 19:06人閱讀

快科技4月18日消息，Intel正式發(fā)布了代號“Hala Point”的新一代大型神經(jīng)擬態(tài)系統(tǒng)，用于類腦AI領(lǐng)域的前沿研究，提升AI的效率和可持續(xù)性。

該系統(tǒng)基于Intel Loihi 2神經(jīng)擬態(tài)處理器，在上代大規(guī)模神經(jīng)擬態(tài)研究系統(tǒng)“Pohoiki Springs”的基礎(chǔ)上，進(jìn)一步改進(jìn)了架構(gòu)，將神經(jīng)元容量提高了10倍以上，達(dá)到史無前例的11.5億個(gè)，大致相當(dāng)于貓頭鷹或卷尾猴的大腦皮層規(guī)模，性能也提高了多達(dá)12倍。

Loihi 2處理器早在2021年就已發(fā)布，首發(fā)采用Intel 4工藝，集成230億個(gè)晶體管、六個(gè)低功耗x86核心、128個(gè)神經(jīng)形態(tài)核心，單顆就有100萬個(gè)神經(jīng)元、1.2億個(gè)突觸，是上代規(guī)模的8倍，性能也提升了10倍。

Loihi 2應(yīng)用了眾多類腦計(jì)算原理，如異步、基于事件的脈沖神經(jīng)網(wǎng)絡(luò)(SNN)、存算一體不斷變化的稀疏連接，而且神經(jīng)元之間能夠直接通信，不需要繞過內(nèi)存。

尤其是在新興的小規(guī)模邊緣工作負(fù)載上，它實(shí)現(xiàn)了效率、速度和適應(yīng)性數(shù)量級的提升。

比如執(zhí)行AI推理負(fù)載和處理優(yōu)化問題時(shí)， Loihi 2的速度比常規(guī)CPU和GPU架構(gòu)快多達(dá)50倍，能耗則只有百分之一。

Intel大型神經(jīng)擬態(tài)系統(tǒng)Hala Point集成11.5億神經(jīng)元：可比人腦快200倍

Hala Point系統(tǒng)的形態(tài)是一個(gè)六機(jī)架的數(shù)據(jù)中心機(jī)箱，大小相當(dāng)于一個(gè)微波爐，內(nèi)置1152顆Loihi 2處理器，共有140544個(gè)神經(jīng)形態(tài)處理內(nèi)核、11.5億個(gè)神經(jīng)元、1280億個(gè)突觸，最大功耗僅為2600瓦。

系統(tǒng)內(nèi)還有2300多顆嵌入式x86處理器，用于輔助計(jì)算。

內(nèi)存帶寬達(dá)16PB/s(16000TB/s)，內(nèi)核間通信帶寬達(dá)3.5PB/s(3500TB/s)，芯片間通信帶寬達(dá)5TB/s，可以每秒處理超過380萬億次的8位突觸運(yùn)算、超過240萬億次的神經(jīng)元運(yùn)算。

Hala Point在主流AI工作負(fù)載上的計(jì)算效率非常出色，比如運(yùn)行傳統(tǒng)深度神經(jīng)網(wǎng)絡(luò)時(shí)，每秒可完成多達(dá)2萬萬億次運(yùn)算(20PFlops)，8位運(yùn)算的能效比達(dá)到了15TOPS/W(每瓦特15萬億次計(jì)算)，相當(dāng)于甚至超過了基于GPU、CPU的架構(gòu)。

在用于仿生脈沖神經(jīng)網(wǎng)絡(luò)模型時(shí)，Hala Point能夠以比人腦快20倍的實(shí)時(shí)速度，運(yùn)行其全部11.5億個(gè)神經(jīng)元。

尤其是在運(yùn)行神經(jīng)元數(shù)量較低的情況下，它的速度甚至可比人腦快200倍！

早期研究結(jié)果表明，通過利用稀疏性高達(dá)10比1的稀疏連接和事件驅(qū)動(dòng)的活動(dòng)，Hala Point運(yùn)行深度神經(jīng)網(wǎng)絡(luò)的能效比可高達(dá)15TOPS/W，同時(shí)無需對輸入數(shù)據(jù)進(jìn)行批處理。

Hala Point系統(tǒng)有望推動(dòng)多領(lǐng)域AI應(yīng)用的實(shí)時(shí)持續(xù)學(xué)習(xí)，比如科學(xué)研究、工程、物流、智能城市基礎(chǔ)設(shè)施管理、大語言模型、AI助手等等。

Intel大型神經(jīng)擬態(tài)系統(tǒng)Hala Point集成11.5億神經(jīng)元：可比人腦快200倍