Intel大型神經(jīng)擬態(tài)系統(tǒng)Hala Point集成11.5億神經(jīng)元:可比人腦快200倍
快科技4月18日消息,Intel正式發(fā)布了代號“Hala Point”的新一代大型神經(jīng)擬態(tài)系統(tǒng),用于類腦AI領(lǐng)域的前沿研究,提升AI的效率和可持續(xù)性。
該系統(tǒng)基于Intel Loihi 2神經(jīng)擬態(tài)處理器,在上代大規(guī)模神經(jīng)擬態(tài)研究系統(tǒng)“Pohoiki Springs”的基礎(chǔ)上,進(jìn)一步改進(jìn)了架構(gòu),將神經(jīng)元容量提高了10倍以上,達(dá)到史無前例的11.5億個(gè),大致相當(dāng)于貓頭鷹或卷尾猴的大腦皮層規(guī)模,性能也提高了多達(dá)12倍。
Loihi 2處理器早在2021年就已發(fā)布,首發(fā)采用Intel 4工藝,集成230億個(gè)晶體管、六個(gè)低功耗x86核心、128個(gè)神經(jīng)形態(tài)核心,單顆就有100萬個(gè)神經(jīng)元、1.2億個(gè)突觸,是上代規(guī)模的8倍,性能也提升了10倍。
Loihi 2應(yīng)用了眾多類腦計(jì)算原理,如異步、基于事件的脈沖神經(jīng)網(wǎng)絡(luò)(SNN)、存算一體不斷變化的稀疏連接,而且神經(jīng)元之間能夠直接通信,不需要繞過內(nèi)存。
尤其是在新興的小規(guī)模邊緣工作負(fù)載上,它實(shí)現(xiàn)了效率、速度和適應(yīng)性數(shù)量級的提升。
比如執(zhí)行AI推理負(fù)載和處理優(yōu)化問題時(shí), Loihi 2的速度比常規(guī)CPU和GPU架構(gòu)快多達(dá)50倍,能耗則只有百分之一。


Hala Point系統(tǒng)的形態(tài)是一個(gè)六機(jī)架的數(shù)據(jù)中心機(jī)箱,大小相當(dāng)于一個(gè)微波爐,內(nèi)置1152顆Loihi 2處理器,共有140544個(gè)神經(jīng)形態(tài)處理內(nèi)核、11.5億個(gè)神經(jīng)元、1280億個(gè)突觸,最大功耗僅為2600瓦。
系統(tǒng)內(nèi)還有2300多顆嵌入式x86處理器,用于輔助計(jì)算。
內(nèi)存帶寬達(dá)16PB/s(16000TB/s),內(nèi)核間通信帶寬達(dá)3.5PB/s(3500TB/s),芯片間通信帶寬達(dá)5TB/s,可以每秒處理超過380萬億次的8位突觸運(yùn)算、超過240萬億次的神經(jīng)元運(yùn)算。
Hala Point在主流AI工作負(fù)載上的計(jì)算效率非常出色,比如運(yùn)行傳統(tǒng)深度神經(jīng)網(wǎng)絡(luò)時(shí),每秒可完成多達(dá)2萬萬億次運(yùn)算(20PFlops),8位運(yùn)算的能效比達(dá)到了15TOPS/W(每瓦特15萬億次計(jì)算),相當(dāng)于甚至超過了基于GPU、CPU的架構(gòu)。
在用于仿生脈沖神經(jīng)網(wǎng)絡(luò)模型時(shí),Hala Point能夠以比人腦快20倍的實(shí)時(shí)速度,運(yùn)行其全部11.5億個(gè)神經(jīng)元。
尤其是在運(yùn)行神經(jīng)元數(shù)量較低的情況下,它的速度甚至可比人腦快200倍!
早期研究結(jié)果表明,通過利用稀疏性高達(dá)10比1的稀疏連接和事件驅(qū)動(dòng)的活動(dòng),Hala Point運(yùn)行深度神經(jīng)網(wǎng)絡(luò)的能效比可高達(dá)15TOPS/W,同時(shí)無需對輸入數(shù)據(jù)進(jìn)行批處理。
Hala Point系統(tǒng)有望推動(dòng)多領(lǐng)域AI應(yīng)用的實(shí)時(shí)持續(xù)學(xué)習(xí),比如科學(xué)研究、工程、物流、智能城市基礎(chǔ)設(shè)施管理、大語言模型、AI助手等等。

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com



