文章來源:中國物理學(xué)會(huì)期刊網(wǎng)
原文作者:方璐1,3^吳嘉敏2,3 戴瓊海2,3,
介紹了什么是光電智能計(jì)算架構(gòu)和芯片。
1.引言
當(dāng)前,人工智能技術(shù)的復(fù)興正引領(lǐng)著新一代信息技術(shù)迅猛發(fā)展,由電子驅(qū)動(dòng)的計(jì)算處理器在過去十年中發(fā)生了巨大的變化,從通用中央處理器(CPU)到定制計(jì)算平臺(tái),例如GPU、FPGA和ASIC,以滿足對(duì)計(jì)算資源無處不在的持續(xù)增長(zhǎng)的需求。這些硅計(jì)算硬件平臺(tái)的進(jìn)步催生了更大規(guī)模的訓(xùn)練和更復(fù)雜的模型,極大地促進(jìn)了人工智能(AI)的復(fù)興。我們見證了各種神經(jīng)計(jì)算架構(gòu),例如卷積神經(jīng)網(wǎng)絡(luò)(CNN)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)、脈沖神經(jīng)網(wǎng)絡(luò)(SNN)等,在諸多領(lǐng)域的廣泛應(yīng)用。
然而傳統(tǒng)電子計(jì)算機(jī)的架構(gòu)和性能的發(fā)展趨勢(shì)已經(jīng)無法滿足新一代信息技術(shù)發(fā)展對(duì)計(jì)算資源的需求。隨著先進(jìn)光刻工藝的不斷發(fā)展,晶體管尺寸已經(jīng)縮小到10 nm以下,逐漸逼近原子尺寸,這使得芯片的加工難度以及加工成本呈指數(shù)式上升。與此同時(shí),隨著晶體管密度的增加,趨勢(shì)明顯的漏電流效應(yīng)加劇了芯片熱功耗,對(duì)系統(tǒng)整體散熱能力的需求也不斷上升,已經(jīng)開始成為限制晶體管密度的另一瓶頸。故而,無論是在硬件實(shí)現(xiàn)還是計(jì)算架構(gòu)上,都使得預(yù)測(cè)晶體管制程的摩爾定律難以維系,新型智能計(jì)算架構(gòu)與芯片研究迫在眉睫。
光具有物理空間最快的傳播速度以及多維度(時(shí)間、空間、光譜等)的優(yōu)勢(shì),這些特性使得光計(jì)算成為構(gòu)建下一代高性能計(jì)算的理想范式之一。受益于光計(jì)算的顛覆性優(yōu)勢(shì)(高帶寬、高并行、低功耗),相比電子計(jì)算,光計(jì)算在理論上有望提升6個(gè)數(shù)量級(jí)的能量效率、3個(gè)數(shù)量級(jí)的計(jì)算速度。針對(duì)如何實(shí)現(xiàn)光計(jì)算,國際上已經(jīng)有初步的研究[1,2],一些代表性的技術(shù)包括:基于片上光學(xué)干涉儀網(wǎng)絡(luò)實(shí)現(xiàn)任意矩陣變換[3],基于諧振環(huán)和諧振腔進(jìn)行可編程光計(jì)算[4],基于衍射連接實(shí)現(xiàn)全光神經(jīng)網(wǎng)絡(luò)[5],基于相變材料實(shí)現(xiàn)存內(nèi)光計(jì)算[6]等。然而,現(xiàn)階段的光計(jì)算仍然面臨算力不足、動(dòng)態(tài)計(jì)算困難、訓(xùn)練效率低下等問題,如何實(shí)現(xiàn)大規(guī)模、可重構(gòu)、低功耗的光電計(jì)算芯片并支撐人工智能應(yīng)用仍然面臨原理架構(gòu)、智能算法、集成工藝等諸多難題。
2.光電智能計(jì)算架構(gòu)和芯片研究
2.1 光電智能計(jì)算架構(gòu)
針對(duì)光電智能計(jì)算面臨的規(guī)模與重構(gòu)難題,清華大學(xué)研究團(tuán)隊(duì)提出了可重構(gòu)衍射智能計(jì)算架構(gòu),構(gòu)建了可重構(gòu)衍射智能計(jì)算處理器(DPU)(圖1(a))[7]。DPU對(duì)光學(xué)衍射物理現(xiàn)象進(jìn)行建模,通過大規(guī)模的光學(xué)互聯(lián),構(gòu)建高復(fù)雜度的光學(xué)神經(jīng)網(wǎng)絡(luò)(圖1(b))。此外,DPU充分挖掘了光的波粒二象性,控制光波傳播的波前分布,實(shí)現(xiàn)光神經(jīng)網(wǎng)絡(luò)權(quán)重的調(diào)整,采用光電效應(yīng)來實(shí)現(xiàn)人工神經(jīng)元,解決大規(guī)模光電非線性激活函數(shù)這一理論難題。通過高通量可編程的光電器件結(jié)合電子計(jì)算的靈活特性,實(shí)現(xiàn)了高速數(shù)據(jù)調(diào)控以及大規(guī)模網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)的編程。DPU計(jì)算架構(gòu)中,光計(jì)算模塊幾乎承擔(dān)了所有的計(jì)算操作。因此,運(yùn)行同樣的神經(jīng)網(wǎng)絡(luò),光電計(jì)算系統(tǒng)與特斯拉V100圖形處理器(GPU)相比,計(jì)算速度提高了8倍,系統(tǒng)能效提升超過一個(gè)數(shù)量級(jí),核心模塊計(jì)算能效可以提升4個(gè)數(shù)量級(jí)。
圖1 大規(guī)模多通道光電智能計(jì)算架構(gòu)和訓(xùn)練方法 (a)可重構(gòu)智能計(jì)算處理器;(b)大規(guī)模光學(xué)神經(jīng)網(wǎng)絡(luò)訓(xùn)練;(c)多通道光電神經(jīng)網(wǎng)絡(luò)示意圖
研究團(tuán)隊(duì)進(jìn)一步對(duì)光學(xué)干涉與衍射進(jìn)行聯(lián)合建模,提出了多通道光電神經(jīng)網(wǎng)絡(luò)的新架構(gòu)Monet(multi-channel optical neural NETworks)[8],將多個(gè)光學(xué)通道的光場(chǎng)信息進(jìn)行融合計(jì)算,實(shí)現(xiàn)了基于光電智能計(jì)算的高維光場(chǎng)信息調(diào)制解耦(圖1(c))。其中,編碼投影干涉計(jì)算單元(IU),通過相位和偏振的編碼調(diào)制以及通道間的光學(xué)干涉,實(shí)現(xiàn)特征匹配、加權(quán)求和等多通道光學(xué)基本計(jì)算。IU和衍射計(jì)算單元(DU)的交替級(jí)聯(lián),實(shí)現(xiàn)了光場(chǎng)信息的多通道可重構(gòu)智能計(jì)算。Monet架構(gòu)突破了現(xiàn)有光電神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單、通道受限等瓶頸,為構(gòu)建大規(guī)模光電神經(jīng)網(wǎng)絡(luò)、探索復(fù)雜光場(chǎng)智能感算提供了理論與架構(gòu)支撐。
目前光電智能計(jì)算在高速圖像處理方面有突出表現(xiàn),但現(xiàn)有架構(gòu)難以挖掘高速動(dòng)態(tài)光場(chǎng)的時(shí)間維度特性,動(dòng)態(tài)計(jì)算受制于電子內(nèi)存讀寫的瓶頸,難以滿足面向超快動(dòng)態(tài)現(xiàn)象開展實(shí)時(shí)智能分析的現(xiàn)實(shí)需求。研究團(tuán)隊(duì)提出了空時(shí)域智能光計(jì)算架構(gòu)[9],刻畫多維光場(chǎng)傳播模型,建立空時(shí)域光計(jì)算表征,在空間和時(shí)序維度上同時(shí)完成連續(xù)光計(jì)算(圖2(a))。研究團(tuán)隊(duì)還提出了空間復(fù)用和光譜復(fù)用的智能計(jì)算模型(圖2(b)),匹配空時(shí)域光計(jì)算維度,建立時(shí)序矩陣乘加計(jì)算模型,實(shí)現(xiàn)了三維空時(shí)域智能光計(jì)算。空時(shí)域光計(jì)算的空間和時(shí)序計(jì)算操作均在光學(xué)模擬域完成,突破了數(shù)字內(nèi)存讀寫的掣肘,將動(dòng)態(tài)機(jī)器視覺處理的速度提升了3個(gè)數(shù)量級(jí)(達(dá)到納秒量級(jí))。
圖2 空時(shí)域動(dòng)態(tài)光計(jì)算 (a)空時(shí)域動(dòng)態(tài)光計(jì)算系統(tǒng)示意圖;(b)空時(shí)域動(dòng)態(tài)光計(jì)算模型
現(xiàn)有光電神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)架構(gòu)僅能支撐小規(guī)模訓(xùn)練,其網(wǎng)絡(luò)容量和特征捕獲能力不足以有效處理ImageNet等大型復(fù)雜數(shù)據(jù)集。為了解決大規(guī)模光電神經(jīng)網(wǎng)絡(luò)中優(yōu)化速度慢、資源消耗高、收斂效果差等問題,研究團(tuán)隊(duì)提出了面向大規(guī)模光電智能計(jì)算的“光學(xué)—人工雙神經(jīng)元學(xué)習(xí)架構(gòu)DANTE(DuAl-Neuron opTical-artificial lEarning)[10]。其中光學(xué)神經(jīng)元精準(zhǔn)建模光場(chǎng)計(jì)算過程,人工神經(jīng)元以輕量映射函數(shù)建立跳躍連接,助力梯度傳播,全局人工神經(jīng)元與局部光學(xué)神經(jīng)元以交替學(xué)習(xí)的機(jī)制進(jìn)行迭代優(yōu)化,在確保學(xué)習(xí)有效性的同時(shí),大大降低了訓(xùn)練的時(shí)空復(fù)雜度,使得訓(xùn)練更大更深的光電神經(jīng)網(wǎng)絡(luò)成為可能。DANTE突破了大規(guī)模光電神經(jīng)網(wǎng)絡(luò)物e理建模復(fù)雜、參數(shù)優(yōu)化困難等桎梏,網(wǎng)絡(luò)規(guī)模提升一至兩個(gè)數(shù)量級(jí),訓(xùn)練學(xué)習(xí)速度提升2個(gè)數(shù)量級(jí)。
2.2 全模擬光電智能計(jì)算芯片
在上述系列新架構(gòu)的基礎(chǔ)上,研究團(tuán)隊(duì)研制了國際首個(gè)全模擬光電智能計(jì)算芯片ACCEL(圖3)[11,12],在一枚芯片上突破性地實(shí)現(xiàn)了大規(guī)模計(jì)算單元集成、光計(jì)算與電子信號(hào)計(jì)算的高效接口。其核心思想是通過全模擬的光電計(jì)算方式來降低對(duì)大規(guī)模光電二極管陣列和高功耗模擬數(shù)字轉(zhuǎn)換器(ADC)陣列的依賴,實(shí)現(xiàn)光學(xué)和電子計(jì)算的高效集成。ACCEL的工作原理涉及兩個(gè)主要模塊,即光學(xué)模擬計(jì)算(OAC)和電子模擬計(jì)算(EAC)。OAC通過多層衍射光學(xué)計(jì)算模塊,以光速提取高分辨率圖像的特征,降低圖像維度并減少光電轉(zhuǎn)換需求。EAC包括一個(gè)32×32的光電二極管陣列,作為非線性激活器,將光學(xué)信號(hào)轉(zhuǎn)換為模擬電子信號(hào),實(shí)現(xiàn)類似二進(jìn)制加權(quán)的全連接神經(jīng)網(wǎng)絡(luò)。ACCEL芯片以全模擬方式進(jìn)行計(jì)算,適用于廣泛的應(yīng)用,并與數(shù)字神經(jīng)網(wǎng)絡(luò)兼容。
圖3 全模擬光電智能計(jì)算芯片(ACCEL)工作原理圖
ACCEL通過數(shù)值模擬和實(shí)驗(yàn)驗(yàn)證,在低光條件下展現(xiàn)出優(yōu)異的穩(wěn)健性。對(duì)于輸入光強(qiáng)的降低,ACCEL通過模擬噪聲對(duì)輸出進(jìn)行精準(zhǔn)校準(zhǔn),可以成功應(yīng)對(duì)多種干擾。在可重構(gòu)方面,同一OAC在不同任務(wù)中均取得了顯著效果。通過OAC對(duì)多個(gè)數(shù)據(jù)集的聯(lián)合訓(xùn)練,ACCEL在不同領(lǐng)域的應(yīng)用中取得了出色的泛化性能,為實(shí)際工業(yè)檢測(cè)等場(chǎng)景提供了關(guān)鍵的靈活性。與現(xiàn)有高性能芯片相比,ACCEL芯片的算力(單位時(shí)間的運(yùn)算次數(shù))提升了3000倍,系統(tǒng)級(jí)能效(單位能量可進(jìn)行的運(yùn)算數(shù))提升了400萬余倍。對(duì)于10類MNIST分類和3類ImageNet分類,ACCEL各達(dá)到9.49×103 TOPS/W和7.48×104 TOPS/W (1 TOPS/W表示在1 W功耗的情況下,處理器可以進(jìn)行1012次操作)的系統(tǒng)能效,展示了其在能效方面的優(yōu)越性。ACCEL作為一種全新的光電神經(jīng)網(wǎng)絡(luò),通過其獨(dú)特的設(shè)計(jì)和卓越的性能,在人工智能硬件領(lǐng)域嶄露頭角。其在圖像分類、視頻判斷和低光條件下的穩(wěn)健性等方面的優(yōu)異表現(xiàn),為未來神經(jīng)網(wǎng)絡(luò)研究和應(yīng)用開辟了新的前景。
3.總結(jié)
光電智能計(jì)算作為一種新興計(jì)算范式,將為后摩爾時(shí)代的人工智能高效訓(xùn)練和推理帶來新的契機(jī)。光子智能芯片的研究將極大促進(jìn)人工智能的發(fā)展,為大規(guī)模數(shù)據(jù)的高效智能處理、大場(chǎng)景多對(duì)象光場(chǎng)智能感算、高速低功耗智能無人系統(tǒng)、超高速科學(xué)研究等奠定基礎(chǔ),具有廣闊的應(yīng)用前景。
-
處理器
+關(guān)注
關(guān)注
68文章
19409瀏覽量
231195 -
芯片
+關(guān)注
關(guān)注
456文章
51192瀏覽量
427306 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4781瀏覽量
101176 -
人工智能
+關(guān)注
關(guān)注
1796文章
47683瀏覽量
240305
原文標(biāo)題:光電智能計(jì)算
文章出處:【微信號(hào):bdtdsj,微信公眾號(hào):中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論