記者從清華大學(xué)獲悉,繼構(gòu)建智能光計算的通用傳播模型、研制全球首款大規(guī)模干涉—衍射異構(gòu)集成芯片“太極”后,該校電子工程系方璐教授課題組、自動化系戴瓊海教授課題組在智能光計算領(lǐng)域獲得新突破:首創(chuàng)全前向智能光計算訓(xùn)練架構(gòu),成功研制“太極-II”通用光訓(xùn)練芯片。該芯片填補了智能光計算在大規(guī)模訓(xùn)練這一核心拼圖中的空白,將與初代“太極”一起合力為AI大模型的訓(xùn)練、推理注入算力發(fā)展的新動力,構(gòu)建光算力的新基座。相關(guān)成果以“光神經(jīng)網(wǎng)絡(luò)全前向訓(xùn)練”為題,于近日發(fā)表于《自然》期刊。
人工智能大模型的迅猛發(fā)展與廣泛應(yīng)用,使得算力成為重大的戰(zhàn)略抓手與基礎(chǔ)設(shè)施。長期以來電子計算芯片的算力增長支撐著AI模型規(guī)模的不斷發(fā)展,然而其高能耗亦帶來了前所未有的能源挑戰(zhàn),新興智能計算范式的建立與發(fā)展迫在眉睫。光具有干涉、衍射等多維計算模態(tài),以光為計算媒介,以光的可控傳播構(gòu)建計算模型,光計算以其高算力低能耗特性打開了智能光計算的新賽道,展現(xiàn)出了巨大潛力。
研究組介紹,訓(xùn)練和推理是AI大模型核心能力的兩大基石,缺一不可。通用智能光計算芯片“太極”的問世首次將光計算從原理驗證推向了大規(guī)模實驗應(yīng)用,為復(fù)雜智能任務(wù)的推理帶來了曙光。然而,初代“太極”尚未釋放智能光計算的“訓(xùn)練之能”。
據(jù)悉,“太極-II”光訓(xùn)練芯片以物理光學(xué)特性為啟發(fā)建立了新型的光訓(xùn)練架構(gòu),克服了計算精度差、訓(xùn)練速度慢、能量效率低的瓶頸,支撐多尺度復(fù)雜光學(xué)系統(tǒng)的高效高精度在線訓(xùn)練。
系統(tǒng)實測結(jié)果表明,“太極-II”智能光訓(xùn)練架構(gòu)在大規(guī)模神經(jīng)網(wǎng)絡(luò)訓(xùn)練、計算成像等方面均表現(xiàn)出卓越性能。它突破了計算精度與效率的矛盾,將數(shù)百萬參數(shù)的光網(wǎng)絡(luò)訓(xùn)練速度提升了1個數(shù)量級,代表性智能分類任務(wù)的準確率提升40%。在非視域等復(fù)雜場景成像應(yīng)用中,實現(xiàn)了千赫茲幀率的計算成像,成像效率提升2個數(shù)量級。這些成果表明,在同等參數(shù)規(guī)模下,相較于圖形處理器(GPU),“太極-II”有望能以十分之一的時間完成AI大模型等大規(guī)模網(wǎng)絡(luò)的訓(xùn)練進程,大幅節(jié)省時間與能源開銷;并能實時解析復(fù)雜場景,為醫(yī)療診斷、工業(yè)檢測、環(huán)境監(jiān)測等領(lǐng)域提供高速精準的解決方案。
據(jù)悉,在原理樣片的基礎(chǔ)上,研究團隊正積極地向智能光芯片產(chǎn)業(yè)化邁進,在多種端側(cè)智能系統(tǒng)上進行應(yīng)用部署。
“智能光計算平臺將逐步登上AI算力舞臺,將能以更低的資源消耗和更小的邊際成本,為人工智能大模型、通用人工智能、復(fù)雜智能系統(tǒng)的高速高能效計算開辟新路徑?!贝鳝偤Uf。(記者鄧暉)