邊緣端人工智能(AI)硬件憑借其低延遲、高能效和強隱私性等優(yōu)勢,得到廣泛關注與應用。在功耗嚴格受限的邊緣端部署AI硬件,不僅需要高能效以滿足功耗約束,還需要高并行度以提升實時性能。基于阻變存儲器(RRAM)的存算一體和近閾值計算作為兩種高效能計算范式,有望在實現(xiàn)高能效、高并行的AI硬件中發(fā)揮關鍵作用。然而,受工藝波動的影響,這兩種計算范式的規(guī)模與可擴展性仍面臨挑戰(zhàn)。此外,如何有效結合這兩種范式以開發(fā)低功耗、高并行的AI硬件,目前仍缺乏深入研究。
針對上述挑戰(zhàn),中國科學院微電子研究所集成電路制造技術全國重點實驗室科研團隊設計并實現(xiàn)了一款基于近閾值計算的RRAM存算一體芯片。團隊利用雙晶體管單阻變存儲器(2T1R)單元,將RRAM的阻變特性轉化為閾值電壓調(diào)控特性,提出RRAM-CMOS閾值電壓失配抵消技術,有效抑制了長期困擾兩種計算范式的工藝波動問題。針對網(wǎng)絡模型多比特乘累加運算的需求,團隊提出了基于電荷堆疊的新型電荷域計算技術,實現(xiàn)了一種采樣、加權與量化一體化模數(shù)轉換電路,顯著降低了外圍電路的功耗與面積開銷。團隊在多核存算一體系統(tǒng)中引入了核間混合精度控制技術,通過對神經(jīng)網(wǎng)絡各層數(shù)據(jù)特征進行分析,為每個計算核心配置優(yōu)化的累加與量化方法,實現(xiàn)了任務級推理功耗的高效優(yōu)化。
基于上述設計,團隊成功流片驗證了具有16個計算核心的近閾值RRAM存算一體芯片。該芯片可實現(xiàn)256通道累加的高并行模擬計算,平均相對標準差低至2.4%,計算能效可達55.21至88.51 TOPS/W。本研究展示了高能效、高并行近閾值RRAM存算一體技術,為邊緣AI硬件的發(fā)展提供了新思路。
本研究以"A near-threshold memristive computing-in-memory engine for edge intelligence"為題發(fā)表在《Nature Communications》期刊(論文鏈接:https://www.nature.com/articles/s41467-025-61025-4)。微電子所博士畢業(yè)生王琳方博士,微電子所博士研究生李偉增及周治道為共同第一作者,微電子所竇春萌研究員為通訊作者。該研究得到了復旦大學、中國科學院計算技術研究所、中國科學院軟件研究所等多個合作單位的大力支持與協(xié)作。

?圖1. (a)芯片顯微照片、關鍵結構和近閾值計算方案;(b)RRAM-CMOS閾值電壓失配抵消技術;(c)采樣、加權與量化一體化模數(shù)轉換技術;(d)核間混合精度控制技術。
| 相關新聞: |
| 微電子所在GaN外延位錯傳導載流子及其導致功率電子器件可靠性退化機制取得重要進展 |
| 微電子所兩項研究工作入選2025年國際微波會議(IMS2025) |
| 微電子所在EUV光刻收集鏡紅外輻射抑制方面取得新進展 |
學習園地