亚洲无精品一区二区在线观看-少妇无码一区二区三区免费-AAAAAA级裸体美女毛片-99桃花在线无码国产毛片视频-亚洲一区二区三区18-精品久久婷婷免费视频-在线观看免费欧美精品-久久国产丝袜高清视频-欧美熟妇极品在线看片

科研工作

當前位置 >>

微電子所在大模型神經(jīng)網(wǎng)絡(luò)注意力加速器研究上取得進展

稿件來源：重點實驗室呼紅陽張康瑋發(fā)布時間：2025-09-18

基于Transformer神經(jīng)網(wǎng)絡(luò)的大模型（BERT、GPT等）的廣泛應(yīng)用，讓機器具備了更接近人類的理解和表達能力，體現(xiàn)了人工智能在提高生產(chǎn)力上的巨大潛力。注意力機制在Transformer的計算能耗和延遲中起重要作用，針對注意力機制設(shè)計高能效和高速的加速器具有較高的研究意義。但現(xiàn)有注意力加速器的硬件架構(gòu)中存在兩個主要局限性，首先，常用的輸入固定、權(quán)重固定以及輸出固定的脈動陣列架構(gòu)無法在數(shù)據(jù)復用、寄存器使用和利用率之間取得平衡；其次，逐層計算的操作順序?qū)е轮虚g結(jié)果的 SRAM 訪問開銷過高。這些局限阻礙了加速器能效和速度進一步提升。

為應(yīng)對上述挑戰(zhàn)，中國科學院微電子研究所集成電路制造技術(shù)全國重點實驗室科研團隊設(shè)計了一種高能效、高利用率注意力加速器硬件架構(gòu)。該架構(gòu)采用內(nèi)外積混合的 “平衡脈動陣列”（Balanced Systolic Array）結(jié)構(gòu)。團隊基于數(shù)據(jù)復用理論公式指導，確定最佳的內(nèi)外積混合陣列形狀，其能效相比傳統(tǒng)脈動陣列提升了40%，利用率達99.5%。在操作流程上，團隊提出了“多行交織”（Multi-Row Interleaved）的操作順序，使 SRAM 能耗降低了 31.7%。基于上述兩種技術(shù)，團隊設(shè)計的注意力加速器在能效方面提升了39%，在吞吐量×能效方面較現(xiàn)有工作提升了38%。

此項研究成果以“An Energy-Efficient High-Utilization Hardware Architecture for Attention Mechanism in Transformer using Balanced Systolic Array and Multi-Row Interleaved Operation Ordering”為題在第62屆國際設(shè)計自動化會議（DAC）上進行了口頭報告。碩士研究生周海洋為第一作者，呼紅陽助理研究員為通訊作者。

該工作獲得了國家自然科學基金青年基金項目和基礎(chǔ)科學中心項目的資助。

、

圖1.?傳統(tǒng)注意力加速器的局限性

圖2. 提出的平衡脈動陣列結(jié)構(gòu)

附件：

中國科學院微電子研究所版權(quán)所有郵編：100029
單位地址：北京市朝陽區(qū)北土城西路3號，電子郵件：webadmin@ime.ac.cn
京公網(wǎng)安備110402500036號，京ICP備05002781號-1