中国半导体十大研究进展候选推荐(2021-014)——可演化AI芯片
1
工作简介
清华大学集成电路学院尹首一教授团队在新型人工智能(AI)芯片方向取得突破。该团队设计的可演化AI芯片Evolver,超越传统AI芯片的神经网络推理功能,实现了任务自适应的强化学习和架构重构能力,为机器智能的自我演化提供了硬件基础。2021年2月,该研究成果以“Evolver: A Deep Learning Processor With On-Device Quantization–Voltage–Frequency Tuning”为题发表于集成电路领域顶级期刊IEEE Journal of Solid-State Circuits(JSSC)。
近年来,AI芯片在学术界和工业界被深入研究,广泛应用于智能手机、车载系统、物联网等各种终端设备。当前终端AI芯片的本质是“推理(Inference)”芯片,即运行预先训练好的神经网络模型,完成针对应用场景输入的推理计算。因此,当前终端AI芯片的能力受限于已训练好的神经网络,无法自适应不断变化的任务目标和应用场景。这里的“能力”是多维度的,既包括神经网络的准确度、延时、能耗等指标,也包括模型能完成的智能任务。
可演化AI芯片Evolver在设计时借鉴了大脑的强化学习机制和可塑性结构特点。大脑的神经网络在人的成长过程中持续演化,主要源于以下两个特点:(1)从学习方式上看,大脑通过强化学习(RL)的机制与环境反复交互,逐渐强化适应环境的能力,完成自我演化;(2)从大脑结构上看,新能力的学习体现在神经网络的可塑性。面向任务目标,通过修剪无用的神经突触,增强有用的神经突触,大脑的神经网络持续改变其结构以实现终身学习,提高能力。图1展示了Evolver芯片的自我演化机制:在终端环境变化时,Evolver芯片从环境获取反馈并收集数据,通过自身的学习能力改变网络结构和硬件架构,提高在不同环境下完成智能任务的能力。
在AI芯片上实现自我演化主要有以下难点:(1)如何实现灵活的强化学习机制以适应不同任务目标和应用环境的需求?(2)如何高效计算不同神经网络模型?针对这两大难点,Evolver芯片创新地设计了(1)可配置强化学习引擎以驱动自我演化,通过和环境交互使演化向目标方向调整;(2)可重构计算引擎和片上配置编译器,为神经网络的可塑性提供高效灵活的硬件支撑。Evolver芯片架构和显微照片如图2所示,采用28 nm 1P8M CMOS工艺实现,芯片面积5.64 mm2,峰值性能和能效可以分别在0.137-2.195 TOPS和3.8-172.8 TOPS/W的范围内调节,提供充分的自我演化空间。Evolver的输入和权重精度均支持INT2/4/8比特,其可重构计算引擎通过在线配置可以支持各种网络结构和规模。图3所示的例子中,Evolver芯片以“能效优先”为任务目标,通过强化学习为ResNet34模型搜索最优的“量化位宽-电压-频率”部署方案。随着搜索次数增加,部署方案也不断演化,能效优先综合指标逐步提高。由于强化学习的引导,Evolver的片上自我演化相比于离线调节可以使用更少的搜索次数获得更好的运行效果。当任务目标由“能效优先”更改为“速度优先”等其他目标时,Evolver可以演化出不同的部署策略,实现对任务目标和环境变化的适应能力。
2
作者简介
通讯作者
尹首一,博士,清华大学长聘教授,集成电路学院副院长。
研究方向为可重构计算、人工智能芯片、低功耗设计。在IEEE JSSC、TCAS-I/II、TPDS、TCSVT、TVLSI和ISSCC、VLSI、DAC、ISCA、HPCA等集成电路和体系结构领域权威期刊和学术会议发表论文100余篇。曾获国家技术发明二等奖、中国电子学会技术发明一等奖、中国发明专利金奖、教育部技术发明一等奖。现任IEEE TCAS-I 和 ACM TRETS 编委。
第一作者
涂锋斌,清华大学微纳电子系19届博士,2019年北京市优秀毕业生。
博士论文《神经网络加速器的计算架构及存储优化技术研究》获2019年清华大学优秀博士学位论文。现于美国加州大学圣塔芭芭拉分校从事博士后研究。
3
原文传递
详情查看论文链接:https://ieeexplore.ieee.org/document/9209075
《半导体学报》简介:
《半导体学报》是中国科学院主管、中国电子学会和中国科学院半导体研究所主办的学术刊物,1980年创刊,首任主编是王守武院士,黄昆先生撰写了创刊号首篇论文,2009年改为全英文刊Journal of Semiconductors(简称JOS),同年开始与IOPP英国物理学会出版社合作向全球发行。现任主编是中科院副院长、国科大校长李树深院士。2019年,JOS入选“中国科技期刊卓越行动计划”。2020年,JOS被EI收录。
“中国半导体十大研究进展”推荐与评选工作简介:
《半导体学报》在创刊四十年之际,启动实施 “中国半导体年度十大研究进展”的推荐和评选工作,记录我国半导体科学与技术研究领域的标志性成果。以我国科研院所、高校和企业等机构为第一署名单位,本年度公开发表的半导体领域研究成果均可参与评选。请推荐人或自荐人将研究成果的PDF文件发送至《半导体学报》电子邮箱:jos@semi.ac.cn,并附简要推荐理由。被推荐人须提供500字左右工作简介,阐述研究成果的学术价值和应用前景。年度十大研究进展将由评审专家委员会从候选推荐成果中投票产生,并于下一年度春节前公布。
JOSarXiv预发布平台简介:
半导体科技发展迅猛,科技论文产出数量逐年增加。JOSarXiv致力于为国内外半导体领域科研人员提供中英文科技论文免费发布和获取的平台,保障优秀科研成果首发权的认定,促进更大范围的学术交流。JOSarXiv由《半导体学报》主编李树深院士倡导建立,编辑部负责运行和管理,是国内外第一个专属半导体科技领域的论文预发布平台,提供预印本论文存缴、检索、发布和交流共享服务。
JOSarXiv于2020年1月1日正式上线(http://arxiv.jos.ac.cn/),通过《半导体学报》官网(http://www.jos.ac.cn/)亦可访问。敬请关注和投稿!
文章来源“半导体学报”公众号
欢迎大家提供各类学术会议或学术报告信息,以便广大科研人员参与交流学习。
联系人:李盼 18005575053(微信同号)
联系人:李盼 18005575053(微信同号)