您现在的位置是:网站首页> 内容页

尹守义,清华大学:AI芯片计算架构的创新是实现AIoT|AIoT智能城市峰会的必由之路

  • 乐游平台下载网址
  • 2019-09-28
  • 424人已阅读
简介清华大学尹守义:AI芯片计算架构的创新是实现AIoT|AIoT智能城市峰会的必由之路清华

    清华大学尹守义:AI芯片计算架构的创新是实现AIoT|AIoT智能城市峰会的必由之路

    清华大学尹守义:AI芯片计算架构创新是实现AIoT|AIoT智能城市峰会的必由之路

    12月20日,雷锋在深圳举办了AIT智能城市峰会。在峰会上,清华大学微电子系副主任、微电子研究所副主任尹守义教授就人工智能算法如何在物联网设备上实现人工智能功能以及超高能效人工智能芯片的最新进展发表了看法。尹教授认为,未来在计算体系结构方面的创新将是实现无处不在的AIoT的必然途径。

    物联网芯片中需要解决的核心问题

    今天提到的人工智能的核心技术是深度学习。深度学习的核心技术是神经网络。目前,它已广泛应用于语音辅助、图像检索等人工智能应用中。它的大部分核心计算都是在云中完成的。随着物联网技术的发展,考虑到通信延迟、设备供电和个人隐私等问题,许多场景需要在物联网终端和传感器上实现人工智能计算。

    尹守义教授,清华大学微电子与微电子研究所副所长

    国际产业巨头,如谷歌和ARM,都同意未来的人工智能计算必须是一个分布式、分层和分层的集成系统,这将导致一个巨大的深入学习芯片市场。根据Tractica咨询公司的统计和预测,从2016年到2025年,深度学习芯片市场将快速增长,到2025年将近700亿美元,其中将近400亿美元用于各种移动设备、机器人、无人机、消费电子、可穿戴设备和其他物联网领域。

    然而,尹教授指出,为了满足物联网设备对人工智能的需求,最需要解决的核心问题是物联网方案中人工智能计算要求与供电能力之间的巨大对比。

    尹教授还说,许多物联网应用对芯片功耗都有非常严格的限制,比如我们每天使用的智能手机,用户想随时随地唤醒手机,通过语言自然地进行交互,这就要求手机具有无需智能语音识别的能力。影响电话的耐力。这种人工智能计算可以容忍大约1-2毫瓦的功率限制,否则将影响移动电话的待机时间。此外,在智能家电、智能眼镜、无人机等场景中,人工智能计算也面临着非常严格的功率约束。这是实现未来AI物联网视觉所必须解决的问题。如何在这些苛刻的功率约束下实现超高能效的人工智能计算?

    AIoT AI芯片必须满足的三个条件

    尹教授指出,从应用和用户体验的角度来看,满足AIoT需要的AI芯片必须满足三个条件:

    首先,可编程性是满足不同IoT场景中不同AI算法需求的唯一途径。

    其次,它对于计算密集型算法和内存密集型算法都很友好,因为今天的AI算法具有这样的特性。

    第三,超高能效。在某些情况下,我们希望芯片能耗在毫瓦水平。在某些情况下,我们甚至需要微瓦级来满足长期IoT计算需求。

    超高能效人工智能计算芯片研究进展

    目前,从AIoT芯片发展的角度,我们正在努力从两个不同的维度(算法和体系结构)实现高效的AI计算。算法的发展方向是使深层神经网络模型更加紧凑。尹教授介绍说,自2016年以来,学术界取得了很大进展。目前,神经网络的权位宽度已经减小到1位,这使得网络模型小了10倍甚至几十倍。

    更值得注意的是,在非常低的位网络中,即使网络被压缩到1-2位,其精度仍然接近于全精度神经网络。最新结果表明,压缩神经网络与全精度神经网络之间的误差仅为一个百分点左右,在大多数应用场合中是可以忽略的。

    除了算法层面之外,许多科学家正在从计算体系结构的角度探索如何实现更有效的人工智能计算。从2014年至今,学术界和工业界提出了许多人工智能计算体系结构解决方案。然而,在未来的物联网方案中,所提出的计算架构仍然难以平衡可编程性、超低功耗和特殊网络模型的需求。

    2015年以来,一种新的计算体系结构——粗粒度可重构体系结构(CGRA)引起了国际学术界和工业界的广泛关注。2015年的国际半导体技术路线图(ITRS报告)认为它是未来很有前途的可编程计算体系结构。2017年,美国国防部高级研究计划署(DARPA)发起了“电子复兴计划”,以确保美国在未来国际电子信息领域保持领先地位。该计划积极地制定了一个名为“软件定义硬件”的研究计划。本项目重点研究了CGRA体系结构“运行时快速重构”的硬件体系结构。

    就在几天前,宣布开源MIPS指令集的Wave Computing将在明年在Wave Computing中提供免费的MIPS体系结构。MIPS能在人工智能时代兴起吗?本文以CGRA为AI芯片的技术来源。CGRA由于具有比CPU、GPU和FPGA更高的能量利用率,并且具有良好的可编程性,能够满足AIoT的要求,因此受到广泛关注。

    可重构芯片的实现

    尹教授介绍说,清华大学的可重构计算团队早在2006年就开始关注可重构体系结构。近十年来,在可重构体系结构的基本理论方面进行了大量的探索性工作。2015年以来,可重构体系结构已应用于人工智能计算和神经网络计算场景,并设计了Thinker AI芯片。

    特别地,Thinker AI芯片在使用指令级可编程技术上与传统处理器不同。在核心计算单元、基本处理单元和处理单元阵列三个层次上实现了硬件的可重构性。例如,在基本乘法器累加器中,不同的位宽适合于支持神经网络的超低位宽;在基本处理单元级中,电路级重新配置用于支持神经网络的不同运算器;在处理单元阵列中,实现体系结构级重新配置。支持不同类型的神经网络。

    自2006年以来,尹教授的团队已经设计了三个Thinker芯片,其最大能量效率为每瓦10万亿次操作,最小功耗为微瓦,并且可以嵌入任何需要人工智能计算但电池容量有限的IoT设备中。

    回顾近30年来处理器的发展,半导体技术进步的双轮驱动和计算体系结构的创新使处理器的性能得到了提高。然而,随着摩尔定律的放缓,半导体技术的进步越来越受到限制。尹教授说,去年,图灵奖得主是两位计算机建筑大师,约翰·亨尼西和大卫·帕特森,他们在图灵奖的演讲中提到,今天是计算机建筑新的黄金时代。这句话很好地解释了我们未来的技术创新和产业发展应该放在哪里。

    AIoT智能城市峰会演讲的完整视频集将在雷锋网络成员[AI投资研究乐队]推出,并及时通知您。您可以扫描二维代码以注意[AI到研究状态]。

文章评论

Top