“南宫28NG相信品牌力量”清华大学魏少军教授：什么是真正的通用人工智能芯片？|CCF-GAIR2018

更新时间：2024-10-22 16:38:01点击：

本文摘要：，能量效率和计算出来效率不低。

，能量效率和计算出来效率不低。而第一象限，到现在为止很少有人注目——软件定义芯片（SDC），像 RCP、CGRA 等。

它的软件和硬件皆可编程，混合颗粒度，最重要的是芯片功能随软件变化而变化；在用于中也不必须芯片设计科学知识，其能量效率和计算出来效率虽然没专业构建那么低，但也充足低。这是一个全新的领域。CPU 等处理器是标准化低灵活性，但早已转入寡头独占极端，它必须最先进设备的技术，成本高、价格喜，易受生态环境制约；专用集成电路，专用而无灵活性，用量充足的情况下才能低廉；FPGA 标准化低灵活性，和 CPU 差不多。

而我们所说的软件定义芯片，它不不存在寡头独占的问题，也并不需要最先进设备，够先进设备就好，不断扩大用量可以降低成本，不不存在生态问题；它一方面不具备 CPU 的灵活性，另一方面是专用集成电路的高能量效率和高集成度。软件定义芯片却是是一个新名词，那么下一步应当怎么做？我们不告诉人脑如何计算出来和思维，因此我们不能用计算机展开大约地推理小说一下。比如说，我们要有硬件平台，这个硬件平台必需得有低计算能力、多任务并行计算能力、充足的吞吐量、极高的能量效率、灵活性高效的存储、适应环境动态的工作变化，这是承托智能的基础。

而芯片要构建智能化，无法光有硬件，一定要有拒绝很高的软件——自律自学的能力、构成科学知识和经验的能力、持续改良和优化的能力、再造和的组织能力、思维逻辑推理能力、做出准确辨别和决策能力，这是软件才能已完成的，而非硬件。如果有人指出需要硬件上做这一点，那一定走错路了。构建智能的核心是软件，所以再进一步看，我们要的是软件定义的芯片——软件变化时，芯片回来变化。

只不过，美国人也在做到这项工作，比如说美国最近发售的 ERI（电子大力发展计划），其中十分最重要的就是软件定义硬件，它是作为 ERI 项目中的 6 个子课题之一。前段时间，我在旧金山和美国 DARPA（国防高级研究计划局，Defense Advanced Research Projects Agency）的项目经理交流找到，美国之所以要做到这件事，正是因为他们看见了韧融合尤其是硬件可变性沦为未来发展的重点；项目中规划的内容，就是创建一个在运营时可以动态变化的硬件和软件，需要超过专用集成电路的性能，同时对于数据密集型的运算不丧失它的可编程性——这就是软件定义芯片。对我来说，我十分注目所谓的运行时间 “At Runtime”，规定 300-1000 NS，0.3-1 微秒，这个变化的速度极快。

那么，FPGA是软件定义芯片吗？不是。我把 FPGA 的 10 大缺失反复一遍：FPGA 细粒度，构建比特级的运算。配备信息量大，几兆甚至几十兆。

配备时间宽，较少则十几毫秒到几十毫秒，甚至要上秒。静态编程，一旦配备完不能变更，转变 FPGA 的功能要下电或者在线新的写入配备信息。逻辑不能适配，所有电路必需全部取出 FPGA。

面积效率较低，每个 LUT 不能构建一位运算，面积效率只有 5%，一个千万门级的 FPGA 不能构建几十万门的逻辑电路。能量效率较低，由于逻辑利用率较低引起违宪功耗极大。

必须特种工艺，FPGA 往往必须最先进设备的生产工艺，且需对工艺展开尤其调整。电路设计技术，应用于者必需不具备电路设计科学知识和经验。成本高昂，几十到几万美元一片。

所以 FPGA 不是我们想的东西；FPGA 无法当 SdC，不是软件定义芯片。那么，为什么要软件定义芯片？举例说明，做到芯片设计时，老板常常说道“你一定要做到差异化的东西，无法跟别人做到得一样”；于是就在规格（Specification）上做文章——这是几乎错误的思路，差异化并不是靠规格设计出来的。

这样设计出来的差异化只不存在于产品生产量的那一段时间，之后就无法变更；别人追上来，差异化更加小，你的产品之后出局。一个小孩从婴儿茁壮为成年人，中间的茁壮中还包括教育、自学，《三字经》说道“人之初，性本善，性相近，习相远”。

为什么芯片无法这么做到？如果我们的芯片可以在用于过程中大大自学，则差异化可以随着时间的变化而不断加强，这样的芯片才是确实的智能芯片。现在的作法是训练 + 推理小说（训练是老师训练，老师利用以前的科学知识教教我们，我们照老师教教的方式推理小说应用于），这刚好是人工智能发展的过程；如果我们让芯片做这一点，我们可以让芯片做到得更佳。现在，我来讲一下什么是确实的软件定义芯片。

一个确实理想的计算出来应当是软件和硬件的架构一模一样，软件是什么样的流形结构，硬件就应当是怎样的流形结构；软件必须什么样的运算，硬件必须不存在这样的运算资源。惜的是，软件可以相当大，硬件无法大；我们不得已把软件分块，跟硬件大小一样。比如把它分成 6 块，根据数据倚赖关系把第二块、第三块、第四块放进去……仍然到第六块。

这拒绝我们硬件必需随时转变其功能，硬件功能和架构需要动态地按照软件动态展开转变，这是我们所说的软件定义芯片——这只不过是一件十分艰难的事情，我的实验室做到了 12 年才制成。按照这种思路，我们可以很更容易地获得基本架构：我们将区分好的软件通过掌控单元送往所谓的数据通道中，由数据通道来对硬件展开编程；因此，我们的编程结果可以几乎适应环境软件的发展，这拒绝我们硬件和软件几乎可重构、几乎可编程。这是我们的基本思想。

这样的基本思想与传统的计算出来架构之间较为，可以看见：经典的计算出来结构基本上是冯诺依曼的体系结构，但是对于软件定义芯片而言，它是一个函数简化的柔性结构。传统的架构中，应用于适应环境于计算出来结构，你要告诉计算机结构展开编程，而在我们的结构中，计算出来适应环境于应用于，这是推倒过来的，硬件适应环境软件。传统结构中，一个任务只有一个处理软件，不有可能编成 10 个软件；在我们的结构中，一个任务有多个等效处理软件。传统计算出来模式中，硬件和软件恒定，但在我们这里，软软件动态选择性转变。

传统结构中，要高度适配，在我们的结构中，产生校验应用于，这是显然的有所不同。但是，我们没逃出冯诺依曼的体系结构，这是坏事也是好事——坏事是创意过于，好事是计算出来理论的完整性。我们利用这个架构来构建可重构神经网络的的基本点子是：通过 AI 应用于定义我们所搭配的深度神经网络，转变芯片架构和功能。

如果能做，我们某种程度限于一种应用于，我们可以回来应用于大大变化，限于 N 种应用于。这样的芯片是所谓标准化的人工智能芯片。这个基本运算单元有多种不同的能力，我们可以让它做到卷积、池化等各种各样的内容。

利用这种方式，我们还可以构建数据通道，几乎分段。这样的结果是，我们可以把大量不合适硬件做到和硬件做到得很困难的东西，可以一个所谓的 Compiler（不是传统的 Compiler）来构建，大幅提高效率。这里有一个结果，它是我们去年得奖的内容。

这个结果是标准化 AI 处理器，在 10 兆到 200 兆频率下，4mW-450mW，运算速度超过 1.06-5.09TOPS/w。另外一个是我们国际会议上报导过的做到人脸识别的，大于 100mW，每辨识一个只必须 6 个毫瓦时，比人类的人脸识别亲率低 1 个百分点。还有一个是语音信号辨识，还包括语音辨识和声纹识别，其耗电量只有 200 多微瓦。

《MIT Technology Review》今年年初在一篇专稿中评论了我们的工作，指出这是中国获得的皇冠级别的成就，一节电池可以用一年多，被指出是世界上耗电量大于的语音辨识软件。我们早已工作了 12 年，这是我们获得一系列的成绩、论文和专利。

最后完结一下。我们说道，大家都在做到 AI。但是 AI 究竟是什么？我们应当怎么做 AI？哪些地方究竟必须 AI？我们期望 AI 协助我们解决问题什么问题？如果不必须 AI 也可以做到，为什么要 AI？只不过我们没问好这些问题。

现在很多应用于显然不必须 AI，甚至有人用 AI 做到幌子。什么是我们离开了就活不了的 AI 刺客级应用于？语音辨识和人脸识别都必须 AI 吗？不一定，尤其是语音辨识很多时候不必须 AI。当然某些情况下语音辨识是有起到的。什么样的 AI 是我们每天都必须的？这是我们的关键。

前两年很多人指出自己多达了美国，有很多这样的声音“明年就多达英特尔”“再行过 3 年就多达微软公司”，我把他们称作“吓尿体”，他们把美国人吓尿了，最近一段时间，大家都说道我们的芯片遇到相当大艰难，跟前两年不过于一样，于是“吓尿体”变为”被吓尿“了。我们的芯片发展有自己的步骤，我们显然不如美国，但也没像美国某些人说道得那么差劲。当然，我们不像某些人说道得那么好，我们在发展过程中，不要妄自菲薄。

告诉他大家一件事：在软件定义芯片领域中，我们现在大幅度领先美国。我的团队明确提出软件定义芯片技术比美国 ERI 技术早于了 10 年，他明确提出 300-1000 纳秒时间，只是我们现在构建指标的十分之一，我们的性能比它好多了。我现在到国外国际会议上，很多人说道我们是国际上做到得最差的，我们在软件定义上在国际回头在前茅。

总结来说，AI 技术不断进步，目前差距仍然相当大；像人类似的同时作出多个辨别和要求，这样的算法仍未经常出现。我们现在是 IA，还不是 AI；芯片是我们不可逾越的障碍，必需通过芯片构建；而芯片的发展绝不是我们今天想象的，做到一个芯片就是 AI 芯片。要让芯片具备智慧的能力，这是我们确实必须考虑到的事情，不是为了 AI 而 AI。

你想要让 AI 芯片在用于中显得更加“聪慧”，架构创意是不能规避的课题。如果你仍然用 FPGA，不要有过于大的期望，没称霸天下的可能性。

期望大家在芯片发展过程中尤其注目架构的创意，只有架构创意才能把大家送往这个领域的巅峰。谢谢大家！原创文章，予以许可禁令刊登。

下文闻刊登须知。

本文关键词：南宫NG·28,南宫28NG相信品牌力量,南宫NG体育

本文来源：南宫NG·28-www.etmoc.net

上一篇 : 高通研发NanoRings技术，有望在7nm工艺下解决电容问题_南宫NG体育下一篇 : 小米终上市雷军的光环与不被理解_南宫NG体育

“南宫28NG相信品牌力量”清华大学魏少军教授：什么是真正的通用人工智能芯片？|CCF-GAIR2018

相关阅读

推荐文章

热门文章