更新时间:2024-10-22 16:38:01点击:
,能量效率和计算出来效率不低。而第一象限,到现在为止很少有人注目——软件定义芯片(SDC),像 RCP、CGRA 等。
它的软件和硬件皆可编程,混合颗粒度,最重要的是芯片功能随软件变化而变化;在用于中也不必须芯片设计科学知识,其能量效率和计算出来效率虽然没专业构建那么低,但也充足低。这是一个全新的领域。CPU 等处理器是标准化低灵活性,但早已转入寡头独占极端,它必须最先进设备的技术,成本高、价格喜,易受生态环境制约;专用集成电路,专用而无灵活性,用量充足的情况下才能低廉;FPGA 标准化低灵活性,和 CPU 差不多。
而我们所说的软件定义芯片,它不不存在寡头独占的问题,也并不需要最先进设备,够先进设备就好,不断扩大用量可以降低成本,不不存在生态问题;它一方面不具备 CPU 的灵活性,另一方面是专用集成电路的高能量效率和高集成度。软件定义芯片却是是一个新名词,那么下一步应当怎么做?我们不告诉人脑如何计算出来和思维,因此我们不能用计算机展开大约地推理小说一下。比如说,我们要有硬件平台,这个硬件平台必需得有低计算能力、多任务并行计算能力、充足的吞吐量、极高的能量效率、灵活性高效的存储、适应环境动态的工作变化,这是承托智能的基础。
而芯片要构建智能化,无法光有硬件,一定要有拒绝很高的软件——自律自学的能力、构成科学知识和经验的能力、持续改良和优化的能力、再造和的组织能力、思维逻辑推理能力、做出准确辨别和决策能力,这是软件才能已完成的,而非硬件。如果有人指出需要硬件上做这一点,那一定走错路了。构建智能的核心是软件,所以再进一步看,我们要的是软件定义的芯片——软件变化时,芯片回来变化。
只不过,美国人也在做到这项工作,比如说美国最近发售的 ERI(电子大力发展计划),其中十分最重要的就是软件定义硬件,它是作为 ERI 项目中的 6 个子课题之一。前段时间,我在旧金山和美国 DARPA(国防高级研究计划局,Defense Advanced Research Projects Agency)的项目经理交流找到,美国之所以要做到这件事,正是因为他们看见了韧融合尤其是硬件可变性沦为未来发展的重点;项目中规划的内容,就是创建一个在运营时可以动态变化的硬件和软件,需要超过专用集成电路的性能,同时对于数据密集型的运算不丧失它的可编程性——这就是软件定义芯片。对我来说,我十分注目所谓的运行时间 “At Runtime”,规定 300-1000 NS,0.3-1 微秒,这个变化的速度极快。
那么,FPGA是软件定义芯片吗?不是。我把 FPGA 的 10 大缺失反复一遍:FPGA 细粒度,构建比特级的运算。配备信息量大,几兆甚至几十兆。
配备时间宽,较少则十几毫秒到几十毫秒,甚至要上秒。静态编程,一旦配备完不能变更,转变 FPGA 的功能要下电或者在线新的写入配备信息。逻辑不能适配,所有电路必需全部取出 FPGA。
面积效率较低,每个 LUT 不能构建一位运算,面积效率只有 5%,一个千万门级的 FPGA 不能构建几十万门的逻辑电路。能量效率较低,由于逻辑利用率较低引起违宪功耗极大。
必须特种工艺,FPGA 往往必须最先进设备的生产工艺,且需对工艺展开尤其调整。电路设计技术,应用于者必需不具备电路设计科学知识和经验。成本高昂,几十到几万美元一片。
所以 FPGA 不是我们想的东西;FPGA 无法当 SdC,不是软件定义芯片。那么,为什么要软件定义芯片?举例说明,做到芯片设计时,老板常常说道“你一定要做到差异化的东西,无法跟别人做到得一样”;于是就在规格(Specification)上做文章——这是几乎错误的思路,差异化并不是靠规格设计出来的。
这样设计出来的差异化只不存在于产品生产量的那一段时间,之后就无法变更;别人追上来,差异化更加小,你的产品之后出局。一个小孩从婴儿茁壮为成年人,中间的茁壮中还包括教育、自学,《三字经》说道“人之初,性本善,性相近,习相远”。
为什么芯片无法这么做到?如果我们的芯片可以在用于过程中大大自学,则差异化可以随着时间的变化而不断加强,这样的芯片才是确实的智能芯片。现在的作法是训练 + 推理小说(训练是老师训练,老师利用以前的科学知识教教我们,我们照老师教教的方式推理小说应用于),这刚好是人工智能发展的过程;如果我们让芯片做这一点,我们可以让芯片做到得更佳。现在,我来讲一下什么是确实的软件定义芯片。
一个确实理想的计算出来应当是软件和硬件的架构一模一样,软件是什么样的流形结构,硬件就应当是怎样的流形结构;软件必须什么样的运算,硬件必须不存在这样的运算资源。惜的是,软件可以相当大,硬件无法大;我们不得已把软件分块,跟硬件大小一样。比如把它分成 6 块,根据数据倚赖关系把第二块、第三块、第四块放进去……仍然到第六块。
这拒绝我们硬件必需随时转变其功能,硬件功能和架构需要动态地按照软件动态展开转变,这是我们所说的软件定义芯片——这只不过是一件十分艰难的事情,我的实验室做到了 12 年才制成。按照这种思路,我们可以很更容易地获得基本架构:我们将区分好的软件通过掌控单元送往所谓的数据通道中,由数据通道来对硬件展开编程;因此,我们的编程结果可以几乎适应环境软件的发展,这拒绝我们硬件和软件几乎可重构、几乎可编程。这是我们的基本思想。
这样的基本思想与传统的计算出来架构之间较为,可以看见:经典的计算出来结构基本上是冯诺依曼的体系结构,但是对于软件定义芯片而言,它是一个函数简化的柔性结构。传统的架构中,应用于适应环境于计算出来结构,你要告诉计算机结构展开编程,而在我们的结构中,计算出来适应环境于应用于,这是推倒过来的,硬件适应环境软件。传统结构中,一个任务只有一个处理软件,不有可能编成 10 个软件;在我们的结构中,一个任务有多个等效处理软件。传统计算出来模式中,硬件和软件恒定,但在我们这里,软软件动态选择性转变。
传统结构中,要高度适配,在我们的结构中,产生校验应用于,这是显然的有所不同。但是,我们没逃出冯诺依曼的体系结构,这是坏事也是好事——坏事是创意过于,好事是计算出来理论的完整性。我们利用这个架构来构建可重构神经网络的的基本点子是:通过 AI 应用于定义我们所搭配的深度神经网络,转变芯片架构和功能。
如果能做,我们某种程度限于一种应用于,我们可以回来应用于大大变化,限于 N 种应用于。这样的芯片是所谓标准化的人工智能芯片。这个基本运算单元有多种不同的能力,我们可以让它做到卷积、池化等各种各样的内容。
利用这种方式,我们还可以构建数据通道,几乎分段。这样的结果是,我们可以把大量不合适硬件做到和硬件做到得很困难的东西,可以一个所谓的 Compiler(不是传统的 Compiler)来构建,大幅提高效率。这里有一个结果,它是我们去年得奖的内容。
这个结果是标准化 AI 处理器,在 10 兆到 200 兆频率下,4mW-450mW,运算速度超过 1.06-5.09TOPS/w。另外一个是我们国际会议上报导过的做到人脸识别的,大于 100mW,每辨识一个只必须 6 个毫瓦时,比人类的人脸识别亲率低 1 个百分点。还有一个是语音信号辨识,还包括语音辨识和声纹识别,其耗电量只有 200 多微瓦。
《MIT Technology Review》今年年初在一篇专稿中评论了我们的工作,指出这是中国获得的皇冠级别的成就,一节电池可以用一年多,被指出是世界上耗电量大于的语音辨识软件。我们早已工作了 12 年,这是我们获得一系列的成绩、论文和专利。
最后完结一下。我们说道,大家都在做到 AI。但是 AI 究竟是什么?我们应当怎么做 AI?哪些地方究竟必须 AI?我们期望 AI 协助我们解决问题什么问题?如果不必须 AI 也可以做到,为什么要 AI?只不过我们没问好这些问题。
现在很多应用于显然不必须 AI,甚至有人用 AI 做到幌子。什么是我们离开了就活不了的 AI 刺客级应用于?语音辨识和人脸识别都必须 AI 吗?不一定,尤其是语音辨识很多时候不必须 AI。当然某些情况下语音辨识是有起到的。什么样的 AI 是我们每天都必须的?这是我们的关键。
前两年很多人指出自己多达了美国,有很多这样的声音“明年就多达英特尔”“再行过 3 年就多达微软公司”,我把他们称作“吓尿体”,他们把美国人吓尿了,最近一段时间,大家都说道我们的芯片遇到相当大艰难,跟前两年不过于一样,于是“吓尿体”变为”被吓尿“了。我们的芯片发展有自己的步骤,我们显然不如美国,但也没像美国某些人说道得那么差劲。当然,我们不像某些人说道得那么好,我们在发展过程中,不要妄自菲薄。
告诉他大家一件事:在软件定义芯片领域中,我们现在大幅度领先美国。我的团队明确提出软件定义芯片技术比美国 ERI 技术早于了 10 年,他明确提出 300-1000 纳秒时间,只是我们现在构建指标的十分之一,我们的性能比它好多了。我现在到国外国际会议上,很多人说道我们是国际上做到得最差的,我们在软件定义上在国际回头在前茅。
总结来说,AI 技术不断进步,目前差距仍然相当大;像人类似的同时作出多个辨别和要求,这样的算法仍未经常出现。我们现在是 IA,还不是 AI;芯片是我们不可逾越的障碍,必需通过芯片构建;而芯片的发展绝不是我们今天想象的,做到一个芯片就是 AI 芯片。要让芯片具备智慧的能力,这是我们确实必须考虑到的事情,不是为了 AI 而 AI。
你想要让 AI 芯片在用于中显得更加“聪慧”,架构创意是不能规避的课题。如果你仍然用 FPGA,不要有过于大的期望,没称霸天下的可能性。
期望大家在芯片发展过程中尤其注目架构的创意,只有架构创意才能把大家送往这个领域的巅峰。谢谢大家!原创文章,予以许可禁令刊登。
下文闻刊登须知。
本文来源:南宫NG·28-www.etmoc.net