当AI遇上闪存，一种全新的运算架构诞生了

懒人葛优瘫 2018-05-22

展开全文

有几十个工程师挤在美国德州奥斯汀(Austin)近郊重划区的咖啡店与美容院之间，探索运算技术的新方向──这是一家名为Mythic的新创公司，目标是将神经网络映像至NOR闪存数组，以或许可节省两个数量等级功耗的方式来运算与储存数据。

如果他们成功了，这家新创公司就可跳过来自诸如英特尔(Intel)或是其他IP供应商、以及众多富裕中国新创公司的数字处理器与核心；这些处理器的目标都是进驻下一代保全摄影机、无人机、工厂设备等试图搭上人工智能(AI)热潮的嵌入式系统，甚至是未来的自动驾驶车辆。

“我们从研究所的时候就知道，混合信号处理很适合这类应用；”与同事Mike Henry在密歇根大学(University of Michigan)一起创立Mythic的David Fick表示：“你需要利用其可调阈值电压来储存很大的数据量与闪存──每个晶体管都非常具吸引力。”

Mythic所开发的闪存数组，基本上可免除将数据从外部内存移出移入的需要，因此大幅节省功耗；Fick表示，他的指导教授David Blaauw与Dennis Sylvester“已经展开一些闪存研究，我们也拥有一些专长技术，因此能很轻易地加速启动一个项目。”

不过要在内存中执行模拟处理器这种有数十年历史的老概念是件棘手任务，Fick表示：“你必须考虑很多模拟效应──不匹配(mismath)、噪声、温度，而且内存单元也有很多类似的显著效应；”不同于配备经过妥善定义之内存、处理与储存子系统的数字计算机，机器学习使用的模拟计算机基本上是一个整合性的庞大工程。

“你需要同时一起设计所有的东西，因此需要了解重迭领域的人，例如了解彼此领域的组件端设计与神经网络设计工程师；”Fick解释：“我们在这方面已经远胜于其他人，因为我们拥有一个可以完成整个任务的超强团队。”

确实，这家公司才刚完成B轮融资、获得一笔高达5,000万美元的资金，有部分原因是他们拥有一个总监等级(director-level)专家组成的多元团队，包括来自德州仪器(TI)的模拟专家、Microchip的闪存设计总监，以及Netronome的实体设计专家。

当AI遇上闪存，一种全新的运算架构诞生了

Dave Fick与他的宠物狗Ellie在奥斯汀办公室合影；Ellie是Mythic这家公司的非正式情绪支持总监（来源：EE Times）

Mythic也藉由实现一系列的原型投片逐步展现其技术进展赢得投资者青睐，Fick在学校里的VLSI设计表现就赢得不少声誉；他表示：“当你以研究所学生身份设计芯片，包括内存、合成、设计规则检查变异(DRC variations)…等所有的步骤都得自己动手；而如果你是直接进入业界，你可能永远看不到整个设计流程，所以很多从学校独立的新创公司会更容易成功量产。”

这家公司的两个创办人从小就是“科技宅男”(geek)；Fick在高中时的第一份工作就是网页开发工程师，念研究所时则进入AMD、IBM与Intel等多家大公司当实习生。Henry则是为了好玩，很爱参加各种快速写程序竞赛。

大大小小的竞争对手以及需要克服的软件障碍

这些日子以来，Mythic的二人组遇到大大小小的竞争对手，至少有40家老牌与新创IP供应商或芯片业者，纷纷表示准备推出或是正在规划某种形式的客户端AI加速器芯片；这些竞争对手还包括中国几家财力雄厚的新创公司，例如地平线(Horizon Robotics)就是其中最具潜力的一家，已经用较传统的数字架构推出低功耗客户端AI加速器。

还有一家美国新创公司Syntiant，跟Mythic一样在开发利用闪存的内存内处理器(processor-in-memory)架构，该公司的团队成员包括几位Broadcom前任工程经理，并获得了Intel Capital的支持。此外IBM Research也正在研究以电阻式RAM (ReRAM)为基础的机器学习加速器，但Fick认为该公司采用了错误的方法。

他表示：“他们正在尝试以完美的内存来让所有事情变得简单，但我们是透过共同设计所有东西取得领先…就算他们找到了理想内存，总是会有一种不太完美的内存可以支持更低功耗或是更快速度。”

创新的并行储存器在历史上总因为太难编程而失败，新兴的内存内处理器芯片肯定也会面临相同的问题，因为机器学习本身需要全新的、仍在发展的编程模型。Mythic的工具虽名为开发平台，但扮演的角色像是编译程序，能为其芯片将TensorFlow数据库内描述的神经网络转换为机器语言。

Fick表示，该开发平台采用PCI Express与芯片链接，能提供“如何从芯片取得额外性能的提示，以及一些常见应用的优化网络范例。”想要使用TensorFlow以外其他框架的客户，显然会需要使用ONNX格式来转译其任务；ONNX (Open Neural Network Exchange)是少数几种用来转译几个不同AI软件架构的新兴工具之一。

而Fick也充分体认到他的客户所面临之软件障碍：“为了进入这个领域，你需要聘请几个深度学习科学家，但这类专家因为非常短缺、费用也非常昂贵 …建立数据集与神经网络并进行训练非常耗时、代价也很高…这些都是冒险进军且投资此领域的限制。”

好消息是，与竞争对手方案相较，Mythic芯片的内存数组应该能处理更多样化的卷积(convolutional)或归递(recurrent)神经网络，而且其性能的提升可望实现在功耗受限制的边缘系统执行更复杂模型。

当AI遇上闪存，一种全新的运算架构诞生了