【原】2021年过了大半了，脑机接口取得哪些进展？

脑机接口社区 2021-08-23

展开全文

NextMind's neural controller allows gameplay via a brain-computer interface.

Image Credit: NextMind

2021年虽然已经过去了8个月，但不可否认的是，2021年已经成为脑机接口(BCI)融资创纪录的一年，是2019年9700万美元的三倍。BCI将人类的脑电波转换成机器可以理解的指令，允许人们可以用他们的大脑来操作计算机。就在前几周，埃隆·马斯克(Elon Musk)的BCI公司Neuralink宣布获得2.05亿美元的C轮融资。几天前，另一家BCI公司Paradromics宣布获得2000万美元的种子轮融资。

几乎在同一时间，Neuralink的竞争对手 Synchron宣布已获得 FDA 的突破性批准，可以对其旗舰产品 Stentrode 进行人类患者的临床试验。甚至在获得批准之前，Synchron 的 Stentrode 就已经在澳大利亚进行了临床试验，有四名患者接受了植入物。

Above: Synchron’s Stentrode at work.

然而，许多人对Neuralink 的进展以及 BCI 即将到来的说法持怀疑态度。尽管 BCI 及其应用的定义可能含糊不清，但我建议从不同的角度来解释另一个领域的突破如何使 BCI 的承诺比以前更加切实可行。

BCI的核心是扩展我们人类的能力或补偿失去的能力，例如对瘫痪的人。

这一领域的公司通过两种形式的BCI来实现这一目标——侵入式和非侵入式。在这两种情况下，大脑活动都被记录下来，以将神经信号转换成指令，如用机械臂移动物品、头脑打字或通过意念说话。这些强大翻译背后的引擎是机器学习，它从大脑数据中识别模式，并能够在许多人类大脑中归纳这些模式。

模式识别与迁移学习

将大脑活动转化为行动的能力其实在几十年前就已经实现了。如今，私营企业面临的主要挑战是为大众打造商业产品，让它们能够在不同的大脑中找到共同的信号，并转化为类似的动作，比如表示“移动我的右臂”的脑电波模式。

想要实现这一点，可能微调才能做到。在上面Neuralink的MindPong演示中，恒河猴经过了几分钟的校准，然后模型被微调到他的大脑神经活动模式。我们可以预期这个例程也会发生在其他任务上，尽管在某些情况下，引擎可能足够强大，无需任何微调就能预测正确的命令，这就是所谓的零样本学习(zero-shotlearning)。

幸运的是，人工智能在模式识别方面的研究取得了巨大进步，特别是在视觉、音频和文本领域，产生了更强大的技术和架构，使人工智能应用程序能够泛化。

开创性的论文《Attentionis all you need》，其提出的“Transformer”架构激发了许多其他激动人心的论文。它于 2017 年底发布，带来了跨领域和模式的多项突破，例如谷歌的 ViT、DeepMind 的多模式感知器和 Facebook 的 wav2vec 2.0。每一个都在各自的基准测试中取得了最先进的结果。

基于Transformer模型的Encoder-Decoder模型示意图

Transformer 架构的一个关键特征是其零样本和少样本学习能力，这使得 AI 模型可以泛化。

丰富的数据

最先进的深度学习模型，如上述Google、DeepMind 和 Facebook的模型，需要大量的数据。作为参考，OpenAI著名的GPT-3模型(能够生成类人语言的Transformer)使用45GB的文本进行训练，包括CommonCrawl、WebText2和Wikipedia数据集。

在线数据是推动计算机生成的自然语言应用程序最近爆炸式增长的主要催化剂之一。当然，脑电图(EEG)数据不像维基百科(Wikipedia)页面那么容易获得，但这种情况正在发生改变。

世界各地的研究机构正在发布越来越多的BCI相关数据集，使研究人员可以在彼此的学习基础上进行研究。例如，多伦多大学的研究人员使用了天普大学医院脑电图语料库(TUEG)数据集，该数据集包含了超过10000人的临床记录。在他们的研究中，在他们的研究中，他们使用了一种受谷歌BERT 自然语言Transformer 启发的训练方法来开发一个预训练模型，该模型可以对用各种硬件记录的原始 EEG 序列以及跨各种主题和下游任务进行建模。然后他们展示了这种方法如何产生适合大量未标记 EEF 数据和下游 BCI 应用的表示。

研究实验室收集的数据是一个很好的开始，但在现实世界的应用中可能还不够。如果BCI要加速发展，我们需要看到人们可以在日常生活中使用的商业产品出现。随着OpenBCI这样的项目使人们可以买得起硬件，以及其他商业公司现在向公众推出他们的非侵入性产品，数据可能很快就会变得更容易获取。其中的两个例子包括，去年NextMind为想要在NextMind的硬件和API上编写代码的开发人员推出了一个开发工具包，还有Kernel，它计划发布其非侵入式大脑记录头盔Flow。

硬件和边缘计算

BCI应用程序具有实时操作的限制，比如打字或玩游戏。如果从想法到行动的延迟超过1秒，那么用户体验就会变得难以接受，因为交互将会变得迟缓且不一致(游戏邦注:想想一款延迟1秒的第一人称射击游戏)。

将原始EEG数据发送到远程推理服务器，然后将其解码为具体的动作，并将响应返回给BCI设备，就会引入这种延迟。此外，发送敏感数据(比如你的大脑活动)会带来隐私问题。

最近AI芯片的发展可以解决这些问题。像英伟达和谷歌这样的巨头都在打造更小、功能更强大的芯片，并在边缘进行了优化。这进而可以使BCI设备脱机运行，避免发送数据，消除与之相关的延迟问题。

最后的想法

几千年来，人类的大脑并没有太大的进化，而我们周围的世界在过去的十年里发生了巨大的变化。人类已经达到了一个转折点，它必须增强其大脑能力，以跟上我们周围的技术创新。