由杜克大学神经科学家、神经外科医生和工程师组成的协作团队开发的言语假肢可以将人的大脑信号转化为他们想要说的话。
这项新技术于 11 月 6 日发表在《自然通讯》杂志上,有一天可能会帮助因神经系统疾病而无法说话的人们重新获得通过脑机接口进行交流的能力。
杜克大学神经病学教授格雷戈里·科根博士说:“许多患者患有肌萎缩侧索硬化症或闭锁综合症等使人衰弱的运动障碍,这会损害他们的说话能力。”医学院和参与该项目的主要研究人员之一。“但目前允许他们进行通信的工具通常非常缓慢且繁琐。”
想象一下以半速听有声读物。这是目前可用的最佳语音解码速率,约为每分钟 78 个单词。然而,人们每分钟说大约 150 个单词。
说出和解码的语速之间的滞后部分是由于可以融合到大脑表面的纸薄材料上的大脑活动传感器相对较少。传感器越少,提供的可解读信息就越少。
为了改善过去的局限性,科根与杜克大学脑科学研究所的教员乔纳森·维文蒂博士合作,他的生物医学工程实验室专门制造高密度、超薄和灵活的大脑传感器。
在这个项目中,Viventi 和他的团队将令人印象深刻的 256 个微型大脑传感器封装在一张邮票大小的柔性医用级塑料上。相距一粒沙的神经元在协调语音时可能具有截然不同的活动模式,因此有必要区分来自邻近脑细胞的信号,以帮助准确预测预期的语音。
制造出新的植入物后,Cogan 和 Viventi 与杜克大学医院的几位神经外科医生合作,包括医学博士德里克·索斯韦尔 (Derek Southwell)、医学博士南丹·拉德 (Nandan Lad) 和医学博士艾伦·弗里德曼 (Allan Friedman),他们帮助招募了四名患者测试植入物。该实验要求研究人员将该设备暂时放置在因其他疾病(例如治疗帕金森病或切除肿瘤)而接受脑部手术的患者体内。Cogan 和他的团队在手术室中测试设备的时间有限。
我喜欢将其与 NASCAR 维修站工作人员进行比较。我们不想给操作程序增加任何额外的时间,所以我们必须在 15 分钟内进出。当外科医生和医疗团队说“出发!”时我们立即采取行动,患者完成了任务。”
Gregory Cogan 博士,杜克大学医学院神经病学教授
该任务是一个简单的聆听和重复活动。参与者听到一系列无意义的单词,如“ava”、“kug”或“vip”,然后大声说出每个单词。该设备记录了每个患者言语运动皮层的活动,因为它协调了近 100 块移动嘴唇、舌头、下巴和喉部的肌肉。
随后,新报告的第一作者、杜克大学生物医学工程研究生 Suseendrakumar Duraivel 从手术套件中获取了神经和语音数据,并将其输入到机器学习算法中,看看它能够如何准确地预测正在发出的声音。仅根据大脑活动记录制作。
对于某些声音和参与者,例如单词“gak”中的 /g/,当它是构成给定无意义单词的三个字符串中的第一个声音时,解码器的正确率是 84%。
然而,当解码器解析出无意义单词中间或末尾的声音时,准确性会下降。如果两个声音相似,比如 /p/ 和 /b/,它也会遇到困难。
总体而言,解码器的准确率为 40%。这看起来似乎是一个不起眼的测试分数,但考虑到类似的大脑到语音的技术壮举需要数小时或数天的数据来提取,这个分数相当令人印象深刻。然而,Duravel 使用的语音解码算法仅处理 15 分钟测试中 90 秒的语音数据。
Duraivel 和他的导师对利用美国国立卫生研究院最近提供的 240 万美元拨款来制造该设备的无线版本感到非常兴奋。
“我们现在正在开发相同类型的录音设备,但没有任何电线,”科根说。“你可以四处走动,而不必绑在电源插座上,这真的很令人兴奋。”
虽然他们的工作令人鼓舞,但维文蒂和科根的语音假肢要尽快上架还有很长的路要走。
维文蒂在杜克杂志最近发表的一篇有关该技术的文章中表示:“我们正处于比自然语音慢得多的阶段,但你可以看到你可能达到这一目标的轨迹。”
这项工作得到了美国国立卫生研究院 (R01DC019498、UL1TR002553)、国防部 (W81XWH-21-0538)、Klingenstein-Simons 基金会和杜克脑科学研究所孵化器奖的资助。