我们习惯把“内心独白”当作一块只属于自己的地方。那些话语在脑海里出现、消失、写了又写、擦了又擦,但从没落到空气里。
最新的一项脑机接口研究把这道边界往前推了一步。斯坦福大学等机构团队在《Cell》发表论文,报告他们首次在人体上实时解码“内语”(inner speech,简单说就是内心独白)——也就是我们在心里对自己说话的体验。
参与实验的是四位严重言语受限的受试者:有人患有渐冻症,也有人因脑干卒中无法发声。研究团队在他们的大脑运动皮层植入微电极阵列,让受试者“在心里说”词或句。结果显示,即使没有任何口腔和舌部动作,运动皮层仍会出现可区分的放电模式,像是“尝试发声”的弱化版本。换句话说,内语不是纯粹的心理活动,它在大脑里确实留下了可以被机器读到的痕迹。
把这些信号变成文字,团队用了两步:先逐时段预测音素,再由语言模型把音素拼成词句,并以近实时的速度在屏幕上显示。系统在较大词表下已能实现整句在线解码,把词表收小后,错误率会进一步下降。对长期依赖眼动或极慢拼写板交流的人来说,用“在心里说”的方式更省力,也更接近日常表达。
不过,研究也发现了一个边界问题:当参与者在心里数数或执行与语言无关的任务时,解码器有时会捕捉到与节奏相关的信号片段。这并不意味着“读心术”已经成真——自由思考的输出多半还是零散片段,但这提示我们,内语和公开表达之间的界限并非天生稳固。
为了降低误触发,团队尝试了两道“保险”:其一是在训练上让模型默认忽略内语,只对“尝试发声”响应;其二是设置一段极少见的“口令短语”,只有在心里先“说出密码”后系统才会开启(可选用少见或者难混淆的短语)。实验表明,这类“默认关闭+显式开启”的设计能显著减少非预期的输出。
需要强调的是,这仍是一项概念验证。受试者数量有限,个体差异明显;同时,在自由问答、即兴对话等开放场景下,当前系统还难以稳定复原完整句子。但就科学层面而言,它更像是在证明:说话与思考在大脑中的联系比我们以往认知更紧密——运动皮层在“想说话”时,会重播一句话的内部构型,这为未来的言语神经假体提供了方向。
至于前景与伦理,可以简要归纳为两点。其一,短期内它最有希望首先服务于重度言语障碍者,目标是让交流更快、更久、更省力。但要走向日常对话,还需要更稳的硬件、更个性化的语言模型和更低的错误率。另一方面,随着解码能力上升,“心理隐私”应被当作需要特别保护的数据:设备层面坚持“默认关闭+显式开启”、清晰的使用者同意与可撤回机制;算法层面尽量在本地处理、最小化采集;制度层面把“内心独白”的输出权和数据处置权,明确地交还给使用者本人。
当然,无论这项技术最终指向何方,它的未来都正在明晰:如果把“在心里说”变成可读的句子变得更准确、更可控,它就可能为沉默者重新打开沟通之门。但同样重要的是,我们也需要为沉默保留空间:学会开启,也要学会关上。两者一起,或许才是这项技术走向社会时最关键的一步。
参考论文:《Inner speech in motor cortex and implications for speech neuroprostheses》,https://www.cell.com/cell/fulltext/S0092-8674(25)00681-6
封面来源:Road Ahead on Unsplash