在过去的几年里,语言的人工智能模型已经变得非常智能了。它们擅长预测文本字符串中的下一个单词,还可以执行似乎需要一定理解才能完成的任务,例如问答、文档摘录和故事续写。
此类模型旨在优化预测文本的特定功能,而不会试图模仿人类大脑如何执行此任务。近日,麻省理工学院神经科学家的一项新研究表明,这些模型的潜在功能类似于人脑中语言处理中心的功能。
在这项新研究中,研究团队使用类似的方法将人脑中的语言处理中心与语言处理模型进行比较。研究人员分析了43种不同的语言模型,其中包括一些对单词进行预测的优化模型。其中包括一个名为GPT-3(生成式预训练 Transformer 3)的模型,它可以根据提示生成类似于人脑处理的文本。其他模型旨在执行不同的语言任务,例如在句子中填空。
由于每个模型都有一串单词,研究人员测量了构成网络节点的活动。然后,他们将这些模式与人类大脑中的活动进行了比较,在执行三种语言任务的受试者中进行测量:听故事、一次读一个句子,以及一次读一个单词的句子。这些人体数据集包括功能磁共振数据和颅内皮层电图测量。
结果表明,性能最好的单词预测模型的活动模式与人脑中的活动模式非常相似。这些相同模型中的活动也与人类行为指标高度相关,例如人们阅读文本的速度。
研究作者Fedorenko说:“我没有预料到,在我有生之年会得到这些清晰的模型。这些模型能够捕捉到足够多的大脑信息,这样我们就可以真正利用它们来理解大脑是如何工作的。”
该研究论文题为“The neural architecture of language: Integrative modeling converges on predictive processing”,已发表在Proceedings of the National Academy of Sciences上。
前瞻经济学人APP资讯组
本文来源前瞻网,转载请注明来源。本文内容仅代表作者个人观点,本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:service@qianzhan.com)