Loading… 更深入透彻!清华发表最新综述,分析破解神经机器翻译三大难题_TOM资讯
正文
Qzone
微博
微信

更深入透彻!清华发表最新综述,分析破解神经机器翻译三大难题

2021-03-17 17:13 前瞻网   

机器翻译(MT)是自然语言处理领域的一个重要分支,旨在利用计算机翻译自然语言。近年来,端到端神经机器翻译(NMT)取得了巨大的成功,已成为实际机器翻译系统中新的主流方法。

在他们的最新综述中,清华大学多位作者首先对深度学习的神经机器翻译技术(neural machine translation,简称 NMT)的方法进行了广泛的回顾,并重点介绍了与体系结构、解码和数据增强相关的方法。然后总结了可供研究者参考的资源和工具。最后,对未来可能的研究方向进行了讨论。

更深入透彻!清华发表最新综述,分析破解神经机器翻译三大难题

论文资料显示,清华大学计算机系教授、欧洲科学院外籍院士孙茂松与清华智能产业研究院副院长、国家杰青刘洋是该论文的两位教师作者。

作为一种数据驱动的机器翻译方法,NMT还包含了概率框架。从数学上讲,NMT的目标是在给定数据集的情况下估计一个未知的条件分布,其中和分别是表示源输入和目标输出的随机变量。他们在论文中回答了NMT遇到的三个基本问题:

建模(modeling)。如何设计神经网络来模拟条件分布?

推理(inference)。给定一个源输入,如何从NMT模型生成翻译句子?

学习(learning)。如何有效地从数据中学习NMT所需的参数?

在这篇综述中,他们首先描述了NMT解决上述三个问题的基本方法。然后,深入讨论NMT架构的细节。他们引入了非自回归NMTs和双向推断,并讨论了替代训练目标和使用单语数据。

译/前瞻经济学人APP资讯组

本文来源前瞻网,转载请注明来源。本文内容仅代表作者个人观点,本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:service@qianzhan.com)

 

责任编辑: 4114RWL

责任编辑: 4114RWL
广告