机器翻译

日期 2018-12-7

基于字典的机器翻译的一个可能用途是促进外语辅导。这可以通过机器翻译技术以及语言学、语义学和形态学来实现,用几乎任何一种语言制作大型词典。从1990年到1996年,词汇语义和计算语言学的发展使自然语言处理得以蓬勃发展,获得了新的能力,但总体上有利于机器翻译。[5]
“词汇概念结构(lcs)是一种与语言无关的表示。它主要用于外语教学,尤其是外语教学中的自然语言处理。lcs也被证明是任何类型的机器翻译都不可或缺的工具,比如基于字典的机器翻译。总体而言,lcs的主要目标之一是证明同义词动词感觉共享分布模式。

“dkvec”是一种从嘈杂的平行语料库中提取双语词典的方法,该方法基于嘈杂的平行语料库中单词的到达距离。这种方法是针对困扰双语词典统计提取的两个问题而出现的:(1)如何使用嘈杂的平行语料库?(2)如何使用不可平行但可比较的语料库?"
事实证明,这种方法对于机器翻译来说是非常有价值的,因为它在英语(日语和英语)和汉语(汉语)平行语料库的试验中取得了惊人的成功。这些数字显示,从一个小的语料库中得到的精度为55.35%,从一个大的语料库中得到的精度为89.93%。有了这么多令人印象深刻的数字,我们就可以安全地假设,像dkvec这样的方法在机器翻译的发展过程中,尤其是基于字典的机器翻译过程中,产生了巨大的影响。
用于以双语格式提取平行语料库的算法利用以下规则,以达到令人满意的准确性和整体质量。
每个语料库都有一种意义
每个语料库都有单一的翻译
目标文件中没有缺少翻译
双语词汇出现的频率相当
双语词汇出现的位置相当
这种方法可以用来生成或查找出现模式,而这些模式又被用来生成dkvec和quot方法所使用的二进制出现向量。

上一篇: 无上一篇
下一篇: 机器翻译发展史