首页  »  科学  »  科学探索

计算机翻译技不如人:制约译文质量瓶颈何在?

计算机翻译技不如人:制约译文质量瓶颈何在?

2012-11-16 10:02:48

  1947年,美国数学家、工程师沃伦·韦弗与英国物理学家、工程师安德鲁·布思提出了以计算机进行翻译(简称“机译”)的设想,机译从此步入历史舞台,并走过了一条曲折而漫长的发展道路。此后65年来,机译成了国际学界、商界甚至军界共同角逐的必争之地。

  机译是涉及语言学、数学、计算机科学和人工智能等多种学科和技术的综合性课题,被列为21世纪世界十大科技难题。与此同时,机译技术也拥有巨大的应用需求,随着经济全球化和互联网时代的发展,克服语言障碍,成为国际社会共同面对的挑战。

  从上世纪80年代中期开始,基于语料和多引擎机译方法的广泛运用,机译系统的性能和效率有了明显提高,各式各样的翻译软件如雨后春笋般问世,而互联网的普遍应用,则使在线翻译成了当今机译的重头戏。

  机译分为文字机译和语音机译。在文字机译方面,谷歌目前处于领先地位。它可提供65种主要语言之间的即时翻译,包括字词、句子、文本和网页翻译。谷歌的文字机译主要是以机器学习为基础,构建统计翻译模型;往计算机内输入大量的文字文本,通过海量统计数据来提高译文的精确度。谷歌的成就主要得益于统计学方法和云计算技术。英国《经济学家》周刊最近刊发的一份报告称,谷歌一天的机译量,相当于全球一年人工翻译的总量。目前,每个月都有两亿多人在使用谷歌的在线翻译。

  在语音机译方面,谷歌目前也处于领先地位:它可以通过声音实现自动检索,再将语音交互技术和机译技术结合在一起。时下流行的安卓智能手机就具有这种较强的语音机译功能。据美国《探索频道》报道,微软最近研发的语音翻译软件,可以将用户所说的话快速翻译成其他听者的母语,而且还能保留用户的口音、音色和语调,听上去就像用户亲口说的一样。

  机译消除了不同文字和语言间的隔阂,堪称高科技造福人类之举。但机译的质量长期以来一直是个问题。美国发明家、作家、未来学家雷·科兹威尔前不久在接受网络媒体《赫芬顿邮报》采访时说:“到2029年,机译译文质量将达到人工翻译的水准。”不过,也有机译专家表示,按照著名的“图灵测试”和“摩尔定律”,机译译文质量或许下世纪才能达到人工翻译的水准。因为机译的若干理论难题至今都没有从根本上得到解决,某些方法和技术也没有实质性的改进;机译系统的性能还不尽如人意,尤其是译文质量,离理想目标仍相差甚远。中国数学家周海中认为,在人类尚未明了大脑是如何进行语言的模糊识别和逻辑判断的情况下,机译要想达到“信、达、雅”的程度是不可能的。这一观点恐怕道出了制约译文质量的瓶颈所在。(新华网)

  • 相关阅读
  • 智能手机“瓶颈期”已经到来

      和传统PC市场曾经面临的情况一样,目前智能手机硬件性能的发展速度已经远远超过了软件应用创新的速度,这使得用户因为硬件提升而产生换机需求的动力将会大大减退,这对于智能手机产业来说无疑是一种危险的信号。...

    时间:11-15
  • 刘慈欣《三体》将出英文版刘宇昆参与翻译

      今天下午,《三体》三部曲译者签约仪式将在北京举行。  消息一透露,就在科幻迷中炸开了锅。  2006年,“中国科幻第一人”刘慈欣的长篇小说《三体1》出版,中国科幻文学进入了“三体纪元&rdq...

    时间:11-07
  • 用户体验是智能电视成为数字家庭中心瓶颈

      近日,在第九届“中国光谷”国际光电子博览会暨论坛现场(以下简称“光博会”),联想集团携旗下K系列以及刚刚上市的S系列智能电视再度闪耀亮相,一面巨大的“Lenovo牌”电视墙成为...

    时间:11-05
  • Android恶意程序或制约进一步发展

      据安全公司 TrustGo 最新数据表明,Android上恶意应用数量自 2011 年 9 月到 2012 年 9 月增长了 580%,Google Play 中排行前 500 的应用中有 23 款存在安全漏洞,而这些高危应用在该时间段内的下载数已经超过 1...

    时间:11-05
  • 最新计算机汉字录入新纪录诞生:每分钟674字

      曾被认为不适应计算机时代的汉字,如今却成为最适合计算机录入的文字之一。最新的计算机汉字录入纪录是每分钟674字,由北京吉利大学学生江秀香17日在沈阳创造。  江秀香的纪录是在参加“亚伟杯&rdqu...

    时间:10-23
  • 德国科学家研发出全新的计算机信息处理原则

      德国马普动力学与自组织研究所和哥廷根贝恩斯坦中心的科学家们新近开发出了一全新的计算机信息处理原则,该原则的核心要素是鞍点与振动元件。科研人员在复合网络计算机上证实,可以实现处理带有如摆或激光那样振...

    时间:10-22
  • 世界第三快超级计算机2013年全面运行

      由美国阿贡国家实验室和劳伦斯.利弗莫尔国家实验室共同设计的Mira超级计算机将于2013年阿贡国家实验室全面运行。Mira运用了IBM第三代“蓝色基因/Q”,将成为世界上运行速度第三快的超级计算机。  Mir...

    时间:10-18
  • 中国计算机报:网络营销的底线缺失

      在不久前召开的2012中国互联网大会上,一些网络营销公司在论坛上大谈特谈他们建立在大数据挖掘基础上的广告投放如何精准,似乎没人关心这些做法是否会侵犯用户的个人隐私。  四五年前,一位公关公司的朋友让我...

    时间:09-24
  • 中国计算机报:谁“惯坏”了苹果?

      为更好而付费,因为付费而获得更好的生活——或许很多人都曾经为苹果公司所坚持的这一价值观而拍手叫好。但是,在中国,苹果似乎并没有以此为准则做生意。中国消费者向苹果支付了费用之后,到底是获得...

    时间:09-24
  • 2012中国计算机大会将在大连举行

      我国计算机领域规模最大、级别最高的学术会议——2012中国计算机大会(CNCC2012)将于10月18-20日在大连举行,本届大会的主题是“创新平台,引领未来”。  CNCC是...

    时间:09-18
免责声明:本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。