您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
全球互联网巨头布局翻译市场,AI翻译水准为何仍难及专业翻译呢?
机器翻译,标题,语料全球互联网巨头布局翻译市场,AI翻译水准为何仍难及专业翻译呢?
发布时间:2020-12-06加入收藏来源:互联网点击:
全球互联网巨头布局翻译市场,AI翻译水准为何仍难及专业翻译呢?
回答于 2019-09-11 08:43:50
回答于 2019-09-11 08:43:50
看到这个问题,我想来回答一下。
首先来说明一下本人虽是英语科班出身但由于种种原因最后并没有从事与翻译相关的职业(但平常还是会用到英语的,也会用到谷歌翻译、有道等软件),对于这个问题可以说是合适又不合适的回答者了。
先来下个结论吧,个人觉得AI翻译水准难以企及专业翻译,那是因为,翻译不仅是技术活,更是一门艺术活!以现在的AI水准,从事艺术怕还是任重而道远吧!
第一,谈技术层面。
翻译首先是个技术活,你最基本的要求是什么?就是把源语言准确的翻译成目标语言,先不管美不美,不管笔译还是口译,信息不能有遗漏。
在这点上,我觉得AI在反应速度和词汇量上是完胜人类专业翻译的。像有时候我们会要翻大量的基础材料或者浏览外文网页或者遇见外国友人需要进行一番沟通啊什么的,用机器翻译,就是一个字,快!在很短的时间内把你所需的信息全部翻译出来。的确非常的便捷高效。
我觉得在这点上现在的AI翻译可以说已经能取代人类了。不论是笔译还是口译,AI已经可以大量快速准确的翻译了。那么唯一还没被攻陷的就是我接下来要谈的第二点。
第二,谈艺术层面。
翻译,在求学期间就多次听老师讲(尤其是笔译),是戴着镣铐在跳舞。作为译者,你一边面对的是作者,一边面对的是观众。
你不可能脱离原文,天马行空,原文无形中就会成为译者身上的镣铐。但另一边的读者又迫不及待的想要了解、欣赏这边动人的风景。于是,译者只好使出浑身解数,在镣铐下翩翩起舞。
专业的译者是把原文转换成目标语言而又不失原文的美感。这难度不比自己创作一篇作品低。可以说好的译者就是原文的第二作者。他自己首先要理解源语言,感受到源语言的美,然后才能谈接下来的用目标语言把内容美美的翻译出来。
而AI翻译呢?我们上文提到,在基础文本上现在的AI翻译可以说是既快又好地完成任务,但翻译文学性比较强或者需要上下文来理解的文本上,AI的水平就让人太捉急了。
这点无需多说,大家自己也都用过翻译app,效果如何,大家想必心里也是有数的。
这时有人会问,我第二点讲的貌似笔译多一点,其实在口译中也是一样的,一般口译文学性不及笔译,但其上下文的重要程度还是很大的,尤其是别人演讲什么的,会抖个包袱呢。
AI翻译这时就一点也不智能了活脱脱一个机器!
当然让机器从事艺术本就是一个笑话!因为,说白了目前,人工智能的发展还很有限,还不能完全取代人类的某些工作。当然我们也不能否认AI。
试问,达芬奇、毕加索梵高等一票大师画出来的画和现在机器画出来的画,你一下就能立判高下,但你最终会买哪一幅回家挂着呢?
个人见解,多有疏漏,还请谅解。并希望大家发表自己的看法!
回答于 2019-09-11 08:43:50
举个例子,在今年的博鳌亚洲论坛上,腾讯机器同传在现场表现不佳,在一场分论坛中频频出现翻译问题。这与其说腾讯的机器翻译技术不好,不如说目前的机器翻译水平很难达到我们理想的效果。
目前在翻译中,国内做的最好的是中英翻译,可以看到仅仅是中英翻译,也是在某些场景相对不错,很难在通用场景做到很好的效果。机器翻译水平的提升一方面有待算法上的进一步突破,另一方面也有待语料数据的大量积累,尤其的语料的积累是一个相对漫长的事情。
目前的AI翻译技术,只是到了我们刚开始可以拿来应用,去落地解决一些问题的地步,远没有成熟。比如像谷歌、微软等布局的都是通用型的机器翻译,大家通过APP都可以体验到翻译效果。其实翻译效果并不理想,一个代表性的例子就是,直接用谷歌翻译看一些英文文章,有时候发现只是能够读个大概,很难看清楚每一句具体讲了什么,有如此海量语料的谷歌尚且如此更不用说其他家了。
目前这些通用翻译软件的意义小于语料搜集的意义,通过用户使用获得大量数据,然后不断迭代机器翻译技术,或许是这些翻译软件背后更大的意图。
因此,AI翻译取代普通翻译都尚需时日,更不要说专业翻译。毕竟向不同语种图书之间的编译,不但要保证语言的准确,又要力求语言的流畅优美,信达雅尤其是最后的“雅”是AI翻译难以做到的。
回答于 2019-09-11 08:43:50
1. 评价:首当其冲,是评价问题,对于摘要,文档这类无严格确定性答案的任务,评价起来很难,也许你生成的结果很好,但是自动评价就是对不上,所以有时你的方法并不是不work,这方面和机器翻译还是不太一样,机器翻译好歹有明确的任务目标和约束,而且BLEU等一堆指标相对还是很好用的,但是文摘的ROUGE感觉相关性不强,所以很多工作最后还是要上人工评价,这就限制了这个任务
2. 任务定义:就我感兴趣的新闻领域而言,不同的媒体,不同的作者写的结构,用词可能都不一样,及时对于同样的新闻,也可以有完全不同的关注重点导致不同的标题,即使同样的标题内容,也完全可以用不同字数的标题来表示,灵活性很大,标题和内容不存在严格意义上的对应关系
3. 数据方面:就中文新闻而言,存在很大的文章结构和标题结构差异,有些新闻是通告,有些是比较标准的新闻,有些是采访,或者混杂的,有些新闻很短,有些新闻包括好几个大的子标题内容,有些子标题和主题相关性都很强,有些可能完全不咋相关,对于标题,中文的单句标题和双句并列符合标题基本各占一半吧,所以感觉数据处理起来都很头疼,很难像机器翻译做到文本的规范化吧,对于英文新闻而言,一般CNN,BBC这些大厂的新闻质量还是比较高的,标题相对没有中文长,没有中文复杂,但是英文标题经常会出现一些隐喻等情况,总之,数据方面是个问题,数据的数量要求应该远大于机器翻译,数据的清晰和提纯也很重要。
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |