搭建属于自己的机器翻译系统

发布时间:2020-05-15   来源:文档文库   
字号:
搭建属于自己的机器翻译系统 ——MTI专业术小白走进小牛翻译开源社区的心得

搭建属于自己的机器翻译系统
——MTI专业“技术小白”走进小牛翻译开源社区的心得
首先,自我介绍一下。我是一个MTI(翻译硕士专业、没有计算机编程背景、没有机器翻译理论基础的菜鸟,任职于一家网络科技公司的市场部门,之前的工作中需要做些翻译工作,有时候求助百度翻译、有道翻译等免费的机器翻译系统来解决问题,但是对于一些涉及我们商业机密的数据,由于担心泄密,只能借助于有道词典查查词,然后再自己形成翻译结果。很早之前我就想,要是能有自己的机器翻译系统就好了。
我心目中的翻译技术大牛、对外经贸大学的崔启亮老师曾在微博中给MTI的学生提建议,“学好翻译技术,有前途。对于仍在迷茫MTI的同学,我建议学机器翻译设计与开发,走出迷茫。”非常非常幸运的是,我一个东大毕业的同学告诉我,东北大学自然语言处理实验室(国内搞机器翻译最好的团队之一)联合沈阳雅译网络技术有限公司推出了“小牛翻译开源社区”,社区中有一项内容,就是教不懂机器翻译的人学习“快速搭建自己的机器翻译系统”。于是,我走进社区,按照社区里的相关说明,亲身体验了搭建过程。下面,我想谈谈这个被誉为“目前国内首个以机器翻译为核心的交流平台”的菜鸟级用户体验。
小牛翻译开源社区里提供了统计机器翻译开源系统的全部代码。我了解了一下,NiuTrans开源系统在国际上比较有名,据说是目前国际上能够支持统计机器翻译模型最全的两套统计机器翻译系统之一(另一套是爱丁堡大学的Moses。这些内容对MT(机器翻译的专业学者应该很有用吧,但是对于我这个非科班出身的人来说,其实会完全忽略这部分内容。我还是讲讲我在社区里的真正收获——快速搭建实用的机器翻译系统。
一、搭建过程详细说明
需要说明的是,我是在在网页指导与人工指导下才在自己的电脑(Windows7 64位系统,硬盘500G,内存8G)上成功搭建机器翻译系统的。解释一下为什么我不仅看了网页上操作指导,还需要人工指导。身为“技术小白”的我,虽然网页上的操作指导写的很规范,但是第一次接触这么“高大上”的东西,还是有点小紧张的。于是,我加入了小牛翻译开源社区的QQ(群号451967838联系了群主,群主很热心的帮我讲解,在服务方面我的用户体验很好。下面我就与大家分享我如何一步步完成在自己电脑上搭建机器翻译系统的。

第一步,进入“小牛翻译开源社区”网站http://www.niutrans.com/接着进入“搭MT系统”界面。如图:

第二步,根据自己电脑的操作系统(Windows系统还是Linux系统),选择合适
的“NiuTrans Server工具包”(之所以叫NiuTrans Server,据说是因为这个工具包是针对单服务器的,或者说,这个工具包还不能用于搭建机器翻译云平台)小牛翻译开源社区的群主告诉我,目前正式运行的机器翻译系统,都是在Linux操作系统下安装的,但Linux系统下没有图形界面,需要用户稍微懂一些代码。为了方便像我这样的用户,他们很贴心地研发出Windows系统下如何搭建机器翻译系统的方法(此处值得为他们点赞哦)。
第三步,点击“Windows版搭建教程,下载“NiuTrans Server工具包”。根据语言方向和电脑内存的大小,社区里提供了四个工具包。由于我的电脑内存总共只有8G,所以选择的是“中译英Windows4G版”。点击下载即可。


第四步,安装perl我是在人工指导下完成的,一共需要四步操作才能完成。先,点击上面网页中“运行环境准备”项中的“Perl下载地址”。如下图:
Step 1Perl-downloadWindowsStep 2、点击页面中“DOWNLOAD ACTIVEPERL”,即页面上Windows下右面第一个图标。大家可以看一下左侧的英文说明,除了64位操作系统,32位操作系统也可以支持的。

Step 3、在新的页面中,点击“Download ActivePerl 5.22.1 forWindows (64-bit,x64”(我的电脑是64位系统)。


Step 4、在新的页面中,会自动弹出一个下载框。经过以上操作就可以成功下载Perl


第五步,做了以上准备工作后,接下来进入搭建步骤。搭建共分两步,
Step 1、解压工具包。找到刚刚下载的工具压缩包,windows 7 系统可直NiuTransServer_v1.1.0_zh2en_x64_window”。打开文件夹如下图:

Step 2、启动机器翻译系统。点击上图文件夹中service”文件夹,进入文件夹内,找到“start.service.batBAT脚本文件)”,双击该文件即实现启动机器翻译系统。如图:


第六步,搭建操作全部完成后,页面会出现下列提示即代表启动成功。下图是社区指导步骤中给的样图。其实操作者只要看最后一句Server startup in XXX ms”即可,代表专属于你的机器翻译系统已经搭建成功,此处特别提醒,该页面不可以关闭,要想运行机器翻译系统,要保持着该页面一直打开状态。

第七步,将该“http://127.0.0.1:1517/niutrans/”网址粘贴到浏览器中,即可弹出如下图页面:

然后嘛,就可以开始使用机器翻译系统了!
以上就完成在自己电脑中搭建机器翻译系统的全过程。“指导搭建机器翻译系统”页面中还介绍了很多小牛翻译系统的其他功能。如翻译API功能、利用自有数据训练翻译模型等,经过好一顿的研究,被社区群主告知这些功能都是为机器翻译专业人士准备的,不懂程序的人无法直接使用。特此提醒其他使用者,完成我上述七步操作,专属于你的机器翻译系统就搭建成功了,其他的小牛翻译系统各种功能就只能根据使用者自身的能力来选择使用了。
二、对小牛开源社区的建议
社区内搭建机器翻译系统的方法实现起来真的很便捷,但是对搭建过程中的某些技术指导表述不够清晰,建议以下部分应该有改进。
1安装perl环节应该添加详细介绍。在上一部分我的搭建过程中,我详细了介绍了安装perl的步骤。安装perl的网页是全英文版,由于我是翻译硕士所以我读起来较轻松,但是对于英语水平不太高的使用者,阅读起来会比较困难,这会导致此部分的操作有一定难度。希望社区开发者会进一步详细介绍一下如何选择各个步骤的下载选项。

2)“代表启动成功”的展示图片需修改。应提示,操作者只要看最后一句Serverstartup in XXX ms”即可,这就代表专属于你的机器翻译系统已经搭建成功,亦在图片中明显标画出来,让操作者可以非常清晰操作思路。如下图:
3)截下图,只想表达,下图的解释说明虽然可以看得懂,但是却不清晰,型的程序猿表达方式。如果想要提升用户体验,某些表达也可以优化一下。

我相信,随着大家对机器翻译的需求逐渐兴起以及对数据翻译安全的考虑,这种可以在自己电脑上搭建机器翻译系统会有越来越多的需求。因此,“详细、直白、清晰、简洁”的搭建过程说明是很有必要的。 三、搭建体会
作为一名不懂计算机编程、机器翻译技术基础的我,竟然可以实现自己动手搭建机器翻译系统,我都被自己吓到了,应该说小牛翻译开源社区给了我很大惊喜。通过自己亲手搭建机器翻译系统,虽然我还是不懂机器翻译技术,但是在使用上,感受到了机器翻译的更多优势。比如,在自己的电脑上搭建机器翻译系统,使用的稳定性、数据的安全性均可得到保障。
随着“互联网+”时代的到来,机器翻译在变革着翻译行业,语言服务行业的变革也离不开机器翻译。各行各业(如旅游、跨境电商、社交或游戏等平台)出现的多语种翻译需求在不断增加。因此,即使不是机器翻译技术的专业学者,同样有必要加深对机器翻译技术的了解,而小牛翻译开源社区恰好给非科班的人准备了这样的平台,感谢小牛翻译开源社区!


本文来源:https://www.2haoxitong.net/k/doc/5823c38a5dbfc77da26925c52cc58bd63086934b.html

《搭建属于自己的机器翻译系统.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式