简言

其他

GPT X 翻译记忆:基于双语翻译记忆进行智能问答

前言传统的计算机辅助翻译工具有三大核心技术用于辅助译者提升翻译效率和翻译质量,分别是:术语、翻译记忆和机器翻译。崔启亮老师曾经梳理过企业内部的语言资产形态,如下:最近行业内有关GPT的各种讨论都对GPT对机器翻译的影响、技术写作的影响、翻译教育的影响等多有讨论,但“翻译记忆”这个计算机辅助翻译技术的核心鲜有讨论。我认为,以GPT为代表的大语言模型技术是对计算机辅助翻译工具内置翻译记忆技术的彻底颠覆。在简言微信公众号之前的文章中大家可以查看我写的一系列与翻译记忆原理相关的文章,翻译记忆之所以能够提高效率是因为译者在翻译过程中可以基于过去翻译的双语数据来翻译形式上相似的新句子。注意,这里我特别指出了“形式”相似,因为无论是衡量字符串相似度的模糊匹配还是衡量机器翻译质量的BLEU都是形式上相似,我在之前的文章中介绍原理时都详细分析过。但GPT的出现,则通过词嵌入(Embedding)技术将相似度的计算从形式层面带到了语义层面。为了证实这一点,我在ParaTrans上添加了“记忆”模块。视频展示正文一、翻译记忆的对齐与上传目前国内外翻译记忆在线对齐工具中,TMXmall做得应该是最好的:离线对齐工具可以选择Abbyy
2023年4月10日
其他

将双语术语与ChatGPT相结合提升机器翻译质量

我们在评价机器翻译质量时有两个比较明显的非公认非学术的指标:术语是否准确和像不像人话。2013年左右,神经机器翻译的出现让大家一下子觉得机器翻译的译文更像人话了,但再仔细一看,会发现明显的漏译、错译问题,尤其是是机器翻译在训练时没有涉及到的术语、新词等,机器翻译会选择词义相近译法,或者直接就不译了。所以,即便机器翻译的译文更像人话了,但译文中关键术语翻译错误和遗漏还是会让人觉得机器翻译质量有问题。ChatGPT出现后,很多朋友也去测试了它的机器翻译能力,认为它的机器翻译水平离DeepL、谷歌等还有一段距离。但我测试后,却持不同的观点。我认为ChatGPT并没有针对翻译进行专业的训练,它的特色还是在于语言的生成,所以不能直接拿来做翻译,而是灵活用好它的API,让它的应用变得更加灵活和充满想象力。比如:在使用ChatGPT进行专业术语翻译时,可以先把待翻译的词用爬虫技术送到谷歌去搜索,把爬虫获取到的实时搜索结果整合成文本后再送给ChatGPT去生成译文和解释,会有一定程度上的质量提升。受到这个工作流程的启发,我在自己的时政语料库Politrans中引入了术语库和ChatGPT,我把任务分成三步:第一步:对时政类双语文本进行术语标注二十大报告双语语料库“政译”(Politrans.org)上线测试第二步:将待译文本送到ChatGPT进行翻译之前先对其进行术语抽取第三步:将抽取后的术语变成一个中英双语的字符串,然后拼接到发送给ChatGPT的指令中,让ChatGPT基于上一步匹配到的双语术语来生成译文。初步的实验结果发现:ChatGPT不仅可以基于双语术语生成译文,还能根据上下文调整术语的译文。详见下方的视频:这个实验给我极大的启发,我觉得很多人在测试ChatGPT时因为不知道什么是API,没有去尝试调用OpenAI的API来探索如何将个人数据与ChatGPT相结合,所以对它的能力认识只局限在网页端的对话交互。一旦我们可以把自己的个人数据(比如双语术语、双语句对、上下文等)从自己的内容管理系统中抽取出来自动与ChatGPT的命令相结合,那么就会限制ChatGPT的答案范围,让其变得相对稳定。在我的这次探索中,ChatGPT给出的时政文本的英译文不仅更加流畅,而且术语翻译准确,给人的直观感受就是:机器翻译质量极大提升。这方面的想象空间很大,值得进一步深入探索。
2023年2月26日
其他

将 ChatGPT 与线上英语教学平台融合的初步探索和功能演示

以下为我在“ChatGPT与国际中文教育发展论坛”的10分钟视频发言。这段发言主要展示了我自主研发的在线英语教学平台如何将ChatGPT用于口语评分、口译评分和口语自主训练。很多人在讨论ChatGPT对外语教育和翻译教育的冲击,甚至有观点认为不需要学外语、不需要学翻译,甚至教外语教翻译的老师也可以淘汰了。但从我的探索来看,ChatGPT可以作为外语教育技术、翻译教育技术的有益补充,可以帮助外语学习者、翻译工作者、外语和翻译教师更好开展外语的学与教,翻译的学、教、研究、实践。最近一段时间,我一直处于兴奋和焦虑中间态,时而因为ChatGPT的应用帮助我实现我不曾实现的功能而感到兴奋,时而对于我们的学生和老师没有跟上节奏没能利用新技术提升能力而感到焦虑。所以我能做的就只能边实践边科普,通过实践充分了解技术的内涵和现状,通过科普了解更多群体的诉求和状态,从而更好的推动新技术走进教育和产业。
2023年2月25日
其他

chatGPT应用于语言教育和语言服务的两个案例

自从chatGPT冒出来之后,我就一直在思考怎么可以真正的用起来,而不是去看一些评论和新闻,发表一些自己主观的看法。chatGPT作为一个语言模型,他在语言上的应用肯定是非常丰富的,所以我从语言测试和翻译质量评估这两个角度入手做了两个小的应用。我主要用的编程语言是PHP和Javascript,调用了:有道的机器翻译API和口语测试API,百度的机器翻译API和腾讯的机器翻译API,以及Openai的API。这几年来我有两个比较核心的观点:一个是我们要培养未来的译者,而未来的译者一定要学会如何使用人工智能技术,途径就是要学会如何去调用他们的API来解决实际的问题。第二个是我们要培养语言服务架构师,要懂得如何把人工智能技术融合到自己的语言服务解决方案中去解决实际的问题。以下的两个案例也是对以上两个观点的补充:案例一:用chatGPT帮助教师生成学生的口语评测报告。无论人工智能技术怎么发展,我们的语言能力是没有办法植入的,所以我们要借助人工智能技术帮助我们快速的提升语言能力,帮助我们更好的去评判语言能力。所以我开发了一个帮助学生提升英语口语能力的应用,这个应用现在用于一个亲子英语启蒙线上课程中,家长录完音之后,我会把他们的声音送到有道的语音评测API中获得评测结果,而这个结果中包含他们,发音有问题的音标。于是我就把这些音标发给chatGPT,让它生成一段英文的报告,效果如下:案例二:用chatGPT帮助译者判断一句话的译文质量如何提升。我们在翻译过程中会从机器翻译那里得到不同的机器翻译结果,有的时候我们也无法判断机器翻译的结果是否可以继续提升。所以我就让chatGPT来基于原文和译文给出译文的提升结果和提升原因。效果如下:思考:1.
2023年2月11日
其他

“简言语言服务”公益直播第二期:简言机器翻译应用

简言语言服务随着“语言服务”概念的不断成熟,人们发现语言服务行业覆盖面极广,潜力巨大。但即便如此,依然会有许多人不了解语言服务。为此简言微信公众号计划推出“简言语言服务”系列公益直播活动,依托北京语言大学国际语言服务研究院、国家语言服务出口基地、高级翻译学院邀请行业内有代表性的企业和专家对谈语言服务。欢迎大家关注!第二期:简言机器翻译应用机器翻译应用如果我问大家哪款机器翻译工具最好用,估计大家会有完全不同的答案,有人会说谷歌,有人会说有道,有人会说百度、有人会说腾讯,有人会说DeepL,等等。但如果我问Dallas,他可能会告诉大家一些不为人知的数据。Dallas
2022年11月26日
其他

二十大报告双语语料库“政译”(Politrans.org)上线测试

在《二十大报告双语语料库建设》一文发布后,许多朋友都在问何时能够用到这个语料库。在官方发布二十大报告的原文和译文后,我也迅速对中文原文和英文译文进行了句对齐,并将语料上传至一个新的域名下:Politrans.org,并取了一个中文名:政译。随着“政译”测试版上二十大报告中英双语语料的发布,后续还会上线中法语料,北语高翻法语口译和笔译方向的同学正在整理中。这次上线的测试版网站尝试将原文和译文中的术语高亮显示出来,并集中显示在“术语表”界面中:双语术语高亮显示术语表集中显示术语和例句并在手机端也高亮显示了双语术语:搜索结果中如果有提前标注好的双语术语,也可以点击后进一步查看术语语境:目前上线的测试版只标注了部分术语,并将很快标注更多术语。术语查询体验也在持续优化中。欢迎大家访问“政译”(Politrans.org),未来这个网站将不仅仅承载二十大报告双语版,还会将更多公开的高质量时政语料上传至该平台供大家检索查询。如果大家在使用过程中遇到任何问题或者在功能上有任何想法,欢迎留言告诉我!点击“阅读原文”即可访问“政译”测试版。
2022年11月1日
其他

“简言语言服务”公益直播第一期:简言翻译教育技术

简言语言服务随着“语言服务”概念的不断成熟,人们发现语言服务行业覆盖面极广,潜力巨大。但即便如此,依然会有许多人不了解语言服务。为此简言微信公众号计划推出“简言语言服务”系列公益直播活动,依托北京语言大学高级翻译学院、中外语言服务人才培养基地、国家级语言服务出口基地邀请行业内有代表性的企业和专家对谈语言服务。欢迎大家关注第一期活动:简言翻译教育技术第一期:简言翻译教育技术翻译教育技术过去很长一段时间,大家在谈及翻译技术时谈到更多的是计算机辅助翻译技术、机器翻译技术、自然语言处理技术,并且是围绕翻译实践环节展开的。所以“翻译教育技术”是一个被许多人忽略但本身极为重要的翻译技术领域。在北京语言大学,我们一直在探索将传统的信息技术和新兴的语言技术与口笔译教学环节相结合,思考如何通过技术手段来改善口笔译教学的效果,并推动建设更智能的翻译技术实验室。学生和教师如果在口笔译教学阶段就能体会到技术带来的便利,未来在语言服务实践中也会自然而然推动新技术在传统业务中的应用。目前国内有许多家企业在推动翻译教育技术的研发,比如北京的试译宝、上海的一者科技和上海文化贸易语言服务基地等,形成了鲜明的中国翻译教育技术研发特色。上海文化贸易语言服务基地和北京语言大学均为首批国家级语言服务出口基地,在翻译技术、翻译教育技术等领域也有诸多合作,所以在第一期简言语言服务直播活动中,我们邀请了基地管理层、运营端和技术端的三位专家,共同探讨翻译教学平台的发展方向以及新技术在口笔译教学中的具体应用。“参与方式第一期简言语言服务直播将于2022年9月26日(周一)19:00
2022年9月18日
其他

如何给基于BiCorpus的平行语料库新增语种

前言什么是BiCorpus?BiCorpus是一款开源语言资产管理平台,一个可用于搭建在线平行句库的开源工具,想了解更多信息请前往:BiCorpus:一款开源语言资产管理平台,让每一位译者拥有自己的在线语料库如何将BiCorpus安装在个人域名下在BiCorpus开源后,好几所学校在翻译技术课上开始使用,我怎么知道的呢,因为小朋友们加了我“助教”(CodeSlator)的微信,告诉我老师给他们布置了作业,让他们搭建自己的平行语料库。不过也正是这些小朋友“肆无忌惮”的问题,我才发现了一些小bug,陆续也修复了几个。今天这篇帖子想具体说一下如何给基于BiCorpus的平行语料库新增语种。正文一、BiCorpus能支持多少个语种?在BiCorpus发布后,我经常遇到的一个问题是:能支持***语吗?BiCorpus自然是可以支持这些语种的,而且可以说,我目前还没有遇到不支持的语种需求。但是目前发布的这个BiCorpus版本仅支持一些语种对,在这个文件中可以看到:upload_file.php在BiCorpus的上传页面也可以看到所有语言对:之所以支持这些语种,是因为当时在做BiCovid.org这个网站的时候主要是需要这些语种,所以也就只设置了这么一些。二、什么是语言标签?新增一个语种就需要增加至少两个语言对,而且这个语言对怎么添加还要看对齐软件导出的TMX格式文件支持的语言代码是什么。如果去查看TMX标准的官方介绍:https://www.gala-global.org/tmx-14b会看到这样的描述:“TMX
2021年11月20日
其他

BiCorpus:一款开源语言资产管理平台,让每一位译者拥有自己的在线语料库

背景在《译者编程入门指南》中我介绍了如何开发一个线上的翻译记忆库,但毕竟是编程入门学习,所以这个翻译记忆库建成后仅可用于非常基本的翻译记忆上传和查询。在疫情爆发后,很多小伙伴和我一起创建了BiCovid.org这个线上的疫情双语数据分享平台,具体如下:BiCovid:新冠肺炎疫情双语数据分享平台虽然现在我们已经停止上传数据了,但是平均每月都还有1000多人使用这个网站,月平均访问量是2000次左右:其实一直我都想让每一位译者或小型翻译团队都能拥有这样一个网站,用来管理手中的语言资产。但实在是太忙了,尤其是这一年一直都在忙冬奥术语平台的事情,连写代码的时间都很少。今天北京下雨了,我决定把这件事儿做了。一、BiCorpus核心功能BiCovid.org网站上有不少实验性的功能,有些徒有其表,不适合放在普适性的BiCorpus版本中,所以BiCorpus的核心功能精简后大致如下:首页第一次安装完开始使用时首页确实如上图这样空空如也,因为我们并没有上传任何数据,这个就要留给大家去体验第一份数据上传之后的喜悦。登录点击登录页面后可以通过输入用户名和密码登录。默认用户名密码是:admin
2021年11月6日
其他

如何基于SRX将英文文本切分成句(一)

在之前的帖子中我们介绍过读懂翻译记忆库文件(TMX)所需的XML和DTD基础知识和使用Tmxmall的文档解析API来进行多种类型文档的断句,以及如何基于TMX来制作翻译记忆库(如何制作一个简易的大会报告双语检索工具)。同样是基于XML技术的SRX却一直没有介绍过,其全称是“Segmentation
2021年4月27日
其他

为什么我们会误解机器翻译?

很多人问我对最近某豆瓣热门事件怎么看,外校的老师也在问,本校的同学也在问。我觉得此事因“机器翻译”而起,但并没有真正涉及“机器翻译”本身。许多与本次事件相关的讨论已经脱离了翻译本身。所以我对此事的定性是:此事因各方对机器翻译的误解而起,兴于网民对学术权力滥用和行政决策不公的挞伐,终将引发我们对文学翻译、翻译教育、翻译研究和机器翻译关系的再思考。如果我们把原评论改成:“错译痕迹严重,糟蹋了Benedett的作品。还是老话,没有金刚钻别揽瓷器活””而非“机翻痕迹严重,糟蹋了Benedett的作品。还是老话,没有金刚钻别揽瓷器活”是否还会有今天大家看到的争议吗?如果学生没有道歉,如果没有公开出来的学生教师聊天记录,后续会引发这样的争议吗?我想是不会的。但整件事情反映出的人文社科圈子对机器翻译的无知却那么的令人咋舌。我姑且问几个问题:·
2021年4月6日
其他

译者的第一个博客

本文转载于我刚刚创建的一个静态博客:CodeSlator.blog正文:我希望通过这篇帖子鼓励更多翻译专业的同学、职业译者、翻译爱好者建立自己的第一个博客。当你看完这篇帖子时,希望你能够立即着手创建自己的第一个博客。我们开始吧!一、译者为何要创建博客我给大家说说为什么我想创建博客:我希望拥有自己的专属域名我希望创建自己的职业品牌我希望发布自己的特色文章这些年来我一直鼓动我的学生开通微信公众号,从大学时代就养成写作的习惯,但是他们遇到了许多问题:微博不适合文章写作微信公众平台限制写作灵感个人博客搭建难度大个人博客维护成本高第三方博客随时会倒闭基于以上原因,借着推广译者编程项目的势头,我给大家提供一种可以解决以上问题方法:创建自己的Github
2021年1月8日
其他

读懂翻译记忆库文件(TMX)所需的XML和DTD基础知识

在我的翻译与本地化实践(一)课程中,我一般都会在翻译专业(本地化方向)学生二年级的时候介绍什么是XML,因为只有理解了XML才能把翻译行业的众多基于XML的数据交换标准搞清楚,比如存储翻译记忆的TMX[1]、存储术语库的TBX、存储断句规则的SRX等等[2]。现在越来越多的老师开始关注技术写作,其中涉及的DITA也是一种基于XML的文档写作解决方案,懂了XML也有利于玩儿转DITA和技术写作。我在之前的文章中介绍过如何从TMX文件中读取双语数据来制作在线翻译记忆搜索工具:如何制作一个简易的大会报告双语检索工具,从中可以看出理解XML的作用。另外,虽然现在主流的数据格式是json,一种更加简单轻便的数据存储格式,但在翻译行业常用的各类计算机辅助翻译工具中,XML的应用还是非常广的,所以对于翻译技术感兴趣的同学和老师还是有必要深入学习XML的。基于这几年上课的内容,这次疫情防控期间我录制了一些视频给学生观看,我也放到这里来分享给大家。在这篇文章中我一共分享两个视频,一个是:什么是XML;一个是什么是DTD。都是相对来说比较基础的内容,总共时长为1小时。简单来说,XML中包含的是要传输的数据,DTD定义了要传输的数据以怎样的结构存在于XML中。下面,就请大家观看这两个视频吧:01
2020年3月9日
自由知乎 自由微博
其他

使用Tmxmall的文档解析API来进行多种类型文档的断句

背景这个学期我在教学生怎么开发一个简易的CAT工具(往期成果参见:计算机辅助翻译工具开发竞赛作品展示:小译通),在开发过程中同学们遇到了一个文档解析的难题,即如何能把不同类型的文本都导入到CAT工具并自动完成分句。这个功能非常不容易开发,但好在一者科技(Tmxmall)的张井、陈件已经把这个功能开发好,并做成API(应用程序接口)了,我们直接调用即可。在这篇文章中我将简要介绍如何去调用他们的文档解析API。正文第一步:了解调用API的简单方法Tmxmall的文档解析API地址是:https://www.tmxmall.com/docs/openapi-fileparser/在这个地址中可以看到这样的说明:从中可知,文档解析API的作用是:“文档解析API提供了极其简单的编程接口,可以快速解析指定格式的文件,返回从文件中提取的文本和样式数据对象。”我填写了上面的申请表,并很快拿到了所需的信息。接下来就是去看他们提供的在线文档:第一次看到这些信息的人会觉得不知所措,但实际上这部分写得非常简洁明了,我给大家解释一下:知识点一:接口完整路径其实这里的“接口完整路径”就是一个网址,但是这个网址你不能直接在浏览器访问,如果访问的话会出现下面的错误提示:可见这不是一个我们常用的网址。知识点二:请求方式:POST我们在浏览器中直接输入这个网址并按回车键时,我们就是在“请求”(Request)这个网址。对于程序员来说,要通过写代码的方式来请求,而不是打开浏览器的方式,这时要用“POST”的方式来请求。简单来说,“POST”就是“寄信”的意思,比如邮局叫“Post
2019年11月22日
其他

面向文科生的正则表达式基础视频教程

背景《Word里面的通配符:基础知识》发布之后反响很好,帖子下方有很多人都在问有没有正则表达式的基础教程。正则表达式可以用来帮助我们去快速找到文本中特定模式的字符串,是极为高效的文本处理工具。本来这学期我就准备录制教程的,大家的留言激励我赶快录出来。因为我之前只是在我的微信公众号中写过一些跟正则表达式相关的例子,包括:小议网站本地化中的正则表达式之所以写这个例子是因为,像SDL
2019年9月22日
其他

Word里面的通配符:基础知识

通配符是一种可以在Word里提高文本处理效率的法宝。今天这篇帖子将会详细讲讲“通配符”的基础知识。我们先来看这样一个问题:请在Word中将下面这段文字的所有英文删掉。要想解决这个问题的话,就要用到“通配符”,因为我们要用一段“通用”的代码来“匹配”相应的“字符”。不过“通配符”的全称并非前面这半句,它是英文“Wildcard”一词的缩写。“Wildcard”是我最喜欢的英文单词之一,因为它的意思很有趣。在计算机领域,我们将其翻译成“通配符”;在体育领域,它的译名是“外卡”;在英语口语中,它有“不可预知的人或事”的意思;在棋牌游戏中,它又叫“万能牌”,比如在著名的“UNO”游戏中,就有一类牌叫“Wildcard”,牌友们还会戏称其为“野牌”。我没有查到“Wildcard”最初是怎么引入到计算机领域的,但如今在这个圈子里基本上已经路人皆知了。每当谈起“通配符”,人们首先想到的是这么几个符号:“*”、“?”、“[]”、“{}”、“@”、“\”、“()”、“”、“!”等等。接下来我将逐个介绍每一个符号的作用,希望这部分的介绍能够让大家充分的了解这些符号的叫法和用法。1、*在中文中我们称这个符号为“星号”,在英文中可称为:asterisk或star。我们平时在印刷品中看到这个符号时,常用这个符号来表示注释,或者是省略的内容。我去查了一下词源,“aster”可看作是“a
2019年9月20日
其他

ParaTrans 2.0:百度、有道、搜狗、谷歌四款机器翻译服务大PK!

关注简言的朋友是否还记得“神奇的机器翻译服务大PK平台上线”这篇文章?如果你还记得那你肯定是老粉丝了!在这篇2017年中旬的帖子中我介绍了自己做的小工具“ParaTrans”:自从这个平台上线后,不少朋友告诉我这是个好东西,并且非常期待有更多功能的“付费版”。昨天我跟我导师讨论论文的时候,她问我何时把搜狗的也更新上来,我正好趁着这个机会把原本打算做的“付费版”给做出来。今天用了大半天的时间,终于完成了ParaTrans
2019年1月17日
其他

计算机辅助翻译工具开发竞赛作品展示:小译通

版权:归北京语言大学季薇璐、叶力豪、何杨林三位同学很开心我们三巨头小组可以凭借“小译通”成为这次计算机辅助翻译工具开发竞赛的冠军组(鼓掌欢呼)。感谢韩老师的倾情赞助👍,让我们可以快快乐乐过双十一。接下来是“小译通”的详细介绍⬇️01工具理念我们在项目初始就为“小译通”想了一个听起来霸气的slogan:“人人都是好翻译”。这个标语很好地体现了我们的理念:
2018年11月10日
其他

人工智能时代传统翻译教育的危机

开设翻译专业本科和翻译专业硕士的学校是不会担心招不到学生的,因为本科文凭和硕士帽子是人人都要拿的,但语言水平特别优秀的高中生和语言底子打得不错的考研学生应该是不会考虑读翻译专业了。
2018年3月17日
其他

如何制作一个简易的大会报告双语检索工具

自从大会报告双语版本发布以来,各大平台都在热转,尤其是翻译圈的各种微信公众号。然而,一个有价值的双语版报告不是那种以段段对照的形式发布成文章的,而是一个可以在网上实时检索的,比如这样:在这篇帖子中,我将展示如何制作这个简易的双语报告检索工具,感兴趣的也可以自己尝试一下。第一步:获取双语报告的TMX格式文件在我所研究的“计算机辅助翻译”领域,双语的句子大多是以“.tmx”格式的文件存储的,这种叫作“翻译记忆”(Translation
2017年10月22日
其他

巧用正则表达式整理双语术语数据

”吗?其实不是,如果仔细观察会发现,加号前面是个空格。也就是说这段代码寻找的是各种标点符号后面有空格的情况。示例如下:那么后面的“$1”指代的是哪段代码呢?是“/([。,!?〔〕()《》“”])
2017年7月13日
其他

神奇的机器翻译服务大PK平台上线

上个月底我写了一篇文章,名为《如何设计并开发一个对比百度翻译和有道翻译结果的小网页》。我把小网页开发的整个过程都写了下来,还给出了这个网页的源代码。我给这个小网页取了一个震耳欲聋的中文名字:神奇的机器翻译服务大PK平台。还取了一个秀气的英文名字:ParaTrans。为了能让更多读者亲自感受神奇的机器翻译服务大PK平台,我今天又干了几件事儿:花了280元租了一台一年使用期的服务器;花了70元买了一个非常霸气的网站域名;花了30分钟把这个霸气的网站域名和我租的服务器绑定到了一起;花了3分钟把神奇的机器翻译服务大PK平台迁移到了服务器上;做了一个假的付费版神奇的机器翻译服务大PK平台钓鱼入口。最后的页面在电脑上看是这样的:在手机上看是这样的:那么怎么样才能访问那个非常霸气的网站域名来体验神奇的机器翻译服务大PK平台呢?请在浏览器里访问:http://translation.education或者点击“阅读原文”。对于那些持币待购的用户,请不要着急,目前的免费版仅用于体验,付费版用于提升个人成就感。免费版主要功能是查看待译中文的有道和百度机器翻译结果,并比较两个结果之间的相似度。暑假里还将(根据我的心情)上线更多付费功能。(这个域名是不是很霸气,哈哈哈哈哈哈..........)如果对该产品有任何反馈,请不吝打赏。
2017年7月9日
其他

如何设计并开发一个对比百度翻译和有道翻译结果的小网页

前言:前几日写了一个帖子,《被机器翻译替代不可怕,可怕的是被替代后还不会用技术》,阅读量将近900。这是我的微信公众平台首次开通“赞赏”功能,帖子发出后,总共收到了36.88元的读者打赏。我很兴奋,于是决定将这笔钱全部捐给我们家小猫咪Catti的“零食基金”。这篇帖子发出后,也收到一些回应,比如:“你倒是说说,怎么用技术?”、“能展示一下使用技术的具体办法吗?”正好我这学期给学生上一点跟编程相关的皮毛课,所以我准备简单展示一下“使用高深技术的简单方法”。一、设想现在国内有几家技术杠杠的公司都推出了他们的机器翻译服务,比如百度翻译、有道翻译、搜狗翻译等等。我们一般使用这些机器翻译服务的方法都是这样的:前往某个机器翻译服务的网站主页,粘贴或者输入要翻译的内容,然后看看机器翻译的结果。查完一个如果觉得不爽,再去使用另一个机器翻译服务。那么,有没有另外一种可能:我在一个页面中输入一次要翻译的内容,点击“翻译”按钮,出来多个机器翻译服务给出的译文。二、实现为了实现上面这个设想,我决定做个小小的网页程序。第一步:做一个网页一提起做网页,有些读者可能觉得,这哪是说做就做啊,是不是得学编程,是不是要学数学,我可不行,我高中数学可不好了。没事,我们可以找一个捷径:http://www.layoutit.com/通过这个网站,我们可以不写代码就可以做出一个像模像样的网页,如下图:点击“START
2017年6月29日
其他

小议网站本地化中的正则表达式

一、背景:这学期的《翻译与本地化实践》课给学生布置了一个期末项目,是很早之前一次计算机辅助翻译大赛的赛题,也是北京大学计算机辅助翻译专业的一次本地化课程期末小组作业。项目内容就是将一个网站本地化成中文,其中有一个文件长这个样子:啊,好像看不出来这个文件长什么样。其实是下面这个样子:这是一个格式为“PHP”的文件,里面存储的是网站上一些文本内容,也就是我们在做网站本地化时要翻译的文本。(小注:PHP
2017年6月21日
其他

论“翻译教育技术”

关注我的课程公众平台,及时了解课程的最新信息,学业问题、生活问题等均可在此与我交流。
2016年9月10日