大模型助力国际术语专业化,前后联动实现所见即所得
01 现状问题
在今年的敏捷团队建设中,我通过Suite执行器实现了一键自动化单元测试。Juint除了Suite执行器还有哪些执行器呢?由此我的Runner探索之旅开始了!
02
分析原因
理解,首先 MCube 会依据模板缓存状态判断是否需要网络获取最新模板,当获取到模板后进行模板加载,加载阶段会将产物转换为视图树的结构,转换完成后将通过表达式引擎解析表达式并取得正确的值,通过事件解析引擎解析用户自定义事件并完成事件的绑定,完成解析赋值以及事件绑定后进行视图的渲染,最终将
在新语言的不断新增过程中,每次新增一种语言,一般的流程是研发提供全套的待翻译词条,业务找到对口的翻译公司按照词条和我们提供的语境、场景翻译成对应的语言,研发根据翻译公司提供的词条生成新的语言包添加到系统中。但是标准和专业的工作流程往往实现起来存在困难,从“成本、效率、体验”的角度出发,总不能研发每次做一个需求都要找一遍翻译公司吧?随着语言包的不断新增和各种需求的不断迭代,所有的翻译都需要专业翻译公司介入基本是不太现实的,这种工作流程方式既增加了成本,又影响了交付效率。在以前没有大模型的时候,一些简单的翻译基本都是借助各类翻译平台实现词语的直译。随着GPT的出现,我们开始使用GPT替换了人工翻译和翻译平台的直译,翻译的准确性对比其他翻译工具更加准确,对比人工翻译成本降低了,效率提高了,且准确性也能得到一定的保障。
不论是人工翻译还是GPT的AI智能翻译,都不能达到国外专业业务系统的简洁和准确,但是想要做的特别专业就需要请专业的外部翻译公司,无疑又增加了成本的支出,有没有一种既能让系统逐步迭代的越来越完美又能降低成本的办法呢?
其实,在多语言方面,“用户”就是最专业的专家。他们对系统熟悉以后,在特定的场景和语境下,是最专业的人。如果他们能够在线修订系统中的各种词汇,是不是就可以解决这个问题?
03
计划目标
理解,首先 MCube 会依据模板缓存状态判断是否需要网络获取最新模板,当获取到模板后进行模板加载,加载阶段会将产物转换为视图树的结构,转换完成后将通过表达式引擎解析表达式并取得正确的值,通过事件解析引擎解析用户自定义事件并完成事件的绑定,完成解析赋值以及事件绑定后进行视图的渲染,最终将
2. 提升翻译质量:
3. 提高词条更新效率:
4. 优化用户参与流程:
5. 降低成本:
6. 增强系统的智能化:
04
实现步骤
理解,首先 MCube 会依据模板缓存状态判断是否需要网络获取最新模板,当获取到模板后进行模板加载,加载阶段会将产物转换为视图树的结构,转换完成后将通过表达式引擎解析表达式并取得正确的值,通过事件解析引擎解析用户自定义事件并完成事件的绑定,完成解析赋值以及事件绑定后进行视图的渲染,最终将
4.1 建设国际物流术语词条库
建设国际系统统一使用的国际专业术语词条库,这个词条库将现有各个系统已有词汇汇集整理以后形成一套大家都在使用的标准国际专业术语词条,后续新增的需求将优先从词条库中选择现有词条,没有的词条需要产品新增,产品新增完成以后前端研发就会引用该词条到各自的系统中。
4.2 哪里不对改哪里,词条管家秒更新
1.划词选中:用户在前端页面中发现需要修订的词条后,可以通过划词操作快速选中该词条。
2.弹出更正窗口:选中词条后,系统会自动弹出一个更正窗口,引导用户输入修订后的词条内容。
3.审批流程:用户输入新词条并提交后,系统将启动审批流程。这一流程确保了词条修改的专业性和准确性。
通过这一流程,我们不仅提高了词条更新的效率,还通过审批机制确保了词条内容的质量和权威性。
4.3 架构实现
4.3.1 大模型翻译
结果纠错:大语言模型对于翻译的结果不是稳定可靠的,经常会因为需要翻译的话术存在歧义导致整体翻译的结果不对,或者翻译出来的内容不是纯粹的翻译结果而失败,在进行翻译时,根据多种规则判断翻译的结果是否是正常的翻译内容,包括翻译结果的长度是否和预期差异较大,包括翻译的结果是否是纯粹的结果而不是带了一些其他的干扰词汇等等最终实现翻译结果与预期一致。
4.3.2 多语言线上化
将多语言包上传至云存储,在每次更新翻译内容并审批通过时自动更新云存储的文件。
4.3.3 自动版本更新
审批通过以后自动生成新的版本,在前端拉取语言版本时自动拉取的就是最新版本的语言包。系统底层存储了各个语言的版本号,和云存储的文件对应在一起。
4.3.4 自动化词条更新技术
4.3.5 异常兼容降级
同时在每次构建时自动拉取最新的语言包并更新,同时该版本作为base(基础)版本,当自动更新词条服务不可用时进行降级处理,继续引用编译构建时的语言包,不影响系统的正常使用。
1.无缝更新:用户可以自动获取最新的语言包,无需手动干预,提升了用户体验。
2.离线支持:即使远程服务不可用,应用也能通过本地缓存的语言包继续运行,保证了应用的可用性。
3.版本兼容性:通过版本检查确保用户总是使用与应用兼容的语言包,避免因版本不匹配导致的潜在问题。
4.构建时更新:在构建应用时自动更新语言包,确保部署的应用总是使用最新的语言资源。
5.资源效率:通过本地缓存减少了重复从远程服务器拉取相同资源的次数,节省了网络带宽和服务器负载。
6.容错性:即使在更新过程中出现问题,系统也可以回退到稳定的base版本,保持系统的稳定性。
7.易于维护:清晰的版本管理和更新逻辑简化了维护工作,便于开发者管理和部署语言资源。
05
实现效果
理解,首先 MCube 会依据模板缓存状态判断是否需要网络获取最新模板,当获取到模板后进行模板加载,加载阶段会将产物转换为视图树的结构,转换完成后将通过表达式引擎解析表达式并取得正确的值,通过事件解析引擎解析用户自定义事件并完成事件的绑定,完成解析赋值以及事件绑定后进行视图的渲染,最终将
5.1 人效提升
5.1.1 系统国际化快速复用
此外,通过建立国际物流术语词条库,我们可以确保不同系统之间的术语统一,避免了重复翻译和不一致的问题。这种方法不仅提高了翻译的准确性,还大大减少了研发在多语言支持上的工作量,使得国际化过程更加高效。
5.1.2 词条校准快速高效
原有流程完成一次术语修改需要经过10个流程节点才能完成一次术语的修改和生效,每次修改需要2个多小时,主要花费在部署多套环境上。增加了术语库的能力以后,每次修改术语需要4个流程节点,生效时间只需要15分钟左右,真正实现了即改即生效,生效即可见的效果。
5.2 质量提升
5.2.1 物流术语专业统一
国际公共词库成型示意图:
通过现有国际物流系统的词条,我们通过使用频率筛选出高频词条,通过GPT翻译加人工校验的方式进行词条沉淀,考虑到不同位置展示的词条书写格式的差异,词条类型根据不同的用途进行分类管理。比如考虑到菜单类词条可能很多英语写法喜欢缩写,会将页面菜单词条和异常提示词条分类存放,使用的时候同样的词汇会根据具体的类型进行翻译。
通过公共词库的实践,我们避免了很多词汇的二次翻译,同时翻译结果的准确性和本土化程度大幅提高,随着词条沉淀的增多,发挥的作用将会越大,所以,如果你的系统正在做国际化,强烈推荐沉淀一份公共词库,可以让系统翻译更加统一,更加精确。
06
总结规划
理解,首先 MCube 会依据模板缓存状态判断是否需要网络获取最新模板,当获取到模板后进行模板加载,加载阶段会将产物转换为视图树的结构,转换完成后将通过表达式引擎解析表达式并取得正确的值,通过事件解析引擎解析用户自定义事件并完成事件的绑定,完成解析赋值以及事件绑定后进行视图的渲染,最终将
国际在多语言的开发过程中不断总结归纳,创新性的将国际的多语言整理成了国际术语词条库,为国际的专业术语统一打下了良好的基础。利用技术优势,将语言包放置到了线上,在打包时自动更新拉取,同时提供线上所见即所得的词条修改能力,不断提高多语言的专业性。
pfinder实现原理揭秘
大模型应用之路:从提示词到通用人工智能(AGI)京东Apple Vision Pro版 Is Coming!