不容错过的免费翻译神器“沉浸式翻译”!实测案例《OpenAI:我们的数据和 AI 方法论》
你好,我是清风徐来
这是《AI,从入门到精通》 系列第 234篇原创文章。
语言的界限不再是你探索世界的障碍
今天,我要介绍给你的,不仅仅是一个工具,而是一扇通往无限可能的大门——沉浸式翻译工具。
没错,这个工具的名字就叫“沉浸式翻译”,笔者每天都在用。
平时,每次推荐了国外的AI工具,都会有很多同学来问,为什么笔者的界面是中文的,而他们打开是英文的?今天就给大家介绍一下这款翻译神器。
它唯一的缺点就是不能够意译,为了弥补这个瑕疵,文末我会再推荐一个意译的小工具。
非常适合需要迅速阅读英文网站、资料的朋友!给大家透露一个行业小秘密,很多翻译公司都在用它做初翻!
1、为什么需要翻译软件?
无障碍沟通
无论是学习新语言,还是与国际友人交流,沉浸式翻译都能帮你轻松跨越语言障碍。
工作提效
传统企业也能通过它,提升工作效率,打开国际市场,让业务更上一层楼。
2、互联网上的 AI 翻译工具千千万,我们该如何选择?
沉浸式翻译是一种先进的翻译技术,它通过智能识别网页的主要内容区域,并在两侧提供双语对照,从而为用户提供一种全新的外文阅读体验。这种翻译方式不仅支持多种语言,还能处理包括视频、PDF 文件和电子书等多种格式的内容。
此外,沉浸式翻译还可以免费使用来实时翻译外语网页、PDF 和 EPUB 电子书,以及视频双语字幕。
免费且强大
沉浸式翻译不仅免费,而且功能强大,支持多种语言的即时翻译。
用户评价高
根据互联网上的用户反馈,沉浸式翻译的翻译准确率和用户体验都非常高。
超过谷歌翻译、微软翻译
很多其他翻译软件无法翻译的场合,沉浸式翻译都可以完成翻译工作!
3、沉浸式使用入门
(1)安装
沉浸式翻译 是一款 浏览器插件,需要安装后,直接在你的浏览器端使用
登录https://immersivetranslate.com
安装后界面如下:
使用也很简单,鼠标点右键,选择“翻译网页”,软件会自动完成翻译
功能很多:
① 切换翻译界面:译文,原文/译文 切换
有两种基本模式,显示原文+译文
只显示译文
② 选择翻译器:国内可以选择 腾讯翻译,免费
③ 翻译 PDF(支持在线或本机上传)
④ 选择目标语言
其实这步不操作,系统也会会自动判断
搞定!
3、使用入门
我们找到 OPENAI 最新文章
《Our approach to data and AI》
点右键,5 秒钟完成翻译,只保留原文模式
以下是全文:
2024 年 5 月 7 日
《OpenAI:我们的数据和 AI 方法》
在 ChatGPT 推出一年多后,AI 正在改变我们的生活、工作和学习方式。它还引发了关于人工智能时代数据的重要对话。更多关于我们的方法,一个新的媒体管理器的创作者和内容所有者,以及我们的方向。
AI 应该为每个人扩大机会。 通过以新的方式转换信息,人工智能系统帮助我们解决问题并表达自己。今天,我们的人工智能工具,如 ChatGPT,正在世界各地使用,帮助肯尼亚和印度的农民提高作物产量(数字绿色),研究人员加速药物发现(Moderna),政府支持他们的劳动力(宾夕法尼亚州),教育工作者促进学生学习,视力障碍者导航我们的世界(Be My Eyes)。像 DALL·E 和索拉(目前处于研究预览阶段)这样的人工智能工具正在为从有抱负的艺术家到电影制片人的创意提供支持。
我们的使命是造福全人类。这不仅包括我们的用户,也包括创作者和出版商。虽然我们相信法律的先例和健全的公共政策使学习成为合理的使用,但我们也认为,在人工智能时代,我们为内容的广泛有益的社会契约的发展做出贡献是很重要的。
我们认为,人工智能系统应该有利于并尊重创作者和内容所有者的选择。我们不断改进行业领先的系统,以反映内容所有者的偏好,并致力于构建产品和商业模式,为创作者和出版商提供充满活力的生态系统。
我们不是专业作家、艺术家或记者,也不是从事这些行业的人。我们专注于构建工具,以帮助这些专业创造和实现更多。为了实现这一目标,我们听取这些社区成员的意见并与他们密切合作,并期待着我们继续进行对话。今天,我们分享更多关于我们在哪里,我们在哪里前进。
我们尊重创作者和内容所有者在 AI 上的选择 几十年前,robots.txt 标准被引入并被互联网生态系统自愿采用,以指示网络爬虫可以访问网站的哪些部分。
去年夏天,OpenAI 率先为 AI 使用网络爬虫权限,使网络出版商能够表达他们在 AI 中使用其内容的偏好。我们在每次训练新模型时都会考虑这些信号。
也就是说,我们知道这些是不完整的解决方案,因为许多创作者并不控制他们的内容可能出现的网站,并且内容经常被引用,审查,重新混合,重新发布并在多个领域中用作灵感。我们需要一个高效、可扩展的解决方案,让内容所有者表达他们在人工智能系统中使用内容的偏好。
我们正在构建 Media Manager,以便内容所有者可以管理他们的作品如何在 AI 中使用 OpenAI 正在开发媒体管理器,这是一个工具,可以让创作者和内容所有者告诉我们他们拥有什么,并指定他们希望如何将自己的作品纳入机器学习研究和培训。随着时间的推移,我们计划引入更多的选择和功能。
这将需要尖端的机器学习研究来构建一个有史以来第一个同类工具,以帮助我们识别多个来源的受版权保护的文本、图像、音频和视频,并反映创作者的偏好。
我们正在与创作者、内容所有者和监管机构合作开发 Media Manager。我们的目标是到 2025 年将该工具投入使用,我们希望它能为整个人工智能行业树立一个标准。
我们正在构建产品,使用户,创作者和出版商在一个充满活力的生态系统中受益 今天,我们生活在一个注意力经济中,广告商比用户更重要,数量比质量更重要。我们的目标是使用人工智能来改变这一点:为创作者和出版商提供支持,并增强用户体验。
我们不断使我们的产品成为更有用的发现引擎。我们最近 improved source links in ChatGPT(opens in a new window)改进 ChatGPT 中的源链接,为给予用户更好的上下文和网络发布者提供与受众联系的新方式。
我们还与合作伙伴合作,在我们的产品中展示他们的内容,并增加他们与读者的联系。我们已经宣布与全球新闻出版商合作, Financial Times, to Le Monde, Prisa Media, Axel Springer 英国《金融时报》、《世界报》、Prisa Media、阿克塞尔施普林格等,在 ChatGPT 中展示他们的内容,丰富新闻主题的用户体验。更多的创新正在路上。这些内容也可用于培训 ChatGPT,以便更好地向用户展示相关的发布者内容,并改进我们的新闻编辑室工具。
我们的合作伙伴关系旨在使合作伙伴及其用户受益,使我们的模型对其员工,客户和社区更有用。为了帮助推进教育资源,我们与非营利组织合作, Khan Academy 和总部位于英国的 ExamSolutions,以提高我们模型的数学性能,从而加快他们在其平台上扩展个性化 AI 辅导的能力。
了解我们的基础模型以及我们如何构建它们
我们将 AI 模型设计成学习机器,而不是数据库
人工智能模型从信息中的关系中学习,以创造新的东西;它们不像数据库那样存储数据。当我们训练语言模型时,我们需要数万亿个单词,并要求计算机提出一个最能描述单词之间关系的方程以及产生它们的潜在过程。在训练过程完成后,AI 模型不会保留对训练中分析的数据的访问。ChatGPT 就像一个老师,她从之前的大量学习中学习,并且可以解释事物,因为她已经学会了概念之间的关系,但不会将材料存储在她的脑海中。
我们的模型旨在帮助我们生成新的内容和想法-而不是重复或“重复”内容。AI 模型可以陈述公共领域的事实。如果在极少数情况下,模型无意中重复了表达性内容,这是机器学习过程的失败。这种失败更有可能发生在训练数据集中频繁出现的内容中,例如由于经常被引用而出现在许多不同公共网站上的内容。我们在整个培训和输出过程中采用最先进的技术,用于我们的 API 或 ChatGPT,以防止重复,并且我们正在不断进行研究和开发。
我们使用广泛而多样的数据为每个人构建最好的 AI 我们希望我们的人工智能模型能够从尽可能多的语言、文化、学科和行业中学习,以便让尽可能多的人受益。数据集越多样化,模型的知识、理解和语言就越多样化--就像一个人接触了广泛的文化视角和经验--人工智能可以安全地服务的人和国家就越多。
每一代新的基础模型都是在新的数据集上从头开始训练的。我们不断改进我们的架构,并大大提高我们的数据集的规模和多样性,超越我们以前的模型。与人工智能领域的大公司不同,我们没有几十年来收集的大量数据。我们主要依靠公开的信息来教我们的模型如何提供帮助。
我们使用以下方法训练模型:
选择公开可用的数据,主要是从行业标准的机器学习数据集和网络抓取中收集的,类似于搜索引擎。我们排除了我们知道有付费墙的来源,主要是汇总个人身份信息,有违反我们政策的内容,或者已经选择退出。
来自数据合作伙伴关系的专有数据。我们合作访问非公开内容,如档案和元数据。我们的合作伙伴包括一个大型的私人视频库,提供图像和视频,培训索拉,以及冰岛政府帮助保护他们的母语。我们不追求纯粹公开信息的付费合作伙伴关系。
来自 AI 培训师、红队队员、员工和用户的人工反馈,这些用户的数据控制设置允许模型改进。
我们注意减少对个人和敏感信息的处理,我们训练我们的模型不提供关于人的私人或敏感信息。我们使用多种技术来处理原始数据,以便在训练中安全使用,并越来越多地使用人工智能模型来帮助我们清理、准备和生成数据。
我们不会将客户的业务数据用于训练,包括来自 ChatGPT Team、ChatGPT Enterprise 或我们的 API 平台的数据。ChatGPT Free 和 Plus 用户可以在其设置中控制他们是否为未来的模型改进做出贡献。
我们正在建立伙伴关系
人工智能发展迅速,我们知道我们的目标无法单独实现。我们致力于与创作者和出版商合作,建立互利的合作伙伴关系,支持健康的生态系统,并探索新的经济模式。我们感谢我们的用户和合作伙伴在这些重要问题上与我们合作。“
4、直译工具
以上是直译,直译可以保留原始细节,到阅读略显拗口,或者说有“翻译腔”
你也可以选择清风 AI 的翻译大师提示词进行意译
(1)进入清风 AI,www.91chatgpt.site
点击“阅读原文”直达
具体操作详见《翻译危险了!国内直联 GPT 新增“科技翻译大师”角色》
(2)选择“翻译大师”角色
发起对话
(3)贴入原文
第一次是直译
第二次是意译
如果中断,你可以输入提示词“继续”
以下是意译全文,读起来比直译更加通畅
另外这里选用的是普通的AI,如果选高级AI,翻译会更加信达雅!
《OpenAI:我们的数据和 AI 方法论》
人工智能的发展应当为每个人提供更多机会。通过以全新的方式转化信息,人工智能系统帮助我们解决问题、表达自我。
现如今,我们的人工智能工具,例如 ChatGPT,在全球范围内被广泛应用。它们不仅帮助肯尼亚和印度的农民提高农作物产量(Digital Green),加速药物研发(Moderna),支持政府管理劳动力(宾夕法尼亚州),促进教育者提升学生学习,还帮助视障人士在世界中自如行走(Be My Eyes)。而像 DALL·E 和 Sora 这样的人工智能工具(目前处于研究阶段)则赋予从初出道的艺术家到电影制片人们更多创作力。
我们的使命是让人工智能造福全人类。这包括我们的用户,也包括创作者和出版商。尽管法律和公共政策为公平使用提供了框架,但我们认为在人工智能时代,我们对内容的广泛社会契约至关重要。
我们坚信人工智能系统应该尊重和造福创作者和内容所有者的选择。我们不断优化我们领先的系统以反映内容所有者的偏好,并致力于开发产品和商业模式,以进一步激发创作者和出版商生态系统的活力。
我们并非专注于专业写作、艺术或新闻行业,而是专心研发能够助力这些领域创新不断、创造更多成就的工具。为了实现这一目标,我们倾听并与这些社区紧密合作,期待促进更多互动。今天,我们分享了更多关于我们现状和未来发展方向的内容。
我们尊重创作者和内容所有者在人工智能方面的选择 几十年前,robots.txt 标准被引入并被互联网社区自愿采纳,帮助网站发布者指明网络爬虫访问网站的权限。
去年夏季,OpenAI 首创了使用网络爬虫许可机制来表达网站发布者在人工智能使用其内容方面的偏好。每次我们训练新模型时,都会考虑这些信号。
尽管如此,我们明白这还不是完美的解决方案,因为很多创作者无法掌控其内容在不同网站上的使用情况,内容也经常被引述、评论、混搭、转载,影响多个领域。我们需要一种高效、可扩展的解决方案,让内容所有者能在人工智能系统中准确表达对其内容的偏好。
我们正在开发 Media Manager,让内容所有者可以管理其作品在人工智能中的使用方式 OpenAI 正在开发 Media Manager,一项工具,使创作者和内容所有者能告诉我们他们拥有的作品,并明确希望如何让其作品参与或减少机器学习研究和训练。未来,我们计划推出更多选项和功能。
这需要先进的机器学习研究来打造一种前所未有的工具,帮助我们识别来自多个来源的受版权文本、图像、音频和视频,并确保反映创作者的偏好。
在开发 Media Manager 过程中,我们与创作者、内容所有者和监管机构合作。我们的目标是在 2025 年推出这一工具,并希望它将成为人工智能行业的标准。
我们正在开发产品,促进用户、创作者和出版商活跃的生态系统 如今,我们所处的生活是建立在广告商利益与用户量上的注意经济体。我们希望借助人工智能的力量改变这种现状:赋予创作者和出版商力量,并提升用户体验。
我们不断提升产品作为更为有用的发现引擎。最近,我们在 ChatGPT 中改进了源链接,为用户提供更全面的背景信息,帮助网络发布者与我们的受众更好地互动。
我们与合作伙伴合作,在我们的产品中展示他们的内容,加强与读者的互动。我们与《金融时报》、《世界报》、Prisa Media、Axel Springer 等国际新闻出版商合作,在 ChatGPT 中呈现他们的内容,丰富用户在新闻领域的体验。更多创新悄然进展中。这些内容还可用于训练 ChatGPT,更好地向用户展示相关出版商内容,并不断改进我们在新闻领域的工具。
我们的合作关系旨在使合作伙伴及其用户受益,让我们的模型能够更好地服务于他们的员工、客户和社区。为了推进教育资源,我们与非营利组织 Khan Academy 和总部位于英国的 ExamSolutions 合作,提升我们的模型在数学领域的表现,加速推广到他们平台上的个性化人工智能辅导服务。
理解我们的基础模型及如何构建它们 我们的人工智能模型旨在是学习机器,而非数据库 人工智能模型通过学习信息之间的关系生成新的内容和想法;它们不像数据库那样存储数据。当我们训练语言模型时,我们使用数万亿个词汇,要求计算机找出最适合描述这些词之间关系并产生它们的基本过程的方程。一旦训练结束,人工智能模型便无法再回到训练中分析的数据。ChatGPT 就如同一位老师,她通过大量学习获取了许多知识,并能解释事物,因为她学会了概念之间的关系,但她不会把这些内容记在脑中。
我们的模型旨在帮助我们产生新的内容和新的思维,而非重复或“复读”内容。
人工智能模型可以叙述属于公共领域的事实。如果偶尔模型无意重复表达性内容,则是机器学习过程中的失误。这种情况更可能发生在训练数据集中频繁出现的内容上,比如那些因在多个公共网站上频繁引用而被广泛知晓的内容。我们在训练和生成输出时采用最先进技术,确保我们的 API 或 ChatGPT 不重复内容,并持续投入研究与发展以改进这方面。”
以上就是今天的全部内容,主要给大家介绍了两款翻译神器。
既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标 ⭐ ~谢谢你看我的文章!
笔者组织了一个VIP学习群。已经有几百位小伙伴加入其中,每天热烈讨论各种的AI知识和工具。
付费加入知识星球“浩瀚的 AI 苍穹”后,即可取得 VIP 学习群加入方式!
以下是新人优惠券