查看原文
其他

技术应用|8大人工智能API平台——打造超智能APP

刘聪颖 语言服务行业
2024-09-09


本文摘编自Geekflare, 文章末附有英文版原文链接。

2010-2020年间,人类正式进入人工智能(AI)时代。它看起来似乎并未引起太大波澜,然而,人工智能其实早已悄悄渗透我们生活的方方面面,它在创造力、速度、增长等方面都有着无限的潜力,比如面部识别、物体识别、语音识别技术等等,不仅给客户提供了极致的体验,也给企业提供了难以比拟的竞争优势。

下面为大家介绍8款强大的AI平台。

Google(谷歌)

谷歌在人工智能对话中占据主导地位,多年来,该公司在人工智能研究和人才培养方面投入了数十亿美元,它的人工智能项目广为人知。谷歌在AI/ML中提供了一些最高质量的API,主要提供以下服务:

文本分析(自然语言处理)

人工智能的最大飞跃是理解和使用自然语言,无论是书面语言还是口头语言。谷歌的文本分析API非常强大,它主要提供了以下功能:

  • 语法分析(分析给定文本并识别关键部分)
  • 实体分析(例如,在非结构化文档中查找发票数据)
  • 情感分析(从书面或口头文字中识别人的情绪、意图等)
  • 多语言(适用于多种语言)

预测
预测服务也是AI平台综合产品的一部分。如果用户有自己的模型,并想对新数据进行预测,那么谷歌可以提供专门的预测服务;如果用户想做一些非标准或实验性的东西,甚至可以添加自定义代码。
AI平台
谷歌提供了一个端到端的综合平台,称为AI平台,它提供了针对数据科学和ML的完全托管式服务,旨在使ML和数据整理的操作尽可能顺畅。
OpenAI
OpenAI在人工智能领域做出了一些开创性的工作,尤其是在文本处理、视频/图像处理等方面。它的人工智能极为强大,甚至打败了最高水平的职业DOTA2玩家。以下简要介绍它的几种API服务:
  • 语义搜索(Semantic search):该服务允许用户基于自然语言中提供的问答,来搜索自由格式的文本数据,如文档。
  • 聊天机器人(Chatbots):如今大多数聊天机器人功能并不完善,相比之下,OpenAI的聊天功能要优越得多。
  • 客户服务(Customer service):OpenAI结合上述两种服务,来提供可行的客户服务体验,包括专门的客户服务,且具有搜索、推荐等功能。
    文本生成(Text generation):OpenAI通过API提供了文本生成功能,用户可以用各种创造性的方式来生成文本!
    理解(Comprehension):该服务可以获取给定的文本并生成其摘要,节省了大量时间,且提供了更多有用的信息。
    其他工具:OpenAI还有一些其他工具/服务,例如,它可以将语义搜索结果转换成电子表格以便于分析;它还提供一种服务,可以将文本从一种语言翻译成另一种语言(这是一种非常普遍的需求)。

Microsoft Azure
Azure这个名字广为人知,但是很多人可能不知道它的人工智能服务同样十分强大。Azure Cognitive Services是一个成熟的人工智能产品,几乎拥有构建智能、强大应用程序所需的一切。以下简要总结:
  • 语言:这些API是围绕计算机科学中所谓的自然语言处理构建的。简而言之,它从人类语言(无论是口语还是书面语)中提取信息,并生成和使用人类语言。它还有一些有趣的功能:对话式QnA Maker(一种基于云的自然语言处理服务)服务,将对话智能注入物联网和其他设备,关于给定文本的情感分析和其他元数据,翻译(截至发布时有60多种语言)等等。
  • 语音:这些API为应用程序提供了处理人类语音的能力。主要功能包括语音到文本转换、文本到语音转换、语音翻译和语音识别。
  • 视觉:计算机视觉一直是一个热门话题,Azure 提供的视觉API包括图像和视频分析、对象识别(图像和视频)、人脸检测、视频索引器(从视频中生成元数据)等功能。
  • 决策:这是一组通用API,有助于更好地做出决策或改进基于ML的决策过程。其提供的功能包括异常检测、内容审核、个性化服务(有助于用户创建智能、个性化的交互)等。

如今的Microsoft专注于云、服务和集成解决方案。如果用户执行的是基于Windows的操作,那么无论是本地部署还是云服务,集成Azure认知API都将大有所益。
AWS AI服务
提及基于云的服务和基础设施,就不可能不提到AWS(亚马逊云计算服务),它拥有约33%的云市场份额。该平台对各种类型和规模的软件架构师、CTO、开发人员、企业主等都有强大的吸引力。
AWS提供了功能丰富的服务:
  • Polly:文本到语音的转换是一项重要功能,尤其对企业来说,因为它有助于企业创建真正“活的”智能应用程序,这些应用程序可以用类似人类的声音进行对话。亚马逊Polly提供的正是此类服务。
  • Transcribe(转录):该服务与Polly相反,将语音转换为文本。它能够毫不费力地识别不同的口音,即使有一些背景噪音,也不受影响。此外,它生成的元数据数量惊人。
  • Rekognition:Rekognition是亚马逊的一项计算机视觉服务(针对图像和视频)。除了面部识别、物体检测、标签等标准功能,它还具有其他有趣的功能,如内容审核(例如,控制孩子在自己的设备上观看的内容)、名人识别、设备识别(为了员工的安全和合规性)等。
  • Fraud Detector(风险识别):该服务在新账户创建、客人结账、在线支付、滥用忠诚度计划等方面提供欺诈检测功能。
  • Lex:Lex是一项使用语音和文本为应用程序构建对话界面的服务,它拥有现代聊天机器人需要的所有功能。由于它是一项托管式服务,用户不必担心服务器的问题。
  • Kendra:Kendra是一项文档搜索服务,它利用人类语言来搜索查询。
ParallelDots
作为一家主要的人工智能公司,ParallelDots创造了十分有用的工具和行业特定的解决方案。其产品列表中只有四个项目(至少到目前为止),其中有一项产品十分突出,因为它既通用又准确。那就是它的文本分析API。
那么,这个API到底有多好用呢?我想自己做一些测试,所以我选择了一段摘自现代文学经典的散文片段(杰克·凯鲁亚克写于1957年的一篇散文)。选文内容如下:
The only people for me are the mad ones, the ones who are mad to live, mad to talk, mad to be saved, desirous of everything at the same time, the ones who never yawn or say a commonplace thing, but burn, burn, burn like fabulous yellow roman candles exploding like spiders across the stars.
你觉得怎么样?这段文字想传达什么?你认为它反映了作者的什么情绪呢?
我把这段文字粘贴到文本框中,点击分析,以下为分析结果:
总而言之,它分析的还不错,我选择的这篇散文相当具有挑战性,因为它没有明确指出任何东西。然而,老练的读者会察觉到明显的焦虑和愤怒。而这也是API显示的主导情绪!然而,这篇文章表达的不仅仅是愤怒情绪,“无聊”和“快乐”近20%的分数也不无道理,这些情绪也在文本中得到了反映,尽管它们不是主导情绪。
当然,它的分析并不总是正确的,但是正如我在本文前面所写的那样,100%的准确性不是目标(甚至可能无法实现)。我们的目标是构建一个强大的人工智能,从而帮助我们构建几十年来只敢想象的应用程序。
IBM Watson 
IBM Watson曾被称为全能的人工智能,或将永远取代人类。然而到2020年,Watson早已淡出公众视野,但这并不意味着这是个昙花一现的项目。虽然人工智能没有达到其史诗般的潜力,但是Watson毫无疑问值得一试,以下是Watson Solutions旗下提供的主要服务:
  • Watson Assistant(沃森助理):该服务包含许多组件,旨在改善客户服务体验。它具有全面的分析功能,可通过与客户数据平台(如 Segment)的集成来了解和改进聊天机器人的性能,并可与您的其他应用程序共享这些洞察。
  • RegTech:IBM RegTech是一项重量级服务,旨在提高合规性并将风险管理集成到组织运营的所有层面。它还有助于应对支付欺诈、金融犯罪等关键问题。
  • Watson Health(沃森健康):沃森健康是医疗保健行业高度专业化的人工智能服务。它能够满足与数据相关的需求,比如研究、诊断成像、优化医疗保健计划的成本和质量等方面。
  • AIOps:IBM说,AI+Ops=AIOps。这是一项专门的人工智能服务,用于优化IT运营。IT工具链和IT运营十分复杂,AIOps有助于为其检测早期问题、提供弹性解决方案以及改进决策等。
  • Watson Media(沃森媒体):沃森媒体服务专用于大规模的实时视频流,能够生成字幕、搜索视频、分析视频等。由于安全摄像头也是一种直播形式,因此Watson Media也十分适用于威胁检测、物体识别等。
Rev.ai
Rev.ai只专注于做好一件事,那就是语音到文本的转换,它甚至不提供文本到语音的转换,更不用说其他类别的AI/ML了,因此其精确度极高。
如上图,测试显示Rev.ai比谷歌的语音转文本要准确得多。
Rev.ai未来可能会推出更多服务,如果用户想要得到准确性极高的语音到文本的转换,Rev.ai值得一试。
Wit.ai
Wit.ai是一个人工智能平台,在语音处理和文本处理方面具有高级功能。这听起来和所有其他的NLP和文本分析/转录服务很相似,但它还具备其他特点:
  • Wit.ai是开源的。因此,用户可以自由学习其技术或在自己的设备上架构托管平台。
  • Wit.ai不仅仅是GitHub上的一些代码转储,还是一项实际正在运行的API服务(以HTTP APIs的形式),且任何人都可以使用。
  • API服务是免费的,不存在定价计划。
  • Wit.ai可扩展。也就是说,它的核心目的或多或少是帮助用户创建、训练、测试和使用ML模型。
结论
人工智能(AI)、机器学习(ML)、神经网络、数据、模型、训练、预测...这些都不再是流行语了。正如任何突破性的技术一样,一旦稳定下来,人工智能就已经商品化了。人工智能创造了一个公平的竞争环境,剩下的就看我们自己了。
原文链接:https://geekflare.com/ai-apis/
声明:本公众号转载此文章是出于传播行业资讯、洞见之目的,如有侵犯到您的合法权益,请致信:chongchong@lingotek.cn,我们将及时调整处理。谢谢支持!


-END-
本文转载自:翻译技术教育与研究转载编辑:Pickey


关注我们,获取更多资讯!

往期回顾

行业动态1. 行业观察 | 齐阿曼:借助新技术点亮翻译教学之光
2. 行业动态 | BRIGHT翻译平台低资源多语言机器翻译评测榜单发布
3. 活动预告 | 第十三届中国认知语言学研讨会4. 行业观察 | 生成式AI能否赢得下一场企业技术竞赛,科技创新世界潮
行业洞见
  1. 行业观察 | 生成式AI能否赢得下一场企业技术竞赛,科技创新世界潮
  2. 精彩回顾 | ChatGPT如何处理各类语料数据?大语言模型赢麻了!
  3. 行业观察 | 张成智:搜索是一种态度
  4. 精彩回顾 | AIGC时代语料库专题沙龙干货来啦


行业技术
  1. 技术应用 | memoQ新手必备:一站式下载、安装和个性化配置指南
  2. 技术应用 | 巧用COCA,语料库武力值UP!
  3. 技术应用 | 4万字+50幅图一网打尽Transformer
  4. ChatGPT | 文献阅读小帮手:New Bing
  5. 如何使用trados生成客户要求的clean和unclean文件?

精品课程
  1. 新课来袭|职业译员的搜索进阶之道
  2. 距离CATTI考试还有两个月,9月23日CATTI备考工作坊带你全面捕获英汉、汉英口笔译重难点!
  3. 10月3日 | AIGC时代西安研修班,探索翻译技术与语料库的奥妙!
  4. 10月2日 | AIGC时代北京研修班,带你纵览翻译技术全景图!
  5. 精品课程|CATTI打卡训练营,全勤打卡可返还全额学费,你敢来挑战吗?

资源干货
  1. 资源干货 | 机器学习入门导读(文章汇总)
  2. 资源干货 | 英语外刊获取途径、网站推荐
  3. ChatGPT | AI外语写作助手,助力高效写作
  4. 双语干货 | 谢锋大使向中美媒体发表讲话
  5. 资源宝库|译者用“典”,多多益善——精选31款在线词典

招聘就业1. 招聘快报 | 军工央企招聘英语、俄语翻译
2. 招聘快报 | 中国国际进口博览会招募实习岗(需英语)3. 招聘快报 | 小米科技:翻译专员4. 招聘快报 | CNBC财经电视台上海分公司招聘发行部助理实习生5. CATTI备考在即,备考实习两不误,硬核语言专业线上实习机会来了!
继续滑动看下一个
语言服务行业
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存