人工智能软件:值得关注的45个人工智能项目
人工智能软件在崛起:我们每天使用的许多设备和服务都基于人工智能,人工智能软件一直在变得越来越聪明。
人工智能(AI)软件已成为频频出现在科幻小说中的一个主要角色,以至于大多数人认为它是一项未来技术,能不能成为现实说不准。
但事实是,我们大多数人已经每天在使用人工智能软件。
每当你跟智能手机对话、上网搜索或者查看社交媒体资讯,就在与人工智能进行交互。人工智能软件与我们一起玩游戏、作曲、编剧。另外,每当你上网购物,越来越有可能遇到人工智能。实际上,知名市场研究机构Gartner预测:“到2020年,并不由人类控制的自主软件代理将参与所有经济交易活动中的5%。”
让人有点不安的是,Gartner的同一份报告预测:“到2018年,全球300多万工人将受到‘机器人上司’(robo-boss)的监管。到2018年,在发展速度最快的公司中,45%拥有的员工数量少于智能机器的数量。”
诸如此类的预测让一些人因此担心失去工作。其他人则发出警告,提醒人工智能有可能变得很危险,包括像伊隆·马斯克(Elon Musk)和斯蒂芬·霍金(Stephen Hawking)这些名人。他们是生命未来研究所(Future of Life Institute)这个组织的成员;该组织声称,智能机器会給人类生活构成“生存风险”,并且在支持致力于确保人工智能仍然有利于人类的研究工作。
到目前为止,根本还没有哪款人工智能拥有危及人类生活所必不可少的功能。相反,大多数人工智能软件专门用来处理极其普通的任务,比如理解自然语言,识别照片中的对象和面部,提供购物建议,并寻找常见问题的答案。然而,这项技术正以极其迅速的步伐发展。许多人工智能代理采用机器学习技术,逐渐变得“更聪明”,许多大大小小的技术公司在积极投资于人工智能研究。
本文介绍了目前正在开展中的45个最值得关注的人工智能项目。前半部分着重介绍了世界上一些最大的科技公司在这方面的研究工作,后半部分详细介绍了开源社区和小厂商在开展的研究工作。本文并不是很全面,但确实包括了已知在开发中的许多最值得关注的人工智能软件。
IBM
蓝色巨人可谓是人工智能领域的早期开拓者之一,Watson系统参与电视智力竞赛节目《危险边缘》后,大众因此领略了现代人工智能技术的强大。IBM通常用“认知计算”(cognitive computing)这个术语来指代其人工智能解决方案,它在销售时采用了“Watson”这个品牌名。IBM提供的不同人工智能产品和服务有几十种之多,它们通常分为两类:开发工具和使用Watson技术的预制应用程序。该公司还赞助一场金额为500万美元的大赛,激励初创公司利用人工智能,“克服全球的一些重大挑战。”
Watson API
这些工具专为开发人员设计,让其他公司可以在自己的应用程序中利用Watson认知计算功能。它目前提供约19套不同的API,拥有众多功能:概念扩展、对话、语言翻译、性格分析、语音分析、关系提取、语音转换成文本、文本转换成语音、视觉识别和分析等。它们可以通过IBM Watson Developer Cloud服务来加以访问。
相关链接:https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/
Watson Marketplace
在Watson Marketplace,IBM提供它开发的基于其认知计算技术的应用程序。这些包括:Watson Trend(一款个人购物应用程序)、Watson Analytics、Talent Insights、Analytics for Social Media和Watson for Clinical Trial Matching(面向医疗保健行业)。
相关链接:https://www.ibm.com/marketplace/cognitive-computing-ibm-watson/
SystemML
IBM已开放了包括SystemML在内的一些机器学习技术的源代码。SystemML现在是个Apache孵化器项目,“针对可以灵活地指定机器学习算法,并自动生成混合运行时计划,从单节点的内存中计算到MapReduce或Spark上的分布式计算,不一而足。”
相关链接:http://researcher.watson.ibm.com/researcher/view_group.php?id=3174
谷歌
众所周知,谷歌将大量的资源投入于研究,有一个名为Google Brain的内部团队从事于人工智能项目。他们的工作成果有许多应用于谷歌的其他产品,包括搜索和Google Now Android个人助理。它还发布了该团队的一些工作成果,作为开源应用程序,该小组还发表了人工智能方面的好几篇文章。
TensorFlow
Tensor Flow是谷歌大脑团队(Google Brain Team)开发的谷歌开源人工智能项目之一,“这个库用于使用数据流程图的数值计算。”网站包括Python和C++ API,让开发人员可以在自己的应用程序中使用谷歌的人工智能功能。
相关链接:https://www.tensorflow.org
谷歌云机器学习
谷歌通过谷歌云平台,将一些机器学习技术提供给广大开发人员使用。它将同样的服务用于其自己的许多产品,包括Photos图片搜索、谷歌语音搜索、翻译和Gmail智能回复。
相关链接:https://cloud.google.com/products/machine-learning/
DeepMind
2014年,谷歌收购了总部位于伦敦的人工智能初创公司:DeepMind。迄今为止,这个研究小组最抢眼的成果就是开发出了AlphaGo系统,这是“第一个在围棋赛中击败职业顶尖棋手的计算机程序。”该小组还在努力将强化学习运用到机器学习,将深度学习技术运用到医疗保健领域。
相关链接:https://deepmind.com
RankBrain
关于影响其搜索引擎上排名的几个因素,谷歌没有透露太多的详细信息,不过表示它采用一种名为RankBrain的人工智能技术,作为其算法的一部分。RankBrain可以猜测它之前从未见过的搜索词的含义,返回相关结果。它无法下载,也没有出售,不过是IT行业备受关注的对象。
相关链接:https://en.wikipedia.org/wiki/RankBrain
微软
与其他大牌科技公司一样,微软也有一支相当庞大的内部团队致力于研发机器学习和人工智能。下设多个小组,分别专注于算法经济学、深度学习、机器学习、机器教学、自然语言计算及更多方面,它在官方网站上列有一长串的当前项目。创新成果也整合到微软的其他产品和服务当中。
Cortana
微软名为Cortana的个人助理软件也许是最引人注目的人工智能产品。它已被整合到Windows 10中,还适用于Android和iOS。它可以执行诸多任务,比如提供更新、给予提醒以及处理自然语言搜索。
相关链接:https://www.microsoft.com/en-us/windows/Cortana
CNTK
近些年来,微软已开始拥抱开源,它在GitHub上发布了一些人工智能技术。CNTK的全称是计算网络工具包,这种工具让开发人员可以将分布式深度学习应用到自己的项目上。最近它进行了更新,支持更高的性能和更好的扩展性。
相关链接:https://www.cntk.ai
分布式机器学习工具包
另一个开源项目:分布式机器学习工具包(DMLT)可帮助训练面向机器学习应用程序的庞大模型。它包括DMTK框架、Light LDA主题模型算法以及Distributed(Multisense)Word Embedding算法。
相关链接:http://www.dmtk.io
微软认知服务
微软还为开发人员提供了采用订阅模式的几套人工智能API,提供免费试用服务。目前的API包括:Computer Vision(计算机视觉)、Emotion(情感)、Face(面部)、Video(视频)、Bing Speech(必应搜索)、Language Understanding(语言理解)、Knowledge Exploration(知识探索)和Recommendations(建议)及更多API。微软还使用这些API构建了几个示例应用程序,其中一些已在社交媒体界流行开来。
相关链接:https://www.microsoft.com/cognitive-services/
Project Malmo
在这个有趣的项目同,微软研究人员将人工智能引入到《我的世界》这款游戏。他们正在教人工智能系统如何理解复杂环境、向别人学习,并运用学到的技能应对新挑战,以解决问题。目前它还是一款内测版,微软计划到时发布采用开源许可证的版本。
相关链接:http://research.microsoft.com/en-us/projects/project-malmo/
Tay
2016年3月份,微软发布了一款名为Tay的人工智能聊天机器人,旨在可以在Twitter上与人进行交互,并向人学习。在不到一天的时间,其他Twitter用户已教会Tay发表种族主义言论和攻击性言论,于是微软将它下线。一周后,微软重新发布了Tay,可是结果遇到了类似的问题。该公司表示,“一旦可以确保机器人安全”,计划把Tay放回到Twitter上。
相关链接:https://en.wikipedia.org/wiki/Tay_%28bot%29
这个社交网络已往人工智能领域投入巨资,主要通过所谓Facebook人工智能研究(FAIR)的内部小组来完成。研究领域涉及自然语言处理和计算机视觉,大部分研究成果通过面部标记和新闻源排名等功能,直接应用到Facebook内部。这个小组还发表了数篇论文,为多个开源人工项目做贡献。
Wit.ai
2015年,Wit.ai被Facebook收购,它为开发人员提供的工具可用于制造与人类进行联系的机器人。其语音识别技术还可以用于与移动应用程序、家庭自动化系统、可穿戴设备甚至机器人进行互动。
相关链接:https://wit.ai
亚马逊
亚马逊是人工智能领域的另一大投资者,它很早就在其电子商务网站上使用机器学习,用于推荐产品、预测价格。而首席执行官杰夫·贝索斯(Jeff Bezos)近期表示,“可以毫不夸张地说,在未来20年,人工智能将会給社会带来很大的影响。”此外,这家公司最近收购了一家名为Orbeus的人工智能初创公司。
Alexa
Alexa是亚马逊Echo设备采用的技术,让用户可以播放音乐、解答问题和购买产品等。该公司最近向开发人员开放了Alexa技术,因而可以使用该技术来支持自己的应用程序和设备。
相关链接:https://developer.amazon.com/appsandservices/solutions/alexa
亚马逊机器学习
亚马逊的云计算部门亚马逊网络服务(AWS)提供一种名为Amazon Machine Learning(亚马逊机器学习)的人工智能服务。如果开发人员想试用这项服务,可获取免费版本;必要时,该服务很容易扩展。
相关链接:https://aws.amazon.com/cn/machine-learning/?tag=vig-20
苹果
相比其他一些大牌科技公司,苹果对于其人工智能计划相对讳莫如深,不过毫无疑问,它在投资于这个领域。它发布的几个工作岗位与机器学习有关,最近还收购了人工智能初创公司Emotient和Vocal IQ。
Siri
苹果的人工智能项目取得的最明显成果就是安装在iOS设备上的Siri语音助理。尽管遭到了一些批评,但这个早期的个人助理还是为类似的基于人工智能的助理(比如Cortana和Google Now)设立了标杆。
相关链接:http://www.apple.com/ios/siri/
英特尔
英特尔的人工智能工作主要专注于借助其芯片和软件,实现机器学习、深度学习和人工智能。它也收购了好几家专注于人工智能领域的小公司。
Saffron Technology
2015年10月份,英特尔收购了Saffron。它提供两款应用软件:Streamline使用认知技术来加快新产品开发,而Advantage对大数据执行可视化分析。
相关链接:http://saffrontech.com
雅虎
雅虎首席执行官玛丽莎·梅耶(Marissa Mayer)畅谈了人工智能的重要性,该公司在内部开发了几款人工智能工具,帮助运行其众多网站。
Caffe on Spark
今年,雅虎开源了一款名为Caffe on Spark的工具,该工具将两个知名的开源项目(Caffe和Spark)结合起来。实际上,有了这个项目,可以在庞大的Hadoop集群上执行机器学习任务,雅虎使用它来帮助自己运行Flickr照片服务。
相关链接:http://yahoohadoop.facebook.com/post/129872361846/large-scale-distributed-deep-learning-on-hadoop
SkyPhrase
收购活动还帮助雅虎增强其人工智能能力。2013年,雅虎收购了SkyPhrase,现在它将SkyPhrase自然语言功能提供給广大开发人员,作为一个软件开发工具包(SDK)。不过要注意,开发人员需要邀请,才能享用这项技术。
相关链接:https://developer.yahoo.com/skyphrase-sdk/
Salesforce
与其他许多科技领袖一样,Salesforce首席执行官马克·贝尼奥夫(Marc Benioff)也热衷于人工智能,预测将会出现“人工智能优先的世界”。这家公司一直通过收购小公司来夯实其人工智能能力。
MetaMind
今年4月份,MetaMind被Salesforce收购,旨在将深度学习和人工智能引入到业务应用软件。由于其技术整合到Salesforce的云计算解决方案当中,MetaMind的独立服务正逐渐被淘汰。
相关链接:https://www.metamind.io
PredictionIO
2016年1月份,PredictionIO成为Salesforce的一部分。它提供开源机器学习服务器,开发人员就可以使用这些服务器,非常迅速地创建预测引擎。Salesforce还将该技术整合到自己的一些产品当中。
相关链接:https://prediction.io
其他
Accord.NET框架
有了这个开源机器学习框架,就很容易将音频或图像处理功能添加到应用程序中。官方网站上有诸多资源,比如示例应用程序、说明文档和维基,帮助开发人员尽快了解和熟悉这项技术。
相关链接:http://accord-framework.net
Apache Mahout
这个开源项目的既定目标是,“打造一种环境,用于快速创建可扩展、高性能的机器学习应用程序。”它包括三大部分:编程环境,面向构建基于人工智能的应用程序的开发人员;支持众多工具的预制算法;以及一种名为Samsara的向量数学实验环境。
相关链接:http://mahout.apache.org
Braina
Braina的全称是“人造大脑”(Brain artificial),这是一种商用个人助理应用程序,适用于Android或Windows PC。它能够通过你告诉它的信息来学习,还能够在你的智能手机或电脑上执行简单任务。
相关链接:https://www.brainasoft.com/braina/
Caffe
Caffe是在加州大学伯克利分校和伯克利视觉及学习中心开发而成的,这是一种面向深度学习的开源框架。它声称拥有表达型架构、可扩展代码、出色性能以及广大用户和开发人员组成的活跃社区。
相关链接:http://caffe.berkeleyvision.org
ConvNetJS
你可能已从其名字中的“JS”猜到,ConvNetJS是一个开源JavaScript库。它让用户可以完全从浏览器训练神经网络。
相关链接:http://cs.stanford.edu/people/karpathy/convnetjs/
Cyc
Cycorp公司提供统一采用Cyc品牌名的几款不同语义工具。OpenCyc是一种开源知识库和推理引擎; EnterpriseCyc实施了同样的技术,不过得到商业支持;ResearchCyc则是人工智能研究人员可免费使用的技术。
相关链接:http://www.cyc.com
Deeplearning4j
这个开源工具为Java带来了商业级深度学习能力。它与Hadoop和Spark之类的大数据工具整合起来,通过Skymind提供商业支持服务。
相关链接:http://deeplearning4j.org
Encog
Encog是一种开源机器学习框架,支持人工神经网络,支持向量机、贝叶斯网络、隐马尔可夫模型、遗传编程和遗传算法。可适用于Java或C#,它是个跨平台工具,在配置GPU的多核硬件上可顺利使用。
相关链接:http://www.heatonresearch.com/encog/
H2O
这家面向企业的人工智能公司拥有众多知名用户,包括第一资本、思科、尼尔森卡塔利娜(Nielsen Catalina)、贝宝(PayPal)和Transamerica。它提供了可将机器学习功能与Spark、Hadoop和R之类的大数据工具结合使用的工具,它既有开源产品,又有商业支持的产品。
相关链接:http://www.h2o.ai
MLlib
Apache Spark大规模数据处理引擎有一个名为MLlib的机器学习库。它承诺可轻松部署到Hadoop上,性能却比MapReduce高100倍。
相关链接:https://spark.apache.org/mllib/
Mycroft
这家公司致力于开发使用人工智能来控制物联网的开源技术。该公司已发布了几款开源自然语言处理工具,还有一款采用了众筹方式的物联网控制设备,外观如同非常友好的机器人。
相关链接:https://mycroft.ai
Neuroph
Neuroph是一种基于Java的开源框架,可用于开发神经网络架构。它旨在供刚接触人工智能的开发人员使用,提供了比较详细的在线说明文档。
相关链接:http://neuroph.sourceforge.net
Numenta HTM /NUPIC
Numenta这家公司开发的产品基于一种名为分层式即时记忆(Hierarchical Temporal Memory)的理论,这同时为生物智能和机器智能提供了一种框架。NUPIC是基于这种理论的开源平台,它可用于数据分析、预测和异常检测。
相关链接:http://numenta.com
Open Cog
Open Cog是另一个开源项目,致力于“创造有利的强人工智能(AGI),拥有与人类相当的广泛能力,最终更胜一筹。”这项技术目前应用于香港理工大学;很快就会发布智能水平与学龄前儿童相当的软件,开发团队对此颇有信心。
相关链接:http://opencog.org
Oryx 2
Oryx 2基于Apache Spark和Apache Kafka的架构,这是一种专门为实时大规模机器学习设计的应用程序开发框架。它是由Cloudera创建的一个开源项目。
相关链接:http://oryx.io
OpenNN
OpenNN的全称是“开放式神经网络”,这是一种用C++编写的预测分析库,声称性能出众。它是由Artelnics开发的,这家软件开发商专门为企业开发数据分析软件。
相关链接:http://www.opennn.net
Scikit-learn
这个开源项目提供了面向Python的机器学习工具,侧重于数据挖掘和分析。它建立在其他几个开源项目的基础上,包括NumPy、SciPy和matplotlib。
相关链接:http://scikit-learn.org/stable/
Shogun
Shogun自称是“一种大规模机器学习工具箱”。它支持一系列广泛的编程语言,并提供众多功能,包括分类、回归、降维、聚类、度量、多任务、结构化输出、在线学习特征哈希、集成方法和优化等功能。
相关链接:http://www.shogun-toolbox.org
Theano
据官方网站声称,Theano“自2007年以来,就一直在支持大规模计算密集型科学调查。”它是个Python库,可以高效地处理涉及多维数组的数学表达式,它对一些深度学习应用来说很有用。
相关链接:http://www.deeplearning.net/software/theano/
Torch
Torch是一种开源科学计算框架,支持许多机器学习算法,它旨在可以在GPU上运行,而且基于Lua即时编译器(LuaJIT)。社区成员已开发了Torch程序包,用于机器学习、计算机视觉、信号处理、并行处理及其他人工智能应用领域。
相关链接:http://torch.ch
Viv
Viv的开发者正是Siri背后的开发团队,这种新的人工智能平台由传统输入方法加以控制。它可以不断学习周围环境,因而每天增强其功能。眼下还没有可供下载的软件,不过其背后的公司目前正在寻求有兴趣将Viv整合到自家产品中的合作伙伴。
相关链接:http://viv.ai
WEKA
WEKA的开发者是新西兰怀卡托大学的机器学习小组,它让Java应用程序具有数据挖掘功能。它包括诸多机器学习算法,可用于数据预处理、分类、回归、聚类、关联规则和可视化等任务。
相关链接:http://www.cs.waikato.ac.nz/~ml/weka/
WolframAlpha
这个商业项目是一个知识引擎,可以回答众多课题方面的问题,包括数学、语言、化学、日期、健康、科学、理财、历史以及更多课题。任何人都可以在官方网站上使用免费版本,也可以订阅专业版服务,每月费用只要五六美元。
相关链接:http://www.wolframalpha.com
云头条编译|未经授权谢绝转载
相关阅读:
最神秘的人工智能创业公司Vicarious,让机器拥有想象力
AI热点:谷歌、Facebook、亚马逊和苹果竞相收购人工智能初创公司
欢迎加入交流,群主微信:aclood