最近Forrester发布了《2020年中国预测分析与机器学习竞争格局》报告(每两年发布一次),本报告旨在解释各大供应商如何满足评估标准,并且帮助首席信息官(CIO)根据自身需求选择最合适的供应商。
相比2018年,2020年国内厂商脱颖而出,第四范式、阿里云、华为云和百度云占据“领导者”位置;京东智联云、腾讯云和百分点为“优异表现者”;而天云数据和浪潮则入选“竞争者”梯队。模型开发、模型运营和基础设施成为拉开差距的关键因素
PAML供应商应具备多样化的建模能力,以满足不同团队的需求,为顺利部署提供模型运营,并提供可扩展的基础设施以支持模型训练和模型推理。
第四范式实现了机器学习自动化,降低了AI转型门槛。第四范式是一家由数据科学家于2014年创办的人工智能独角兽企业,在大规模机器学习应用方面经验丰富,并致力于赋能全生命周期的人工智能转型。该公司凭借其AI专业知识和商业技能将领域数据集标准化,从而缩短数据准备周期。第四范式采用超高维算法生成并处理数十亿个数据特征,以提高模型性能,此外,还能通过连续不间断的模型运营保证出色的模型性能。对这些功能的简化使第四范式的自动机器学习(AutoML)区别开来,从而加速金融服务、零售等主要垂直领域的企业转型。受访客户表示,4Paradigm的AutoML在某些场景中,可以和人类数据科学家一样精确,并对该供应商的ML项目管理和安全特性感到满意。除软件包以外,第四范式还可以提供集成专用FPGA芯片、实时数据库以及软硬件优化的AI设备。为寻求进一步的发展,该公司需要在标准化的产品组合和定制化的解决方案之间找到平衡——这是初创企业经常遇到的困难。对于渴望构建AI能力但缺乏专业人才的公司来说,第四范式是理想之选。阿里云通过公共云生态系统突出其PAML服务的不同之处。公共云先驱阿里巴巴在其云平台上推出了人工智能平台(PAI)以提供全面的PAML服务,涵盖多模、基于笔记本、专注自动化的功能。由于支持阿里巴巴的电子商务,PAI表明了它具有支持大规模机器学习训练和推理工作负载的可扩展性,尤其是对稀疏数据而言。PAI还支持众多开源AI框架,甚至支持拥有更高性能和可扩展性的一些改进版TensorFlow和PyTorch。阿里巴巴的不同之处在于其PAI Studio和PAI Studio-Notebook产品能够使用可视化元素和代码加快模型开发。受访客户称赞PAI与阿里云服务无缝集成。在公共云上运行时,PAI可以轻松访问来自云数据库、大数据平台和流式数据源的数据,不过它确实需要更强大的模型监测功能。对于已经在阿里云上运行业务应用系统,寻求简易高性能的模型训练和部署服务的公司来说,PAI是理想之选。
华为在入围2018年Forrester Wave报告后,积极升级了PAML服务,并拆分出华为云这家独立公司。华为云不仅提供面向机器学习模型训练和推理的ModelArts,还提供开源深度学习框架MindSpore。华为云的模型开发和部署体验在云和边缘设备上稳定一致。在中国新冠疫情爆发期间,由于迫切需要数字化转型,ModelArts的使用量激增了两个数量级以上。受访客户称赞ModelArts的智能标记功能,这帮助他们大大减少了对人力的需要。ModelArts拥有易于使用的模型验证和解释功能,可帮助开发人员评估和诊断备选模型的性能和稳健性;它还支持模型压缩,以改善华为云边缘设备上的推理性能。华为云仍需要加强其创建和托管使用PAML模型的应用软件这一功能。对于面对涉及云、本地和边缘的复杂部署环境的公司来说,它是理想之选。百度对AI寄予厚望,将其视作公共云的一个关键的差异化优势。百度在中国拥有领先的搜索引擎;客户钦佩其在自然语言处理(NLP)及其他深度学习功能方面的专长。百度的ERNIE预训练语言模型获得了出色的性能。其飞桨开源深度学习框架支持拥有数万亿个参数的模型;源于该框架的PaddleCV、PaddleSpeech和PaddleRec等库支持丰富的基于深度学习的解决方案。受访客户对百度EasyDL的易用性和模型性能感到很满意。此外,PaddleSlim和Paddle Lite可适应一系列广泛的边缘芯片组。然而,百度仍需要加强其模型验证和解释功能。客户期望百度消除公共云机器学习与本地机器学习在功能上的差距。百度很适合试图快速针对NLP、计算机视觉和语言分析实现深度学习解决方案的公司。京东集团积极利用AI来支持其庞大的电子商务业务和自建物流业务。其AI服务在618大促销活动期间被调用了700多亿次。京东云与AI事业部通过NeuHub AI服务展现了京东的智能供应链专长,包括产品设计、采购、仓储、物流、销售、营销和客户服务。属于NeuHub系列的NeuFoundry提供了多模PAML服务,包括公共云和本地部署方案。京东云与AI事业部提供了为其电子商务业务开发的一些差异化的算法,包括重购预测、账单确认、产品图像理解和客户评论分析。受访客户对这些算法的性能感到很满意。为了支持更复杂的企业场景,NeuFoundry的公共云版本需要支持更多的数据源,并改进可扩展性,以支持大规模的模型训练和推理。它还需要改善模型性能监测和重新训练等模型操作。京东云与AI事业部很适合力求借助AI改善客户智能和数字化运营的公司。腾讯云提供灵活的PAML产品组合以满足客户需求。腾讯的TI-ONE为AI开发人员提供了多模PAML服务。TI-ONE嵌入了一系列广泛的开源AI框架和内置算法,在拥有 GPU实例的可扩展环境上运行。腾讯还提供弹性模型服务,以应对动态推理工作负载带来的挑战。除了公共云服务外,腾讯云还提供TI-Matrix本地软件包,以加快金融服务、能源、电信和智慧城市等垂直领域的AI应用开发。TI-ONE可在图形化工作台中为大多数可用的模型提供参数自动优化。受访客户称赞TI-Matrix的模型注册库和模型服务中心。为了在机器学习生命周期过程中均衡地提供服务,腾讯云仍需要改进其数据探查和模型验证功能。TI-ONE只支持其对象存储作为数据源,缺少与其他云服务集成的功能。腾讯很适合要求本地PAML部署的客户。百分点创办于2009年,在机器辅助决策和自动知识创建以推动数字化智能转型方面有着丰富的经验。百分点提供嵌入了PAML功能的洞察力平台BD-OS,并提供知识图实用工具和自然语言智能等认知计算产品。百分点已经在为20多个国家的公共安全、媒体、零售和金融服务等垂直领域的10000多个政府机构和企业客户提供服务。百分点的多模PAML服务与其大数据套件紧密结合。在数据探查阶段,它可以使用内置规则来诊断数据,以生成报告、提供建议。受访客户称赞百分点针对数据、功能和项目进行细粒度、基于角色的验证。可视化的建模服务很好,但基于笔记本的推理和自动化功能需要有待加强。客户期望百分点改进其模型验证和监测功能。百分点的专长很适合期望获得数据智能的政府和公共服务机构。浪潮将其PAML与AI基础架构和大数据套件联系起来。浪潮领导中国的AI服务器市场。它将其PAML解决方案嵌入到云海Insight大数据和洞察力平台中。除了软件包外,浪潮还提供一款集成的设备以缩短部署时间。该供应商还提供AI Station这种集成式环境,用于深度学习模型开发、部署和调度。浪潮PAML解决方案的大客户来自教育、研究、公共服务和金融服务等垂直领域。受访客户对浪潮的集成式软硬件解决方案、快速部署时间和流行的开源深度学习框架感到很满意。他们特别指出,AI Station势必会加大浪潮硬件资源的使用率。为了变得更具有竞争力,浪潮需要改进其数据探查功能、加强模型验证和监测功能,并提供粒度更细的项目访问控制。天云数据通过打破数据僵局在PAML市场上脱颖而出。天云数据成立于2013年,最初专注于金融服务,近期将业务扩展到制药和能源行业。其PAML解决方案组合主要包括三个部分:Kaleido——数据准备和特征工程,MaximAI——模型开发,以及Gaea Decision——基于ML模型和规则引擎的决策。天云数据可提供包括数据集成、采样、清理和转换在内的丰富功能,帮助数据科学家们轻松完成数据准备。其自动数据管理系统可帮助客户快速发现数千个表之间的数据关系,该公司在提供支持服务方面展现出来的技术专业知识和商业技能,深受受访客户的赞赏。为覆盖更多垂直领域,天云数据尚需扩展其产品存储库,并添加更多自动化特性。客户还希望该供应商能丰富其产品组合,纳入更多的深度学习相关服务。