谷歌与OpenAI 竞相升级的背后——生成式AI市场机会引发关注
北京,2024年5月20日
2024年5月14日,OpenAI发布了更新的大模型GPT-4o,并在ChatGPT中免费提供了更多的功能,这款新产品在文本、图像、音频和视频等多模态融合尝试方面展现出强大的能力,能够以这三者的任意组合进行输入和输出,交互方式更为多样和自然,且新模型性能更强,接口调用价格只有此前模型的一半。同期,在2024年5月15日举行的2024 年 I/O 大会,Google宣布全面进入Gemini时代,会上连续发布、更新了十多款产品,包括AI助手Astra、文生图模型Imagen3、对标Sora的文生视频模型Veo,以及旗舰大模型Gemini,除此之外,Google也展示了在AI搜索领域的布局和创新以及其在智能手机操作系统的优化上的努力。IDC以OpenAI和Google发布会为背景,分析了中国生成式AI市场值得关注的市场机会,旨在为技术供应商和行业用户提供参考。
趋势一:多模态大模型将在未来塑造 “多边形战士”应用
多模态人工智能模型将使用多种类型的数据进行训练,如文本、图像、视频、音频和代码等数据进行学习来创建新内容。未来技术一定是朝向多模态token输入、多模态token输出的形式发展。从模态来看,中国市场AI开发者开发的模型多为基于文本和图像等单模态模型,今年预计将会向多模态、音视频等生成式AI模型积极尝试,这一进展预计会优化在针对个人生产效率提升、生活办公的一些AI助手类应用,并提升此类应用的用户交互体验。
趋势二:为了加速大模型和生成式AI应用的落地,MaaS、AI Agent、App Builder等多种产品形态浮出水面
连接平台和应用侧的产品演变方向出现了多种形式,例如更普惠的模型即服务(MaaS)、更协同的AI 智能体(AI Agent)、更低门槛的应用开发工具(App Builder)等在市场中纷纷出现。这些产品的出现使得大模型、生成式AI更加易用,这将大大降低大模型、生成式AI技术的使用门槛,从而使得行业用户更加普惠地使用大模型、生成式AI技术,也能解决企业内部人才、算力、数据不足的挑战。
趋势三:生成式AI将在各个生产效率提升、业务职能和行业应用中无处不在
应用层创新成为产业发展驱动力——从应用场景来看生成式AI已经在各个领域得到探索,无论是像文案撰写和内容生成、在线会议总结还是OpenAI和Google此次“带火”的AI助手、搜索类应用,面向个人生产效率提升的应用场景的交互体验会逐步提升,另外无论是面向客服、营销等水平业务职能的场景还是行业特有场景的应用落地都将会是今年市场关注的重点。
程荫
IDC中国研究经理
IDC中国研究经理程荫表示,2024年产业界更加关注大模型和生成式AI的落地,生成式AI的进一步发展不仅需要多种模态的大模型作为引擎, 也需要更加普惠、易用的平台工具,从而促使生成式AI在各个生产效率提升、业务职能和行业特定的应用场景中无处不在。无论是技术供应商还是行业用户都应该了解持续变化的生成式AI的发展趋势与应用场景,为无限可能的生成式AI时代做好准备。
IDC更多人工智能领域研究相关报告
如需了解更多相关研究内容,请与IDC中国研究经理 程荫(邮箱:acheng@idc.com)联系。
免责声明
本文中的内容和数据均来源于IDC所发布的报告,所有内容及数据均为我公司所有。未经IDC书面许可,任何机构和个人不得以任何形式翻版、复制、刊登、发表或引用。
全文完
+
联系我们
扫描左侧二维码
与我们保持沟通
相关咨询,请联系:
王勇,IDC中国 副总裁
电话:(+86-10) 5603 4087
电邮:fwang@idc.com
刘晓婷,IDC中国 客户支持代表
电话:(+86-10) 5082 5797
电邮:yvliu@idc.com
谢静,IDC中国 市场部
邮箱:mxie@idc.com