从2018数博会看国内大数据市场
数博会已经过去一个礼拜了,在现场全程参加了这样一个大型的大数据峰会,感觉到了国内大数据市场蓬勃发展的热度。参展的公司很多,一部分代表了国内大数据领域的重量级选手,凯哥花时间仔细的整理了352家参展企业,根据官方的参展商介绍进行了分类,希望从这些数据中来管窥一斑,对国内的大数据市场做一个粗浅的分析。
2018数博会参展公司全景图
下图是所有参展单位的全景图,我将它分成以下类别
(时间有限,不一定精准供大家参考):
D1 政府/产业/运营/媒体
大数据相关的产业运营,资源整合,孵化器,创业组织,媒体机构和政府D2 行业解决方案供应商
在参展公司介绍中,提供的产品或服务有一定的业务领域和行业专注的单位,比如专注在农业、智慧城市、物流、金融。D3 语音/图像/NLP/ChatBot等智能服务供应商
专注于某一个智能技术领域的服务商,比如语音、图像、自然语言处理、智能客服等。D4 区块链
数博会上区块链是一个相对独立的版块,所以把区块链单独拿出来放到一起.D5 数据治理/分析/可视化/安全/咨询服务供应商
专注于数据治理、数据分析、可视化、数据安全的咨询、产品服务商。D6 集成/实施综合解决方案供应商
在介绍中体现全面的跨行业的供应商,将系统集成、综合解决方案放在一起。D7 数据基础应用/服务供应商
数据库、PaaS、数据存储、数据处理的产品和应用服务供应商。D8 平台服务供应商
云平台服务供应商D9 基础架构供应商
偏硬件,数据中心基础架构的供应商
对于行业解决方案的参展单位,根据不同的业务领域,又做了具体的统计分析如下:
(这个分布不包括那些综合解决方案供应商或者集成商,专指那些有一定专注的领域服务商)
医疗健康相关的大数据服务公司,占据了13%,一共16家
交通,金融,能源相关的占据第三,共33家
政务和教育,占据第四,共9家
从这些数据侧面也能得出一些现象的总结,在大数据与行业结合方面,政府方面的投资和项目,特别是智慧城市、智慧交通是比较多的,这方面的业务场景相对较成熟。
大数据行业的产业结构图
根据以上的数据分类,结合对于行业的理解,下图是凯哥所认为的大数据行业的产业结构图:
L0 基础架构层
L1 云平台层
L2 基础数据技术层
包括数据存储,数据处理和数据管理的技术栈以及架构。L3-1 通用数据技术层
与行业,业务领域无关的通用数据工程处理技术栈及架构L3-2 通用智能技术层
与应用场景无关的通用智能算法和技术L3-3 通用数据服务层
围绕企业数据的一些通用型服务类型L4 行业业务应用层
将L3的技术、算法和服务组合起来,结合不同的业务领域知识,提供给行业的应用
对比美国和中国的人工智能服务公司
前面分析了本次数博会大数据和人工智能领域的行业解决方案公司在不同行业的分布,同时我找到2018全球AI公司的数据库,一共3464家从事AI相关的公司。
数据来源:
拿到这个数据我做了几个简单的分析:
按国家分布
不看数字不知道,一看数字统计才感觉到和美国的差距。
全球3000多家公司里面,美国占据了一半左右,接下来是中国,以色列和英国。如果算上GDP或人口因素,那么中国的AI相关的公司相对数量并不占优势。
按行业应用
美国AI公司最多前五个领域:通信、销售/市场、核心AI技术、医疗健康领域,和安全,一共688家公司
中国AI公司最多的前五个领域:机器人、通信、计算机视觉、健康和娱乐从绝对数量上看,机器人领域是中国超越美国的唯一领域
按国内AI公司的地区分布:
一点总结
凯哥将AI技术的应用分为四个层次,如下图所示:
第一层 基础学术层
这一层是AI技术的最基础的部分,也就是那些国际顶尖的学术论文会议。比如ACL2018
这一层是那些基础研究的成果,以论文的形式展示出来,一般是非常通用的场景,解决一个领域的问题的算法。当我在举ACL 2018作为例子的时候,无意间惊喜的发现赞助商好熟悉。
看来中国公司越来越关注在基础学术能力的投资了。
第二层 工程实现层
有科研能力的软件工程师将第一层的论文编程成软件代码。第三层 AI服务层
AI的服务商集合多种算法,软件工程能力,开发成面向某个领域或者通用领域的软件、或者服务,提供出来。比如Tensorflow ,比如图像识别Image-Net,比如人脸识别技术。第四层 业务场景层
将AI的技术、服务应用到某个业务领域或者场景,比如将计算机算法应用到供应链领域,做到库存预测,销量预测,物流路径优化等。
热点阅读: