专精特新|数据服务领域崛起“小巨人”
数据会魔法吗?
共享单车离不开它
自动驾驶离不开它
虚拟主持人也离不开它
……
进入AI时代,
我们已经离不开数据。
如同工业时代,
我们离不开石油。
数据为何具有如此魔力?
数据如何获得?
数据如何影响现在与未来?
……
🔽戳视频
如果你也对此好奇,不妨与我们一起走近数据堂——国家级专精特新“小巨人”。数据堂副总裁何鸿凌展示了其独家秘笈。
数据堂副总裁何鸿凌
数据,具有非凡的魔力
以目前相当热门的自动驾驶为例,自动驾驶是各种科技应用的集大成者,不过,归根结底,数据才是自动驾驶的基石——
要做到完全的自动驾驶,至少需要 1000 万公里的数据积累。若要感知更准、决策更好、驾驶更加安全,更需要依托海量的数据。
不仅是自动驾驶,放眼整个AI时代,数据、算力、算法合称三大利器。
有了数据,才能设计算法,再通过算力平台,得到模型,进而解决各种实际问题。
由此可见,数据,是AI时代的基础,更为推动时代发展提供了动力。
也正是看到了数据的非凡魔力,数据堂2011年诞生之时,选择了人工智能数据服务作为主赛道专注数据赋能AI 。
即便数据具有非凡魔力,也要经过一番历练,方能为算法所用。
#
01/ 采集
仍以自动驾驶为例:
数据堂备有多辆采集车,配置多种专业设备。采集车需要在多种场景、多种天气、多种路况下采集数据,甚至走一趟川藏线 318 国道……
不难看出,数据采集是一项大工程。数据堂为此开辟了三条渠道:
一、设立数据服务基地
场地、设备、采集人员、标注人员、保密工作室……设施齐全。
二、寻找合作基地
由合作商提供人员,解决数据的多样性问题。
三、众包模式
数据堂旗下数加加App上设有一个众包程序,每个用户都可以随时领取任务,完成任务者即可“领赏”。
#
02/ 识别
采集只是第一步,由此得到的原始数据,机器无法理解,需要使用数据处理工具进行标注、转写。
怎样才能高效识别数据?
数据堂在全球部署了柔性数据生产线,可以为全球客户实现最具成本效益的数据处理方式,解决了“数据标注效率低”难题,数据生产效率提升30-40%,此成果获得了北京市科技进步奖二等奖、中国自动化学会科技进步奖一等奖!
数据堂还开展了定制业务,为客户提供立等可取的数据集,快速满足客户的需求,由此赢得了百度、阿里、腾讯等头部企业的信赖。
11年来,数据堂持续加大研发投入,不断提高解决技术难题的能力,在行业里声誉日隆,2021年,被认定为国家级专精特新“小巨人”。
能够成为“小巨人”,离不开数据堂内身在专精特新方面的坚持:
专:
专注于 AI 数据领域,在该领域建立了数据堂技术的专业性;
精:
数据堂打造了诸多精品,包括数据集、标注平台以及整套生产线;
特:
数据堂打造了整套解决方案。从客户刚刚入门 AI 领域、到其产品商用、再到其业务规模扩大,数据堂都能够提供对应的服务;
新:
数据堂投入了很多技术研究力量,提升了数据的智能化、自动化。
何鸿凌认为,数据堂的快速崛起,也离不开外部环境,尤其是海淀区给予的支持。
一是海淀的人才优势
确保了无论是做开发,还是做建模、做模型,都能够有很多的人才为我们所用;
二是贴近客户
我们大部分客户是在海淀,方便为客户提供快捷、周到的服务;
三是产学研资源丰富
既可以相互合作,又可以给企业提供外脑,帮助我们提升智能化、自动化的程度。
未来,数据堂将继续扎根海淀,牢牢把握人才高地优势,提升核心竞争力,降低数据的门槛,方便新客户获取数据,为客户提供更高质量的服务,为中国人工智能产业的发展贡献力量。
图源:视觉中国
END
【版权声明】
本文由“中关村科学城”公众号编辑,
欲转载请关注公众号回复
“转载”取得授权,谢谢配合。
出品 | 中关村科学城
编辑 | 丁乐
责编 | 一天
信息来源 | 产业促进一处