查看原文
其他

专精特新|数据服务领域崛起“小巨人”

新媒体工作室 中关村科学城 2022-11-07




数据会魔法吗?

 

共享单车离不开它

自动驾驶离不开它

虚拟主持人也离不开它

……

 

进入AI时代,

我们已经离不开数据。

如同工业时代,

我们离不开石油。

 

数据为何具有如此魔力?

数据如何获得?

数据如何影响现在与未来?

……


🔽戳视频



如果你也对此好奇,不妨与我们一起走近数据堂——国家级专精特新“小巨人”。数据堂副总裁何鸿凌展示了其独家秘笈。


数据堂副总裁何鸿凌



数据,具有非凡的魔力

以目前相当热门的自动驾驶为例,自动驾驶是各种科技应用的集大成者,不过,归根结底,数据才是自动驾驶的基石——

 

要做到完全的自动驾驶,至少需要 1000 万公里的数据积累。若要感知更准、决策更好、驾驶更加安全,更需要依托海量的数据。

 

不仅是自动驾驶,放眼整个AI时代,数据、算力、算法合称三大利器。

 

有了数据,才能设计算法,再通过算力平台,得到模型,进而解决各种实际问题。

 

由此可见,数据,是AI时代的基础,更为推动时代发展提供了动力。

 

也正是看到了数据的非凡魔力,数据堂2011年诞生之时,选择了人工智能数据服务作为主赛道专注数据赋能AI 。




即便数据具有非凡魔力,也要经过一番历练,方能为算法所用。

 

#

01/   采集

仍以自动驾驶为例:

 


数据堂备有多辆采集车,配置多种专业设备。采集车需要在多种场景、多种天气、多种路况下采集数据,甚至走一趟川藏线 318 国道……

 

不难看出,数据采集是一项大工程。数据堂为此开辟了三条渠道:

 

一、设立数据服务基地

场地、设备、采集人员、标注人员、保密工作室……设施齐全。

 

二、寻找合作基地

由合作商提供人员,解决数据的多样性问题。

 

三、众包模式

数据堂旗下数加加App上设有一个众包程序,每个用户都可以随时领取任务,完成任务者即可“领赏”。


#

02/   识别


采集只是第一步,由此得到的原始数据,机器无法理解,需要使用数据处理工具进行标注、转写。

 

怎样才能高效识别数据?

 


数据堂在全球部署了柔性数据生产线,可以为全球客户实现最具成本效益的数据处理方式,解决了“数据标注效率低”难题,数据生产效率提升30-40%此成果获得了北京市科技进步奖二等奖、中国自动化学会科技进步奖一等奖!

 

数据堂还开展了定制业务,为客户提供立等可取的数据集,快速满足客户的需求,由此赢得了百度、阿里、腾讯等头部企业的信赖。



11年来,数据堂持续加大研发投入,不断提高解决技术难题的能力,在行业里声誉日隆,2021年,被认定为国家级专精特新“小巨人”。

能够成为“小巨人”,离不开数据堂内身在专精特新方面的坚持:

专:

专注于 AI 数据领域,在该领域建立了数据堂技术的专业性;

精:

数据堂打造了诸多精品,包括数据集、标注平台以及整套生产线;

特:

数据堂打造了整套解决方案。从客户刚刚入门 AI 领域、到其产品商用、再到其业务规模扩大,数据堂都能够提供对应的服务;

新:

数据堂投入了很多技术研究力量,提升了数据的智能化、自动化。


何鸿凌认为,数据堂的快速崛起,也离不开外部环境,尤其是海淀区给予的支持。


一是海淀的人才优势

确保了无论是做开发,还是做建模、做模型,都能够有很多的人才为我们所用;

二是贴近客户

我们大部分客户是在海淀,方便为客户提供快捷、周到的服务;

三是产学研资源丰富

既可以相互合作,又可以给企业提供外脑,帮助我们提升智能化、自动化的程度。



未来,数据堂将继续扎根海淀,牢牢把握人才高地优势,提升核心竞争力,降低数据的门槛,方便新客户获取数据,为客户提供更高质量的服务,为中国人工智能产业的发展贡献力量。


图源:视觉中国

END





【版权声明】

本文由“中关村科学城”公众号编辑,

欲转载请关注公众号回复

“转载”取得授权,谢谢配合。

出品  |  中关村科学城

编辑  |  丁乐

责编 | 一天

信息来源 | 产业促进一处






您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存