如何帮企业大幅节省人力,还将工作效率提升 1 万倍?| 专访达观数据陈运文
不难发现,我们所知晓的每一个企业,尤其大型企业,在文档资料的汇总、管理、审批、撰写过程中都会消耗大量的人力资源。如果这些文本工作可以实现自动化,相信很多企业会因此节省大批人力,从而降低生产经营成本。
为此,以达观数据为首的文本处理技术服务公司应势而生。
所谓文本智能处理,即以机器代替人来完成对文章、资料的自动化的阅读、提取、归纳整理、搜索推荐等。
其中的商业模式并不复杂,简而言之就是为企业提供技术系统,做相应技术维护服务,进而收取服务费用。
达观数据目前提供 SaaS 化公有软件和私有化部署软件。前者为付费能力一般、对安全性要求较低的中小微企业提供;后者的目标对象则为付费能力较强、对安全隐私性要求较高的大型企业。
因涉及到私有化部署问题,达观数据已在华北、华东、华南设立了分部。今年还会继续扩展西南、西北市场,完成全国规模化布局。
目前,达观数据的主要客户集中在金融、传媒和大型集团的企业客户之间。公司多采用顾问式销售,每一名顾问销售都是文本处理专家,可以为客户提出专业的解决方案和建议,推动系统在企业中落地。
公司要求每一名员工都要深刻了解相关技术,因此会定期邀请行业专家、高校老师以及公司的优秀工程师分享行业前沿技术,每周开设一次达观大讲堂。
本期,企服行业头条(微信 ID:wwwqifu)独家专访了达观数据的创始人兼 CEO 陈运文先生。陈运文将分别从市场现状、产品增益、行业壁垒和未来发展等层面对国内文本智能分析市场进行深度梳理。
SaaS+私有化双线并行
市场爆发依赖成本考量
企服行业头条:国内的 SaaS 市场都会面临盈利问题,为什么达观数据成立大半年就能盈亏平衡呢?
陈运文:纯 SaaS 服务的客群大部分是中小微企业,客单价很难做高,在中国市场想要规模化盈利比较困难。所以达观数据在成立初期就坚定地选择了纯 SaaS 化服务和私有化部署并行的发展策略。
SaaS 化服务可以帮助达观数据在市场上打响知名度,而私有化部署又可以为我们带来相对丰厚的利润,所以我们很快实现了盈亏平衡。
企服行业头条:您认为国内的文本分析行业什么时候能迎来真正的市场爆发?
陈运文:我觉得爆发要依赖于两点。
第一、要靠技术的进步。文本挖掘技术,效果是非常重要的。如果识别系统对文字语义理解的效果能够进一步提升,我觉得市场空间会被进一步打开。
第二、现在很多企业面临着非常严峻的人力成本负担,我觉得成本的压力也可以促使文本挖掘有更广阔的应用市场。人工成本里面很重要的一块就是处理文本资讯,如果我们把这个过程自动化,就可以帮企业提升经营效率,降低生产成本。
语料积累提升分析能力
独有算法确立技术优势
企服行业头条:说到提升效率,降低成本,那企业应用达观数据后的效果是怎样的呢?
陈运文:达观数据做过相应统计,普通员工一分钟可以阅读 300 字左右,但计算机可以处理的数量是人工的一万倍。
企服行业头条:那分析的效果呢?
陈运文:对于比较规范文本,尤其是书面文本,计算机的处理的效果已经接近人类了。而对于口语化、互联网上的一些非规范用语,计算机则需要做大量特定语言模型的建立和调试,才能把效果做上去。
企服行业头条:达观数据如何提升这方面能力?
陈运文:我们会分两块进行提升,一块是数据,一块是算法。
首先,我们都知道常用的汉字是 3000 个,但是常用的词语却有上千万个。因此,达观数据会不断积累每一个行业的文本语料作为我们的弹药来训练我们的模型。所以说,数据层面就是积累更多各种各样的文本。
其次,就是我们比较独特的文本挖掘算法。达观数据在文本智能处理领域已经申请了 30 多项国家发明专利,我们能够保证技术处于行业领先位置。当把大量的数据和独特的技术结合起来,我们就能快速提升文本的分析能力。
数据支撑助力 AI 发展
人才经验将成行业壁垒
企服行业头条:这种分析是 AI 层面的吗?
陈运文:对,其实从 AI 的层面来解读的话,达观数据是来处理文字的。还有很多 AI 公司像商汤、旷世是处理图像的,思必驰、云知声和讯飞是处理语音的,每个企业都有自己擅长处理的数据类型,我们擅长的是处理文字。
企服行业头条:您怎么看待 AI 和大数据的关系?
陈运文: AI 和大数据是不分家的。大数据是基础,没有大数据谈 AI 都是空谈。所以说达观数据是在文本数据的基础之上,建立起了文本智能处理的应用系统。
企服行业头条:那您能畅想一下未来文本分析领域的 AI 场景吗?
陈运文:未来包括合同、公文、通知、简历等与文本有关的工作,绝大部分都可以让计算机参与其中。
甚至我觉得未来 100% 的文本工作都有计算机的参与,不管是在文章的撰写修改、分类整合还是搜索推荐。我认为计算机可以在每一个环节帮助人把事情做得更快、更好。
企服行业头条:您认为文本分析行业的壁垒是什么?
陈运文:第一是数据。大量的垂直行业的语料数据是非常重要的。
第二是技术人才。在人工智能行业人才是核心竞争力之一。我们公司的技术团队有很多人来自百度、阿里,积累了很多有技术经验的人才。
第三是在每个行业里的落地经验。人工智能系统要真正的落地,需要系统开发部署、调试、和客户各种系统适配,这些实战经验是非常难得的。
打通上下游完善产品
借助口碑抢占文本市场
企服行业头条:未来 3~5年达观数据的发展规划?
陈运文:达观数据的想法是围绕文本分析展开,逐步完善更多的功能。比如说文本解析( NLP ),文本合成、机器撰写、机器润色等。
同时,我们会优化不同语言之间的文本转换和处理,未来机器翻译也将会是一块很重要的业务。
其次,达观数据还会与上游各种各样的文本要素相对接,比如说光学字符识别 OCR ,语音转文字(音字转换),只要是和我们息息相关的应用领域,我们都会和上下游企业一起来合作。
我们将围绕文本打开市场,在接下来的 3~5 年,把达观数据做得更为完善。我们希望未来所有的中国企业,当它们想到要采购文本智能处理服务的时候,首先想到的是达观数据。
企服行业头条:其实B端企业的推广一直是个难题,您认为达观数据要做哪些努力才能让市场了解并接受达观数据?
陈运文:To B 行业最重要的一点是口碑,因此我们做的每个案例、每个客户,我们都会认真地把它们服务好。达观数据认为把企业品牌的口碑塑造好,是非常非常重要的。
▌编辑点评:
1.信息爆炸时代,一套洞悉人性的算法模型,帮助用户高效率地获取信息,帮助企业创造“千人千面”的产品体验,这其中蕴含的价值毋庸置疑;
2.做“小而美”的市场产品,就是要把核心技术做成壁垒,做成口碑,毕竟用户是用脚投票,市场是检验产品的试炼场。
采访 / 文:李晓松
受访者:达观数据创始人兼 CEO 陈运文
编辑:张萌哲 图片:unsplash.com
本文系原创,转载请联系编辑 微信 ID:wawawa1994
今日互动
▼
目前,你所在的企业耗费在
文本资料处理上的人力有多少呢?
你或许还对这些内容感兴趣
点击图片即可阅读
▼