达观数据如何“把冷板凳坐热”?【星特写】
达观数据成立于2015年,是一家专注于文本智能处理技术的国家高新技术企业。其利用NLP(自然语言处理)、OCR(光学字符识别)、知识图谱等技术,为大型企业和政府机构提供机器人流程自动化、文档智能审阅、垂直搜索、智能推荐、客户意见洞察等智能产品,旨在让计算机协助人工完成业务流程自动化,大幅度提高企业效率。
达观数据创始人兼CEO 陈运文
达观数据创始人兼CEO陈运文认为,所谓智能,就是从数据中提炼出信息,再从信息里进一步提炼出知识,最终利用知识去模仿人类工作的过程,“人工智能很难一蹴而就,还是要扎扎实实从数据出发,不断提炼加工,耐心训练神经网络系统,才能一点一点的突破现有的技术瓶颈。”
据IDC预计,到2023年,全球RPA软件市场规模将达到39亿美元,2018-2023年复合增长率达36%。中国RPA市场也将高速发展,2023年市场规模将达到10.2亿美元,2018-2023年复合增长率为64%。
此次新冠病毒肺炎疫情更是加速了无人办公、数字化建设进程,让RPA变得愈加炙手可热。根据Forrester针对企业的调研显示,2019年末,RPA技术在所有企业自动化系统部署中排名最低;而到2020年,RPA技术的排名则上升到了第一位。
“未来一个公司的工作岗位可能一半是机器人,一半是人,机器人帮助人做重复性的工作,比如归纳、整理、收集、填写等;分析、决策等高级一点的工作仍然交给人来做。”陈运文表示,随着自然语言处理技术的发展,机器人处理重复性、机械性文字的能力很快就将超过人类,十年以后将有超过50%的基础性办公工作由机器人流程自动化(RPA)完成。
在商业模式上,达观数据在一开始就选择了2B,且将金融类龙头企业作为主要服务行业之一。
“首先,领域越细分与巨头的正面竞争就越少,这有利于初创企业生存。其次,选择金融行业一是因为其固有的信息化水平远高于其他行业;二是因为金融业务有其固定的规则,算法较易切入;三是这类企业对降本增效有刚需。”陈运文说。
金融行业的清缴清算,监管报送、账目抽取、核对等很多基层工作都是智能RPA的适用场景,通过自然语言逻辑分类、自然语言数据提取、识别和深度学习模式预测,可以实现将RPA 应用场景覆盖面提升到80%。
目前考虑到投入产出比,在智能RPA应用上最为积极的当属金融行业。陈运文预测,可能在五年以后大部分银行都会用上智能RPA。
谈及今年年初爆发的新冠病毒肺炎疫情,陈运文表示,虽然对众多企业的正常经营都造成了一定影响,但这次危机同样也是RPA赛道的加速器。
“此次疫情让众多企业对数字化和自动化的需求再次升温,意识到了RPA机器人的重要性,相当于间接的教育了市场。往常,客户认为使用达观的产品是‘锦上添花’,但现在他们会觉得这是‘雪中送炭’。”陈运文说道。
近年来,“RPA+AI”的结合受到业界追捧,那么RPA和AI的区别及联系是什么?二者如何融合落地?
随着RPA的不断成长和进化,它与AI之间的联系正变得越来越紧密。
二者的结合,相当于是在基于规则的自动化基础(RPA)之上增加了基于深度学习和认知技术的推理、判断和决策能力,实现了真正的智能流程自动化。
AI技术是RPA技术快速发展的基石, RPA技术在A1技术的不断加持下,能够实现深度的业务场景的覆盖,完成复杂的系统操作和数据获取,达到接近人或超过人的准确率,打破了传统RPA只能按照特定规则处理业务的局限。
AI与RPA如何深度融合?
不久的将来,RPA技术在计算机算力和存储力不断提升下,通过感知智能(如语音识别、手写识别、图像识别等)、认知智能(如人际交互、智能阅卷等)相结合,打造出能够模拟人类进行业务决策和业务处理的智能RPA机器人。智能RPA软件机器人可以学习人的业务处理经验,协助人类在业务场景下作出决策判断并完成复杂的系统操作。
以达观数据推出的智能财税机器人为例,可助力企业自动化报税。财税机器人对企业税务工作的优势包括错率低、效率提升、成本降低、及时性。
针对财税领域自动化,达观数据围绕税收合规、纳税申报流程和财务共享中心运营等场景推出了系列机器人。在这些场景中机器人自动登录税务申报系统执行纳税申报底稿的读取、增值税主动报送抵扣,自动填写表单并汇总、以及进行合同自动比对等工作。
目前达观智能办公机器人已与中国银联、深交所、中国银行、工商银行、建设银行、渣打银行、汇丰银行、招商证券、新华财经、人民网、万科、碧桂园、中国移动、中国科协等数百家金融、制造、军工、科技等领域知名企业和政府机构达成合作。在不久的将来,我们会看到更多的企业在自己的税务领域投入财税自动化的怀抱。
3
自研底层开发框架,
“以机代人”提高数倍工作效率
据投资界报道,从2015年开始,达观数据就一直专注于自然语言处理(NLP)、光学字符识别(OCR)、知识图谱等AI技术,提供文档审阅、智能推荐、资料搜索、知识图谱等多款文本自动化解决方案。并在2019年正式推出“达观智能RPA”,融合自研语义理解模块,打造了首款国产自研“NLP+OCR+RPA” 三位一体的智能化机器人。
据陈运文介绍,围绕文本处理场景下的“数据+AI能力”,达观数据目前构建了较为完整的文本数据采集、标注、训练体系。在数据知识层构建知识仓库和知识图谱;在数据应用层训练机器学习模型并结合业务场景来开发出一系列智能机器人产品。
“我们揭开的不过是企业文本大数据的冰山一角。”陈运文认为企业的需求是一片蓝海,达观处理的文档数据中蕴含着诸多规律,而这些规律同样需要依靠计算机识别,形成“系统知识”运用到企业的服务中去。“我们希望能够努力满足各行各业的企业的需求,帮助他们解决数据挖掘问题。”
陈运文表示,以RPA机器人代替人工操作,可以实现节省成本、提高效率和准确率等诸多优势,这些都是经过实际测算得出的结论。首先,机器人系统的采购成本大概是普通白领工资待遇的1/4,但工作效率是普通白领的3-4倍。
“我们有一家电力企业客户,该公司财务部在对账过程中涉及多家银行,上千笔的对账业务量,数据量很大。在使用达观RPA机器人代替传统手工操作后,财务对账效率提升了600%。”
其次,机器人的犯错率与人工相比会低出很多。“人在连续长时间工作后,错误率容易上升。但机器人可以在非常稳定的状态下进行7×24小时工作,机器人系统内部的交叉核验,也可以保证准确率维持在较高水准。”
陈运文介绍,与同业相比,达观RPA产品的核心优势是市场上唯一不采用微软底层开发框架,完全独立自主研发的机器人。
“比起借用国外现成框架,虽然研发的过程代价更高更困难,但是回头来看是非常值得的,因为掌握了从底层向上的所有核心技术,软件的跨平台适应能力更强,能在国内外各种操作系统上运行。”
对于接下来的发展规划,陈运文表示达观数据的目标一直都很明确,即成为国内文本智能处理行业第一,因此会在产品研发、交付质量、技术深度等方面持续投入,打造出更高品质的产品与丰富的场景来服务客户。
“文本智能处理是一条困难但正确的道路,正所谓‘板凳要坐十年冷,文章不写半句空’,低调务实是我们团队一直坚持的做事风格,达观也将沉下心来认认真真把产品做好,沿着这条赛道坚持下去。”陈运文说道。
参考来源:
https://mp.weixin.qq.com/s/s40DZfYUNcYbUjRsQrLMBg
相关阅读: