查看原文
其他

微模式:逼近100%正确率识别票据,从金融领域切入挖掘文字识别的巨大价值|裸泳投资欲

何婧 裸泳 2020-09-09


如果自然语言处理是人工智能皇冠上的一颗明珠,那么文字识别就是这颗明珠下不可或缺的底座。


记者:何婧/主编:张浩

深度报道/共2564字/阅读6分钟



项目名称:微模式

主营业务:人工智能图像识别方案提供商

融资情况获得中科招商及国嘉资本A轮融资5000万元

关键词:人工智能、文字识别、人脸识别、花旗银行、OCR识别技术、准确率逼近100%

受访人:微模式创始人 陈友斌

一句话提炼:基于OCR识别技术快速抓取图像中文字信息录入系统,节约相关从业人员95%的重复工作时间。 



20世纪70年代以来,『空间技术』、『能源技术』以及『人工智能』被称为世界三大尖端技术,而随着人工智能近三十年来的迅速发展,无论是理论还是实践,人工智能已逐渐自成一体,并且在多个领域实现了完美的结合,推动产业实际的应用发展。

 

由于人类对世界的感知有约80%是通过眼睛来获取。因此在这其中,视觉感知或许称得上是话题最多,也是最被大众熟知的分支之一,典型的技术包括图像识别、人脸识别以及视频监控等等。

 

然而人们了解、学习这个社会更多的还是通过文字,但是文字识别技术却一直没有得到应有的关注,所谓的文字识别指的是利用计算机自动识别字符的技术。业界将自然语言处理誉为人工智能皇冠上的一颗明珠,那么文字识别则是这颗明珠下不可或缺的底座,没有文字识别技术将纸张或图片上的文字提取出来,机器也就无法进行后续的语义理解。

 

事实上,从上个世纪80、90年代开始,文字识别就已经在国外的表单名片识别、邮政编码及自动分拣、票据自动处理等领域得到了广泛的应用,大大降低了人力成本以及人工所导致的高误差率。

 

也正是在文字识别技术高速发展的时期,『微模式』创始人陈友斌从清华大学博士毕业,随后便赴美国科罗拉多州立大学继续深造,并在之后的2、30年间专注于自动目标识别、图像识别、机器视觉等领域的研究。

 

陈友斌博士告诉我们,『当时我带领团队主持研发的英文票据自动化识别系统,一度做到了世界第一,占领了欧美很大的市场份额,被花旗、汇丰、Bank of America等多家知名银行应用。』

 

『美国平均每年会产生约50亿张支票,且欧美国家人力成本普遍偏高,因此他们从90年代就开始大量使用机器进行相关的票据处理了。反观国内的发展,甚至到了今天还有很大一部分企业依然在沿用人工录入信息的方式,更别提10到20年前的中国了。』

 

爱国情怀这个词,平时说起来或许显得虚无缥缈了些,但当真正身处异国他乡时,便是真真切切的思念与爱护。『出了国之后,尤其不愿意听到别人说中国落后,或者说中国偷了他们的知识产权。当我们把票据识别做到世界领先时,我首先想到的是中国还很缺乏这样的技术,那么我能不能回来填补这样的空白,如果我带领一支团队在国内也做到世界第一,那到时候是谁偷谁的呢。』

 

于是,2005年陈友斌放弃了在美国已然成熟的职业路径,回国后首先在母校清华任职,以便熟悉国内的相关行业情况。并于2007年初,成立了『微模式』,专注于文本图像处理与识别、视频图像处理、OCR识别技术,和人体生物特征识别等相关领域。

 

只要是输出的识别结果

准确率逼近100%


科学家们从50年代便开始探讨文字识别的方法,并研制出了光学字符识别器,70年代开始开始逐渐重视于汉字识别的研究与发展。然而由于中文字笔画繁多、字符结构复杂、形近字较多,因此识别中文字符的难度,相较于英文识别要困难得多。

 

『并且,国内企业习惯在票据上有文字的地方盖章,这样一来无疑又加大了字符的提取难度。此外,国外的票据个性化较强,例如个人支票上的背景图片可以根据所有者的喜好自由选择,因此造假难度偏高,而中国的票据样式都是统一的,如此一来,防伪难度也相应提高了。』

 

『但我们在票据识别、票据防伪、手写签名验证、人证对比、以及车辆识别等技术领域,都已经达到世界领先水平,相关产品也已在银行、安防、互联网金融等多个领域实现了商业落地。』

 

人票据识别


据陈友斌博士的介绍,文字识别除了传统的银行业,还可以应用于许多领域,例如互联网金融、代记账企业、财务或审计公司、保险公司、证券公司,档案馆,包括工商税务甚至是婚恋网站。简单来说就是,一切需要抓取、录入纸质材料或电子图片中文字信息的企业,都有可能是『微模式』的潜在合作伙伴。

 

『拿保险公司举例,按传统的方式,需要消费者把身份证、银行卡、保单、缴费凭证等材料的原件及复印件统一快递给保险公司,然后由保险公司的工作人员进行手工录入信息,等待保险赔付,这个过程快则2-3个星期,慢则2-3个月。但现在只需要用户将所有资料拍照上传,经过系统的影像质量评判后,机器通过深度学习技术便会自动将照片上的文字识别出来,然后进行可视化呈现以及系统备份,整个过程只要几分钟即可完成。』

 

『此外,现在的无纸化支付、无纸化办公趋势对我们非但没有影响,反而产生了例如活体检测、认证是否一致等更多需要验证的场景。归根结底,无纸化只是把原来集中在商户与消费者之间的工作量分配到了每一个消费者自己的身上,从而加快支付流程,例如在餐厅开具了电子发票后,消费者回到公司还是要打印出来才能给财务报销,所以只是信息的载体发生了变化,信息量只会有增无减。』

 

『用我们平台识别输出的结果,几乎可以做到一个字不错,准确率逼近100%。』

 

『微模式』以其核心技术为基础,根据多层次的市场需求,既研发了相对的通用产品,如针对互联网金融、财务或审计部门、工商税务、银行网上业务、包括婚恋网站等企业的互联网识别验证云平台,用户只需将资料拍照上传即可进行快速识别及验证;同时也有针对不同细分领域的解决方案,例如针对安防领域的动态人脸布控系统、OCR识别警务应用、天网搜车系统等;以及人证合一身份验证一体机、人脸考勤机、人脸闸机等硬件结合产品。

 

人证合一检测


陈友斌说道,『我们最核心的技术和产品更多的在文字、票据识别方面,但我们的人脸识别技术同样是处在行业第一梯队的,有单项数据冠军。像武汉大学今年举办的樱花展,入口处的通关闸机使用的就是我们的产品。』

 

『我们希望产品尽量做到与设备无关、与行业无关的通用化,如果客户有特定的需求我们再加上部分的定制化设置。』

 

由于陈友斌此前一直从事外资银行的相关服务工作,因此对于传统银行乃至金融行业都有非常透彻的理解,如何针对行业痛点提出整体解决方案,让产品的使用体验更加符合从业人员的期待,而这些方面,不是一家单纯有技术的企业就能够做到的。

 

『客户要的是产品的整体性能,他们不会过多的在乎准确度是99%还是95%。因此在这一点上,我们相对其他企业有更大的优势,同样这也是我们的壁垒所在。』

 

人工智能改变世界终究还是要从每一个细分领域开始,那么契合垂直场景中的需求或许就是撬开市场的这根杠杆了。

对项目感兴趣可在后台与我们联系~


- End -



精彩文章回顾 ☟


对大多人来说,我们并不了解这个世界的运行方式 | 批发价买别墅,只买商品,不买营销 | 他们让游戏内容重回C位置 | 二手免费交易平台做母婴用品一手租赁 | SAAS+AI智能影像如何赋能医疗决策 作为投资人,无形的东西比有形的东西更重要 | 打破刚兑,私募才有春天 | 发乎情的咖啡,如何不止于赔 楚商集团李璟璟:“走心”投资,“掘金”医药 | 枫红资产万杰:理工男的并购经 | 光谷硅谷的差距,不在产业,而在金融 | 武汉注定微不足惜,武汉注定一举千里 | 这并不是一个乌托邦产业,自动驾驶就是未来



裸泳已进驻今日头条、新浪、网易、天天快报、搜狐、九派、大鱼号、雪球、财条等,敬请关注。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存