墨奇科技汤林鹏:如何用 AI 技术颠覆指纹识别?
受访者 | 墨奇科技联合创始人& CTO 汤林鹏
记者 | Aholiab,编辑 | Carol
出品 | AI科技大本营(ID:rgznai100)
随着深度学习等AI技术的成熟,生物识别成为了关注度较高的领域,指纹、人脸、虹膜等识别技术,正在越来越多的场景中得到应用。根据前瞻产业研究院的数据,目前中国生物识别技术的市场规模已超过300亿元,到2023年,这一数字将达到379亿元。虽然人脸识别、虹膜识别近几年大有成为「后起新贵」之势,但指纹识别凭借其“证据之王”的权威性和较高的安全性,仍然占据整个生物识别领域的半壁江山(52%)。
在生物特征识别产业中,有这样一家公司,他们利用AI+指纹识别技术,解决了传统指纹识别耗时长、精确度低、指纹大库搜索困难、无法处理低质量指纹等问题。通过海量高精度图像搜索技术,实现了20亿枚指纹秒级精准对比的落地应用;同时,其自主研发的非接触3D指纹采集技术,也已在强身份认证领域获得应用。这家公司就是墨奇科技。
作为墨奇科技的联合创始人兼CTO,汤林鹏在普林斯顿大学获得博士学位,曾在KDD、AISTATS、OSDI、ATC等顶级机器学习和系统会议上发表多篇论文。早在读博期间,他就开始了机器学习和人工智能方面的研究,并开发出了一套高精度的图像搜索系统,这套系统成为了墨奇科技业务方向和核心技术的开端。尽管彼时深度学习的发展已相对成熟,但谈到成立墨奇科技的初衷时,汤林鹏坦言:“还是想在AI的原理和应用上,做出比较大的突破,继续推动技术的发展。”
不久前,CSDN记者采访到了汤林鹏,对于AI在指纹识别领域中的应用、指纹识别技术创新,以及墨奇科技的发展等话题,与他进行了畅谈。对于AI创业者和开发者来说,相信通过汤林鹏的分享,一定会让你对AI技术的应用与创新,有更深的理解。
「小众」赛道不小众,为何要做指纹识别?
CSDN:你从什么时候开始研究深度学习,你的技术生涯是怎样的?
汤林鹏:我最早关注深度学习是我本科刚毕业的时候,大概是2012年,那个时候深度学习还处在早期阶段,但国内已经有一批公司在这个领域做了。我个人对这个领域也比较感兴趣,所以在博士期间开发出了一套高精度的图像搜索技术,并将其运用到了指纹识别之中。这也成为了成立墨奇科技的契机之一。
2017年博士毕业后我就回国了。主要是看到AI在国内的落地更优势,包括计算机视觉、图像感知、工业互联网、NLP等领域,关注度都非常高。此外,我当时也觉得,虽然深度学习历经了四五年的发展后已经相对成熟,但依然有一些瓶颈需要突破,因此希望能在方法论上去做一些创新。
CSDN:我记得那个时候,很多初创公司都是选择切入到图像识别、人脸识别等较宽的赛道,为什么你们却瞄准了指纹识别这么一个相对细分的领域?
汤林鹏:这里有一个误区,其实指纹识别的市场并不小。我们可以看看前瞻产业研究院的预测,到2021年生物识别的市场规模将达到340亿元,而在生物识别中,指纹识别的占有率为52%,这样来看的话,其实指纹识别是一个百亿级别的市场。
究其原因,是因为指纹识别相比于其他的生物识别方式更加成熟,指纹门禁、手机指纹解锁、二代身份证、护照等都已经应用了指纹识别技术。而另一方面,中国这样的人口大国,特别需要通过指纹识别实现全民的身份认证,从而进入智能社会的快车道,因此我们才希望能在这一领域做出一些技术突破,提供一系列能够落地的AI解决方案解决现实的难题。
CSDN:既然指纹识别已经是一个发展迅速且相对成熟的领域,那么还有哪些「现实的难题」呢?
汤林鹏:传统的指纹识别中,其实还有不少可以提升的空间,主要包括以下几个方面:
耗时长,专业指纹人工编辑非常费时,对相关专家要求较高;
精确度低,大库容比对时唯一比中率不足;
海量指纹搜索困难,随着指纹库容增大,系统计算会造成延时甚至宕机;
安全及隐私风险,指纹信息一旦泄露会造成一定的欺诈风险;
无法处理低质量指纹。
重新定义指纹识别技术
CSDN:针对上述传统指纹识别中的痛点,墨奇科技做了哪些技术创新?
汤林鹏:我们研发出了高精度图像搜索引擎技术,它包含三个部分:图像的自适应多尺度表示和索引系统、无标注或极少标注的自学习框架,以及高速异构的搜索系统。通过这套技术我们可以实现20亿量级指纹图像秒级识别。
墨奇高精准图像搜索引擎架构
CSDN:可以分别讲讲这三个部分的作用及基本原理吗?
汤林鹏:好的。我们首先讲讲图像的多尺度表示和索引系统,在展开前,我们不妨先来看看传统的指纹识别的原理是怎样的。传统的指纹识别主要依靠的是特征点,比如手指上的纹线、纹线的分叉和断点等。但在真实场景中,指纹的质量往往比较低,模糊、残缺、扭曲都十分常见,给识别增加了难度。
而在我们的多尺度算法索引下,我们会按照整体到局部在到细节等多个尺度,对指纹图像进行特征提取,不同尺度之间我们还会考虑它的多样性刻画。相比于传统的指纹识别,这种算法可以提取到更多的信息,看到更多的细节。而相比于深度学习算法,这种多尺度的算法则可以更有效地对质量较差的指纹进行识别。
高精度图像搜索数学模型
再说说只需极少量样本的自学习框架。其实这一框架与上面的多尺度表示是相辅相成的。传统的深度学习框架需要大量的标注数据,其原因在于一张图片能提取的特征只有一两个。比如要识别一只猫的体态,需要对成百上千张不同体态的猫的图片进行特征提取,才能完成训练。而在多尺度多样化表示的算法中,一张图中就可以提取出成百上千个特征,这样一来,我们所需要的样本数量就可以压缩到传统深度学习的千分之一,甚至万分之一。不仅如此,由于有了多尺度多样化表示这一特点,图像搜索过程中对于误差的容忍性也提升了数十倍。
最后是高速异构的搜索系统,它的核心是通过对图像搜索精度要求的判断,来调用不同的运算资源。对于量大且不需要高精度的图像,可以使用GPU来进行运算;而对精度要求较高的图像则调用CPU来进行运算,从而实现指纹图像的高速比对。完成比对之后,系统会对相似度较高的结果进行排序,就类似网页搜索引擎反馈的排名较高的搜索答案一样。
高性能异构搜索系统
CSDN:刚才我们讲到的是指纹的搜索和比对,其实指纹的采集也是很重要的一个环节,一般的指纹都是通过指压的方式进行采集的,但我了解到墨奇科技研发出了非接触指纹识别技术,请问研发这一技术的原因是什么?
汤林鹏:原因有三。第一是指纹识别在应用上的普及,无论是办证、出入境还是其他场景,指纹识别都是首选的生物识别方案。传统的指纹采集方式却存在一些弊端,例如手指表面的脱皮、破损、干湿度、按压力度/角度,都会造成指纹的畸变,导致指纹的质量降低。而多次反复采集又非常耗时。
第二,得益于深度学习的发展及行业的积累,现在我们已经有能力对低质量的指纹进行处理。
第三,随着边缘计算、AI芯片的发展,边缘端的计算能力得以增强,一些图像处理过程完全可以在边缘端去实现。
另外,新冠疫情也让大家深刻体会到非接触指纹采集的重要性。不少国家接触式的指纹门禁已经被禁用,出入境指纹采集后还需要消毒,非常的不卫生不方便。美国国家标准与技术研究所(NIST)最近也加速了非接触指纹技术的评估和推广。
https://www.nist.gov/news-events/news/2020/05/nist-study-measures-performance-accuracy-contactless-fingerprinting-tech
我认为,这几点是历史性的机遇,也是我们为什么要做非接触指纹识别的原因。
CSDN:那么非接触指纹识别的技术原理是怎样的?
汤林鹏:主要原理是基于多目视觉+结构光这样一个三维成像方法,从不同角度来重建指纹的三维曲面,再进行融合,然后再对指纹信息从三维曲面到二维曲面进行展开,这样就得到了一个高质量、大面积的指纹。
与一般3D扫描不同的是,墨奇的非接触指纹采集的精度非常高,可以精确到亚毫米。
CSDN:在人脸识别中3D扫描技术可以对人脸的真实性进行判断,那么3D扫描指纹是否也可以对指纹的真假进行判别?
汤林鹏:没错,在指纹识别中我们称之为「活体指纹识别」。因为在传统的指纹识别中,像指纹膜、假手指等欺骗手段很容易骗过指纹采集设备。因为传统的按压式的指纹设备得到的只是一张黑白的二维图像。而在非接触采集中,我们却可以得到RGB彩色图像。同时,通过对三维手指外在的眩光、时序信号等,可以精确地分析手指的生理和光学性质,从而判断指纹是否来自活体。
未来,打通AIoT和5G场景
CSDN:你如何看待深度学习的发展?
汤林鹏:我认为深度学习取得今天的成绩,跟一批有远见卓识,且孜孜不倦在这个领域上努力研究的人有关,例如神经网络之父Geoffrey Hinton和一些年轻的研究者,他们用很多年的时间来推动这门技术的发展。
此外,深度学习在一开始表现的并不如传统的算法好,是因为它对数据量的要求比较多,但早期的数据量不够。所以想要提升深度学习的性能的前提,需要先建立一个海量的数据集。我在普林斯顿的导师李凯教授和李飞飞教授一起在早期推动了 ImageNet 数据集的建立,也直接促成了2012年以来深度学习发展的浪潮。当然在很多应用中,大规模的数据采集是比较困难的,我们的技术规避了深度学习的这一瓶颈,同时实现了更加精准的视觉信号的搜索。
CSDN:墨奇科技的未来计划是怎样的?
汤林鹏:近期的规划是继续深耕指纹识别领域,并以此为核心建立起下一代的强身份认证平台。未来2~3年,我们希望能够打造通用的、精确的图像搜索技术,并将这些技术应用到AIoT、5G等场景中。但总结起来一句话,我们的核心是希望不断在技术上有所突破,推进 AI 的发展,并以此来撬动更多重要的行业应用。
推荐阅读
性能超越最新序列推荐模型,华为诺亚方舟提出记忆增强的图神经网络 阿里云科学家入选计算机顶会HPCA名人堂,他是什么来头? 干货 | 基于SRS直播平台的监控系统之实现思路与过程 DevOps 在移动应用程序开发中扮演什么角色? 又一国产数据库诞生!腾讯发布 TGDB,实时查询比 Neo4j 快 20-150 倍! 稳定币经济:十大稳定币简史