论文回顾|[ICDAR 2019] DeepSignDB:大规模联机签名数据集
手写签名是社会认可度最高、应用最为广泛的身份认证方式之一,在行政管理、银行办公等场景中十分常见。因此,手写签名认证研究具有很大的现实意义。然而,受限于签名数据难以获取的难题,当前的联机签名认证主流方法仍是DTW模板匹配,深度学习方法的应用受到了极大的约束(以往学界的许多签名数据集,例如BiosecurID等,出于隐私保护和个人信息安全的考虑,无法公开获取)。因此,一个大规模、可公开获取的签名数据集,对于深度学习时代签名认证的研究,无疑具有十分重要的意义。
该论文作者Ruben Tolosana等来自西班牙BiDA生物信息认证实验室,整合了以往多个非公开可获取的联机签名数据集,作为单一数据集DeepSignDB向学界免费公开,并给出了基于DTW和BGRU 孪生网络的基准认证结果。
DeepSignDB共包含5个子集,分别为MCYT,BiosecurID,Biosecure DS2,E-BioSign DS1,和E-BioSign DS2,具体信息分别如下:
MCYT:该子集共包含330个用户。每个用户有25个真实签名与25个仿冒签名,共计16500个签名样本。采集设备为Wacom Intuos A6数位板,采样频率为100 Hz。
BiosecurID:该子集共包含400个用户。每个用户有16个真实签名与12个仿冒签名,共计11200个签名样本。数据分为4个阶段采集,相邻两个阶段间隔2个月。采集设备为Wacom Intuos 3数位板,采样频率为100 Hz。
Biosecure DS2:该子集共包含650个用户。每个用户有30个真实签名与20个仿冒签名,共计32500个签名样本。数据分为2个阶段采集,期间间隔3个月。采集设备为Wacom Intuos 3数位板,采样频率为100 Hz。
E-BioSign DS1:该子集共包含65个用户,由5台不同的设备采集(3台数位板+2台智能手机)。对于每台设备,每个用户有8个真实签名和6个仿冒签名,共计4550个签名样本。数据分为2个阶段采集,期间间隔至少3个星期。数位板采样率为200 Hz,手机采样率不定。
E-BioSign DS2:该子集共包含81个用户,由3台不同的设备采集(1台手写板+2台智能手机)。对于每台设备,每个用户有8个真实签名和6个仿冒签名,共计3402个签名样本。数据分为2个阶段采集,期间间隔至少3个星期。手写板采样率为200 Hz,手机采样率不定。
DeepSignDB共计有1526个用户,68152个签名样本。另外应该指出,数位板均采用手写笔(Stylus)进行书写,而智能手机既可使用手写笔书写,也可直接使用手指(Finger)。MCYT、BiosecurID和Biosecure DS2里的签名均为手写笔书写,而E-BioSign DS1和E-BioSign DS2中的签名既有手写笔书写的,也有手指书写的。
作者给出了DeepSignDB数据集划分和评估的协议,并给出了基于DTW和BGRU 孪生网络的基准认证结果。该方法的工作流程如下:
(1)首先,用DTW算法进行输入样本与模板样本的序列匹配,检测输入样本是否为Random Forgery(随机仿冒签名)。
(2)如果输入样本并非Random Forgery,则与模板样本共同输入到BGRU孪生网络,判断其为真实签名还是Skilled Forgery(熟练仿冒签名)。
基准结果如图2所示。4vs1意为,对于1个测试样本,供对比的模板样本有4个;1vs1意为,对于1个测试样本,供对比的模板样本只有1个。可以看到,基准方法对于Skilled Forgery的认证错误率并不理想,存在较大的改进空间。同时,手指书写的签名相比于手写笔书写的签名,认证错误率更高,这也是值得思考和研究的一个点。
https://github.com/BiDAlab/DeepSignDB
原文作者:Ruben Tolosana, Ruben Vera-Rodriguez, Julian Fierrez, Aythami Morales, and Javier Ortega-Garcia
编排:高 学
审校:连宙辉
发布:金连文
论文推荐|[CVPR 2020]UnrealText:基于虚拟场景的真实场景文本图像合成 论文推荐|[CVPR 2020]增广学习:面向文本行识别的网络优化协同数据增广方法 论文推荐|[IEEE TPAMI 2020] TE141K:用于文字风格转换的大规模艺术文字数据库 论文推荐|[CVPR2020] SwapText: Image Based Texts Transfer in Scenes 论文推荐|[CVPR 2020]: 基于深度关系推理图网络的任意形状文本检测(有源码) 论文推荐|[PR 2020] 汉字层次学习的自由基分析网络 论文推荐|[AAAI 2020] GTC: CTC引导训练实现有效准确的场景文本识别 论文推荐|[AAAI 2020] 用于算术习题自动批改的结构文本精确识别方法 10篇与文档图像分析识别相关的AAAI 2020论文(附下载链接) 论文推荐|[AAAI 2020] SynSig2Vec:无需任何真实仿冒签名数据亦可训练高性能笔迹鉴别模型
欢迎加入中国图象图形学学会!(附入会攻略)
(扫描识别如上二维码加关注)