账话单转换导入相关问题详解
数岚情报分析专家系统正式服务各级部门和用户以来,得到了广大专业人员的高度评价和积极反馈。以下,对于初次使用本系统人员进行账话单转换导入时遇到的主要问题进行说明。
数据的产生和应用是相分离的,这就导致实际收集到的数据异源异构。
异源异构指的是数据源往往来自于不同的业务系统,具有不同的数据结构。例如一个省份内不同银行给出的账单格式都是不同的,甚至有时同一家银行不同省份给出的账单格式也不同。
这就对数据导入管理提出了更高的技术要求。可以豪不夸张地说,数据能够整理成统一格式导入成功,数据分析就成功了一半。
问题详解
问题如上图,造成这个问题的原因有很多,主要分为两种:一是数据文件老旧;二是该账单格式未录入账单转换器。
1. 有时原始账单文件比较老,格式不规范,如出现如下的提示。
可以用excel或wps打开原始账单文件,另存为xlsx文件,弹框选择是。再次导入,解决一部分教老的格式无法识别的问题。
2. 若确认原始数据文件有数据,以上方法都试过后,转换器仍只能读取到0条。请联系数岚技术支持(微信:15306815969)提供原始账单范本(保留10行以上有效数据),代为制作账单模板,升级转换器。
与问题1不同,有时账单原始数据导入有数据,但数据不全。这是因为原始数据有空行,转换器识别到空行暂停转换,删除空行即可。这个问题一般出现在多账户挤在一个excel表格里同个sheet表内,有的银行会用空行断开不同账户。建议在转换前大致记录下总的会账单条数,以避免问题2出现却未意识到。
出现这类情况,大多是原始excel表格内有无法识别的乱码数据,如日期、金额为中文等,建议联系技术支持(微信:15306815969)解决。
【账单列表】出现上图中账户名缺失的情况,可以通过红框手动添加/修改账户名,或是按照下方图片中的操作,在转换前处理excel(推荐)。
不会,同一个excel转换的文件,数据库识别到已有的数据不会重复导入。
将同一银行的数据放在一个文件夹下,拖曳文件夹至账单转换器种即可。每个文件转换条数都会在转换结果里显示,像图中的转换结果意味着除了“示例1.xlsx”以外的文件均导入成功。
但是,如果原始账单数据的数据质量不高的情况下,不推荐批量导入!不推荐不熟练的用户使用批量导入功能。因为批量导入时,上述问题2和问题4即使出现也很难第一时间发现,一旦导入进案件,很容易出现数据缺失及大片的数字账户名,这时就很难一一关联逐个标注,给数据整理工作造成巨大的困扰。
假如账单内有银行卡号,可以通过手机支付宝转账处输入银行卡号,或第三方网站(如卦卜网)查询所属银行。
原则上不推荐转换导入pdf账单文件,在银行给出pdf账单时,办案人员最好进一步沟通获得其他格式的账单文件。
账单标准化流程
异源异构的原始账单在导入时,会遇到千奇百怪的问题,上述罗列的问题并不能涵盖所有异常情况。与其在各种困难间焦头烂额,不如防患于未然,确立并严格执行账单的标准化流程。磨刀不误砍柴工,数据能够整理成统一格式导入成功,数据分析就成功了一半。
1收集数据
办案人员收集数据时,尽可能要主动提出数据内容、格式的要求。例如,向银行调取账单明细的时候,要求提供xlxs或xls格式文件,包括以下字段:电子银行明细应该还包括本方账号、户名、卡号,交易时间、交易网点代码和交易网点名称、交易金额、用处(摘要)、资金往来方式、交易对手资料(交易对手账号、交易对手姓名)等内容,尽可能保证内容详尽、格式规范。
2分类整理
办案人员收集完账单数据后(话单比较简单,按运营商分类即可),在自己的系统内初步整理数据,为了方便后期转换导入数据,我们推荐按照银行分类文件夹,并确保每一个银行账户、卡号都知道使用者是谁。
在之前的灰度测试中,我们发现有的原始账单数据内不包含使用者姓名,而在excel文件名或文件夹名中标识,或是银行单独给出一份清单:上有账户号、卡号、姓名。针对这种情况,我们推荐办案人员统一记录账户号、卡号、姓名,方便后期添加标注,同时避免遗失信息。
3转换导入
之后便要将原始话账单导入转换器,再将生成的数据文件导入分析软件,这个过程有以下几点注意事项:
① 原始数据质量不高(即收集时信息不全、格式不规范) 、不熟练的情况下建议逐个转换导入数据。
② 转换时校对下原始数据条数、转换后保存条数、导入软件后读取条数三个数据有没有大的出入。
若导入软件后增加的账单记录远大于实际转换的条数,有可能是因为自动链接关联了过去导入的人员库信息。例如,以前办案子导入过10000条王小明的账单(自动进入数据库),新建案件后又导入了2569条账单,其中1569条重复,那么导入软件后就会有11000条账单。
了解详情/业务咨询/申请试用,请联系我们,
服务热线:400-999-0905
往期推荐
关注公众号 成为办案高手
数岚情报分析专家