【大数据专栏】从金融大数据到大数据金融
文 / 冯永,本文来源于国家财经周刊(ENNWEEKLY)
伴随着阿里集团在美国上市,互联网金融的大戏进入高潮,大数据、云计算以及互联网金融等几年前对公众还很陌生的技术术语,迅速成为社会热点。这些底层技术以移动互联的用户体验呈现出来,不仅通过互联网产品改变了人们的衣食住行,更通过互联网金融产品开始冲击“智力博弈巅峰”的金融业。
不管你恐惧还是欣喜,大数据金融时代已经来临。
如何理解由技术创新逐渐引领的金融创新?何谓大数据金融?我们选取三个最有代表性的例子来解答。
何谓大数据?大数据没有严格定义,顾名思义就是“很多数据”.可以从三个层面来解析这个特别的称谓--
从生产来看,不需要特别的采集过程,因为监管要求、业务逻辑或者技术便利,具有“自生产”特征,比如搜索数据、交易数据等;从存储来看,相对于传统数据库的数据规模,量变引起质变,需要新的数据库技术来支持存储和访问;从使用来看,分析方法从基于概率论的抽样理论过渡到人工智能、统计学习等讲求高维、高效率分析技术。
从行业细分角度,大数据金融业主要有大数据银行金融和大数据证券金融,分别和银行业务、证券业务相关。当然,保险业天然就和大数据相关。
信用卡自动授信是典型的大数据银行金融。从银行角度是否应该对申请者授信、发授多少信用额度,是个重要问题。传统方式是人工审核申请资料,然后根据大致的档位发放额度或拒绝申请。但是当银行积累了足够多的用卡客户数据,可以把是否违约,违约概率,有效使用额度等指标作为被评价对象,然后调用与此相关的各种客户信息建立统计模型,自动计算授信结果。
机器人投资是大数据证券金融的代表形式,股票价格波动受各种因素影响,传统的投资方式一般人工收集信息,手动交易。机器人投资可以建立多因素模型,自动选择股票或寻找交易时机,在适当的风控模型下建立机器人投资云交易模式。
再如,连接银行和证券的大数据不良资产评估。2005年,某国有不良资产管理公司开始尝试在海量数据基础上进行不良资产评估。原本银行信贷资产的评估都是基于会计模型,但是不良资产基本没有会计特征,很难用传统方法评估。因此,收集已处置资产和待处置资产样本进行对比,建立数据挖掘模型,可以方便评估待处置资产的价格。
了解了大数据和大数据金融的几个应用实例,我们总结一下何谓大数据金融。
金融业积累的大数据就是金融大数据,根据银行金融和证券金融本身的不同,这些数据也分成银行金融大数据和证券金融大数据。积累数据过程中,产生了数据采集、存储、使用的相关工作和企业,这样就完成了金融大数据的产业链,但总体依然是信息技术产业链。
随着信息技术全面发展,金融大数据产业具备提供信息技术服务之外的金融服务能力时,就产生了大数据金融。大数据金融是脱颖于金融大数据的新服务,是技术服务催生出来的金融服务。
出走的“阿里系”
阿里巴巴在美国纽交所上市次日,清华五道口金融学院的一场EMBA课后,蒋韬被讲台下各路大佬包围,要求私聊。
复旦大学计算机硕士毕业后,蒋韬从IBM到了美国硅谷,2009年加入阿里,从事反欺诈和风控领域研究,位至安全部技术总监。2013年创业,成立“同盾科技”,同年获得IDG和华创资本的1000万元投资。
除他之外,从阿里出走的还有一批人。
创业最初,蒋韬一个人拉客户、谈投资、建团队,但不久就有原同事加入进来。眼下,核心团队汇集了阿里安全部、美国PayPal公司的一批反欺诈科学家和技术高管,专注于账号、交易、支付和网络信用等领域的一系列反欺诈技术开发。
“创业圈里有腾讯系、百度系、华为系、IBM系、复星系等,我们是阿里系。”
蒋韬团队目前所做的,是接入银行、保险公司、第三方支付和P2P等机构的大数据库,以数学建模来抓取行为、用户习惯等信息,“抓坏人”.
在全球规模庞大的信息泄露关联产业,一批黑客长期从事截获并贩卖大众信息的工作,而接货者则通过计算机自动比对,将买来的账号密码等信息在各大金融机构网站、电商网站进行“撞库”,成功率通常可以达到5%-10%,成功“撞库”的信息将高价卖出,以便下个团队用以挪走消费者资金、非法支付和欺诈勒索,等等。
按照银监会一位人士的说法,金融机构自身安全措施并不完善,技术不断升级但总赶不上黑色产业的蓬勃生长,加之互联网金融中的P2P、直销银行、NFC支付、在线保险、比特币等新业态如雨后春笋般涌现,金融系统的反欺诈手段亟待升级。
蒋韬的公司很快就获得国内部分有反欺诈市场需求的金融机构的重视,商业银行中也有不少于10家开始试用并购买其产品。而他,也开始在各种场合一遍遍“扫盲”.
“但是,别以为没有竞争。”蒋韬说。公司产品瞄准了商业银行的信用卡、贷款、理财、P2P、电子银行和对私业务等领域,这些“肥肉”早有人垂涎三尺。
蒋韬眼下最大的心病是人才。公司的现有团队人数明年需要翻番,“推荐人才吧,好的都要”.只是这个“好”,恐怕得兼具金融、数学、IT、统计等多专业背景。
人才缺乏是行业共同的难题。在杭州,阿里高薪招人的条件家喻户晓,非名校应届生的工程师岗位,底薪已经加至每月9000?12000元。
蒋韬说,人力成本被炒得很高,公司现有100人的团队,每月要付出200多万元运营成本。但是在长三角地区,阿里系的创业者仍旧如雨后春笋。有人统计,阿里系已然占据长三角创业圈1/3的规模。
而阿里最让人难以捉摸的,是其在技术上不畏分享的态度,以无偿的技术开源社区供创业者免费使用。蒋韬的公司就大部分搭建于阿里开源出来的技术框架,并由此得以在巨人的肩膀上成长。
至于由此而生的大数据金融生态系统,也很可能成为未来影响中国发展的力量中,最风生水起的那一支。
大数据监管的混业挑战
在大数据金融时代,“大数据监管”模式也将应运而生,即围绕数据的生成、传输和使用等环节,采取实时、互动方式,实现对金融市场的监管。
《财经国家周刊》记者在调研中发现,无论是顶层设计,还是“一行三会”的实际监管工作,“大数据监管”都已经在筹备和应用中。一位不愿具名的专家说,各部委动起来,更多是意识到大数据能够为己所用,但相互间仍处于割裂状态。
“一行三会”动起来
“征信系统为金融机构提供了一个共享借款人信用记录的平台。”央行征信中心副主任王晓蕾对《财经国家周刊》记者说。
根据央行提供的数据显示,截至2014年8月底,企业征信系统累计收录企业和其他组织信息1951万户,个人征信系统累计收录自然人数8.5亿,其中,收录有信贷记录的自然人约3.4亿,中国已建成世界上最大的个人征信数据库。
近几年新金融业态,譬如小贷公司、融资性担保公司的发展都对央行征信系统提出新要求。这些新业态的数据是否纳入征信系统也一直为各界所讨论。
“从法律层面没有任何障碍。”王晓蕾表示,《征信业管理条例》第二十九条规定,从事信贷业务的机构应当按照规定向金融信用信息基础数据库提供信贷信息。
《财经国家周刊》记者了解到,由央行征信中心控股的上海资信有限公司,已经发起设立了网络金融征信系统,开始收集P2P借贷机构上报的信息。
大数据给监管机构带来的压力日增。“银监会既要管好每家银行,又要关注整个银行体系,还要参与宏观调控,这就可想而知所需要的数据统计量了。”银监会统计部副主任苗雨峰在接受《财经国家周刊》记者采访时表示。
证监会则充分利用了大数据这一神器,如稽查“老鼠仓”.证监会一位司局级官员对《财经国家周刊》记者透露,“捕鼠”的线索就是来自交易所日常监控下的大数据。他透露,每天下午4点钟,监管部门就能拿到全国基金公司报送的交易和净值数据,“基金获益率是否异常,通过大数据检测一眼就能看出。”
2014年,中国保险信息技术管理有限责任公司成立,负责统一建设、运营和管理保险信息共享平台,主要通过信息技术手段,采集保险经营管理数据,建立标准化、系统性的数据体系。
协调不易
《财经国家周刊》获悉,一个关于中国金融业的大数据库早在2012年就已酝酿,目前正加紧推进。
9月24日,“一行三会”主管统计或调统的负责人齐聚央行,关于中国金融综合统计平台建设的讨论会正在召开,央行副行长潘功胜参加。
会议讨论筹建中国规模最大、涵盖最广的金融信息数据库。它将在集合“一行三会”现有数据,涵盖银行、证券、保险、基金等金融行业,甚至将银行业表外业务数据进行统一的基础上,建立起中国金融业信息统计平台。
“金融业综合信息统计是决策层特别提出的,从2012年就开始酝酿。”央行一位司局级领导接受《财经国家周刊》记者采访时表示,之所以建立金融业综合信息统计平台,主要出于两点:一是中国金融数据历来以银行业为主,当下混业趋势日渐明显,如何建立全维度、全覆盖的大数据系统,是“一行三会”的共同难题;另一方面,互联网金融等新兴业态层出不穷,对监管统计工作提出重大挑战。
但是,中国金融综合统计平台建设的细节问题仍需解决。9月24日会上,一行三会人士进行了激烈的讨论,主要集中在以下几点:
首先,金融综合统计平台的建设亟须在统计方式、指标、对象、主体上实现标准化,包括金融机构代码、企业代码和个人代码都需要制定标准;
其次,这一新型数据系统要实现综合化覆盖,囊括新型金融业态,这就涉及新型金融机构、准金融机构如何统计、是否强制性纳入等问题;
再次,是该系统最终要实现共享,需要解决社会服务共享中是否收费、如何收费等问题。
前述知情人士还表示,建设金融综合统计平台必须打破现有分业监管“画地为牢”的思想,“有些部委的数据库,不准别人插手,目前协调的难度仍相当大”.
民间数据对接难题
通过10余年积累,电商巨头已经积累了海量的信用数据,如今这些数据的商业价值正逐步显现。政府机构是否可以利用这些数据?
中央财经大学中国银行[0.38%资金研报]业研究中心主任郭田勇表示,目前我国最大的数据库征信系统的信息覆盖面主要集中在信贷系统,而对于个人其他经济活动和社会活动尚缺乏信用报告。
央行副行长潘功胜也曾公开表示,鼓励包括民间资本在内的各类资本进入征信业,也欢迎阿里、腾讯等互联网企业进入征信体系建设。
但是,一位接近央行征信中心的监管人士却表示,目前电商数据库很难被直接纳入官方数据库。《征信管理条例》规定,采集个人信息应当经信息主体本人同意,未经本人同意不得采集--电商数据来源是否合法难以界定。
此外,“电商平台上的差评是否算不良信息?目前很难说。”这位监管人士强调,在不知道电商数据质量如何的情况下,不会盲目将其纳入央行征信系统。
杭州同盾科技有限公司首席执行官蒋韬向《财经国家周刊》记者介绍说,在美国,金融、互联网各个行业都有自己的数据体系。“民间、官方的数据很难放到一个数据库里去,只能是开放的心态,双方在数据层面上达到共建共享。”
国家统计局局长马建堂也表示,所有拥有海量数据的机构,无论是企业还是政府机构,原则上除涉及国家安全、商业秘密和个人隐私等数据外,都应以更加开放的姿态、更加积极的行动促进大数据的深度应用,通过立法保障各方在大数据应用中的共享共赢。
沉睡的银行大数据
互联网金融正式进入破茧成蝶的大数据时代,传统银行业面临的挑战前所未有。
清华大学五道口金融学院一位专业人士表示,互联网时代海量的数据和分析工具,催生出很多新的金融业态,切入传统银行的禁地,“他们比传统银行有更强的数据收集和分析能力”.
北京银行一位高管也对《财经国家周刊》记者坦言,大数据应用可能对银行的一些观念和经营模式产生颠覆。
接受采访的一些人士认为,探索以大数据为基础的解决方案,是中国的银行提高自身竞争力的重要手段。如何建立强大稳定的数据分析系统,开发创新数据应用,实现经营转型,是银行业在大数据时代迫在眉睫的任务。
梦想很远,现实却很紧迫。“国内银行还处在搭建推广手机银行、网上银行阶段,”前述五道口人士表示,“我们已经慢了一拍。”
“金融富士康”
华道数据处理有限公司是隐身在银行大数据“转型”背后的“推手公司”.
“只要你去银行填表单,无论是对私还是对公业务,银行都会把手写表单的影像第一时间发给我们,我们再通过人工录入生成电子表单返回给银行。”该人士介绍,“时间很短,可能就1分钟。”
这就是银行后台外包业务,也是银行最初的大数据入口。《财经国家周刊》记者了解到,目前几乎所有的大中型银行都将数据录入业务外包。
“这个工作比较枯燥,属劳动密集型。银监会一位领导来检查时,称我们为‘金融富士康'.”该人士有些不好意思地笑着说。
银行业具有天然的数据属性,但是与阿里巴巴等电商动态的数据采集系统相比,银行目前经营管理数据挖掘和采集方式仍比较落后。而且,不仅数据录入处于原始状态,一位信息系统的管理人员透露,目前银行仍有不少业务处理系统和管理系统缺乏标准化的统一设计,直接导致大数据二次开发难。
银行正逐渐意识到这一点,不少银行开始用移动终端直接录入客户信息。但是华道数据人士表示,由于国家于电子类单据尚未立法保障,所以在今后一段时间内,银行大数据的获取仍离不开手工录入。
《财经国家周刊》记者了解到,在数据录入完成后,银行的每张纸质单据仍需作为凭证,归档库存。
除为银行录入单据之外,华道还承担了另一项外包业务--信息审核。
几乎每人申请信用卡的时候都会接到核实信息的电话,“这个电话一般都不是银行打来的,多是外包公司打的。”华道人士介绍。
至于业务银行信用卡的审核,也由华道负责。前述人士说,在审核流程中,银行可能会调取央行的征信系统信息,但是,查询一条信息的费用为5元左右,所以很多银行查询完就放到自己的信息池中,不再更新。“我们对照核实的信息很有可能是几年前的。”
除此之外,银行传统的数据库可能会涵盖客户的基本身份信息,更深一步的信息譬如性格特征、消费习惯、兴趣爱好等却是银行难以准确掌握的。而这正是互联网金融的强项。
沉睡的大数据
互联网公司频频在已有的大数据基础上开展金融业务,这些业务跨过银行传统的信贷领域,开始向转账汇款、现金管理、资产管理、供应链金融、支付等领域蔓延。
前述五道口人士表示,互联网、电子商务等新兴企业在大数据处理经验、产品创新能力、市场灵活度等方面都拥有明显的优势,一旦涉足金融领域,将对银行造成很大的威胁。在这种情况下,银行更应激活利用内部的“沉睡数据”.
记者了解到,目前银行对数据的分析仍集中在结构化数据,譬如单据、借贷行为,等等。对于非结构性数据,如客户浏览银行网站的行为信息、服务通话的语音信息、营业网点或ATM机的录像信息都无法分析,更谈不上挖掘利用。
麦肯锡的一份研报指出,这类非结构性数据中蕴含了丰富的客户信息,如客户身份、客户偏好、服务质量、竞争对手信息,等等。但现实中,此类数据除了少量的人工质检调阅外,几乎没有其他用途。
“国际经验已经表明,加强数据分析能力会使银行具体业务收益得到改善。在国内银行转型的这个节点,加强数据分析,也有利于银行挖掘资源,找到独特的经营模式。”前述五道口人士表示。
畏首畏尾
银行业对大数据的挖掘创新似乎并不如互联网企业那么热衷,这其中既有传统行业理念的保守,也有制度上的掣肘。
“银行进行大数据挖掘,必然牵扯多方面,譬如观念转变、制度建设、流程优化、系统开发以及人才储备,等等。”一位股份制银行的信息管理人士说。
首先是合法性问题。前述央行司局级官员说,与电商相比,银行机构同样也能做到消费者信息实时跟踪,但《征信业管理条例》第十三条规定,采集个人信息应当经信息主体本人同意,未经本人同意不得采集。
“所以很多信息,尤其是服务通话的语音信息、营业网点或ATM机的录像信息等,这些数据信息采集尚未得到当事人允许,所以能否进一步分析开发是否合法没有定论,这也使得很多银行无法拓展这方面的业务。”前述股份制银行人士表示。
其次,银行现行的架构缺陷。国内银行传统架构中,信息科技部门是作为配角出现的。与电商成千上万的IT工程师相比,银行的技术部门仅有几十甚至十几人,并且基本上集中在电子银行、系统维护等边缘业务。
“进行数据分析开发必须把信息科技部门提到一个新高度,整合全银行的数据资源。但是这又牵扯到部门利益,必须进行大刀阔斧的改革,所以很复杂。”前述股份制银行人士说,进行数据开发,银行要从内部把数据标准化,这又会牵扯到很多细节问题,仅统一日期格式的工作就很繁重。所以,在大数据时代来临之时,很多银行仍显得犹疑不定。
大数据金融时代
伴随着阿里集团在美国上市,互联网金融的大戏进入高潮,大数据、云计算以及互联网金融等几年前对公众还很陌生的技术术语,迅速成为社会热点。这些底层技术以移动互联的用户体验呈现出来,不仅通过互联网产品改变了人们的衣食住行,更通过互联网金融产品开始冲击“智力博弈巅峰”的金融业。
不管你恐惧还是欣喜,大数据金融时代已经来临。
如何理解由技术创新逐渐引领的金融创新?何谓大数据金融?我们选取三个最有代表性的例子来解答。
何谓大数据?大数据没有严格定义,顾名思义就是“很多数据”.可以从三个层面来解析这个特别的称谓--
从生产来看,不需要特别的采集过程,因为监管要求、业务逻辑或者技术便利,具有“自生产”特征,比如搜索数据、交易数据等;从存储来看,相对于传统数据库的数据规模,量变引起质变,需要新的数据库技术来支持存储和访问;从使用来看,分析方法从基于概率论的抽样理论过渡到人工智能、统计学习等讲求高维、高效率分析技术。
从行业细分角度,大数据金融业主要有大数据银行金融和大数据证券金融,分别和银行业务、证券业务相关。当然,保险业天然就和大数据相关。
信用卡自动授信是典型的大数据银行金融。从银行角度是否应该对申请者授信、发授多少信用额度,是个重要问题。传统方式是人工审核申请资料,然后根据大致的档位发放额度或拒绝申请。但是当银行积累了足够多的用卡客户数据,可以把是否违约,违约概率,有效使用额度等指标作为被评价对象,然后调用与此相关的各种客户信息建立统计模型,自动计算授信结果。
机器人投资是大数据证券金融的代表形式,股票价格波动受各种因素影响,传统的投资方式一般人工收集信息,手动交易。机器人投资可以建立多因素模型,自动选择股票或寻找交易时机,在适当的风控模型下建立机器人投资云交易模式。
再如,连接银行和证券的大数据不良资产评估。2005年,某国有不良资产管理公司开始尝试在海量数据基础上进行不良资产评估。原本银行信贷资产的评估都是基于会计模型,但是不良资产基本没有会计特征,很难用传统方法评估。因此,收集已处置资产和待处置资产样本进行对比,建立数据挖掘模型,可以方便评估待处置资产的价格。
了解了大数据和大数据金融的几个应用实例,我们总结一下何谓大数据金融。
金融业积累的大数据就是金融大数据,根据银行金融和证券金融本身的不同,这些数据也分成银行金融大数据和证券金融大数据。积累数据过程中,产生了数据采集、存储、使用的相关工作和企业,这样就完成了金融大数据的产业链,但总体依然是信息技术产业链。
随着信息技术全面发展,金融大数据产业具备提供信息技术服务之外的金融服务能力时,就产生了大数据金融。大数据金融是脱颖于金融大数据的新服务,是技术服务催生出来的金融服务。
阿里数据到底有多美?
彭蕾和自己女儿同学的妈妈打赌,因为对方不相信孩子的专业课本--《天目山植物学实习手册》能在淘宝上买到。结果,同学妈妈搜到了此书的25个卖家链接后,瞬间折服。
接下来,这位妈妈只要一登录淘宝或阿里旺旺,天目山、莫干山等各种“山”,植物学、动物学等各种“学”,甚至从大学英语到旅游手册,无数相关商品扑面而来,所有的依据,就是其仅有的一次搜索。
她感慨自己瞬间就“被大数据”了。而参与打赌的彭蕾,正是阿里小微金融服务集团CEO.
在历时近一个月的调研活动中,《财经国家周刊》记者所见阿里金融剑之所向,是成为环境舒适安全、人流络绎不绝的全维度大“超市”--无论银行、证券、保险,抑或拥有数据和技术的互联网公司,将统统会在该“超市”上架。
而整个阿里集团,也将转向定位于大数据服务商和技术提供商,不卖数据卖分析,不卖硬件卖服务。“马云想要的,是下一个IBM.”阿里一位高管说。
不过,在央行一位官员看来,阿里能提供给客户的大数据产品,瑕疵不少而且安全难保,“一切并非所见的那么美好”.
“毛细血管”的野心
阿里原安全部技术总监蒋韬说,阿里的大数据技术至少全球前三,甚至已超过另两位--亚马逊和谷歌。8000多人的技术团队,从2003年底第一笔支付宝交易以来的10年内,他们已铆足劲头,等待爆发。
阿里大数据之战的战略核心,就在于此。
阿里小微金融服务集团副总裁俞胜法给出一组调研数据,称传统银行的客服、柜台和客户经理人数占比达80%左右,数据工作人员不足10%,而阿里微贷事业部采用数据化决策,60%从事数据相关工作,余下则主做数据底层架构搭建。整个阿里的金融团队,90%的人每天与数据打交道。
目前,阿里拥有全国最大的Hadoop分布式计算集群,日增数据50TB(数据存储单位,1TB=1024G),有40PB(1PB=1024TB)海量数据存储,分布于全国80多个节点的CDN网络,支撑流量超过800Gbps,即同时支撑对数十亿商品的实时搜索和记录。
关键的是,所有访客行为都被如实记录。部分数据采用1:120的高压缩极限存储技术,通过由3000多台服务器组成的“云梯”超大规模数据系统,以及阿里自研的ODPS数据系统,持续挖掘和分析。
“有人说我们要卖数据,也有银行来洽谈,但其实数据是不卖的。”俞胜法很直接,说阿里倾尽全力打造的大数据库,难以定价。
他表示,阿里每一步的初衷都很简单,成立支付宝,意在解决网购双方信誉和担保问题;余额宝,是为减少网购涉及的银行备付金及其利息;涉足小贷,则是为了让无厂房、无固定资产、无财务报表的淘宝卖家们,能有融资和生存之路。而眼下的大数据金融,是意在满足市场对高效金融服务的需求,并带动淘宝卖家实现电算化。
那么,捂着这些数据黄金,马云究竟想做什么?
“马云要自己动手取代IBM.”前述阿里高管告诉《财经国家周刊》记者。
具体的商业模式,是阿里将拿出5000台服务器的系统处理能力作为基础,将大数据库作为核心竞争力,免去银行建机房、造系统的成本,只出具少量服务费就能享用阿里式服务。
“银行将继续做金融系统主动脉,阿里一边做毛细血管,一边做数据和技术服务商。”前述高管勾勒出一幅蓝图--待纳入基金、证券、保险等机构后,拥有巨量金融信息的阿里平台就将诞生。
局限性质疑
对此,有人提出异议。
央行一位司局级官员指出,阿里前述商业模式明显有三点局限性--
首先,阿里90%以上的数据来自含淘宝、天猫在内的“大淘宝”,支付宝实名制用户2013年底接近3亿人,但与“大淘宝”高度重叠。阿里只能驾驭自有平台的数据,之外则无优势。
“我们确实在数据采集上存有局限。”前述阿里高管也坦言,他本人就少有网购行为,“数据库中可能找不到我的信息”.
加之京东、1号店等电商崛起,同一客户在不同电商平台的表现是否一致,不同平台的分析结果谁更准确等问题,还有待商榷。并且,阿里的客户群相对单一和同质化,一旦风险袭来则很难把控。相比之下,银行却拥有众多细分市场和细分风险模型,小微业务即便做砸了,也不至全盘皆输。
其次,阿里宣称其具备确认支付宝用户信息的能力,但其实,开设支付宝账户必须链接至少一张银行卡,身份确认的工作和成本,早已由银行付出,阿里只是借力而已。
不仅如此,阿里也不应具有对客户数据的交易和处置权,至少应该在征得被搜集人许可后才能进行买卖。相比之下,银行线上线下的业务办理,均会书面通知客户信息将被部分抓取,行为明显规范得多。
其三,阿里目前呈现的数据产品,不包含细节信息和分析过程,仅是所谓评分系统给出的信用评分,不但真实性、可信度打上了问号,其评分标准亦可能各执其词。
例如,全球银行普遍使用的美国FICO个人信用评分系统,是在依据高达100万的大样本数据进行验证与核对的基础上,才开始使用的。阿里的大数据模型,却尚未经过数据检验和修正。
“金融数据必须足够准确。阿里的产品缺乏标准,如何负起不良率的风险连带责任?”一位有着阿里背景的高盛人士质疑,“一个负责任的银行,绝不会轻易购买。”
是故,一些数据源匮乏的中小银行,就算高价买来阿里数据也难以二次使用。P2P和小贷公司等机构,则往往囊中羞涩,掏腰包也会“货比三家”.
“例如,央行征信系统能给出个人或企业贷款90天内的逾期概率,阿里能给出吗?”前述央行官员说。
合规之忌
有监管方面专家指出,阿里的大数据金融,从源头到终端都画了一个“圈”,“玩”到极致也跳不出来,没“玩”好则将导致风险在“圈”内爆炸。
按俞胜法的说法,大数据系统设计之初就囊括了风控措施,对店铺信息的长期跟踪,亦伴随着准入、定价、反欺诈等风控评分;一旦发现经营异象,阿里会有专人负责沟通核实、提早介入;一旦违约,还有一整套外包的催收机制。
《财经国家周刊》记者获悉,截至2014年7月底,阿里小贷已具有几百亿元贷款规模,户均贷款余额和户均授信分别仅约4万元和18万元,但贷款余额不良率在1.5%左右。这在业内是个较高的数字。
“是金融背景还是互联网背景的人在玩金融,一眼便知。”前述高盛人士称,后者往往另辟蹊径、大步向前,缺乏对金融应有的敬畏。
而更客观和严峻的问题是,银监会规定小贷机构放贷规模不得超过自有资本50%,贷款规模受到严格限制。但资本金仅20亿元左右的阿里小贷,缘何能将贷款资金杠杆放大至几百亿元?
知情人士私下透露,阿里小贷早就“突破”20亿元资本金的限制:各种合作方,能助其将资产包在交易所上市,比如2013年深交所东证资管将阿里的资管计划挂牌出售,以资本市场交易来实现“出表”,即贷款行为不再受到自身资产负债表制约,贷款余额得到大幅增长。
简单说来,与绝大多数小贷公司孤立无援相比,阿里强大的“人脉网”,能让其放贷行为避开资本金规模和杠杆率监管的制约。
“证券化能轻松将贷款余额做到资本金的数倍,这是做小贷的默认’行规‘,阿里玩得最猛。”高盛人士说,阿里无所畏惧地横行于自己不擅长的领域,并且以全链条闭环封闭了可能的风险。
这一点,金融危机时的美国银行业改革已给出警示。2010年初,奥巴马宣布采纳“沃克尔法则”,要求银行业剥离衍生品、抵押贷款等杠杆率过高的交易,并提高了资产2500亿美元以上银行的风险和资本标准,规定对抵押贷款进行证券化的金融机构必须自身持有一部分风险头寸并接受消费机构检查。
“此举可谓美国1930年大萧条以来最致命的金融改革,目标直指交易透明度,限制大型机构以自有资本参与市场投机。”高盛人士指出。
有分析人士认为,阿里的核心问题,在于包括前述隐性扩大杠杆和实体经济下行等一系列风险,均内置于一套金融闭环内,从数据收集、信用评估、模型建设、贷款发放、风险跟踪直到还贷收贷,整个链条统统由阿里一家完成,风险无法跳出循环,此乃金融业大忌。
“无论什么新花样,其本质是金融,就要尊重基本规律。”前述央行官员警示,阿里的金融闭环正在不断放大风险。
银监会创新部主任助理李志磊告诉《财经国家周刊》记者,不论出身不论形式,也不论线上线下,都要进行监管,“只要是金融机构,就要接受与传统金融机构等同的监管方式,没有特殊。”
隐私裸奔?
隐私和安全是大数据时代的重要问题,阿里同样绕不过去。在监管尚未完全到位之时,如何把握大数据金融对于个人信息的抓取程度?如何划定不触及大众隐私和安全的法律底线?
李志磊对此表示,消费者是否允许挖掘和跟踪数据,还需要出台相关法律规定。与大数据公司相比,一些银行机构同样也能做到信息实时跟踪,只是考虑到法律授权比较慎重而已。
央行征信中心副主任王晓蕾指出,欧美国家的个人数据保护立法,基本包含四个原则,即目的性、适当性、本人同意及知情原则。大数据并不意味着无限制搜集,信息主体对自身信息的采集和使用也应有更多知情权和控制权。
《欧洲数据保护法》明确要求,搜集方在隐私声明中要将信息及用途加以说明,允许用户对个人信息进行修改,甚至要求将条款细化成一张列表,供用户自行勾选。但在中国,尽管一些机构认识到了“本人授权”能够规避可能的法律风险,但这种“授权”往往是强制性和形式上的。
“金融业还无法完全驾驭大数据。”前述专家说,随着金融市场乃至整个社会管理的信息基础设施日益一体化和外向型,隐私和数据安全面临越来越大的风险。
最近一份对欧洲150万手机用户数据的研究表明,只需要4项参照因素就能确认其中95%用户的身份。显然,中国大数据信息的搜集范围严重“超标”.
相关法律法规和行业自律等措施,究竟由哪个机构来牵头负责,由怎样的专业人士来制定游戏规则,是眼下摆在国家决策层面前的一道最紧迫的难题。
这一困境,已在实践中逐渐显现。
此前,有消息说阿里、腾讯等大型电商平台数据未来有望纳入征信系统中。但一位接近央行征信中心的人士对《财经国家周刊》记者明确回应,“目前尚不可行。因为电商的一些数据来源与目前法律相悖。”
《征信业管理条例》第三章第十三条明确规定,采集个人信息应当经信息主体本人同意,未经本人同意不得采集。但是,依照法律、行政法规规定公开的信息除外。
“电商抓取客户的行为信息,搜集客户在电商平台上的活动,经过客户允许了吗?”该知情人士问。
此外,还有一个“产业”,即在电商平台上刷信用--“这种刷出来的信用占电商平台的多少比例?是否会直接影响到其信用度的评定,这些都没有定论”.
阿里于2014年9月19日在美国上市。有分析说,作为在美上市公司,阿里有义务对美国监管部门和公众履行非公开或公开披露义务,而阿里几乎掌握所有商家、厂家及购买人的经济信息及重要金融端口,包括客户姓名、住址、身份证号码等等。这些信息能否披露?
有分析人士认为,阿里的数据业务模式可能代表着一个全新的发展方向,但必须清醒意识到,阿里是站在一堆法律并未明确定性的大数据的“刀尖”上跳舞。
欢迎大家加入科技杂谈菁英汇,交流思想、分享信息。仅限行业商端人士参与。参与方式:点击左下方“阅读原文”填写您的加入信息,科技杂谈通过审核后,会添加入群。
本文仅代表作者观点,科技杂谈授权刊登。
转载必须注明作者与科技杂谈,侵权必究。
科技杂谈文章,均同步发布于犀牛财经网。
已入驻搜狐新闻客户端,网易阅读客户端。