查看原文
其他

☞【大数据100分】张良贵:P2P场景大数据应用的实践--积木盒子@“大数据100分”之“金融大数据专题月”

2015-04-06 软件定义世界(SDX)
新用户请点击标题下
【软件定义世界(SDX)】快捷关注

“中关村大数据产业联盟”推出“大数据100分”论坛,每晚9点开始,于“中关村大数据产业联盟”及专业委员会(工业大数据(工业4.0暨工业大数据)、汽车大数据、农业大数据、金融大数据(目前正在进行金融大数据专题月<2015年4月>)、电信大数据(筹)、电商大数据(筹)、旅游大数据(筹)、房地产大数据(筹)微信群进行时长100分钟的交流、探讨。目前已经完成200多场,部分精彩内容已登载在微信公众号:软件定义世界(SDX)【ID:SDx-SoftwareDefinedx】,敬请查阅!

【大数据100分】张良贵P2P场景大数据应用的实践--积木盒子@“大数据100分”之“金融大数据专题月”


主讲嘉宾:张良贵

:中关村大数据产业联盟金融大数据专业委员会 副主任 李灵隐

:中关村大数据产业联盟、金融大数据专业委员会

:王维

嘉宾介绍

张良贵,积木盒子大数据应用中心副总裁。吉林大学数量经济学博士,中国人民大学经济学博士后,中央财经大学数量经济研究中心研究员。10年金融从业经验,先后服务于投资公司、私募基金、期货公司、信用评级公司等,主要领域涉及固定收益、商品期货、有色金属、金融衍生品套利套保、结构化产品设计等量化模型的研究与开发;

在目标数据挖掘、定量模型研究与设计方面拥有丰富经验。曾在穆迪-中诚信国际任总经理助理、高级分析师,负责信用评级、资产证券化、非标业务评级等业务开展;参与多项国家级、省部级课题研究,兼任GLG等国际公司的咨询顾问。

以下为分享实景全文:

大家晚上好!很高兴向各位业界朋友汇报下积木盒子在大数据应用方面的进展。同时,也感谢陈新河秘书长、李灵隐主任提供这样的平台,让业界人士深度交流。


积木盒子作为互联网金融成员,自20138月正式运营以来,一直秉承“真诚透明”。

下图是积木盒子20138-20153月的成交数据。


下图是积木盒子发展中的大事件,很感谢投资人和融资人对积木盒子的信任和支持,取得了一定成绩:

下图是积木盒子保障方式、产品、融资期限和融资主体的分布情况:

下图是积木盒子融资金额的区域分布图:

下图是P2P行业发展趋势:

从图中可以看到,P2P行业发展迅速,被业界认为是对传统金融服务模式的有效补充。这种补充主要来自对金融效率的提高。


这张图可以看到,互联网金融火爆的内在机理,互联网金融本质是将体验、效率融入了金融业务,是“互联网+”的典型应用。


在对互联网金融发展规模、发展内在机理简单分析之后,回归到积木盒子的运作模式,如下图所示:


积木盒子的价值在于为融资人和投资人提供更好的服务,将体验达到极致。服务好这两大群体,产品设计、风险控制、渠道准入等方面需要做的工作很多,基于此,形成的内生数据和外生数据积累,也为大数据分析与应用提供了必备的基础。

如图所示,大数据的应用一定是与业务生态紧密绑定的,这样才能实现闭环的数据链,得到的分析模型与结论才能更好的指导业务实践。在后面的应用案例中,会看到大数据在运营监测中的具体应用。

大数据可以提高决策支持,要实现大数据的高效应用,需要构建基础设施平台,即大数据平台,积木盒子为构建高效的大数据平台一直在努力。

大数据平台应当有三大功能,即数据模块、工具模块和可视化模块。


如下图给出了积木盒子大数据平台基本架构。







在对大数据平台做了基本分析之后,回归大数据应用场景,应用场景是数据的灵魂,可以让数据更有生命感。


对互联网金融而言,场景的关键要素就是“互联网+金融”,互联网的本质就是极致体验,金融的本质就是风险控制。如上图所示。

在这一过程中,积木盒子积累了两大数据,即内生数据和外生数据,内生数据主要是交易场景数据,如投资记录、信审积累等。为了极致体验与服务提供了大量的数据样本。


对外生数据而言,主要是如何从过载的互联网信息中甄别出对传统数据的有效补充。大的思路就是要建立欺诈规则、违约预警和运营的监测。

组件库和规则库是未来大数据应用的主要产品。


在上图中,可以看到数据仓库和API应用接口能够保证积木盒子的数据应用更具有便利移植性、拓展性。

形成闭环的数据生态链是关键。


上图给出了大数据的基本思路。

在明确下大数据的基本思路,即“数据+工具+场景”,数据大集中,形成API可以规范调用的数据仓库,场景就是业务模式,是数据应用逻辑所在,工具就是为实现数据和场景的有效对接而存在,包括调度、展示与预警等。

下面将是大数据在积木盒子业务场景中的应用。

构建筹资能力指数、融资压力指数和痛苦指数的初衷就是能够迅速找到资源的平衡点,互联网金融在投资人收益、融资人成本之间做着平衡,所以痛苦指数是心情的表达。


投资端运营监测,主要监测投资人结构(价值型、投机型)、投资人粘度、投资人偏好,基于实证结果为激励政策、产品服务提供决策支持。

项目端运营监测,主要监测项目满标时间、项目还款行为、项目分布等,满标时间可以直接引导项目定价、上线时间、上线额度及项目上线计划。

下图给出项目满标时间


下图给出了计划项目上线与实际项目上线趋势图。


下图给出了项目满标的热度。


风险端运营监测,是重中之重,对系统风险和个体风险要有更精准的研判,为实现这一目标,数据层、工具层和逻辑层要达到高度配合。

分散度是风险管理的重要指标,我们构建了时间、项目、融资人、渠道等不同层级下的分散度指数,可以对风险决策提供直观支持。如下图所示。




最后给出了积木盒子风控总体结构,基于这样的结构,去建模,去分析,为决策支持提供实时指导,如下图:


我的汇报到此结束,谢谢各位在百忙中不断的触摸屏幕,看着内容,再次感谢~

以下为交流问答环节:

韩笑:感谢@积木盒子张良贵的精彩分享关于外生数据中提到了三类,网购,浏览和社交。是否验证过这三类数据的有效性,相比传统数据和内生数据,这类数据的使用效果如何呢?此外,这三类的有效性从高到低是什么样的呢?

张良贵:@韩笑网购等行为数据我们更多倾向是对欺诈和违约成本分析,数据清洗程度对结果影响很大

豫章文:就昨天话题普级一个知识点,劝告大家表以企业评级高于所在国主权评级而去笑话大公,希腊还被三大公认为垃圾级呢?岂不是希腊企业信用全垃圾级?有评级牌的超码对企业信用评级是有两把刷子的,技能要尊敬,动机另议。

戴星:从运营角度谈风控,很有意义。@积木盒子张良贵担保公司在积木盒子有风险保证金吗?

张良贵:@戴老我们会根据不同的风险特征,会要求渠道在授信敞口期缴纳担保金。

张良贵:国有担保没有,需要出具保函。

梁军成:@豫章文豫总是实战派的,传统的经验再加上技术和大数据分析的预判,或许会有不一样的模式出现。

王恺:@积木盒子张良贵谢谢分享,数据脱敏ppt有提到,具体如何实现?

张良贵:@耐特,数据脱敏是个重要课题,既不能影响数据深度挖掘又不能牺牲隐私安全,积木盒子还在摸索中

高莉:@积木盒子张良贵谢谢;非常精彩;全面翔实;请教对投资和项目两端单独做信用评估及与征信有关内容吗?

张良贵:@高莉,项目端是有信用评级的。

豫章文:保证金仅是加大点违约成本和为平台支撑点时间催收,在次级债中风控意义不大,实际在于推高利率。

戴星:@豫章文在依赖担保公司的风控放款下,代偿及时性就依赖保证金额度了。

豫章文:平台变相蓄了点资金池贝,但那是純负债。

王恺:@积木盒子张良贵谢谢,共同关注,请问自有,线下数据之外,第三方和互联网获取的数据主要指?如何获取?互联网数据是指网购、浏览和社交网络信息吗?


张良贵:@耐特现在各类数据公司很多,大家都在为数据大集中做着贡献,满足特定场景的数据获取还是有方法的。

戴星:@积木盒子张良贵对担保公司的评级,有几家都做了,但现在结果也不算很理想,特别是被国资坑了的情况下,有苦只能自己咽,你们风控在这时有何好招?

张良贵:@戴老风控是艺术也是科学,细节可以咨询积木盒子的首席风险官

陈锋:@积木盒子张良贵,言简意赅,逻辑封闭。谢谢分享。请教两个问题:

1从图上看,指标的分布时间间隔单位是天?这是积木系统内最低的还是中位数的还是标准的数据时间刻度?

2采集系统面向需要脱敏的数据源和公开数据源,它们的最小采集间隔一样吗?分别常规是多少?

张良贵:@陈峰,问题很专业,第一个问题,时间刻度根据运营监管需求来定,对P2P而言,天的粒度可以满足需要了,毕竟不是高频交易。第二个问题,采集要根据资源限制和需求密度,最高频到天的粒度。在大数据上我们一直在追求对欺诈和违约成本上的研判。

吴昊:@积木盒子张良贵积木盒子如何利用大数据判别违约成本?

张良贵:@吴昊违约成本将是大数据下最有价值的突破口,积木还在摸索。

李灵隐:非常感谢良贵的精彩分享!金融大数据专题月精彩更多,敬请期待!


☞“大数据100分”之“金融大数据专题月”4月精彩纷呈


2015330日(周一)2100~2240

分享主题:《大数据重构中国信用体系》

主题汇报人:张韶峰

汇报人简介:张韶峰,百融金服CEO,张韶峰先生是国内第一家专注于大数据与推荐引擎的互联网技术公司百分点集团的合伙人兼金融事业部负责人,清华大学电气工程自动化学士、硕士。2014年,张韶峰先生创建百融金服,作为大数据应用的首批践行者,立志把百融金服打造成为国内金融领域最大的第三方风控及营销服务提供商。并以传播诚信文化理念,开拓诚信生态环境为己任,为国家全民信用体系的建设及普惠金融的实现贡献一己之力。张韶峰先生最初以管理培训生身份加入全球最大的企业软件公司甲骨文大中国区数据挖掘与商业智能软件部门。之后加入全球最大的IT解决方案提供商IBM,负责商业智能与数据挖掘以及智能分析方案。并创建了天才博通公司,在天才博通期间一手打造了国内第一个SaaS模式的数据挖掘软件系统(Geni-sage Data Mining),时间序列预测效果效果远超欧洲领先水平,获得业界认可。


2015331日(周二)2100~2240

分享主题:《您的信用您做主》

主题汇报人:李昊

汇报人简介:李昊,闪银奇异(WecashCIO联合创始人北京大学 物理学院 凝聚态物理博士学位,巴黎高师 化学学院 欧盟项目访问学者(两年)。北京玖富时代投资顾问有限公司 大数据中心总监,任职期间,与FICO达成战略合作,任FICO项目项目经理(技术方向),负责项目技术层面的管控和验收工作;熟练掌握FICO零售信贷评分模型体系方法论;并作为建模专家参与项目,为包括中信银行,青岛银行,包商银行在内的多家银行建立量化风控模型。2013年联合创业闪银奇异科技有限公司,Wecash闪银成立于201311月,Wecash闪银是一家依托大数据分析的科技公司,它是使用数据分析技术和机器学习算法,服务于简单的使命:更快、更精准的信用决策。这项技术可以进行身份识别,并结合个人社交行为及其他互联网信息,对个人信用进行在线评分。


2015401日(周三)2100~2240

分享主题:《大数据催生新型金融模型》

主题汇报人:孙林

汇报人简介:孙林,数信网 CEO。法国巴黎六大博士毕业 (Paris 6),研究如何从海量数据中建模个体及群体的行为,并发现背后的行为智慧。曾任互联网金融创业公司IT总监,中国外汇交易中心外汇系统架构师等职务。20139月创立北京数云普惠科技有限公司。目前致力于提供基础数据源整合及数据加工,以普及大数据的理念,提高广大的大、中、小、微企业,社会组织及个人利用大数据获益的能力。


2015402日(周四)2100~2240

分享主题:中产阶层的社交金融

主题汇报人:金海涛

汇报人简介:金海涛,水木创投创始合伙人,聚合水木社区论坛网友,北邮人论坛网友,水木汇咖啡厅成立水木创投,建立水木ceo俱乐部,北邮ceo俱乐部,主要为互联网80后 ceo提供商业模式梳理,团队组建,商务合作,投融资对接,可以让80后ceo更专注于产品创新。着重关注中产阶级的消费场景,水木创投已经孵化了金融1号店,找装修两个互联网项目。


2015403日(周五)2100~2240

分享主题:《大数据监管是互联网金融监管的新范式》

主题汇报人:李崇纲

汇报人简介:李崇纲,金信网银常务副总经理,曾任北大方正舆情产品总经理; 中国计算机学会大数据专家委员会委员,北京新媒体协会媒体融合论坛副秘书长,中国网络版权维权联盟副秘书长,中关村大数据产业联盟成员; 10多年网络数据挖掘分析经验,网络舆情分析经验;10多年舆情服务一线市场经验;专注大数据在政府、金融等行业领域应用;国内首款舆情监测系统的设计者,长期跟踪网络舆情行业变化; 多家政府企业舆情管理咨询顾问;目前主持开发国内首个大数据防控金融信用风险与智能决策支持系统。


2015404日(周六)2100~2240

分享主题:《P2P场景大数据应用的实践--积木盒子》

主题汇报人:张良贵

汇报人简介:张良贵,积木盒子大数据应用中心副总裁。吉林大学数量经济学博士,中国人民大学经济学博士后,中央财经大学数量经济研究中心研究员。10年金融从业经验,先后服务于投资公司、私募基金、期货公司、信用评级公司等,主要 领域涉及固定收益、商品期货、有色金属、金融衍生品套利套保、结构化产品设计等量化 模型的研究与开发;

在目标数据挖掘、定量模型研究与设计方面拥有丰富经验。曾在穆迪-中诚信国际任总经理助理、高级分析师,负责信用评级、资产证券化、非标业务评级等 业务开展;参与多项国家级、省部级课题研究,兼任GLG等国际公司的咨询顾问。


20154月06日(周一)2100~2240

分享主题:《大数据时代的金融征信》

主题汇报人:王晓蕾

汇报人简介:王晓蕾,人民银行征信中心副主任。


20154月07日(周二)2100~2240

分享主题:《互联网金融之风险解构》

主题汇报人:戴星

汇报人简介:戴星,心意贷CIO兼首席风控官。戴星出身于传统金融,曾参与现行银行五级风险分类体系构建工作,后多年从事互联网咨询和投资。进入P2P行业两年,一直战斗在风控前沿,为建立超越银行的风控实操体系而努力。


20154月08日(周三)2100~2240

分享主题:《金融大数据云风控平台》

主题汇报人:吴昊

汇报人简介:吴昊,好贷网大数据平台高级经理。好贷网是中国最大的在线贷款搜索和服务平台,好贷网云风控平台目前的数据已运用于包括各大银行、小额贷款公司、P2P等200余家信贷机构,保护着数百亿信贷资金的安全,持续为合作信贷机构降低风险。好贷网近期与FICO联合发布云风控平台,将共同致力于利用云技术提供风险管理服务。


20154月09日(周四)2100~2240

分享主题:《大数据防交易欺诈系统》

主题汇报人:张炎

汇报人简介:张炎,中智诚征信有限公司,技术总监。张炎获得美国伯克利大学工程学博士,清华大学学士。高级系统架构师,1994年至今约20年相关领域专业经验,2007年-2011年在Fair Isaac担任 Lead Software Engineer,负责 Falcon 防交易欺诈系统的全面升级换代工作。2011年之后于Opera Solutions任高级软件经理。现任中智诚征信有限公司技术总监。


20154月10日(周五)2100~2240

分享主题:《金融大数据》

主题汇报人:鄂维南、王储

汇报人简介:

鄂维南,中国科学院院士、北京大学教授,美国普林斯顿大学终生教授,应用数学和大数据技术专家。鄂教授任中国计算数学协会理事长,大数据专家委员会特邀委员,北京大学元培学院院长。鄂教授致力于大数据技术的科学研究和产业化,主持国家973重点项目《非结构化数据分析》。

王储,普林科技CTO。北京大学数学院本科,美国普林斯顿大学应用数学博士, 师从普林斯顿大学教授、中科院院士鄂维南教授和机器学习领域领军人物、美国工程院院士沙皮尔(R.Schapire), 研究方向为机器学习与大数据建模分析。王储博士参与过多项机器学习算法和大数据建模分析的研究,其学术成果被业界争相使用。


20154月11日(周六)2100~2240

分享主题:《 小而分散成就P2P安全稳健》

主题汇报人:唐武

汇报人简介:唐武,民信贷总经理。中国传媒大学MBA学院工商管理硕士,亚洲国际公开大学(东亚大学)工商管理硕士,曾先后服务于招商银行、广发银行,担任北京、上海信用卡中心的总经理,目前担任民信贷总经理。加盟民信贷以来,亲自主导了平台的整体规划、策略制定、组织实施、模式创新、营销拓展及客户运营管理,成功将民信贷打造成行业内最具影响力、最具创新活力的P2P网贷平台。


更多节目预告:订阅微信公众号:软件定义世界(SDX)后,查询 501 或 500


期待您的加入,期待您的分享!


中关村大数据产业联盟

【入中关村大数据产业联盟500人微信群指南】

您只需在中关村大数据产业联盟500人微信群中分享一次大数据思想、案例,即可进入500人微信群,与众多大数据朋友沟通、交流、合作!(入联盟500人微信群,请把代表您能力和水平的PPT及姓名、单位、职务、联系方式发chenxinhe2020@126.com。详情请订阅微信公众号:软件定义世界(SDX)后,查询 500或501

中关村大数据产业联盟主旨与目标

落实国家战略,聚合产业势能,促进商学互动,

助力企业成长,倡导数据伦理,探寻数字文明

中关村大数据产业联盟活动

〖大数据100分〗以500人圈大数据技术、资本、专家和政策专业人士为依托,每晚9点进行的线上活动。

〖大数据地平线〗以大数据执委会和中关村大数据产业联盟成员为依托,进行的走入企业现场调研活动。

〖大数据香山汇〗以“运动、分享、进步”为宗旨的爬山、PPT分享、研讨活动。

〖大数据沙龙〗“数据驱动,创新未来”为主题的高端大数据沙龙活动。

中关村大数据产业联盟联盟网站

http://www.zgc-bigdata.org/

大数据媒体方阵

〖软件定义世界(SDX)〗、〖大数据文摘〗、〖大数据栋察〗、〖科技杂谈〗、〖CSDN云计算〗、〖天云融创〗、〖大数据邦〗、〖199IT〗、〖大数据实验室〗、〖云里数里〗、〖中云网〗、〖云华时代〗、〖大数据问答〗等,目前已覆盖20多万订阅用户。

欢迎加入大数据媒体方阵,第一时间获得〖大数据100分〗等中关村大数据产业联盟提供的独家信息,请在公众号留言或加入个人微信号沟通。

联系方式

地址:北京市西城区赵登禹路小绒线胡同22号

电话:010-56380808

个人微信号: sdxtime

电子邮件:sdxtime@gmail.com

如果您认为该文章不错,请转发至朋友圈。分享知识,分享快乐!


您已观看本文 秒,是否对您有启发呢?分享给您的朋友们来共同讨论下如何?

【软件定义世界(SDX)】2014年4月份不容错过的精彩文章:

“查看信息”中,回复日期代码即可。

回复“20140406”-->武新:大数据架构及行业大数据应用【大数据100分

回复“20140301”-->互联网的未来【PPT

回复“20140426”-->大数据产业地图

回复“20140406”-->《互联网思维“独孤九剑”》读书笔记【PPT

回复“20140429”-->怀进鹏院士:大数据与产业发展转型【PPT
回复“20140427”-->部分欧洲国家新一轮工业革命进展
回复“20140430”-->大数据足以引领第四次革命的商业价值
回复“20140408”-->阿里巴巴西湖品学大数据峰会观后感
回复“20140413”-->明天的数字营销分析工具
回复“20140409”-->华尔街分析师选出全球最重要16张图表
回复“20140408”-->颠覆支付行业的创新者RIPPLE
回复“20140410”-->预测零售业未来将发生的十个“神奇”变化
回复“20140403”-->移动支付分析报告【PPT
回复“20140412”-->传统行业转型必须回归产品本质
回复“20140409”-->医疗行业大数据应用的15个场景
回复“20140403”-->谢国忠:“新经济”幻象:互联网不能拯救中国经济


【软件定义世界(SDX)】原创文章推荐。
“查看信息”中,回复【 】内数字快速到达。

《软件定义世界,数据驱动未来》【001

《2013年世界软件产业发展回顾与展望》【003

《平台格局确立,生态体系深化,竞争由硬转软--2013年全球移动互联网发展回顾与展望》【006

《云计算叫好不叫座深层次原因分析》【015

《数据驱动新商业世界【PPT】》【016

▌软件定义世界(SDX)

软件定义世界(SDX),数据驱动未来(DDF)!

微信公众号:软件定义世界(SDX)
微 信 号:SDx-SoftwareDefinedx


软件定义世界(SDX)由陈新河运营维护,本人在IT领域超过15年的观察和思考,产业数据控,同样的数据不同的思考!多次参与软件·信息产业·信息经济·云·物·移·大·智等重大课题研究和产业促进政策制定工作,主持国家发展和改革委员会“十三五”规划前期研究重大课题--《“十三五”信息经济发展研究》,主持课题研究成果获部级奖励一项;IT思想贡献:互联网是以人均GDP为基数的产业,移动互联网是以人口数为基数的产业;首次量化移动操作系统平台经济,首次提出Android微生态概念。现任中关村大数据产业联盟副秘书长。
希望在各位朋友的鼎力支持下,共同把软件定义世界(SDX)打造成SDX的指南针、大数据思想的策源地、政府和企业家的智库、连结创业者与VC的桥梁、从业人员的加油站。

投 稿 邮 箱:sdxtime@gmail.com
我的个人微信号: sdxtime



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存