Python数据科学

其他

《100天风控专家》限时优惠,最后26个名额!

最近一段时间,都在佛系更新风控相关的文章,不少朋友私信说看了很有帮助,希望能有更详细的内容。这里我来说明一下,所有的文章内容都来自《100天风控专家》视频课程中的,考虑到付费成员的优先学习权益,文章一般都会延迟发出来,并且只节选其中一部分章节作为公开分享,并不是完整内容。下面是历史分享的汇总,其中数篇文章获得官方推荐。基于交叉表制定风控规则CART决策树制定风控规则决策树生成规则可视化(升级版)风控“规则集”的性能测试(Python实操)风控“规则集”的A类调优(Python实操)风控规则的A类调优:拒绝客户坏账预测一文读懂风控策略调优方法体系信贷风控中是如何做拒量回捞的?信贷风控中是如何做策略收紧的?信贷风控中如何平滑的做收紧?信贷风控中的置入置出策略是什么?大厂风控策略是如何做收紧的?大行的额度策略是如何设计的?大行的额度收入测算是如何做的?如果对完整内容感兴趣,想第一时间看视频讲解,获取数据代码实操,建议了解下本课程(扫码试看)。本次国庆为今年最后一次保持599的优惠价格,名额有限。价值
10月4日 上午 8:34
其他

《100天风控专家》国庆优惠活动

大家好,我是东哥。最近一段时间,都在佛系更新风控相关的文章,不少朋友私信说看了很有帮助,希望能有更详细的内容。这里我来说明一下,所有的文章内容都来自《100天风控专家》视频课程中的,考虑到付费成员的优先学习权益,文章一般都会延迟发出来,并且只节选其中一部分章节作为公开分享,并不是完整内容。下面是历史分享的汇总,其中数篇文章获得官方推荐。基于交叉表制定风控规则CART决策树制定风控规则决策树生成规则可视化(升级版)风控“规则集”的性能测试(Python实操)风控“规则集”的A类调优(Python实操)风控规则的A类调优:拒绝客户坏账预测一文读懂风控策略调优方法体系信贷风控中是如何做拒量回捞的?信贷风控中是如何做策略收紧的?信贷风控中如何平滑的做收紧?信贷风控中的置入置出策略是什么?大厂风控策略是如何做收紧的?大行的额度策略是如何设计的?大行的额度收入测算是如何做的?如果对完整内容感兴趣,想第一时间看视频讲解,获取数据代码实操,建议了解下本课程(扫码试看)。本次国庆为今年最后一次保持599的优惠价格,名额有限。价值
9月29日 下午 5:34
其他

大厂的额度策略效果是如何测算的?

当授信额度策略迭代优化以后,需要与旧策略进行对比测算,如何进行有效的对比呢?本篇针对新旧额度效果对比进行几个维度的介绍,内容节选自《100天风控专家》贷前额度策略篇。目录:额度策略测试方法额度分布对比额度风险测算额度盈利性测算一、额度策略测试方法贷前的定额策略和审批策略一样,也要进行优化调整。调整的原因分为两种:①客观变化引起:比如通过监控发现的策略效果变差、公司政策变化、客群变化等原因,导致被动要做出适应新环境需求的调整。②主观上的挑战:即便没有客观的变化发生,企业也要定期主动去发现旧策略的可优化点,优化生成新策略来挑战旧策略,往复不断尝试,以此让策略更优。无论是哪种方式,一个必须面临的问题是:当每次新额度策略制定以后,都需要和旧策略进行效果对比,以此来评估是否要做新旧策略切换。关于额度策略的对比测试方法有哪些呢?二、新旧额度离线测试1)新旧额度策略的分布对比首先,要分析新旧额度策略在额度分布上的差异。比如下面展示了新旧额度策略在各个额度区间下最小值、最大值、均值以及分位点上的变化程度。对额度区间、
9月29日 下午 5:34
其他

大行风控的 ”策略+模型“ 是如何做的?

大家好,我是东哥。最近一段时间,都在佛系更新风控相关的文章,不少朋友私信说看了很有帮助,希望能有更详细的内容。这里我来说明一下,所有的文章内容都来自《100天风控专家》视频课程中的,考虑到付费成员的优先学习权益,文章一般都会延迟发出来,并且只节选其中一部分章节作为公开分享,并不是完整内容。下面是历史分享的汇总,其中数篇文章获得官方推荐。基于交叉表制定风控规则CART决策树制定风控规则决策树生成规则可视化(升级版)风控“规则集”的性能测试(Python实操)风控“规则集”的A类调优(Python实操)风控规则的A类调优:拒绝客户坏账预测一文读懂风控策略调优方法体系信贷风控中是如何做拒量回捞的?信贷风控中是如何做策略收紧的?信贷风控中如何平滑的做收紧?信贷风控中的置入置出策略是什么?大厂风控策略是如何做收紧的?大行的额度策略是如何设计的?大行的额度收入测算是如何做的?如果对完整内容感兴趣,想第一时间看视频讲解,获取数据代码实操,建议了解下本课程(扫码试看)。本次国庆为今年最后一次保持599的优惠价格,名额有限。价值
9月27日 下午 7:16
其他

大行的额度收入测算是如何做的?

定额策略是贷前的关键一环,好的额度策略可以让收益最大化,而额度策略中较为重要的维度就是收入,如何准确测算出申请人的收入是重中之重。本篇针对金融机构对“收入测算”常用的几种方法进行详细介绍,内容节选自《100天风控专家》贷前额度策略篇。定额策略(1):额度对风险的意义定额策略(2):数据维度定额策略(3):收入测算定额策略(4):各发展阶段的不同定额策略定额策略(5):额度矩阵设计定额策略(6):额度效果评估定额策略(7):新旧额度效果测试对比一、社保1)什么是社保社保缴费是指参加各类社保保险并缴纳保费的行为。一般情况下特指社会统筹的“养老保险、医疗保险、失业保险、工伤保险、生育保险”的缴费。社保缴费分为两部分:单位缴纳部分和个人缴纳部分。2)个人缴费基数个人缴费基数是按照职工上一年度(1月至12月)的工资收入月平均来确定的,即职工工资越高,社保缴费基数就会越高。该缴费基数有上限和下限,范围在当地上一年度社会平均工资的60%—300%,比如上一年度社会平均工资是1000元,则今年缴纳的基数就在600元—3000元的范围内。老员工基数核算按照上年的月均工资来核定,新员工按照入职首月的工资进行核定,即新人首月起薪,老人上年月均。参考:根据《关于规范社会保险缴费基数有关问题的通知》(劳社险中心函【2006】60号)3)缴费比例养老保险:单位、个人分别缴纳20%、8%医疗保险:单位、个人分别缴纳12%、2%失业保险:单位、个人分别缴纳2%、1%4)月收入推算如果可以获取借款人的社保数据,则可以根据根据缴纳比例倒推出月收入,公式如下:推算月收入=养老保险月缴纳额/
9月19日 下午 5:47
其他

大厂风控的 “置换策略” 是如何设计的?

本篇来介绍下风控中的置换策略,它是策略分析师实际工作中经常使用的方法,并且也是面试中经常被问到的问题。以下正文内容节选自《100天风控专家》策略优化篇。1.
9月14日 下午 7:45
其他

如何搭建自己的风控策略体系?

《100天风控专家》更新至今内容过半,其中策略篇更是已经更了大部分,包括了策略开发、策略调优、贷前中后场景策略、定额定价策略,大量的业务逻辑讲解和Python实操得到了很多朋友的肯定。以下是本号从课程中节选的部分内容进行的分享,其中很多篇文章也是被业内的风控人员转载和分享,并且也得到了官方的推荐,数篇文章突破了一万阅读,最高的两万多。基于交叉表制定风控规则CART决策树制定风控规则决策树生成规则可视化(升级版)风控“规则集”的性能测试(Python实操)风控“规则集”的A类调优(Python实操)风控规则的A类调优:拒绝客户坏账预测一文读懂风控策略调优方法体系信贷风控中是如何做拒量回捞的?信贷风控中是如何做策略收紧的?信贷风控中如何平滑的做收紧?大厂风控策略是如何做收紧的?损益测算:风控中
9月14日 下午 7:45
其他

大行的额度策略是如何设计的?

阶梯方式分布取值交叉融合的维度需要有一定的排序性,即有一定业务可解释性。因此,两个维度交叉后会天然形成阶梯式的分布规律。矩阵中具体每个元素值的制定,可根据产品政策和业务理解灵活设计。③
8月30日 下午 1:36
其他

如何搭建自己的风控策略体系?

《100天风控专家》更新至今内容过半,其中策略篇更是已经更了大部分,包括了策略开发、策略调优、贷前中后场景策略、定额定价策略,大量的业务逻辑讲解和Python实操得到了很多朋友的肯定。以下是本号从课程中节选的部分内容进行的分享,其中很多篇文章也是被业内的风控人员转载和分享,并且也得到了官方的推荐,数篇文章突破了一万阅读,最高的两万多。基于交叉表制定风控规则CART决策树制定风控规则决策树生成规则可视化(升级版)风控“规则集”的性能测试(Python实操)风控“规则集”的A类调优(Python实操)风控规则的A类调优:拒绝客户坏账预测一文读懂风控策略调优方法体系信贷风控中是如何做拒量回捞的?信贷风控中是如何做策略收紧的?信贷风控中如何平滑的做收紧?大厂风控策略是如何做收紧的?当然,干货可远不止这些,来看看课程的大纲吧。01课程内容《100天风控专家》从0到1,全面介绍了信贷风控的各个环节,包括业务、产品、策略、模型、数据,”5大板块,10大专栏,近150期“,目前已完成进度是1/2,后续更新可能还会做适当增加,比如最近应大家要求新增了“损益测算”
8月23日 下午 11:33
其他

大厂风控策略是如何做收紧的?

风控策略调优是策略分析师必备技能,本篇对收紧策略的方法论,以及一些步骤、操作方法进行了汇总,内容节选自《100天风控专家》策略调优篇。一、策略收紧调优的方法论D类调优可分为宏观和微观两个层面的。1)宏观层面:对“整体风险客群”的收紧,而非某个具体维度的客群;2)微观层面:对某个维度的客群(非整体)进行策略收紧,以达到优化策略效用的目的,具体方法包括了策略收紧、策略替换、策略新增。本篇重点介绍策略规则的收紧。二、策略收紧1)概念理解策略收紧(狭义上理解)这里特指,对规则或模型的阈值进行收紧调整,将原通过的客群进行一定比例的拒绝,以达到降低逾期率的目的。注:这里的策略收紧指的是狭义上的理解,一种具体的方法,仅对规则或模型本身的阈值进行调整,不借助其他变量(比如策略新增、策略替换)。2)适用对象策略收紧的分析方法同时适用于规则和模型(因为模型本身就是一个强规则)。规则是微观的调整,调整范围小,而模型是宏观调整,收紧的调整范围更大,比如对主模型融合模型的风险等级进行收紧拒绝一类风险客群,那将会大幅度的降低通过率和逾期率。3)方法特点策略收紧是通过有贷后表现的样本分析后制定的,和A类调优的阈值放松相比,有更好的量化分析条件基础,分析过程更容易。1.
8月9日 下午 11:26
其他

信贷风控中的置入置出策略是什么?

本篇来介绍下风控中的策略收紧,内容节选自《100天风控专家》第74期。历史策略文章:基于交叉表制定风控规则CART决策树制定风控规则决策树生成规则可视化(升级版)风控“规则集”的性能测试(Python实操)风控“规则集”的A类调优(Python实操)风控规则的A类调优:拒绝客户坏账预测一文读懂风控策略调优方法体系信贷风控中是如何做拒量回捞的?信贷风控中是如何做策略收紧的?信贷风控中如何平滑的做收紧?1.
7月29日 下午 5:15
其他

信贷风控中是如何做策略收紧的?

本篇来介绍下风控中的策略收紧,内容节选自《100天风控专家》第67期。历史策略文章:基于交叉表制定风控规则CART决策树制定风控规则决策树生成规则可视化(升级版)风控“规则集”的性能测试(Python实操)风控“规则集”的A类调优(Python实操)风控规则的A类调优:拒绝客户坏账预测一文读懂风控策略调优方法体系信贷风控中是如何做拒量回捞的?0.
7月11日 下午 1:25
其他

信贷风控中是如何做拒量回捞的?

本篇来介绍下风控中的拒绝回捞策略,内容节选自《100天风控专家》第65期。历史策略文章:基于交叉表制定风控规则CART决策树制定风控规则决策树生成规则可视化(升级版)风控“规则集”的性能测试(Python实操)风控“规则集”的A类调优(Python实操)风控规则的A类调优:拒绝客户坏账预测一文读懂风控策略调优方法体系1.
6月28日 上午 11:51
自由知乎 自由微博
其他

风控规则的A类调优:拒绝客户坏账预测

本篇更新策略篇的规则集A类调优Python实操篇,内容选自《100天风控专家》第64期。历史策略文章:基于交叉表制定风控规则CART决策树制定风控规则决策树生成规则可视化(升级版)风控“规则集”的性能测试(Python实操)风控“规则集”的A类调优(Python实操)本篇开始介绍策略调优方面的内容,从A类调优开始,规则阈值的放松具体如何来做。1.
6月24日 下午 11:57
其他

终于搞定了风控模型和策略!

《100天风控专家》的大纲终于尘埃落地了。之前一直未做出来,主要是因为有部分未更新的内容不确定,毕竟涉及到内容交付,有些东西还是需要仔细斟酌的,所以拖了好久。其实在这期间有不少朋友咨询过我,也提出过类似目录大纲的问题。近期已经全都搞定了,也给感兴趣的朋友做个参考,接下来我需要做的就是按计划上新了。废话不多说,来看看干货。01课程内容《100天风控专家》从0到1,全面介绍了信贷风控的各个环节,包括业务、产品、策略、模型、数据,”5大板块,10大专栏,近150期“,目前已完成进度是1/3,后续更新可能还会做适当增加,所以最终完全体应该在150期以上。以下是目录大纲。价值
6月24日 下午 11:57
其他

风控策略调优方法论体系

本篇来介绍下风控策略调优的方法论体系,内容选自《100天风控专家》第63期。历史策略文章:基于交叉表制定风控规则CART决策树制定风控规则决策树生成规则可视化(升级版)风控“规则集”的性能测试(Python实操)风控“规则集”的A类调优(Python实操)风控规则的A类调优:拒绝客户坏账预测1.什么是策略调优?风控策略开发上线后并不是一成不变的,它会受业务目标、市场变化、数据质量效果等很多方面的影响,比如:业务不同发展阶段下会有不同的业务目标,策略需跟随调整;客群质量变好或者变差,策略需进行放松或收紧的调整;监管政策变化,比如要求定价不得高于24%,策略需要调整;数据下线或者效果衰减,策略需进行下线或者替换的调整;…所以策略是需要不断调整优化的。简单理解,策略调优就是根据当前最新的变化对现有策略所做出的调整,以适应最新的变化。这个变化可能来自业务、市场、产品、数据、技术等可能影响策略的各种因素。因此我们说,没有最完美的策略,只有不同变化下最合适的策略。2.宏观策略调优宏观的风控策略的主基调要根据公司整体的风险偏好来制定,有保守、激进、平稳几类。一般情况下,在市场行情好的时期,策略可以偏激进一些,这时迅速占有市场用户为主要目标,可以快速扩大规模,形成规模效应。而在市场行情不好的时期,策略需要调整为保守一些,这时以稳定发展为主,大多是在经营前期吸收的存量客户,对于风险较高的新客户谨慎处理。因此,从大的市场环境角度考虑,这就是策略调优的价值所在。当然,在什么时间点切入做调优也是一个非常关键的点。因为风险往往是滞后的,如果在市场环境不好之前可以提前捕捉预判进行收紧,那么后期的贷后压力就会很小。而如果盲目乐观等到了市场变差的时候再做调整,那么后期风险集中,压力会非常大。3.
6月18日 下午 6:47
其他

风控规则的A类调优:拒绝客户坏账预测

本篇更新策略篇的规则集A类调优Python实操篇,内容选自《100天风控专家》第64期。历史策略文章:基于交叉表制定风控规则CART决策树制定风控规则决策树生成规则可视化(升级版)风控“规则集”的性能测试(Python实操)风控“规则集”的A类调优(Python实操)本篇开始介绍策略调优方面的内容,从A类调优开始,规则阈值的放松具体如何来做。1.
6月14日 下午 1:20
其他

终于搞定了风控模型和策略!

《100天风控专家》的大纲终于尘埃落地了。之前一直未做出来,主要是因为有部分未更新的内容不确定,毕竟涉及到内容交付,有些东西还是需要仔细斟酌的,所以拖了好久。其实在这期间有不少朋友咨询过我,也提出过类似目录大纲的问题。近期已经全都搞定了,也给感兴趣的朋友做个参考,接下来我需要做的就是按计划上新了。废话不多说,来看看干货。01课程内容《100天风控专家》从0到1,全面介绍了信贷风控的各个环节,包括业务、产品、策略、模型、数据,”5大板块,10大专栏,近150期“,目前已完成进度是1/3,后续更新可能还会做适当增加,所以最终完全体应该在150期以上。以下是目录大纲。课程详细内容,可扫码
6月6日 下午 11:29
其他

pandas “图形,表格” 可视化大全

pandas的可视化方法,分为图形可视化和表格可视化。本次介绍完整的图形可视化使用方法,包括基础和高级两部分。基础可视化一种是针对series和dataframe的绘制方法,可以一行代码快速绘图。dataframe.plot.func()series.plot.func()func()主要是日常比较基础的图形,如下:折现图(line)条形图(bar)直方图(hist)箱箱型(box)面积图(area)散点图(scatter)饼图(pie)六边形箱型图(hexbin)核密度图(kde)子图import
6月4日 下午 11:52
其他

终于搞定了风控模型和策略!

《100天风控专家》的大纲终于尘埃落地了。之前一直未做出来,主要是因为有部分未更新的内容不确定,毕竟涉及到内容交付,有些东西还是需要仔细斟酌的,所以拖了好久。其实在这期间有不少朋友咨询过我,也提出过类似目录大纲的问题。近期已经全都搞定了,也给感兴趣的朋友做个参考,接下来我需要做的就是按计划上新了。废话不多说,来看看干货。01课程内容《100天风控专家》从0到1,全面介绍了信贷风控的各个环节,包括业务、产品、策略、模型、数据,”5大板块,10大专栏,近150期“,目前已完成进度是1/3,后续更新可能还会做适当增加,所以最终完全体应该在150期以上。以下是目录大纲。课程详细内容,可扫码
6月3日 下午 11:50
其他

终于搞定了风控模型和策略!

《100天风控专家》的大纲终于尘埃落地了。之前一直未做出来,主要是因为有部分未更新的内容不确定,毕竟涉及到内容交付,有些东西还是需要仔细斟酌的,所以拖了好久。其实在这期间有不少朋友咨询过我,也提出过类似目录大纲的问题。近期已经全都搞定了,也给感兴趣的朋友做个参考,接下来我需要做的就是按计划上新了。废话不多说,来看看干货。01课程内容《100天风控专家》从0到1,全面介绍了信贷风控的各个环节,包括业务、产品、策略、模型、数据,”5大板块,10大专栏,近150期“,目前已完成进度是1/3,后续更新可能还会做适当增加,所以最终完全体应该在150期以上。以下是目录大纲。课程详细内容,可扫码
6月2日 下午 11:55
其他

风控“规则集”的A类调优(Python实操)

本篇更新策略篇的规则集A类调优Python实操篇,内容选自《100天风控专家》第61期。前面介绍了单变量规则、二维交叉规则、多维决策树规则、决策树规则可视化等常用的方法。规则集的性能介绍,以及规则集性能测试Python实操。本篇来介绍如何对规则集进行A类调优。规则集提升通过率(A类调优)的一般分析流程。什么是A类调优?策略调优就是对已有策略进行放松或者收紧的调整,来应对市场风险变化,主要关注的两个指标:通过率、逾期率。按照通过率提升或者降低的角度考虑,策略调优可分两大类:A类调优、D类调优。A类调优的相关注意事项:含义:A是Ascending的缩写,代表提升通过率,即从已有策略拒绝的客户中寻找好客户进行通过。场景:通过监控报表发现,某规则集、模型命中率逐渐变高导致通过降低;业务初期通过率较低风险可控,希望提供通过率扩大业务范围。方式:无客户贷后表现,需通过历史数据推演进行拒绝客户逾期表现的推断。规则集A类调优分析流程对于并行的规则集而言,客户进入规则集的节点以后,我们可以无差别地获取规则集内部每个规则的数据以及命中情况,这是并行规则集的优势,这种优势主要就体现在策略调优上。01
5月31日 下午 7:33
其他

风控“规则集”的性能测试(Python实操)

本篇更新策略篇的规则集性能测算及Python实操,内容选自《100天风控专家》第57期。首先介绍规则集的完整分析流程,包括五个步骤。一、规则集分析流程1.
5月23日 下午 6:42
其他

终于搞定了风控模型和策略!

《100天风控专家》的大纲终于尘埃落地了。之前一直未做出来,主要是因为有部分未更新的内容不确定,毕竟涉及到内容交付,有些东西还是需要仔细斟酌的,所以拖了好久。其实在这期间有不少朋友咨询过我,也提出过类似目录大纲的问题。近期已经全都搞定了,也给感兴趣的朋友做个参考,接下来我需要做的就是按计划上新了。废话不多说,来看看干货。01课程内容《100天风控专家》从0到1,全面介绍了信贷风控的各个环节,包括业务、产品、策略、模型、数据,”5大板块,10大专栏,近150期“,目前已完成进度是1/3,后续更新可能还会做适当增加,所以最终完全体应该在150期以上。以下是目录大纲。课程详细内容,可扫码
5月22日 下午 11:13
其他

这次终于,搞定了风控模型和策略!

《100天风控专家》的大纲终于尘埃落地了。之前一直未做出来,主要是因为有部分未更新的内容不确定,毕竟涉及到内容交付,有些东西还是需要仔细斟酌的,所以拖了好久。其实在这期间有不少朋友咨询过我,也提出过类似目录大纲的问题。近期已经全都搞定了,也给感兴趣的朋友做个参考,接下来我需要做的就是按计划上新了。废话不多说,来看看干货。01课程内容《100天风控专家》从0到1,全面介绍了信贷风控的各个环节,包括业务、产品、策略、模型、数据,”5大板块,10大专栏,近150期“,目前已完成进度是1/3,后续更新可能还会做适当增加,所以最终完全体应该在150期以上。以下是目录大纲。课程详细内容,可扫码
5月18日 上午 8:29
其他

终于搞定了风控模型和策略!

《100天风控专家》的大纲终于尘埃落地了。之前一直未做出来,主要是因为有部分未更新的内容不确定,毕竟涉及到内容交付,有些东西还是需要仔细斟酌的,所以拖了好久。其实在这期间有不少朋友咨询过我,也提出过类似目录大纲的问题。近期已经全都搞定了,也给感兴趣的朋友做个参考,接下来我需要做的就是按计划上新了。废话不多说,来看看干货。01课程内容《100天风控专家》从0到1,全面介绍了信贷风控的各个环节,包括业务、产品、策略、模型、数据,”5大板块,10大专栏,近150期“,目前已完成进度是1/3,后续更新可能还会做适当增加,所以最终完全体应该在150期以上。以下是目录大纲。课程详细内容,可扫码
5月15日 下午 10:15
其他

终于搞定了风控模型和策略!

《100天风控专家》的大纲终于尘埃落地了。之前一直未做出来,主要是因为有部分未更新的内容不确定,毕竟涉及到内容交付,有些东西还是需要仔细斟酌的,所以拖了好久。其实在这期间有不少朋友咨询过我,也提出过类似目录大纲的问题。近期已经全都搞定了,也给感兴趣的朋友做个参考,接下来我需要做的就是按计划上新了。废话不多说,来看看干货。01课程内容《100天风控专家》从0到1,全面介绍了信贷风控的各个环节,包括业务、产品、策略、模型、数据,”5大板块,10大专栏,近150期“,目前已完成进度是1/3,后续更新可能还会做适当增加,所以最终完全体应该在150期以上。以下是目录大纲。课程详细内容,可扫码
5月12日 下午 9:37
其他

150期“风控策略和模型” 终极版!

大家好,我是东哥。《100天风控专家》的大纲终于尘埃落地了。之前一直未做出来,主要是因为有部分未更新的内容不确定,毕竟涉及到内容交付,有些东西还是需要仔细斟酌的,所以拖了好久。其实在这期间有不少朋友咨询过我,也提出过类似目录大纲的问题。近期已经全都搞定了,也给感兴趣的朋友做个参考,接下来我需要做的就是按计划上新了。废话不多说,来看看干货。01课程内容《100天风控专家》从0到1,全面介绍了信贷风控的各个环节,包括业务、产品、策略、模型、数据,”5大板块,10大专栏,近150期“,目前已完成进度是1/3,后续更新可能还会做适当增加,所以最终完全体应该在150期以上。以下是目录大纲。课程详细内容,可扫码
5月8日 下午 11:17
其他

〝风控策略、模型〞,全部搞定!

大家好,我是东哥。《100天风控专家》的大纲终于尘埃落地了。之前一直未做出来,主要是因为有部分未更新的内容不确定,毕竟涉及到内容交付,有些东西还是需要仔细斟酌的,所以拖了好久。其实在这期间有不少朋友咨询过我,也提出过类似目录大纲的问题。近期已经全都搞定了,也给感兴趣的朋友做个参考,接下来我需要做的就是按计划上新了。废话不多说,来看看干货。01课程内容《100天风控专家》从0到1,全面介绍了信贷风控的各个环节,包括业务、产品、策略、模型、数据,”5大板块,10大专栏,近150期“,目前已完成进度是1/3,后续更新可能还会做适当增加,所以最终完全体应该在150期以上。以下是目录大纲。课程详细内容,可扫码
5月2日 上午 10:20
其他

终于搞定了 PSI 稳定性计算(Python代码)

大家好,我是东哥。在风控中,风险意味着不确定性,不确定性越强意味着越不可控,做数据化风控也是同理,追求的就是让确定性越来越强,转换成统计概率论来说就是不断提高我们的胜算的概率。当然,没有任何人可以做到100%的确定,因为没有人是上帝视角,所以在风控决策过程中总会产生错杀或者误放。这是对风控宏观层面的理解,将视角缩小至风控模型上,也是如此。风控模型人员在做模型时可能更关注效果AUC/KS等评估指标,效果胜过一切。但其实对于模型而言,稳定性的重要程度要胜过效果。因为一个模型的开发周期并不短,且上线后不会轻易的更换,也就是说我们做的不是一个高频的事情。如果模型不稳定,即便离线效果比较好但线上稳定性差,那么对于整个风控决策结果而言就是致命的,因为此时你无法保证有大概率的胜算了。本文将介绍风控中稳定性指标PSI的概念和理解,以及A卡模型上线后如何对模型分及入模变量进行稳定性观测。PSI的理解作为一名风控人员,相信对IV指标并不陌生,它可以代表一个变量的信息价值,或者可以理解为与目标变量的相关程度,是一个变量好坏的效果指标。如果你是一个老风控人员,就会发现PSI和IV指标的计算公式是非常相似的,因为二者的本质是相同的,都是计算两个分布之间的距离。PSI衡量稳定性,希望两个分布越接近越好,而IV衡量变量的区分能力,希望两个分布越远离越好。所以,弄清楚这点,PSI和IV的计算公式就相当容易理解了。这就是PSI,全称为(Population
4月25日 下午 5:37
其他

风控模型策略考点&大厂面经手册

金三银四求职季,应届的、跳槽的,最近100天风控群里太多朋友有求职面试的需求了,借此机会整理了关于金融信贷风控模型和策略方面的大厂面经,以及常见考点和解答。这个手册由于还没更新完,有部分内容还在补充完善,目前仅限《100天风控专家》课程内部共享使用。如果感兴趣可以私信我。另外,信贷风控的免费交流群即将满员,最近无论技术讨论、还是行业招聘信息内容质量都拉满了,想要进群交流的,可以私我备注:风控注意:该群仅适合银行/消金/小贷/互联网风控的业内人士、正在学习风控的应届同学、转行转岗的同学,非相关人士不会邀请。--end--100天风控专家历史文章迁徙率报表逻辑和开发(Python代码)Vintage分析表计算过程详解CART决策树暴力生成风控规则基于交叉表制定风控规则全流程(Python)风控规则的决策树可视化(升级版)
4月3日 下午 3:36
其他

Vintage分析表计算过程详解

大家好,我是东哥。信贷风控领域中,经常用到账龄Vintage报表,这是入门初学者的难点之一,因为它涉及到用户还款、逾期等多种行为以及业务上的多种统计口径,因此很多朋友一直无法将逻辑梳理清楚。本次来给大家详细介绍Vintage报表的底层计算逻辑是什么样的。一、4个统计时点以2022-11放款月份为例,各个MOB对应的M2+逾期率为:MOB1的M2+逾期率=MOB1的M2+逾期金额/2022年11月总放款金额=0MOB2的M2+逾期率=MOB2的M2+逾期金额/2022年11月总放款金额=0.95%…MOB12的M2+逾期率=MOB12的M2+逾期金额/2022年11月总放款金额=3.22%通用公式:MOB(N)的M2+逾期率=MOB(N)的M2+逾期金额/xx放款月份的总放款金额要计算每个单元格的逾期率,需要首先了解4个统计时点:应还款日、实际还款日、MOB观察日,当前观察日。应还款日:还款计划生成后,确定了每个月的还款日。有两个方式,第一种是还款日根据放款日而定,比如2022年11月10日放款,那么后续每个月10号还款,第二种是所有客户都是同一还款日,比如所有客户都在每个月的21号还款。实际还款日:客户实际的还款日,由客户还款行为决定,与应还款日比较以后可有三种方式,提前还款、按时还款、逾期不还。MOB观察日:每个MOB月的观察时点,也分为两种,一种是期末时点,一种是月末时点。当前观察日:就是假设你站在了某个时点,然后对历史每个月放款后各MOB逾期数据的回看。与前三个时点不同,当前观察日不是周期性产生的,而是固定不变的,对于所有放款月都一样。总结一下,在进行Vintage计算之前需要确认几个事项:当前观察日是哪天?MOB观察日的口径,是月末时点,还是期末时点?观察逾期的口径,是当前current逾期,还是曾经ever逾期?金额口径还是订单口径?实际业务场景中,比较常用的是“MOB月末时点观测+当前逾期口径+逾期未结清余额”的逾期率口径。以上4个都确定以后,剩下就看应还款日和实际还款日了,而应还款日是根据产品设计而定的,因此只有实际还款日是不确定的。实际还款日是由客户行为决定的,可以发生在任何的时间点,所以根据实际还款日的不同发生位置,就会产生多种情况。二、逾期天数计算第一种是,当应还日超过当前观察日的时候,也就是应还日还在未来,是未发生的事,因此我们无法判断。第二种是,应还日在当前观察日之内了,属于我们可以观察到的历史数据了。此时,如果实际还款日在应还日当天或者之前,说明是正常还款,未发生逾期,因此逾期天数为0。第三种是,实际还款日在应还日和mob观察日之间,说明虽然逾期了,但在mob观察日之前还上了。此时如果是当前逾期的口径,那么在mob月底观察是未发生逾期的,那么逾期天数为0;如果是曾经逾期口径,那么就发生过逾期了,逾期天数=实还日-应还日=5第四种是,实际还款日在mob观察日之后,虽然也还了,但晚于mob观察点,因此当前逾期与曾经逾期口径是一样的,逾期天数都=MOB观察日-应还款日=21第五种是,从应还日一直到当前观察日,客户一直没有还款动作,也就是一直未结清。因此当前逾期与曾经逾期口径也是一样的,逾期天数都=MOB观察日-应还款日=21三、逾期金额计算前面我们根据4个统计时点,计算出每个客户在各个mob下的逾期状态和逾期天数。逾期天数可以转化为逾期期数,比如M1+/M2+/M3+等等,因此我们就可以观察M1+/M2+/M3+的逾期率在vintage账龄下的趋势。通过各mob的逾期状态判断,我们也可以统计出逾期的剩余未还本金,也就是我们前面所要求的金额逾期率口径的分子。四、逾期率计算逻辑五、Python代码实操对于核心部分逾期天数和金额计算的Python代码展示如下。############################逾期标识##########################################
3月15日 下午 6:42
其他

CART决策树暴力生成风控规则

上一篇我们介绍了决策树节点信息更新的方法风控规则的决策树可视化(升级版),以辅助我们制定风控规则,可视化的方法比较直观,适合做报告展示,但分析的时候效果没那么高。一、树结构信息本篇我们介绍一种通过决策树自动挖掘规则的方法。通过Sklearn中的tree_可以获取树结构的所有信息,进而将所有决策路径挖掘出来,也就是全自动化地的生成规则。总体想法就是先暴力挖掘规则,然后再从规则池中按照评估指标进行筛选。以下是官网链接。https://scikit-learn.org/stable/auto_examples/tree/plot_unveil_tree_structure.html#sphx-glr-auto-examples-tree-plot-unveil-tree-structure-py二、代码实操首先,也需要使用DecisionTreeClassifier或者DecisionTreeRegressor构建一个决策树模型对象。X
3月13日 下午 11:15
其他

风控规则的决策树可视化(升级版)

上一篇我们介绍了如何通过交叉表来生成规则:基于交叉表制定风控规则全流程(Python),本篇我们来介绍一种可以生成多规则的方法,决策树。除了做模型以外,也可以用来挖掘规则,原理是一样的。下面通过sklearn的决策树方法来实现风控规则的发现,同时分享一种可以更新决策树节点信息的方法,以辅助制定风控规则。sklearn决策树Sklearn中有两个决策树API方法,分别是:tree.DecisionTreeClassifier:CART分类树tree.DecisionTreeRegressor:CART回归树要注意的是,Sklearn没有对ID3和C4.5算法的实现,就只有CART算法,并且是调优过的。下面是官方文档的说明。X
3月10日 下午 2:20
其他

基于交叉表制定风控规则全流程(Python)

规则是风控策略中最常用的工具之一,生成、筛选、监控、调优,几乎每天都在打交道,本篇来介绍如何基于交叉表来生成风控规则,并且如何基于评估指标进行筛选。一、交叉表介绍1.1.
3月7日 下午 8:15
其他

大更新,pandas终于有case_when方法了!

when语句非常好用,尤其在加工变量的时候,可以按照指定的条件的进行赋值,并且结合其他嵌套用法还可以实现非常强大的功能。同样作为数据分析常用工具之一,pandas中却没有像case
1月29日 下午 3:44
其他

pandas 时序统计的高级用法!

label='right')['C_0'].sum().to_frame(name='right_bnd').head(5)4)聚合统计类似于groupby和窗口的聚合方法,
1月5日 下午 11:34
其他

终于搞定了pandas数据分析

推荐一个原创的pandas数据分析图文,由东哥亲自打造,包涵入门、进阶、实战、刷题四个核心部分,以及一些数分的辅助部分。从图文启动开始一直保持着很高的更新频率,最新的更新版本如下。01如何使用?《pandas快速入门》适合初学者入门,花最短的时间了解pandas,建立初步的认识和感觉。如果已经有了一定基础,可以选择忽略。《pandas进阶宝典》适合初学者进阶,10万字+300章节+80%图解的图文,分为基础篇、进阶篇、实战篇。超详细的分类介绍和高级玩法,多个行业的实战项目(以下是其中两个)pandas实战:出租车GPS数据分析pandas实战:电商平台用户分析pandas实战:用户消费行为画像数据分析实战:二手房价分析和预测当然,作为工作中的查询手册也是不要太爽,我自己一直在用,效率非常高。以下是部分内容展示(左右滑动查看更多)>《pandas进阶题库》适合进阶后巩固,掌握各种场景下的技巧和方法。大部分问题由pandas交流群成员提出的,均是真实需求,在实际需求中解决问题,从而快速熟练掌pandas和数据分析思维。以下是部分内容展示。练习题库持续更新中。《Numpy速查手册》统计计算有时使用基于数组的Numpy更方便,并且在pandas效率较低时,可以通过Numpy矢量化进行速度的提升优化。该图文对常用的Numpy函数进行了分类和用法整理,方便随时查看。pandas
1月3日 下午 11:59
其他

pandas实战:用户消费行为画像

《再见pandas》系列图文继续更新,新增第5个实战项目。以下是系列图文中两个公开分享的历史文章。pandas实战:出租车GPS数据分析pandas实战:电商平台用户行为分析该项目主要对某平台用户消费行为进行画像分析,通过pandas的灵活使用,对月销量、客户复购率、回购率、客户分层、高质量客户、留存率、消费间隔等进行多维度分析。以下为部分节选内容,完整数据和代码可在文末扫码了解👇首先,加载用户的消费数据。columns=["user_id","order_dt","order_product","order_amount"]df
2023年12月26日
其他

风控实战:用Python实现vintage报表

大家好,我是东哥。本篇继续分享风控的内容,关于如何用python实现vintage报表及可视化图的实战。历史实战文章如下:数据挖掘实战:聚类分群实现精准营销数据挖掘实战:个人信贷违约预测账龄分析(vintage)是风控中非常重要的报表之一,通过它可以将不同月份的资产数据拉齐对比贷后表现,也可以用于指导制定风控模型Y标签的成熟表现期。那么账龄分析是如何做的呢?vintage报表,一般需要客户的还款计划表数据,即客户历史的还款记录,包括放款金额、每期到期日期、每期还款日期、每期应该金额、每期实还金额、期数等等。vintage加工计算逻辑会在理论篇单独讲解,本篇主要介绍python代码实战。Python代码实现首先导入数据,每家机构的数据字段可能不尽相同,但核心逻辑都是一样的,可以基于已有的数据进行加工出我们想要的样子,比如下面这个比较原始的表结构,没有非常完善的字段。以下是核心字段的加工逻辑。我们以每月月底为观测点对各个账龄进行DPD30+金额口径逾期率的计算。#
2023年12月20日
其他

机器学习模型可解释性的综述

导读:模型可解释性方面的研究,在近两年的科研会议上成为关注热点,因为大家不仅仅满足于模型的效果,更对模型效果的原因产生更多的思考,这样的思考有助于模型和特征的优化,更能够帮助更好的理解模型本身和提升模型服务质量。本文对机器学习模型可解释性相关资料汇总
2023年12月16日
其他

pandas数据分析学习路线

大家好,我是东哥。《再见pandas》系列已有300多位朋友加入学习了,这段时间亲眼见证了很多朋友的飞跃进步,从无到有,从一个问问题的小白到开始慢慢回答别人的问题,在讨论和练习中不断成长。虽说pandas已经很普及了,但普及内容的深度却远远不够。下面这套原创图文是东哥亲自打造,包涵入门、进阶、实战、刷题四个核心部分,以及一些数分的辅助部分。从图文启动开始一直保持着很高的更新频率,最新的更新版本如下。01如何使用?《pandas快速入门》适合初学者入门,花最短的时间了解pandas,建立初步的认识和感觉。如果已经有了一定基础,可以选择忽略。《pandas进阶宝典》适合初学者进阶,10万字+300章节+80%图解的图文,分为基础篇、进阶篇、实战篇。超详细的分类介绍和高级玩法,多个行业的实战项目(以下是其中两个)pandas实战:出租车GPS数据分析pandas实战:电商平台用户分析当然,作为工作中的查询手册也是不要太爽,我自己一直在用,效率非常高。以下是部分内容展示。>《pandas进阶题库》适合进阶后巩固,掌握各种场景下的技巧和方法。大部分问题由pandas交流群成员提出的,均是真实需求,在实际需求中解决问题,从而快速熟练掌pandas和数据分析思维。以下是部分内容展示。练习题库持续更新中。《Numpy速查手册》统计计算有时使用基于数组的Numpy更方便,并且在pandas效率较低时,可以通过Numpy矢量化进行速度的提升优化。该图文对常用的Numpy函数进行了分类和用法整理,方便随时查看。pandas
2023年12月15日
其他

数据挖掘实战:聚类分群实现精准营销

本次分享一个通过聚类实现精准营销的实战项目。风控中分群介绍本实战案例介绍如何通过无监督的聚类算法对银行客户进行分群。所谓物以类聚,人以群分,有相似属性、行为特征等的客户就可以聚合为一类人群。在信贷风控中,聚类分群多应用于没有Y标签的场景,如反欺诈、客户画像等。以反欺诈为例,现在我们想抓出黑产,但有没有Y标签无法使用监督学习训练模型,这时就可以先找出有可能识别出黑产的一些特征数据,比如设备信息、行为操作信息、地址信息等,通过聚类算法就可以将操作频率高、地址切换频率高这种异常行为的人群归为一类,从而打出黑产的标签。当然,此时的标签还有待考证,但至少是一种维度的参考,可以参与到策略的使用中,比如我们可以将黑产标签设计成一个弱规则,与其他规则组合使用来判断客户风险。通过上线的监测观察来检验标签的识别效果。再比如,我们现在有客户的基础属性、业务等画像数据,想对客户的价值高低进行识别,从而能够有针对性的进行产品营销。此时同样可以通过聚类划分出对业务影响不同程度的客群,然后再以此设计策略。数据&需求以下数据为银行客户的信息和业务画像数据,营销策略部的业务需求是拟通过聚类对客户价值进行分层,以此设计营销白名单。df
2023年12月12日
其他

来了!pandas的终极学习秘籍

大家好,我是东哥。《再见pandas》系列已有300多位朋友加入学习了,这段时间亲眼见证了很多朋友的飞跃进步,从无到有,从一个问问题的小白到开始慢慢回答别人的问题,在讨论和练习中不断成长。虽说pandas已经很普及了,但普及内容的深度却远远不够。下面这套原创图文是东哥亲自打造,包涵入门、进阶、实战、刷题四个核心部分,以及一些数分的辅助部分。从图文启动开始一直保持着很高的更新频率,最新的更新版本如下。01如何使用?《pandas快速入门》适合初学者入门,花最短的时间了解pandas,建立初步的认识和感觉。如果已经有了一定基础,可以选择忽略。《pandas进阶宝典》适合初学者进阶,10万字+300章节+80%图解的图文,分为基础篇、进阶篇、实战篇。超详细的分类介绍和高级玩法,多个行业的实战项目(以下是其中两个)pandas实战:出租车GPS数据分析pandas实战:电商平台用户分析当然,作为工作中的查询手册也是不要太爽,我自己一直在用,效率非常高。以下是部分内容展示。>《pandas进阶题库》适合进阶后巩固,掌握各种场景下的技巧和方法。大部分问题由pandas交流群成员提出的,均是真实需求,在实际需求中解决问题,从而快速熟练掌pandas和数据分析思维。以下是部分内容展示。练习题库持续更新中。《Numpy速查手册》统计计算有时使用基于数组的Numpy更方便,并且在pandas效率较低时,可以通过Numpy矢量化进行速度的提升优化。该图文对常用的Numpy函数进行了分类和用法整理,方便随时查看。pandas
2023年12月9日
其他

数据挖掘实战:个人信贷违约预测

本次分享风控圈子的一个练手实战项目:个人信贷违约预测,此项目对于想要学习信贷风控模型的同学非常有帮助。完整数据和代码见文末。项目背景当今社会,个人信贷业务发展迅速,但同时也会暴露较高的信用风险。信息不对称在金融贷款领域突出,表现在过去时期借款一方对自身的财务状况、还款能力及还款意愿有着较为全面的掌握,而金融机构不能全面获知借款方的风险水平,或在相关信息的掌握上具有明显的滞后性。这种信息劣势,使得金融机构在贷款过程中可能由于风险评估与实际情况的偏离,产生资金损失,直接影响金融机构的利润水平。而现今时间金融机构可以结合多方数据,提前对客户风险水平进行评估,并做出授信决策。解决方法运用分类算法预测违约模型选择单模型:
2023年11月30日
其他

pandas 图形可视化大全

pandas的可视化方法,分为图形可视化和表格可视化。本次介绍完整的图形可视化使用方法,包括基础和高级两部分。以下是内容展示,完整数据、和代码可戳👉《再见!pandas》了解。基础可视化一种是针对series和dataframe的绘制方法,可以一行代码快速绘图。dataframe.plot.func()series.plot.func()func()主要是日常比较基础的图形,如下:折现图(line)条形图(bar)直方图(hist)箱箱型(box)面积图(area)散点图(scatter)饼图(pie)六边形箱型图(hexbin)核密度图(kde)子图import
2023年11月24日
其他

pandas实战:出租车GPS数据分析

大家好,我是东哥。本次分享一个交通行业实战项目,这个项目是对出租车GPS数据进行分析,具体内容包括了数据理解、业务场景、数据处理、可视化等。完整数据、和代码可长按扫码了解pandas进阶宝典👇一、数据背景数据表的变量含义如下。id:车辆编号,唯一标识time:GPS采集时间long:GPS经度lati:GPS纬度status:载客状态,1为载客,0为空客speed:采集的GPS车速首先读取数据,由于原数据没有header,直接就是数据,因此需设置为None,然后手动添加列索引名称。#
2023年11月23日
其他

学习 pandas 的正确打开方式

大家好,我是东哥。《再见pandas》系列已有300多位朋友加入学习了,这段时间亲眼见证了很多朋友的飞跃进步,从无到有,从一个问问题的小白到开始慢慢回答别人的问题,在讨论和练习中不断成长。虽说pandas已经很普及了,但普及内容的深度却远远不够。下面这套原创图文是东哥亲自打造,包涵入门、进阶、实战、刷题四个核心部分,以及一些数分的辅助部分。从图文启动开始一直保持着很高的更新频率,最新的更新版本如下。01如何使用?《pandas快速入门》适合初学者入门,花最短的时间了解pandas,建立初步的认识和感觉。如果已经有了一定基础,可以选择忽略。《pandas进阶宝典》适合初学者进阶,10万字+300章节+80%图解的图文,分为基础篇、进阶篇、实战篇。超详细的分类介绍和高级玩法,多个行业的实战项目(以下是其中两个)pandas实战:出租车GPS数据分析pandas实战:电商平台用户分析当然,作为工作中的查询手册也是不要太爽,我自己一直在用,效率非常高。以下是部分内容展示。>《pandas进阶题库》适合进阶后巩固,掌握各种场景下的技巧和方法。大部分问题由pandas交流群成员提出的,均是真实需求,在实际需求中解决问题,从而快速熟练掌pandas和数据分析思维。以下是部分内容展示。练习题库持续更新中。《Numpy速查手册》统计计算有时使用基于数组的Numpy更方便,并且在pandas效率较低时,可以通过Numpy矢量化进行速度的提升优化。该图文对常用的Numpy函数进行了分类和用法整理,方便随时查看。pandas
2023年11月20日
其他

再见,pandas!

大家好,我是东哥。《再见pandas》系列已有300多位朋友加入学习了,这段时间亲眼见证了很多朋友的飞跃进步,从无到有,从一个问问题的小白到开始慢慢回答别人的问题,在讨论和练习中不断成长。虽说pandas已经很普及了,但普及内容的深度却远远不够。下面这套原创图文是东哥亲自打造,包涵入门、进阶、实战、刷题四个核心部分,以及一些数分的辅助部分。从图文启动开始一直保持着很高的更新频率,最新的更新版本如下。01如何使用?《pandas快速入门》适合初学者入门,花最短的时间了解pandas,建立初步的认识和感觉。如果已经有了一定基础,可以选择忽略。《pandas进阶宝典》适合初学者进阶,10万字+300章节+80%图解的图文,分为基础篇、进阶篇、实战篇。超详细的分类介绍和高级玩法,多个行业的实战项目(以下是其中两个)pandas实战:出租车GPS数据分析pandas实战:电商平台用户分析当然,作为工作中的查询手册也是不要太爽,我自己一直在用,效率非常高。以下是部分内容展示。>《pandas进阶题库》适合进阶后巩固,掌握各种场景下的技巧和方法。大部分问题由pandas交流群成员提出的,均是真实需求,在实际需求中解决问题,从而快速熟练掌pandas和数据分析思维。以下是部分内容展示。练习题库持续更新中。《Numpy速查手册》统计计算有时使用基于数组的Numpy更方便,并且在pandas效率较低时,可以通过Numpy矢量化进行速度的提升优化。该图文对常用的Numpy函数进行了分类和用法整理,方便随时查看。pandas
2023年11月18日