其他
风控规则的决策树可视化(升级版)
sklearn
的决策树方法来实现风控规则的发现,同时分享一种可以更新决策树节点信息的方法,以辅助制定风控规则。sklearn决策树
tree.DecisionTreeClassifier:CART分类树 tree.DecisionTreeRegressor:CART回归树
Sklearn
没有对ID3和C4.5算法的实现,就只有CART算法,并且是调优过的。下面是官方文档的说明。y = df[yflag]
# 划分数据集
x_train,x_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=42)
# 按照最优的方式分裂
model=tree.DecisionTreeClassifier(criterion="gini",
splitter='best',
random_state=42,
max_depth=3,
min_samples_leaf=0.05,
min_samples_split=0.05)
model = model.fit(x_train,y_train)
dot_data=tree.export_graphviz(model,
feature_names=X.columns,
filled=True,
rounded=True,
out_file=None)
graph=graphviz.Source(dot_data)
graph
可视化更新
export_graphviz
可视化方法,但会在此基础上做一些内容的优化调整。item = re.sub(r'(?<=fillcolor=").*?(?=")', 'orange', item)
感兴趣的朋友可以向我咨询,同时也有免费的风控交流群,分享风控行业信息、讨论策略模型方法。