其他
lazypredict,一个超强的 python 库
大家好,我是小寒。
今天给大家分享一个超强的 python 库,lazypredict。
https://github.com/shankarpandala/lazypredict
简介
初体验
安装库
pip install lazypredict
数据集
# import all required libraries
import pandas as pd
import lazypredict
# For regression problems
from lazypredict.Supervised import LazyRegressor
# For classification problems
from lazypredict.Supervised import LazyClassifier
import pandas as pd
df_train = pd.read_csv('california_housing_train.csv')
df_test = pd.read_csv('california_housing_test.csv')
df_train.info()
X_train = df_train.drop(columns = 'median_house_value' )
X_test = df_test.drop(columns = 'median_house_value' )
y_train = df_train[ 'median_house_value' ]
y_test = df_test[ 'median_house_value' ]
训练和拟合模型
# For regression tasks
reg = LazyRegressor(verbose=0, ignore_warnings=True, predictions=True)
models, predictions = reg.fit(X_train, X_test, y_train, y_test)
与 lazypredict 模型一起使用的其他参数有。
custom_metric
:你可以指定 Lazypredict 将用于模型评估的自定义指标函数,而不是默认指标。random_state
:你可以设置随机种子以实现再现性。exclude
:你可以提供模型名称列表,以从评估中排除特定模型。例如,如果你不想评估特定模型,则可以将其排除。
显示模型性能
通过此排名,你可以一目了然地识别出表现最好的模型。
选择最佳模型
那么如何确定哪种模型最适合你的特定问题呢?
确定你的优先指标:首先,确定你的问题最关键的指标。对于此任务,我们将主要考虑 RMSE(较低的 RMSE 表示更好的性能)。
查看模型排名: Lazypredict 已经对模型进行了排名。首先根据你的优先级指标查看表现最好的模型。
因此,我们将把选择范围缩小到:
HistGradientBoostingRegressor LGBMRegressor XGBRegressor RandomForestRegressor
但另一个人可能会选择 “LGBMRegressor”,因为它的训练时间较短。
最后
—
「进群方式:加我微信,备注 “python”」
往期回顾
Fashion-MNIST 服装图片分类-Pytorch实现
如果对本文有疑问可以加作者微信直接交流。进技术交流群的可以加微信拉你进群。