其他
一图让你了解特征工程的所有套路
本文授权转载自金融科技应用学苑
公众号ID:Liang_fintech
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。
下图便是进行特征工程的所有顺序和步骤,及采用什么方法来完成每一步的操作。
通过以上步骤对数据的预处理,就可以将其作为最终的特征样本数据,通过不同的模型去更方便的探索数据中所包含的规律。
更多精彩,戳这里: