编码机

基于Python的自动特征工程教你如

发布时间:2022/11/11 20:13:30   

作者

WilliamKoehrsen

编辑

Jane

本文经授权转载自AI科技大本营(ID:rgznai)

如今机器学习,正在从人工设计模型,更多地转移到自动优化工作流中,如H20、TPOT和auto-sklearn等工具已被广泛使用。

这些库以及随机搜索等方法,都致力于寻找最适合数据集的模型,以此简化模型筛选与调优过程,而不需要任何人工干预。

然而,特征工程作为机器学习过程中,最有价值的一个环节,却几乎一直由人工来完成。

在本文中,我们通过引用一个数据集作为例子,来给大家介绍基础知识,并给大家介绍一个基于FeaturetoolsPython库,来实现特征工程自动化的实例。

前言

特征工程也可以称作特征构造,是基于现有数据构造新特征,来训练机器学习模型的过程。可以说这个环节,比我们具体使用什么模型更重要,因为机器学习算法,只会基于我们提供给它的数据进行学习,所以构造与目标任务相关的特征是极其重要的(详见论文「AFewUsefulThingstoKnowaboutMachineLearning」)。

论文链接:

转载请注明:http://www.aideyishus.com/lkgx/2254.html

------分隔线----------------------------