当前位置: 编码机 >> 编码机优势 >> 基于Python的自动特征工程教你如
作者
WilliamKoehrsen
编辑
Jane
本文经授权转载自AI科技大本营(ID:rgznai)
如今机器学习,正在从人工设计模型,更多地转移到自动优化工作流中,如H20、TPOT和auto-sklearn等工具已被广泛使用。
这些库以及随机搜索等方法,都致力于寻找最适合数据集的模型,以此简化模型筛选与调优过程,而不需要任何人工干预。
然而,特征工程作为机器学习过程中,最有价值的一个环节,却几乎一直由人工来完成。
在本文中,我们通过引用一个数据集作为例子,来给大家介绍基础知识,并给大家介绍一个基于FeaturetoolsPython库,来实现特征工程自动化的实例。
前言
特征工程也可以称作特征构造,是基于现有数据构造新特征,来训练机器学习模型的过程。可以说这个环节,比我们具体使用什么模型更重要,因为机器学习算法,只会基于我们提供给它的数据进行学习,所以构造与目标任务相关的特征是极其重要的(详见论文「AFewUsefulThingstoKnowaboutMachineLearning」)。
论文链接:
转载请注明:http://www.aideyishus.com/lkgx/2254.html