当前位置: 编码机 >> 编码机介绍 >> 应用基于自动编码器的异常检测技术进行欺诈
信用卡欺诈可以被归类为一种异常,使用Keras中实现的自动编码器可以检测欺诈
我最近阅读了一篇名为《使用自动编码器进行异常检测》的文章,在该文中对所生成的数据进行了实验,并且我认为将使用自动编码器进行异常检测这一想法应用于真实世界当中的欺诈检测中,似乎是一个不错的主意。
我决定从Kaggle中使用信用卡欺诈数据:该数据集包含有在年9月欧洲持卡人的信用卡交易信息。
这个数据集显示了两天内发生的交易,其中在,次交易中有次为欺诈数据。这样的数据集是相当不平衡的,其中正类(欺诈)数据占所有交易数据的0.%。
数据挖掘
这虽然是一个非常不平衡的数据集,但是它也是一个很好的例子:对异常或欺诈进行识别验证。
首先,我们需要通过主成分分析法将数据集维度由30维下降到3维,并画出其对应的点状图。其中,该数据集共有32列,第一列为时间,29列为未知的数据,1列为交易金额和剩下1列为类别。需要说明的是,我们将忽略时间这一指标,因为它不是一个较为固定的指标。
defshow_pca_df(df):x=df[df.columns[1:30]].to_numpy() y=df[df.columns[30]].to_numpy() x=preprocessing.MinMaxScaler().fit_transform(x) pca=de
转载请注明:http://www.aideyishus.com/lkyy/1708.html