多项式展开
组件介绍
“多项式展开”(Polynomial Features) 控件将多项式展开方法应用于输入数据。
多项式展开一般用于创建原始特征的高阶项和交互项,以便在进行线性模型等机器学习任务时揭示更复杂的模式。例如,假设你有两个特征X1和X2,然后你决定使用一个二阶多项式扩展。这意味着你将创建所有可能的单一特征的平方(X1^2和X2^2)以及所有可能的特征对的乘积(X1X2)。 所以,对于二阶扩展,你的特征将是:[1, X1, X2, X1^2, X1X2, X2^2]。 请注意,通常也会包含常数项1。多项式特征扩展可以帮助模型找到特征 之间的复杂关系,但它也可能导致维度灾难——特征数量的急剧增加。因此,在使用时需要谨慎选择阶数和交叉项。
- 输入:
- data:数据集
- 输出:
- data:经过多项式展开后的数据
页面介绍
点击 “多项式展开”(Polynomial Features) 控件查看参数配置页面,如下图所示:
参数选项
选项 | 说明 | 取值范围 | 样例值 |
---|---|---|---|
多项式阶数 | 多项式展开式的最大阶数 | 1~1000 | 2 |
只进行交叉相乘 | 是否只进行交叉相乘,意味着不会出现单一特征的平方 | 勾选/不勾选 | 不勾选 |
是否包含零次方 | 是否包含特征的零次方,即1 | 勾选/不勾选 | 勾选 |
使用案例
在下图所示的案例中,使用 “加载文件”(File) 控件加载数据,使用 “多 项式展开”(Polynomial Features) 控件对数据集进行多项式展开,之后通过 “查看数据”(Data Table) 控件查看处理后的数据集。
案例中加载 iris 数据集,案例中控件的配置以及执行结果如下图所示。