主成分分析
组件介绍
**“主成分分析”(PCA)**控件将主成分分析方法应用于输入数据。
**“主成分分析”(PCA)**控件对输入数据计算其 PCA 线性转换,输出经过转换的带权重的数据或特征向量。
PCA是一种统计分析、简化数据集的方法。它利用正交 变换来对一系列可能相关的变量的观测值进行线性变换,从而投影为一系列线性不相关变量的值,这些不相关变量称为主成分(Principal Components)。具体地,主成分可以看做一个线性方程,其包含一系列线性系数来指示投影方向。PCA对原始数据的正则化或预处理敏感(相对缩放)。
- 输入:
- data:数据集
- 输出:
- data:经过PCA变换后的数据
- cmp:特征向量
页面介绍
点击**“主成分分析”(PCA)**控件查看参数配置页面,如下图所示:
参数选项
选项 | 说明 | 取值范围 | 样例值 |
---|---|---|---|
主成分占比 | 主成分覆盖的方差范围 | 0.1~1 | 0.9 |
奇异值分解方法 | 奇异值分解方法选择 | auto | |
数据标准化 | 是否对数据进行标准化操作 | 勾选/不勾选 | 不勾选 |
使用案例
在下图所示的案例中,使用**“加载文件”(File)控件加载数据,通过“查看数据”(Data Table)控件查看加载数据的信息,同时使用“主成分分析”(PCA)控件对数据集进行主成分分析,之后通过“查看数据”(Data Table)**控件查看处理后的数据集。
案例中加载 iris 数据集,案例中控件的配置以及执行结果如下图所示。