习题9-1 - Githubissues

nndl / solutions

《神经网络与深度学习》课后习题答案-分享讨论

697 stars 79 forks source link

习题9-1 #63

Open simo-an opened 2 years ago

simo-an commented 2 years ago

习题9-1 分析主成分分析为什么具有数据降噪能力？

解答

什么是主成分分析？

主成分分析（ PCA）是一种最常用的数据降维方法，使得在转换后的空间中数据的方差最大。如图9.1所示的两维数据，如果将这些数据投影到一维空间中，选择数据方差最大的方向进行投影，才能最大化数据的差异性，保留更多的原始数据信息。（根据信息论，数据方差越大，包含的信息越大，方差为0，则不包含任何信息）

主成分分析为什么具有数据降噪能力？

主成分分析有两个步骤：

线性投影：将高维数据映射到底维度（保证最大投影方差）
重构：将底维数据重构回原始维度（保证最小重构误差）

在上面的两个过程中，重构回的数据会丢失一部分信息，这部分信息可能就是噪声，所以具有数据降噪能力。一下举一个例子：

如上面的二维数据可能是某一线性函数f(x) = ax + b在引入噪声后的分布情况，现将其线性映射到一维空间上（如x轴上），再重构回二维空间，数据就会服从在某一函数g(x) = ax + b上（成了一条直线），相当于去掉了噪声。

simo-an commented 2 years ago

参考：https://www.cxymm.net/article/m0_38056893/103188612