janjunjon / master-core

0 stars 0 forks source link

Difference between PCA and FA #96

Closed janjunjon closed 1 year ago

janjunjon commented 2 years ago

summary

主成分分析は因子分析と非常によく似ている分析ですが、考え方が異なります。

因子分析はデータに影響を与えている要因の共通因子を抽出する方法であり、因子(原因)がデータ(結果)に影響を与えていると考えます。 一方、主成分分析では多数のデータから少数の主成分として表す方法であり、データ(原因)から主成分(結果)が作られます。

このような性質を持つため、同じデータで因子分析と主成分分析を行うと主成分と共通因子の値は非常に似た値を持つことになります。

diff_pca

繰り返しになりますが、主成分分析はデータの情報量を削減してデータの特徴を可視化したり要約したりするのに使われます。対して因子分析では複数のデータからその背後にある潜在的要素を発見するのに使われます(例えば国語と英語のテストの点数に対して因子分析を行うことで、二つのテストの点数に影響を与える潜在的要素である言語能力を発見することができます)。因子分析に関して、詳しく知りたいは、次の記事「因子分析とは?」をご覧ください。

ref

janjunjon commented 1 year ago

主成分負荷量 (principal component loading)

主成分得点と観測変数との相関係数のこと。主成分負荷量が大きいほど、その主成分は変数と強く相関しているということを表し、主成分をよく説明する変数であるといえる。主成分負荷量はからまでの値をとる。

第主成分の主成分負荷量は、固有ベクトルにの分散(固有値)の正の平方根をかけることで求めることができる。

主成分得点 (principal component score)

主成分分析で得られた主成分に各個体の実際のデータを代入して求めた第主成分の数値のことを第主成分得点(主成分スコア)と言う。データが各主成分の軸上でとる値のこと。

複数の変数を合成した値であり、この値の大小から各個体の第主成分における傾向や関係を把握することができる。

janjunjon commented 1 year ago

image