主成分分析とクラスタ分析の違いについて
ざっくりとした違いは
主成分分析:変数を統合した新たな変数を使用して,データがもつ変数の数を減らす方法
クラスタ分析:変数の値が互いに類似するものを集めることによって,データを分類する方法
いずれにしても「データを「要約」」するのが共通してます。
要約する分析手法ですが、要約する目的が異なります。
主成分分析とは
主成分分析とは、多くの変数を持つデータを集約して主成分を作成する統計的分析手法です。
例としては次のようになります。
- 国数理社英の5教科の得点から総合評価点を求める
国語(変数)・数学(変数)・理科(変数)・社会(変数)・英語(変数)⇒総合評価点(変数)といった形で5つの変数を1つの変数とするイメージです。
また、身長と体重をBMIという1つの指標にするというのも同じように2つの変数を1つとしています。
クラスタ分析とは
クラスター分析とは、個々のデータから似ているデータ同士をグルーピングする分析手法です。
例としては次のようになります。
- 国語の点数が高いグループや、低いグループ等に分ける
クラスター(集団)の言葉どおり、似ているデータ通しを集める形となります。
コメントを残す