本サイトはプロモーション(広告)が含まれています。

主成分分析とクラスタ分析の違いについて

主成分分析とクラスタ分析の違いについて

ざっくりとした違いは

主成分分析:変数を統合した新たな変数を使用して,データがもつ変数の数を減らす方法
クラスタ分析:変数の値が互いに類似するものを集めることによって,データを分類する方法
 
いずれにしても「データを「要約」」するのが共通してます。
 
要約する分析手法ですが、要約する目的が異なります。

主成分分析とは

主成分分析とは、多くの変数を持つデータを集約して主成分を作成する統計的分析手法です。

例としては次のようになります。

  • 国数理社英の5教科の得点から総合評価点を求める

国語(変数)・数学(変数)・理科(変数)・社会(変数)・英語(変数)⇒総合評価点(変数)といった形で5つの変数を1つの変数とするイメージです。

また、身長と体重をBMIという1つの指標にするというのも同じように2つの変数を1つとしています。

クラスタ分析とは

クラスター分析とは、個々のデータから似ているデータ同士をグルーピングする分析手法です。

例としては次のようになります。

  • 国語の点数が高いグループや、低いグループ等に分ける

クラスター(集団)の言葉どおり、似ているデータ通しを集める形となります。

情報処理 の記事一覧

PAGE TOP