3 多変量の分析
多変量を解析するには、クラスタと主成分が有効な分析になる。これらの分析がデータベースの統計処理に繋がるからである。
多変数のデータでも、最初は1変数ごとの観察から始まる。また、クラスタ分析は、多変数のデータを丸ごと扱う最初の作業ともいえる。似た者同士を集めたクラスタを樹形図からイメージする。それぞれのクラスタの特徴を掴み、それを手掛かりに多変量データの全体像を考えていく。樹形図については、単純な二個二個のクラスタリングの方法を想定し、変数の数や組み合わせを考える。
作成したデータベースから特性が2つあるカラムを抽出し、グループ分けをする。例えば、A:五感(1視覚と2それ以外)、B:ジェスチャー(1直示と2比喩)、C:情報の認知プロセス(1旧情報と2新情報)、D:情報の認知プロセス(1問題解決と2未解決)というように文系と理系のカラムをそれぞれ2つずつ抽出する。
まず、ABCDそれぞれの変数の特徴について考える。次に、似た者同士のデータをひとかたまりにし、ここでは言語の認知ABと情報の認知CDにグループ分けをする。得られた変数の特徴からグループそれぞれの特徴を見つける。
最後に、各場面のラインの合計を考える。それぞれの要素からどのようなことがいえるのか考える。「魔の山」のバラツキが縦のカラムの特徴を表しているのに対し、ここでのクラスタは、一場面のカラムとラインの特徴を表している。
なお、外界情報の獲得に関する五感の割合は、視覚82%、聴覚11%、嗅覚4%、触覚2%、味覚1%とする。(片野2018)
花村嘉英(2019)「トーマス・マンの「魔の山」の多変量解析-クラスタ分析と主成分」より