2要因の分散分析

  分散分析は、実験計画法にもとづいて収集したデータを分析の対象とする統計的手法である。実験では、要因計画を立て、この要因の各水準に、等しい数の被験者を割り当てたデータ収集をおこなうことが可能である。いわゆる「jが等しい場合」の分散分析を、このような被験者の割り当てが適切におこなわれるならば、分析において使用することができる。これに対して、調査法で収集したデータでは、一般的に「jが等しくない場合」となることが多い。

  分散分析(ANOVA)の計算方法は、古典的な計算方法から、後者のようなデータの解析や多変数の分散分析(MANOVA)をも包含する一般線形モデル(以下GLMと略す。)へと拡張されてきた。ここでは、このGLMによる分散分析について解説する。

 

  問題:因子分析の結果から構成した尺度の得点について、性と学年とを2つの要因と

     として、2要因の分散分析をおこなう。

  

  前処理:分析に入る前に、基本的な統計量の確認が必要である。

      このデータについて、性別(gender)と学年(grade)のクロス表を計算し

      てみる。


 


 この表は、SPSSで計算し、出力ナビゲータの内容をExcelへコピーし、整理したものである。各セルの上の段が度数、下の段が横%である。


 


図1 尺度得点の計算(項目得点・合計得点(変数の操作)参照)

 

 各セルの被験者数は、それぞれn11 = 58n12 = 26n21 = 119n22 = 38であり、1年生の数が多い。このデータを2要因の「jが等しくない場合」として、分散分析をおこなってみることにする。 分散分析の前に、尺度得点の採点がおこなう。この尺度の変数名をvf1として、「変換(T)」の「計算(C)」において、図1のように、この変数を生成させる。

 

 

GLMによる分散分析

 この分散分析は、「分析(A)」の「一般線型モデル(G)」の「一変量()」でおこなうことができる。

 


図2 GLMによる2要因の分散分析

 


この「一変量()」を選ぶと次のような画面となる。 ここでは、分析対象の変数(fv1)を「従属変数(D)」に入れる。2つの要因については、「固定因子(F)」に順次入れる。

 この分散分析では、モデルの指定はおこなわず、デフォルトの「タイプV」を使用する。このタイプは表1のようなアンバランスな場合に有効な計算方法である。


 


図3 GLMでの分析変数の指定画面

 

 このままOKを押しても、分散分析は実行してくれるが、平均値の出力やグラフの作成を試みてみることにする。このGLMは、複雑な計算が可能であるために、数多くのオプションが準備されているが、ここでは、最も単純な分散分析の実行に制限して説明する。

まず、平均の出力は、「オプション(C)」の「記述統計量(S)」のチェックを確認すること

 この図は、まず、左の「因子と交互作用(F)」で表示される(全体, gender, grade, gender*grade を右側の「平均値の表示(M)」へ選択して表示させ、次に「記述統計量(S)」を選択したものである。この指定は、周辺の各種の平均値を計算・出力させるためのものである。

 


図4 GLMの「オプション(C)」の画面

次に「作図(T)」では、次のような手順で指定をおこなう。


 


図5-a 作図の指示(横軸と線)         

 


 図5-b 作図に「追加」後

横軸に置く変数と線として表す変数とをまず指定する。ここでは、学年(grade)を横軸においている。そして、性(gender)ごとの線を表示させることにしている。さらに、この指定後、右の図のように、「追加」ボタンをクリックする。「続行」を押して、図3へ戻り、「OK」で、この分析を実行させる。

 以下では、この計算結果を示す。

 

この表では、GENDERGRADEGENDER*GRADEそして誤差について、平均平方、F値、有意水準の欄に、分散分析結果が表示されている。今回のデータでは、性別と学年ともに5%水準で有意であるといえる。

 

 周辺平均値の出力は次のとおりである。

 

 この図は、上が女子の平均であり、下が男子である。検定結果と整合する図となっている。(周辺平均のgender:gradeを参照。)

 


 

 


このようなアンバランス(njjの異なる)なGLMによる分散分析では、タイプIIIで計算する必要がある。先にも記したように、図32にある「モデル(M)」に入ると、デフォルトで、このタイプIIIとなっている。これを変更してはいけない。

このデータ例では、要因の水準の数が2であったので、「その後の検定(H)」はおこなえない。水準の数が3つ以上の場合には、どの水準間に有意な差があるかを検定することができる。最後にその指定方法を示しておく。


 


図6 多重比較の指定

 多重比較に関しては、数多くの計算方法が提案されている。一般的に使用される方法は、「Tukey(T)」である。上の図は、このデータに1年と3年以外の学年のデータがある場合を想定したものであって、今回のデータでは、この指定は、機能しない。水準が2つしかないからである。(今回のデータで、この指定をすると、出力の最初に「グループが3つ未満しかない」との警告がでる。)