クロス表の計算

 2つ以上の名義尺度水準の変数間での度数を集計したものをクロス表という。度数からカイ2乗として検定統計量を計算することもできる。ここでは、対象とするデータを、rosen96.savとして、分析メニューの「記述統計(E)」の中の「クロス集計表(C)」を選ぶ。

 


図1 クロス集計表の選択画面

 


 ここでは、性別(1:男子・2:女子)と居住形態(1:自宅・2:下宿)についてのクロス表を計算してみることにする。


2 「クロス集計表(c)」での分析変数の指定

左の変数欄から、行の変数として性別(SEX)を、列の変数として居住形態(HOME)を指定している。単純な集計表は、この指定でおこなうことができる。度数とは要するに該当する人数のことである。この割合を変数ごとに計算するには、「セル(E)」での指定が必要である。次の図が、行(この例ではsex(性別)が該当)のパーセンテージを計算することを指定したものである。


3 セル表示の指定


図4 出力ビューアより

ここでは、行だけをクリックして指定しているが、同時に列のパーセンテージも、全体のものも指定することができる。

 

 

カイ2乗検定

次に最もクロス表の検定統計量は、図2の「統計(S)」で選択することができる。この統計には、たくさんの統計量の計算が準備されている。一般的に独立性に関するカイ2乗を出力するには、次の選択をおこなえばよい。


図5 カイ2乗の計算を指定した画面

出力ビューアには、図4のクロス表の次に、下の図5が表示される。

 


6 出力ビューアの1部より

 


 一般的なカイ2乗の統計量は、Pearsonのカイ2乗欄に表示されている。今回の性別と居住形態とでは、χ2(1)=1.946n.s.)、<自由度1で、10%水準に満たない(P=.163)>では、有意とはいえなかった。すなわち、性別と居住形態という2つの変数の間には、関連性がなく、独立であるといえる。逆に、もし有意であれば、2つの変数間に関連性があり、独立ではないということになる。

 なお、クロス表(2×2)のセルの期待度数が 5 以下のときには、Yates の修正カイ 2 乗が出力されます(図6の注a参照)。2×2より大きなクロス表の場合には、Fisher の直接法によって、少ない度数からの統計量なお算出の修正計算がおこなわれます。

 

カイ2乗検定では、各セルを対象に残差分析をおこなうこともある。田中(1996)が、残差分析については詳しく書いている。

 

田中 敏 1996 実践心理データ解析−問題の発想・データ処理・論文の作成 新曜社