エクセルでアンケート分析をする

概要

  • 課題⑧ではエクセルを使ってアンケートの分析をします。以下を読みながらサンプル通りに入力して処理を確認しましょう。
  • まずは質問ごとに基本統計(平均や分散など)を求めます。そして、その数字をもとに「この集団にはどんな特徴があるか」を考えます。次に各質問の結びつきをみる相関係数を求め、「Aな人ほどBだ」「Aな人ほどBではない」といった法則を発見します。

データの確認

  • アンケートのデータファイルを開いて確認しましょう。
  • データは列ごとに質問、行ごとに1人分の回答が並んでいますが、回答の並び順はランダムです。

  • なお、ファイルを開いた際に下のようなメッセージが表示されたら「編集を有効にする」をクリックします。

基本統計でデータの特徴を確認する

  • アンケート分析では、まずは平均などの基本統計と呼ばれる数字を求め、全体の傾向を見てみます
  • まずは下図のように生データの下に基本統計の項目を用意しましょう。そして、各問ごとにこれらを関数で求めます。平均には「average」を、分散には「var.p」を、合計には「sum」を使います。合計は「Yes or No」の問26までだけ求めます。

  • 基本統計が計算されたら、以下の点に注意しながら、今回のアンケート結果にどんな特徴があるかを考えましょう。まわりの人たちとも話をして、発見を共有してください。
種類 意味・解釈
平均 「5点スケール」では中立的な「どちらでもない」が3なので、これを上回っていれば「このクラスでは肯定が強い(多い)」と解釈でき、下回っていれば「このクラスでは否定が強い(多い)」と解釈できます。「Yes on No」では真ん中が0.5なので、これを上回っているか下回っているかで、同様の解釈をします。
分散 相対的なバラツキの強さを表します。この数字が小さければ「回答は平均付近に集中している」ことになり、大きければ「回答は割れている」ことになります。
合計 「Yes or No」の問では「Yes」を「1」としているので、合計が「Yesの人数」を表します。5点スケールには使いません。

相関係数を使って、変数間の関係を考える

  • 次に変数間の結びつきを調べる相関分析をします。これは「Aな人ほどBだ」とか「Aな人ほどBでない」などを読み取るものです。
  • 手計算で相関係数を求めるのは大変な作業ですが、エクセルを使えば簡単に求めることができます。
  • 「データ」タブにある「データ分析」のアイコンをクリックします。下のような画面が表示されるので、「相関」を選び「OK」をクリックします。

  • すると下のような設定画面が出てきます。入力範囲では生データのセル範囲を指定します。
  • データがあるのは「B2からBD39」までですが、今回は表の先頭行を項目名(ラベル)として使うため、「B1からBD39」までを指定します。そして「先頭行をラベルとして使用」にチェックマークを付け、「OK」を押します。

  • すると、下のように全ての質問をペアにした相関係数表が出力されます。
  • 例えば「F7」セルを見ると、「0.45644」と表示されています。これは「Q5とQ6には正の相関があり、強さは0.46」ということです。
  • 同様に「B11」セルを見ると、「-0.3204」と表示されています。これは「Q1とQ10には負の相関があり、強さは0.32」ということです。
  • 相関係数は0から1の値を取り、「その絶対値が大きいほど、二つの相関関係は強い」と解釈されます。「相関係数がどれぐらいあれば関係が強いと言ってよいか」は分野によって異なります。理科の実験のように因果関係が明確な場合は0.8ぐらいがメド、人間の心理のように因果関係があいまいな場合は0.3ぐらいがメドになります。今回は相関係数の絶対値が0.3以上の場合に「関係が強い」と読み取ることにします

  • このままでは表を見にくいので、小数点以下の表示桁数を減らします。
  • まずは、相関係数が表示されている「B2からBD56」セルまでを範囲選択します。このような大きな表を範囲選択する際は、一番右下のセルから左上のセルへ範囲選択するのが簡単です。
  • そして、「ホーム」タブの「小数点以下の表示桁数を減らす」ボタンをクリックし、小数点以下2ケタまで表示されるようにします。

  • さらに、列の幅を調整するために、「A列からBD列」を選択します。そして、どこの列でもいいので、列の間にある仕切り線をマウスでダブルクリックして列の幅を調整します。

  • するとこのようになり、先ほどより見やすくなりました。

  • 相関表の見方は、この表の中から、数字の絶対値が大きいものを探します。絶対値が大きければ、それだけ相関が強いことを意味します。
  • 今回は、正の相関として「0.3以上」、負の相関として「-0.3以下」を探します。正の相関が強ければ「Aな人ほどBだ」と解釈し、負の相関が強ければ「Aな人ほどBでない」と読み取ります。

  • ただし、この膨大な表から目で探すのは大変なので、一定の数字に自動で色を付けてもらいましょう。まずは、相関係数が表示されている「B2セルからBD56セル」を範囲選択します。
  • そして「ホーム」タブの「条件付き書式」をクリックします。その中の「セルの強調表示ルール」を選び、さらに「指定の範囲内」を選びます。

  • すると下のような設定画面が表示されるので、左の数字欄に「0.3」と「0.99」を入力します。
    そして、装飾を設定する右側で「ユーザー設定の書式」を選びます。

  • 設定画面の「塗りつぶし」タブで色を選べばセルに色を付けることができます。また、「フォント」タブの「色」欄を設定すれば文字に色を付けることができます。

  • 下の例は「強調表示ルール」の「指定の範囲内」で「0.3~0.99」が黄色に塗りつぶされるように設定した例です。数字はこの通りに、装飾は自由に設定してください。

  • さらに負の相関のルールを追加します。同様に「B2セルからBD56セル」を範囲選択してから「指定の値より小さい」で「-0.3」以下が水色に塗りつぶされるように設定すると、下のようになります。

  • なお、この「強調表示ルール」を修正したければ、「条件付き書式」の「ルールの管理」を選びます。

  • 下の修正画面で赤線内をダブルクリックすると設定を変更できます。なお「書式ルールの表示」欄で「このワークシート」を選んでおいた方がいいです。

法則の見つけ方

  • 「基本統計」
    平均は真ん中からずれている回答を探し、分散は相対的に大きいか小さい回答を探します。合計は「Yes or No」の時だけ使い、「何人いる」という意味になります。
     平均:Q43は「平均が4.7」と非常に大きい。寝ることが大好きな人が多いようだ。
     分散:Q52は「分散が2.4」と大きい。動物の好き嫌いが激しいようだ。
     合計:Q1は「合計が34人」。地元で働きたい人が圧倒的に多いようだ。
  • 「相関係数」
    相関係数の絶対値が大きいものを探します。符号がプラスなら「Aな人ほどBだ」と解釈し、符号がマイナスなら「Aな人ほどBではない」と解釈します。重要なのは、なぜそのような関係になるのか理由を考えることです
    ・Q34とQ43は「相関係数が0.63」と大きい。勉強が難しいと感じる人ほど寝ることが好きなようだ。
     おそらく○○だからだろう。
    ・Q37とQ39は「相関係数が-0.45」だ。自分に自信がある人ほどスマホに依存しないらしい。
     おそらく○○だからだろう。

情報科学