業務改善と標準化を同時に実現:MS 365業務システム開発

単回帰分析の結果の見方【エクセルのデータ分析ツール】

    
単回帰分析の結果の見方
\ この記事を共有 /
単回帰分析の結果の見方【エクセルのデータ分析ツール】

エクセルの単回帰分析の結果の見方を説明しています。決定係数、相関係数、補正R2の違いと解釈の仕方を理解することができます。重回帰分析の時に重要になりますので、P-値の説明もやっています。

(動画時間:5:16)

エクセルの単回帰分析から単回帰式を作る

こんにちは、リーンシグマブラックベルトのマイク根上です。
業務改善コンサルをしています。

前回の記事で回帰分析の基本と散布図での単回帰式の出し方を学びました。
今回はエクセルのデータ分析ツールを使った単回帰分析の仕方を学びます。

<< 回帰分析シリーズ >>

散布図からの回帰式と決定係数

上図が前回の散布図の結果で
Y = 0.1895 X – 35.632と言う単回帰式と、0.8895の決定係数を得ました。

実務でちょっとした分析ならこの散布図だけで済んでしまいます。
しかし単回帰分析をする事で更に詳しい情報が得られるのです。
前回と同じデータでエクセルの単回帰分析をした結果を先に見てみましょう。

エクセルの単回帰分析の結果

沢山数値がありますね。
しかし実務では最低限、上図の中の黄色の部分だけ知っていれば良いです。
「係数」のところの数値がさっきの回帰式のX値の係数と切片と
全く同じになっているのが確認できます(下図参照)。

ですから、回帰式を作るのにこれを使うのです。

エクセルの単回帰分析の係数と切片

P-値は説明変数Xと目的変数Yの関係度を表す

エクセルの単回帰分析の係数と切片

次がX値1のP-値です。ここでは0.004%です。
このP値は散布図では出せない数値です。
簡単に言うと、このP-値で自分の説明変数が
どれだけ上手く目的変数に影響してるかを確認できるのです。

重回帰分析ではこのP-値がすごく重要で、
これで複数ある説明変数の中でどれが
一番目的変数に影響を与えているかが分かるのです。

もう少し詳しく言いますと、P-値は帰無仮説の確率です。
何じゃそりゃ?って感じですね。
回帰分析での帰無仮説とは
「このXの説明変数はYの目的変数と無関係と仮定すること」となります。

一般的にこのパーセンテージが5%以下ならこの帰無仮説を棄却出来ます。
言い換えると「無関係である」ことを棄却する。
つまり「XとYの関係がすごい有る」ということです。

回帰分析のP値の解釈の仕方

今回の場合、その確率が0.004%で、5%以下で
すごく低いので帰無仮説を棄却できるので、すごく関係が有るという事です。

もしこのP-値が5%以上である場合はデータに誤差が無いか確認し、
もっとサンプルデータを加えて分析をやり直すか、
その二つのデータ群には関係性が無いと結論付けるかです。

僕の場合は5%以下なので次に進みます。

「重相関 R」、「重決定 R2」、「補正R2」の違い

「重決定 R2」と「重相関 R」

単回帰分析の決定係数

一番上の表を見ましょう。「重決定 R2」を見ます。
この数値は前回の散布図での決定係数と全く同じです。
これは0から1の数値で、作った回帰式が目的変数を
どれだけの割合で正しいかを表します。

1に近いほど良いのです。ちなみにこれを「寄与率」とも呼びます。

「重相関 R」は相関係数です。
それを2乗すると、下の「重決定 R2」と同じになるのが分かります。

相関係数の2乗は決定係数

「補正 R2」

実は決定係数として使って頂きたいのがその下の「補正 R2」です。
「重決定 R2」よりちょっと低い値ですね。
この二つの違いは何でしょうか?

実務ではもっと説明変数を加えて重回帰分析をする必要が出てきます。
「重決定 R2」だと説明変数の数を増やすほど
それだけで数値結果が良くなってしまうという性質があり、問題になります。

その問題を補正したのが下の「補正 R2」なのです。
今回は単回帰分析であまり影響は無いですが、
普段から「補正 R2」を使った方が良いでしょう。

単回帰分析の手順をまとめると、

  1. 単回帰分析の結果を出したらまず、X1のP値が5%以下なのを確認します。
  2. それから「補正 R2」の数値を見て、状況にもよりますが、0.5以上あれば許容範囲ではないでしょうか。
  3. それからXの係数と切片から自分のデータの単回帰式を求めます。今回の場合ですとY = 0.18953 X- 35.6319です。

これにより自分のデータのXからYを予測出来るようになります。

エクセルの回帰分析のやり方

最後にこの単回帰分析のエクセルでの結果の出し方を簡単に触れときます。
ちなみに重回帰分析も全く同じやり方です。

「データ」からこの「データ分析」で「回帰分析」を選びます。

エクセルのデータ分析ツール

「入力 Y 範囲」では今回は目的変数の「動画時間」のデータを、
「入力 X 範囲」では説明変数の「ブログ文字数」のデータを選んで「OK」するだけです。

エクセル回帰分析ツール

もしこの「データ分析」が非表示であれば、
「ファイル」、「オプション」、「アドイン」をクリックしていき、
「エクセルアドイン」が表示されているのを確認して「設定」をクリックします。

エクセルデータ分析ツールの表示の手順

次の小スクリーンで「分析ツール」にチェックをして「OK」を押すと出てきます。

エクセルで簡単に散布図や単回帰分析が出来ますので、
とりあえずデータを入れてやってみて下さい。思いがけない発見がありますよ。

<< 回帰分析シリーズ >>