業務改善と標準化を同時に実現:MS 365業務システム開発

散布図(相関図)の書き方 – 外れ値を除外しましょう!【エクセルテンプレート】

    
QC7つ道具:散布図の使い方 – 外れ値を外しましょう!【エクセルテンプレート】
\ この記事を共有 /
散布図(相関図)の書き方 - 外れ値を除外しましょう!【エクセルテンプレ...

散布図(相関図)は作成後が重要。決定係数から二つのデータ群に強い相関があり因果関係が有るかを考える出発点になります。散布図内に外れ値があればそれを除外する事が必須です 。そのやり方をエクセルテンプレート上で紹介してます。

(動画時間:4:36)

ダウンロード  ←これをクリックして「散布図」テンプレートをダウンロードできます。

散布図(相関図)の基本の「相関」とは?

こんにちは、リーンシグマ、ブラックベルトのマイク根上です。業務改善コンサルをしています。

今日はQC7つ道具の一つである散布図の使い方をエクセルテンプレートを使ってご説明します。

散布図で出来ることは、例えば、クラシックな例ではアイスクリームの売上と気温の関係とか、生徒の体重と身長みたいに二種類のデータ群が統計的に関係があるか無いかが分かります。それを相関と言います。

正の相関と負の相関

片方の数値が増えていくともう片方も増えていく時は正の相関があると言い、その逆を負の相関が有ると言います。この時に注意して欲しいのは、相関があっても、因果関係が実際に有るとは言えないという事です 。しかしそれを確定する大きな手掛かりには成ります。

それと、この散布図で全く相関性が無い、つまり無相関なのを見つけられます。僕の場合、二種類のデータ群がある時に取り敢えず相関図を作って無相関なのを見て、因果関係が無いのを確認するのに、この散布図を使う方が多いですね。

散布図(相関図)の書き方、テンプレートの使い方

それでは実際に散布図を作ってみましょう。以前の記事でも書きましたが、英語圏ではテンプレートやソフトウェアーが充実していて、作成方法の勉強よりも、それを具体的にどう使うかの勉強に時間を割きます。僕もそれに習って進めていきます。

下のリンクをクリックして散布図のエクセルテンプレートをダウンロード出来ます。ファイルを開いた後、そのマクロを有効にするために「編集を有効にする」と「マクロを有効にする」のボタンを続けて押して下さい。⇒「散布図」テンプレートをダウンロード。

相関性を見たい二種類のデータ群を二列でエクセル上で用意し(下図参照)、散布図テンプレート上の「ここをクリックして、散布図を作成。」をクリックします。

Sample Data for Scatter Diagram

エクセルが「散布図のデータの入ったエクセルファイルは開いてますか?」と聞いてきます。「Yes」をクリックして、そしてまた「これがそのデータファイルですか?」と聞いていますので、正しいなら「Yes」をクリックします。

ここでデータの要素名と各データ群の3列を選択します(上図参照、B2:D32)。2列のデータだけでも良いです。もしデータのヘッダーもあればそれも含めて下さい。そして「OK」をクリックすると結果が出てきます。

エクセルが「散布図上で外れ値を選択して除外し、決定係数 (R2) が再計算されます。」と言ってますが、これは後で説明します。

散布図(相関図)の読み方

散布図結果

上図が散布図です。元データの一つが横軸でもう一つが縦軸になり、各データが重なるところで打点されています。全体的に右肩上がりですね。正の相関が有りそうです。

上図内で R2 =0.4128とあります。これはR二乗とか決定係数と言って、0から+1の間で+1に近いほど強い相関があり、0に近いほど無相関と言うことです。

一般的に言って、 R2が0.5以上であれば強い相関が有ると言えますが、これはあくまでも目安です。その他の情報で更なる検証をして下さい。

散布図(相関図)では外れ値を除外しよう

散布図で注意しないといけないのが「外れ値」の存在です。このデータはあるアイスクリーム屋の毎日の顧客数とその日の最高気温のデータです。例えば、上図相関図内の赤円内の点は外れ値で気温が低いのに極端に顧客数が高いですね。

その点をクリックすると「これは外れ値で、データから除外したいですか?」と言っています。このデータ表で20日のデータだと分かります。

外れ値除外の質問メッセージ

確認したら、その日は珍しくすごい団体客が来たということでした。特殊な例ですので除外しましょう。「Yes」をクリックします。そしたら、その外れ値が除外され、 R2が再計算されて、0.6379になりました。0.5以上ですので、強い正の相関がありますので、統計的にこのアイスクリーム屋は気温が高いと来客が増えると言えます。

今日は散布図の作り方とその解釈の仕方の話をしました。

「こちらの記事も読まれてます