業務改善と標準化を同時に実現:MS 365業務システム開発

最小二乗法の概要と回帰分析との違い、最小二乗法で会社の固定費の簡単な求め方

    
最小二乗法と回帰分析の違い、最小二乗法で会社の固定費の簡単な求め方
\ この記事を共有 /
最小二乗法の概要と回帰分析との違い、最小二乗法で会社の固定費の簡単な求め...

最小二乗法と回帰分析との違いは何でしょうか?それについてと最小二乗法の概要を分かり易く図解しています。また、最小二乗法は会計でも使われていて、簡単に会社の固定費の計算ができ、それについても図解しています。

(動画時間:6:38)

最小二乗法と回帰分析の違い

こんにちは、リーンシグマ、ブラックベルトのマイク根上です。

今日はこちらのコメントからです。

最小二乗法 動画コメント

リクエストというよりか回帰分析と最小二乗法の
関係性についてのコメントを頂きました。
みかんさん、コメントありがとうございました。

回帰分析の詳細は以前シリーズで動画を作りました。
「回帰分析をエクセルの散布図でわかりやすく説明します!【回帰分析シリーズ1】」

今日は回帰直線の計算に使われる最小二乗法の概念と、
記事の後半に最小二乗法を使って会社の固定費を
簡単に計算できる事をご紹介します。

まず、最小二乗法と回帰分析はよく一緒に語られたり、
同じ様に言われる事が多いです。
その違いは何でしょうか?

その関係は簡単で、
回帰分析で回帰直線を計算する時に
この最小二乗法が使われているのです。

もちろんエクセルで簡単に回帰直線を作れますので、
僕らは実務で最小二乗法を意識する必要はないのですが、
回帰分析をもう少し理解するために
最小二乗法の概念だけでも知っておくと良いでしょう。

ちなみに最小二乗法は回帰分析だけでなく、
数学や天文学など色んなところで使われています。

係数と切片を求める最小二乗法の概念分かり易く解説

最小二乗法 サンプルデータと散布図

上図の左の表が以前の単回帰分析の動画で使ったサンプルデータで、
僕のブログの各投稿の文字数と動画時間のデータです。

投稿の文字数から動画時間を予測する為に回帰直線を作りました。
上図の右の散布図がその分析です。
散布図内に回帰直線と単回帰式が書かれています。

これにより文字数から動画時間を
予測できるようになり重宝しています。

このデータを例題にして最小二乗法を説明します。

まず、平たく言うと散布図内に
そのデータ群の全体を表す直線を
数学的に引くのが最小二乗法なのです。

そしてその直線を回帰直線と言います。

最小二乗法の概説

ここで着目するのが各点からその直線への縦方向の距離です。
全ての距離の合計が一番小さくなる直線が回帰直線になるのです。

回帰直線を表す式、回帰式をY = a X + b とします。

今回の例ではYが目的変数の動画時間で、
Xが説明変数の文字数です。(上図参照)
これらは変数ですが測定データがあります。

最小二乗法の概説2

残りのaがこの直線の傾きである係数、
bがY軸との接点の数値である切片です。

違う言い方をすると最小二乗法は測定データを使って
この係数と切片の値を求める方法なのです。

最小二乗法の概説3

例えば上図の一点はXが1959でYが357です。
回帰式のXに1959を入れると
回帰直線上の垂直に交わる点Y値はa x 1959 + bとなるので、
その二点の差が距離なので、その距離は
357 – (a x 1959+b)となります。

同じ方法で全ての距離をaとbと数値だけで表せるのです。

最小二乗法の概説4

最小二乗法で使う二乗和をやってみる

ここで問題になるのが
全ての距離の和をどう表現するかです。

前述の計算では距離がプラスの時とマイナスの時があるので
普通に合計したら実際の総和より短くなるので
正しい結果になりません。

各距離をプラスにする必要があります。

ですので、各距離を二乗してプラスにし、
それを合計するのです。

最小二乗法の概説5

これを二乗和と言い、二乗した合計が最小になる、
変数aとbを求めるのでこの方法を「最小二乗法」と言うのです。

これで何となく最小二乗法をご理解できましたか?

この先の計算は微分を使った難しい計算になるし、
実務ではエクセルがやってくれるので割愛します。

ちなみに二乗ではなく絶対値を使って
マイナスをプラスにする事もできますが、
これだと後の計算で前述のaとbの組合せが
複数出てきてしまうので絶対値は使えません。

最小二乗法を使って会社の固定費を3分で計算する。

最後にこの最小二乗法の便利な使い方をご紹介します。

この最小二乗法は会計の分野でもよく使われます。
その中で会社の毎月の売上高と総経費のデータから
簡単に固定費を求める事ができます。まずはやってみましょう。

ここに毎月の売上高と総経費のサンプルデータがあります。

最小二乗法の活用例 サンプルデータ

そのデータの数値部分を選択した状態で、
メニューバーの「挿入」、「グラフ」の中の
「散布図」を選ぶと、散布図が作れます。

次に回帰直線を出します。
散布図を選んだ状態で「グラフツール」の「デザイン」、
「グラフ要素を追加」、「近似曲線」、
そして「その他の近似曲線オプション」を選びます。

出てきた右のペインで「線形近似」を選び、
「グラフに数式を表示」にチェックを入れると、
グラフ上に回帰式が出てきます。

最小二乗法の活用例 散布図結果

この時Y軸が総経費であるのを確認して下さい。

散布図内の回帰式から切片は17万9570円ですね。
切片は売上0の時の総経費ですのでこれが固定費になるのです。

切片を計算するINTERCEPT関数を使っても求められます。

最小二乗法の活用例 INTERCEPT関数

経費には商品原価や広告費など、
売上によって変動する変動費と、
人件費や光熱費など売上に関係なく掛かる固定費があります。

時間の掛かる変動費と固定費の仕分をしなくても
なんとこんなに簡単に固定費が計算できてしまうのです。

しかもこっちの方が実は正確な数値だと言われています。
ぜひ一度やってみて下さい。

<< 回帰分析シリーズ >>

第一話:回帰分析をエクセルの散布図でわかりやすく説明します!

第二話:単回帰分析の結果の見方(エクセルのデータ分析ツール)

第三話:重回帰分析をSEOの例題で理解する。

第四話:← 今回の記事