教材の内容に関係のない質問や教材とは異なる環境・バージョンで進めている場合のエラーなど、教材に関係しない質問は推奨していないため回答できない場合がございます。
その場合、teratailなどの外部サイトを利用して質問することをおすすめします。教材の誤字脱字や追記・改善の要望は「文章の間違いや改善点の指摘」からお願いします。
回帰分析と言う言葉は、統計について興味を持ち始めると、色々な場面で聞くようになるかと思いますが、回帰という言葉は、あまり一般的な言葉ではないので、初めて聞いた時はイメージができないかもしれません。例えば以下のような事例を考えてみてください、
もしも、あなたが企業の営業担当だったとしたら、先月や昨年の売上、販売個数、キャンペーンの新規申込者数などの情報から、来月のそれぞれの見込みが分かれば、とても助かるかと思います。
たいていは、自分の経験やカンといったものを使って、Excelソフトなどで来月の予測について抽象的に売上見込みを考えるのが、一般的なのではないでしょうか?
このような売上予測や、申し込み数予測などの各種予測を、数学をベースとした統計的処理を行うことで、現場の人の感覚ではなくより厳密に予測することができるのが、回帰分析と呼ばれるものです。
つまり、回帰分析とは、予測分析
なのです。
予測ができるだけなの?と思われるかもしれませんが、回帰分析では、各説明変数というもののそれぞれの重みというものが可視化されます。
たとえば、街のアイスクリーム屋の1日の売上を予測したいとします。アイスクリームの売上を決める代表的な要因は何が考えられるでしょうか?気温や湿度、街の人通りの多さなどは重要な要因かもしれません。これら一つ一つの要因を、説明変数
と呼び、予測したい売上を、 目的変数
と呼びます。
ここでは気温による影響が重要であると仮定して、上記を計算式にすると、
Copied!アイスクリームの売上 = 気温による影響
という式ができあがります。これをさらに数学的な式に変形すると、
Copied!y = αX + β
という式に置き換えることができます。
y
が、アイスクリームの売上を表す 目的変数
X
が、各種の要因を表す 説明変数
となるということですね。
注目すべきは、α
と β
という別の記号が付与されています。
α
が、係数と呼ばれるもので、俗に 重み
とも呼ばれます。 α * X
という計算により、説明変数であるXの重要性を表しているということですね。
では、今回、重みを2、気温を30度だと仮定してみて、式に代入してみましょう。
Copied!y = αX
α = 2, X = 30のとき
y = 2 * 30
y = 60
つまり、アイスクリームの売上個数は、60個ですね。
もしも一個200円で販売していれば、円単位に換算すると、売上は12,000円ということになります。
回帰式を使えば、気温が分かると、売上が予測できるのです。
一つ忘れているものがありますね。 β
です。
これは 切片
と呼ばれるもので、もしも、気温であるXが、 0
だった場合のアイスクリームの売上個数を予測したいときに役に立ちます。
例えば、 β=3
が 気温=0
の時の回帰式を見て見ましょう。
Copied!y = αX + β
α = 2, β= 3, X = 0のとき
y = 2 * 0 + 3
y = 3
気温が0度の時のアイスクリームの売上個数は、3個
ということですね。
回帰式を使えば、予測を立てることができるようになり、予測が立てられれば、アイスクリームの原料をどれぐらい仕入れれば良いかも分かり、経営効率を高めることもできるのです。
本パートは以上となります。