最小二乗法とは
最小二乗法とは、観測データに最もよく合う式を見つけるために、予測値と実測値のズレ(誤差)の二乗の合計が最も小さくなるよう係数を決める方法です。特に、直線の関係を仮定する回帰で、y = ax + b を求めるときの基本手順として使われます。
たとえば、勉強時間(x)とテスト得点(y)、宣伝費(x)と売上(y)の関係を知りたいとき、散布図に点を打ち、その傾向を一本の直線で近似します。直線がデータ全体の動きをどれだけ説明できるかを、誤差を通じて評価します。
各データ点について、実測のyと直線が与える予測値の差を残差と呼びます。差をそのまま合計すると正と負が打ち消し合い、全体のズレを小さく見誤るおそれがあります。そこで差を二乗して常に正にし、その合計が最小となるように a と b を求めます。
二乗を用いることで大きな誤差をより強く評価でき、データ全体に一貫した基準で当てはめが行えます。さらに、解の求め方が確立しており、手計算や表計算ソフト、統計ツールでも実装しやすい点が実務上の利点です。
最小二乗法は単回帰だけでなく、曲線当てはめや重回帰にも拡張でき、データの傾向を数式で要約し、予測や要因の説明に役立つ基礎的な手段として広く用いられます。

