【python入門】回帰分析を行う

pythonを使って住宅価格の回帰分析を行います。

ちなみに同じようなことはExcelでも簡単にすることができます。

用意するもの

・pythonの文法の知識

・Jupyter notebook

はじめに

単回帰分析とは、一つの説明変数で目的変数を記述できる回帰のことです。

式にすると、y = ax +bという形になります。

これにより、説明変数の傾向から目的変数を予測することができます。

以下から、実際に住宅価格のデータを用いて将来価格を予測していきたいと思います。

データの準備

これでhouseにデータが代入されました。

データの前処理

houseに入ったデータを説明変数と目的変数に分けます。

変数Xには6個の特徴量を入れました。

これを用いて変数yに代入されたmedian_house_valueの単回帰分析を行います。

データの分割

教師あり学習のため、学習用とテスト用に分割します。

scikit-learnライブラリのtrain_test_split関数では学習データとテストデータに分割することができます。

X_train, X_test, y_train, y_testにそれぞれ説明変数と目的変数の学習用データとテストデータが代入されました。

学習と予測

LinearRegressionというクラスで線形回帰モデルを呼び出すことが出来ます。

fitメソッドの引数に学習データを入れて、lrに対して学習データを読み込みます。

回帰式の作成

配列で結果が返されると思います。

それぞれの値と対応する説明変数をかけた式が回帰式となります。







コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です