線形回帰の演習

シンプルにやる方法
変数を途中で変更する方法

import pandas as pd

df = pd.read_csv("input/boston.csv")  # ボストン市の住宅価格データ一式

# 予測の対象になる多次元のデータ
X = df.iloc[:, :-1]
# 予測の元になる多次元のデータ
y = df.iloc[:, -1]
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score
# トレーニングデータとテストデータに
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)
# 線形回帰の作成
lr1 = LinearRegression()
# フィッティング
lr1.fit(X_train, y_train)
# 予測値
y_pred1 = lr1.predict(X_test)
# 決定係数
score1 = r2_score(y_test, y_pred1)
float(score1)
0.6354638433202127
# 線形回帰の作成
lr2 = LinearRegression()
# フィッティング
lr2.fit(X_train[['RM', 'LSTAT']], y_train)
# 予測値
y_pred2 = lr2.predict(X_test[['RM', 'LSTAT']])
# 決定係数
score2 = r2_score(y_test, y_pred2)
float(score2)
0.5692445415835348

コメント

タイトルとURLをコピーしました