どうもニコイチです。いよいよ予測の開始です。実際にpredict関数を使って、予測をしてみましょう。
1. 基本的な予測(predict関数)
# 予測の実行
predictions = model.predict(X_test)
# 最初の5件の予測結果を確認
print("予測結果(0:継続なし、1:継続あり):")
print(predictions[:5])
2. 確率による予測(predict_proba関数)
# 確率予測の実行
probabilities = model.predict_proba(X_test)
# 継続確率(1である確率)の取得
continuation_prob = probabilities[:, 1]
# 結果の確認(最初の5件)
print("\n継続確率:")
for prob in continuation_prob[:5]:
print(f"{prob:.1%}")
3. 実践的な予測例
import pandas as pd
# 予測したいケース
new_data = pd.DataFrame({
'年齢': [35, 50, 65],
'世帯年収': [500, 800, 1200],
'預入期間': [3, 5, 7]
})
# 予測実行
predictions = model.predict(new_data)
probabilities = model.predict_proba(new_data)[:, 1]
# 結果をまとめる
results = pd.DataFrame({
'年齢': new_data['年齢'],
'世帯年収': new_data['世帯年収'],
'預入期間': new_data['預入期間'],
'継続予測': predictions,
'継続確率': probabilities
})
print("\n予測結果:")
print(results)
予測値の解釈
- predict():
- 出力: 0(継続なし)または 1(継続あり)
- 例: [1, 0, 1] → [継続する, 継続しない, 継続する]
- predict_proba():
- 出力: [[非継続確率, 継続確率], …]
- 例: [[0.2, 0.8]] → 継続確率80%
コメント