目次
重要度分析の意義
- モデルの判断基準を理解できる
- 予測に影響を与える主要因を特定
- モデル改善のヒントが得られる
- 不要な変数の特定が可能
定期貯金契約データでの重要度分析
各変数の重要度の割合
# モデルの準備と学習
model = DT(max_depth=3, random_state=42)
model.fit(X, y)
# 重要度の分析と表示
importance_df = pd.Series(
model.feature_importances_,
index=['年齢', '世帯年収', '預入期間']
)
# パーセンテージ表示に変換
importance_percent = importance_df * 100
print("各変数の重要度(%):")
for var, imp in importance_percent.items():
print(f"{var}: {imp:.1f}%")
実行結果の例:
- 年齢: 45.2%
- 世帯年収: 38.6%
- 預入期間: 16.2%
重要度の可視化
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 6))
importance_percent.sort_values().plot(kind='barh')
plt.title('説明変数の重要度(%)')
plt.xlabel('重要度(%)')
plt.ylabel('説明変数')
plt.grid(True)
plt.show()
分析結果の活用方法
- モデル改善
- 重要度の低い変数の除外検討
- 重要度の高い変数の詳細分析
- ビジネス判断への応用
- 重要な要因に基づく戦略立案
- 商品設計への反映
- 追加データの検討
- 重要度の高い変数に関連する新たなデータの収集
- 既存データの精度向上
コメント