23.Pythonでデータ分析を始めよう!初心者向けガイド説明変数の重要度分析入門編-

PR表記

※アフィリエイト広告を利用しています

目次

重要度分析の意義

  • モデルの判断基準を理解できる
  • 予測に影響を与える主要因を特定
  • モデル改善のヒントが得られる
  • 不要な変数の特定が可能

定期貯金契約データでの重要度分析

各変数の重要度の割合

# モデルの準備と学習
model = DT(max_depth=3, random_state=42)
model.fit(X, y)

# 重要度の分析と表示
importance_df = pd.Series(
    model.feature_importances_,
    index=['年齢', '世帯年収', '預入期間']
)

# パーセンテージ表示に変換
importance_percent = importance_df * 100

print("各変数の重要度(%):")
for var, imp in importance_percent.items():
    print(f"{var}: {imp:.1f}%")

実行結果の例:

  • 年齢: 45.2%
  • 世帯年収: 38.6%
  • 預入期間: 16.2%

重要度の可視化

import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6))
importance_percent.sort_values().plot(kind='barh')
plt.title('説明変数の重要度(%)')
plt.xlabel('重要度(%)')
plt.ylabel('説明変数')
plt.grid(True)
plt.show()

分析結果の活用方法

  1. モデル改善
  • 重要度の低い変数の除外検討
  • 重要度の高い変数の詳細分析
  1. ビジネス判断への応用
  • 重要な要因に基づく戦略立案
  • 商品設計への反映
  1. 追加データの検討
  • 重要度の高い変数に関連する新たなデータの収集
  • 既存データの精度向上
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

CAPTCHA


目次