DX– category –
-
DX
22.Pythonでデータ分析を始めよう!初心者向けガイド–決定木モデルの学習編-
モデル学習の基本 データの準備 import pandas as pd from sklearn.tree import DecisionTreeClassifier as DT # CSVファイルの読み込み data = pd.read_csv('定期貯金契約データ.csv') # 説明変数と目的変数の分離 X = data[['年齢', '世帯年収',... -
DX
21.Pythonでデータ分析を始めよう!初心者向けガイド-モデルの前処理編-
どうもニコイチです。いよいよモデルの操作に移っていきます。その前に毎処理について解説いたします。 必要なライブラリのインポート from sklearn.tree import DecisionTreeClassifier as DT モデルの初期化 基本的な初期化 model = DT() # 最もシンプル... -
DX
20.Pythonでデータ分析を始めよう!初心者向けガイド-モデルについて編-
どうもニコイチです。ここでは肝心のモデルについて説明していきます。いよいよデータ分析の世界へようこそ!ここでは、初心者の方でも理解しやすいように、決定木モデルを中心としたデータ分析の基礎を解説します。 モデルの基本概念 モデルとは? モデル... -
DX
19.Pythonでデータ分析を始めよう!初心者向けガイド-AUC入門編-
どうもニコイチです。前回評価関数についてざっと触れました。今回はPythonを使ってデータ分析を始めたいと思っている初心者の方に向けて、今回はデータ分析で重要な評価指標の一つである「AUC」について解説します。また、実際のデータを使ってAUCを計算... -
DX
18.Pythonでデータ分析を始めよう!初心者向けガイド-評価関数の基礎入門編-
どうもニコイチです。データ分析の世界で成功するためには、モデルの性能を正確に評価することが不可欠です。なぜなら、実際に作成した予測モデルがどれくらい正しいか評価することができないからです。正しく評価できれば、ROIの算出などにも役立てること... -
DX
17.Pythonでデータ分析を始めよう!初心者向けガイド-データ分割入門編-
どうもニコイチです。前回はモデル作成の概要をお伝えしました。今回から実際にモデル作成に写っていきます。まずは、データを分割していきます。 import pandas as pd import numpy as np from sklearn.model_selection import train_test_split from skl... -
DX
16.Pythonでデータ分析を始めよう!初心者向けガイド-機械学習モデル作成(概要)編-
どうもニコイチです。今回からいよいよ、データ分析の花形である、予測モデルの作成に写っていきたいと思います。まずは、モデル作成に関する概要をご紹介します。 1. 汎化性能と過学習の詳細解説 汎化性能の本質 未知データへの対応力 例:料理人が新しい... -
DX
15.Pythonでデータ分析を始めよう!初心者向けガイド-ダミー変数化編-
どうもニコイチです。実際に特徴量を作成してましょう。今回は、ダミー変数化について、実践的に解説していきます。 import pandas as pd import numpy as np # サンプルデータの読み込み df = pd.read_csv('bank_data.csv') # 基本的なダミー変数化 print("=... -
DX
14.Pythonでデータ分析を始めよう!初心者向けガイド-特徴量編-
どうもニコイチです。前回まではデータ確認する工程を行いました。今回からはデータの前処理に関する特徴量のステップに取り掛かっていきましょう。特徴量(説明変数)の基礎と作成方法について、実践的に解説していきます。 import pandas as pd import nump... -
DX
13.Pythonでデータ分析を始めよう!初心者向けガイド-ヒストグラム入門編-
どうもニコイチです。前回に引き続きヒストグラムを使った可視化について、実践的に解説していきましょう。 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # 日本語フォントの設定 plt.rcParams['font.family'] = 'MS Go...