-
20.Pythonでデータ分析を始めよう!初心者向けガイド-モデルについて編-
どうもニコイチです。ここでは肝心のモデルについて説明していきます。いよいよデータ分析の世界へようこそ!ここでは、初心者の方でも理解しやすいように、決定木モデルを中心としたデータ分析の基礎を解説します。 モデルの基本概念 モデルとは? モデル... -
19.Pythonでデータ分析を始めよう!初心者向けガイド-AUC入門編-
どうもニコイチです。前回評価関数についてざっと触れました。今回はPythonを使ってデータ分析を始めたいと思っている初心者の方に向けて、今回はデータ分析で重要な評価指標の一つである「AUC」について解説します。また、実際のデータを使ってAUCを計算... -
18.Pythonでデータ分析を始めよう!初心者向けガイド-評価関数の基礎入門編-
どうもニコイチです。データ分析の世界で成功するためには、モデルの性能を正確に評価することが不可欠です。なぜなら、実際に作成した予測モデルがどれくらい正しいか評価することができないからです。正しく評価できれば、ROIの算出などにも役立てること... -
17.Pythonでデータ分析を始めよう!初心者向けガイド-データ分割入門編-
どうもニコイチです。前回はモデル作成の概要をお伝えしました。今回から実際にモデル作成に写っていきます。まずは、データを分割していきます。 import pandas as pd import numpy as np from sklearn.model_selection import train_test_split from skl... -
16.Pythonでデータ分析を始めよう!初心者向けガイド-機械学習モデル作成(概要)編-
どうもニコイチです。今回からいよいよ、データ分析の花形である、予測モデルの作成に写っていきたいと思います。まずは、モデル作成に関する概要をご紹介します。 1. 汎化性能と過学習の詳細解説 汎化性能の本質 未知データへの対応力 例:料理人が新しい... -
15.Pythonでデータ分析を始めよう!初心者向けガイド-ダミー変数化編-
どうもニコイチです。実際に特徴量を作成してましょう。今回は、ダミー変数化について、実践的に解説していきます。 import pandas as pd import numpy as np # サンプルデータの読み込み df = pd.read_csv('bank_data.csv') # 基本的なダミー変数化 print("=... -
14.Pythonでデータ分析を始めよう!初心者向けガイド-特徴量編-
どうもニコイチです。前回まではデータ確認する工程を行いました。今回からはデータの前処理に関する特徴量のステップに取り掛かっていきましょう。特徴量(説明変数)の基礎と作成方法について、実践的に解説していきます。 import pandas as pd import nump... -
13.Pythonでデータ分析を始めよう!初心者向けガイド-ヒストグラム入門編-
どうもニコイチです。前回に引き続きヒストグラムを使った可視化について、実践的に解説していきましょう。 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # 日本語フォントの設定 plt.rcParams['font.family'] = 'MS Go... -
12.Pythonでデータ分析を始めよう!初心者向けガイド-フィルタリング編-
どうもニコイチです。前回可視化を行いましたが、実際のデータを取り扱う時にはフィルタリングすることで必要なデータのみ確認することができるため、不要な情報を省くことができます。そこで今回は、フィルタリングについてご紹介します。 全編はこちらから 1. ... -
11.Pythonでデータ分析を始めよう!初心者向けガイド-ヒートマップ編-
どうもニコイチです。改めて可視化についてご紹介します。今回は相関係数を表示する上で欠かすことができないヒートマップについてです。下記コードを具体的に説明していますのでぜひごらんください。 # 必要なライブラリのインポート import pandas as pd imp...