どうもニコイチです。今回はdemoデータを使って実際に予測モデルを作れるようになることを目的とした、シリーズをご紹介します。Pyhonってなに?どうやってつかうの?と戸惑ってしまっている方や、実際にインストールしたけど使い方がわからないと感じている方向けの内容となっています。ぜひ一緒に手を動かしながら作業をしてみましょう。
目次
データの読み込み
1.Pythonでデータ分析を始めよう!初心者向けガイド-データの読み込み編-
どうも、にこいちです。みなさんデータ分析の世界へようこそ!Pythonを使ったデータ分析は、ビジネスや研究など様々な分野で活用されています。私も業務の中で、データ分析…
データの確認(特徴の洗い出し)
2.Pythonでデータ分析を始めよう!初心者向けガイド-データ確認方法入門編-
どうもニコイチです。前回は、データを読み込む方法について学びました。でも、データを読み込んだだけでは不十分です。まるで届いた荷物の中身を確認せずに使い始めるよ…
3.Pythonでデータ分析を始めよう!初心者向けガイド-EDA(探索的データ分析)編-
どうもニコイチです。初めての方向けのデータ分析も第3回目となりました。今回はいよいよデータを深堀り検索していく、EDA編です。ぜひチャレンジしてみてください。 前回…
4.Pythonでデータ分析を始めようー統計量とデータ可視化の基礎ガイド編ー | いきかちガジェットゲームLab:…
どうもニコイチです。Pythonでデータ分析を始めようもついに4回目です。今回は最低限の統計量とデータ可視化に関して学んでいきたいと思います。 1. 統計量って何だろう? …
5.Pyhonでデータ分析-describe関数入門- | いきかちガジェットゲームLab:ガジェット・ゲーム・DX
前回の記事で、特徴量とはなにかに触れました。今回は、実際にPythonを使ってデータを解析する際に、describe関数を用いて特徴量を確認します。量的なデータはそのまま利用…
6.Pyhonでデータ分析初心者ガイド-Series型入門- | いきかちガジェットゲームLab:ガジェット・ゲーム・DX
前回の記事で統計量を活用してデータの全体像を確認しました。その結果、データの中に「この数値は本当?」「どんな内容だろう?」と詳細を確認したくなるポイントが見つか…
7.Pythonでデータ分析を始めよう!初心者向けガイド-value_counts編- | いきかちガジェットゲームLab:ガジ…
どうもニコイチです。前回の記事で、特徴量とはなにかに触れました。今回は、実際にPythonを使ってデータを解析する際に、describe関数を用いて特徴量を確認します。量的な…
8.Pythonでデータ分析を始めよう!初心者向けガイド-相関分析編- | いきかちガジェットゲームLab:ガジェッ…
どうもニコイチです。今回は実際にデータの見る際に重要な視点の一つである相関についてご紹介します。できるだけわかりやすく例えを交えながら紹介しています。 1. 相関とは…
9.Pythonでデータ分析を始めよう!初心者向けガイド-クロス集計編- | いきかちガジェットゲームLab:ガジェ…
どうもニコイチです。前回の記事で、基礎統計量やグラフ、相関分析に関する見方を学びました。今回は、データを分析する際の基本的なステップとして、「仮説を立てること」の…
10.Pythonでデータ分析を始めよう!初心者向けガイド-相関分析編- | いきかちガジェットゲームLab:ガジェ…
どうもニコイチです。前回の記事で、基礎統計量やグラフに関する見方を活用して、実際に仮説1を検証してみました。今回は、前回に引き引き続きデータを分析する際の基本的なス…
11.Pythonでデータ分析を始めよう!初心者向けガイド-ヒートマップ編- | いきかちガジェットゲームLab:ガ…
どうもニコイチです。改めて可視化についてご紹介します。今回は相関係数を表示する上で欠かすことができないヒートマップについてです。下記コードを具体的に説明しています…
12.Pythonでデータ分析を始めよう!初心者向けガイド-フィルタリング編- | いきかちガジェットゲームLab:…
どうもニコイチです。前回可視化を行いましたが、実際のデータを取り扱う時にはフィルタリングすることで必要なデータのみ確認することができるため、不要な情報を省くことが…
13.Pythonでデータ分析を始めよう!初心者向けガイド-ヒストグラム入門編- | いきかちガジェットゲームLab…
どうもニコイチです。前回に引き続きヒストグラムを使った可視化について、実践的に解説していきましょう。 import pandas as pd import seaborn as sns import matplotlib….
データの前処理
14.Pythonでデータ分析を始めよう!初心者向けガイド-特徴量編- | いきかちガジェットゲームLab:ガジェッ…
どうもニコイチです。前回まではデータ確認する工程を行いました。今回からはデータの前処理に関する特徴量のステップに取り掛かっていきましょう。特徴量(説明変数)の基礎…
15.Pythonでデータ分析を始めよう!初心者向けガイド-ダミー変数化編- | いきかちガジェットゲームLab:ガ…
どうもニコイチです。実際に特徴量を作成してましょう。今回は、ダミー変数化について、実践的に解説していきます。 import pandas as pd import numpy as np # サンプルデー…
予測モデルの作成と評価
16.Pythonでデータ分析を始めよう!初心者向けガイド-機械学習モデル作成(概要)編- | いきかちガジェット…
どうもニコイチです。今回からいよいよ、データ分析の花形である、予測モデルの作成に写っていきたいと思います。まずは、モデル作成に関する概要をご紹介します。 1. 汎化…
17.Pythonでデータ分析を始めよう!初心者向けガイド-データ分割入門編- | いきかちガジェットゲームLab:…
どうもニコイチです。前回はモデル作成の概要をお伝えしました。今回から実際にモデル作成に写っていきます。まずは、データを分割していきます。 import pandas as pd imp…
18.Pythonでデータ分析を始めよう!初心者向けガイド-評価関数の基礎入門編- | いきかちガジェットゲームLa…
どうもニコイチです。データ分析の世界で成功するためには、モデルの性能を正確に評価することが不可欠です。なぜなら、実際に作成した予測モデルがどれくらい正しいか評価…
19.Pythonでデータ分析を始めよう!初心者向けガイド-AUC入門編- | いきかちガジェットゲームLab:ガジェッ…
どうもニコイチです。前回評価関数についてざっと触れました。今回はPythonを使ってデータ分析を始めたいと思っている初心者の方に向けて、今回はデータ分析で重要な評価指…
20.Pythonでデータ分析を始めよう!初心者向けガイド-モデルについて編- | いきかちガジェットゲームLab:…
どうもニコイチです。ここでは肝心のモデルについて説明していきます。いよいよデータ分析の世界へようこそ!ここでは、初心者の方でも理解しやすいように、決定木モデルを…
21.Pythonでデータ分析を始めよう!初心者向けガイド-モデルの前処理編- | いきかちガジェットゲームLab:…
どうもニコイチです。いよいよモデルの操作に移っていきます。その前に毎処理について解説いたします。 必要なライブラリのインポート from sklearn.tree import DecisionT…
22.Pythonでデータ分析を始めよう!初心者向けガイド–決定木モデルの学習編- | いきかちガジェットゲームLa…
モデル学習の基本 データの準備 import pandas as pd from sklearn.tree import DecisionTreeClassifier as DT # CSVファイルの読み込み data = pd.read_
23.Pythonでデータ分析を始めよう!初心者向けガイド説明変数の重要度分析入門編- | いきかちガジェットゲ…
重要度分析の意義 モデルの判断基準を理解できる 予測に影響を与える主要因を特定 モデル改善のヒントが得られる 不要な変数の特定が可能 定期貯金契約データでの重要度分…
24.Pythonでデータ分析を始めよう!初心者向けガイド-予測の実装編- | いきかちガジェットゲームLab:ガジ…
どうもニコイチです。いよいよ予測の開始です。実際にpredict関数を使って、予測をしてみましょう。 1. 基本的な予測(predict関数) # 予測の実行 predictions = model.pr…
25.Pythonでデータ分析を始めよう!初心者向けガイド-AUC計算入門編- | いきかちガジェットゲームLab:ガジ…
どうもニコイチです。この記事では、Python初心者がデータ分析を始める際のステップを具体例を用いて解説します。特に、初心者がつまずきやすいポイントをわかりやすく説明…
26.Pythonでデータ分析を始めよう!初心者向けガイド-ROC曲線入門編- | いきかちガジェットゲームLab:ガジ…
どうもニコイチです。前回AUCについて学びました。今回はデータ分析の一環として、モデルの性能を評価する際に「ROC曲線(Receiver Operating Characteristic Curve)」が…
27.Pythonでデータ分析を始めよう!初心者向けガイド-決定木の描画入門- | いきかちガジェットゲームLab:…
どうもニコイチです。前回はROC曲線について学びました。この記事では、Pythonを使ったデータ分析の基本として「決定木」の作成と可視化を学びます。今回は、具体的な例と…
予測モデルのブラッシュアップ
28.Pythonでデータ分析を始めよう!初心者向けガイド-予測精度向上へのモデルチューニング- | いきかちガジ…
どうもニコイチです。前回まででモデルの作成や評価を行えるようになりました。しかし、結果が今ひとつ・・・ということは少なくありません。その時は予測精度の向上に取り掛かる…
29.Pythonでデータ分析を始めよう!初心者向けガイド-パラメータチューニングと評価手法- | いきかちガジェ…
機械学習モデルの性能を最大限に引き出すためには、適切なパラメータ設定と評価方法の理解が不可欠です。この記事では、初心者の方向けに、重要な概念をわかりやすく解説し…
30.Pythonでデータ分析を始めよう!初心者向けガイド-グリッドサーチ入門- | いきかちガジェットゲームLab…
どうもニコイチです。前回、モデルチューニングの概要について説明しました。以下の記事では、初心者向けにグリッドサーチを実行し、CSVデータを用いたデモンストレーションを…
コメント