統計解析・機械学習のためのPythonハンズオンセミナー

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

本セミナーでは、初めての方でも安心してご受講いただけるようPythonの基礎から解説し、機械学習における教師あり学習 (分類問題と回帰問題) および教師なし学習 (次元圧縮およびクラスター解析) についてExcelおよびPythonを使ってわかりやすく解説します。

日時

開催予定

プログラム

最近、プログラミング言語として、Pythonが注目の的となっています。Pythonは汎用のスクリプト言語で、多くのプログラミング言語の中でも多目的で使用でき、簡単であり、また無料であるという特長があります。Pythonによる統計解析と機械学習は、様々な領域 (医療、画像処理、インフォマティクス、ファイナンス等) に応用されています。システム連携を考慮したデータ分析を目指すのであれば、Pythonは長い目で見て優れたツールといえます。ただしそのためにはプログラミングの知識が必要となります。本講座では統計解析・機械学習に必要なPythonのプログラミングをハンズオンで実施し、講座終了後直ちに皆様の業務に活用できることを主旨としております。

 本講座では、先ずPythonの基礎を学びます。初めての方でも、インストール方法含めわかりやすく解説します。次いで、初日は統計解析 (記述統計、推測統計、線形モデルによる予測) 、2日目は機械学習 (分類問題、回帰問題、次元圧縮、クラスター解析) をPythonを使い具体的事例でわかりやすく紹介します。ソースコードも配布しますので、すぐに実践することが可能です。是非この機会に講座への参加をお待ちしております。

第1日目:Pythonによる統計解析

  1. なぜ今統計解析にPythonか
    1. 統計解析が重要視される背景
    2. 統計解析ソフトの選択肢の増大
    3. プログラミング言語の多様化とPythonの位置づけ
    4. PythonとRの違い
  2. Pythonを使うために~PC環境の構築~
    1. ANACONDAのインストール
    2. Jupyter Notebookを使う
    3. Pythonプログラミング入門
      1. 簡単プログラミング (演算、変数、条件分岐など)
      2. 基本モジュールとそのインポート (numpyの使い方)
      3. データを読み込もう (pandasの使い方)
  3. Pythonによる記述統計
    1. データを整理してわかりやすく伝えよう
      1. データを要約する (要約統計量)
      2. いろいろな要約統計量 (平均値、中央値、標準偏差など)
      3. 要約統計量をPythonで計算する (pandasとnumpy)
    2. データを視覚化してわかりやすく伝えよう
      1. データを視覚化する (散布図、箱ヒゲ図、ヒストグラム)
      2. 視覚化をPythonで行う (matplotlibとseaborn)
  4. Pythonによる推測統計
    1. 統計解析における確率と統計的推測
      1. 確率の基本を理解しよう (データは確率的に変動する)
      2. 測定値は正規分布をする (正規分布の特徴)
      3. 統計的推測 (母集団と標本)
    2. 大きな集団を推定しよう
      1. 母集団を推定する (標本の無作為抽出)
      2. 標準誤差を理解しよう (母平均の推定)
      3. 95%信頼区間を理解しよう (母平均の推定)
      4. Pythonを使って95%信頼区間を計算しよう (statistics)
    3. 差があることを証明しよう
      1. 仮説検定における仮説の設定 (帰無仮説と対立仮説)
      2. 2群の平均値の差からp値を求める (t-検定)
      3. 2群の有効率の差からp値を求める (カイ2乗検定)
      4. 多群の群間差からp値を求める (分散分析)
      5. Pythonを使って仮説検定を行ってみよう (numpy)
  5. Pythonを用いた線形モデルによる予測
    1. 直線回帰分析 (直線的予測)
    2. 重回帰分析 (説明変数が複数ある場合の予測)
    3. ロジスティック回帰分析 (2値の予測)
    4. Pythonでモデルによる予測をやってみよう (sklearn)

第2日目:Pythonによる機械学習

  1. Pythonによる機械学習
    1. 機械学習とは
    2. Pythonと機械学習
    3. 環境構築
      1. OSとフレームワーク
      2. CPUとGPU
      3. NumPy
      4. matplotlib
      5. scikit-learn
      6. Jupiter
  2. 分類問題
    1. 分類問題とは
      1. 学習テストとテストセット
      2. ホールドアウトと交差検証
      3. k-分割交差検証
      4. 正答率・適合率・再現率・F値・ROC曲線下面積
    2. いろいろな分類器
      1. 決定木
      2. Random Forest
      3. AdaBoost
      4. Naive Bayes
      5. サポートベクターマシン (SVM)
  3. 回帰問題
    1. 回帰問題の基礎
      1. 最小二乗法
      2. 線形単回帰
      3. 線形重回帰
  4. 次元圧縮
    1. 次元の呪い
      1. 過学習
      2. 情報量規準
    2. 次元圧縮
      1. 主成分分析
      2. 主成分得点・固有値・因子負荷量
  5. クラスタリング
    1. 階層的クラスタリング手法
      1. 最短距離法
      2. ウォード法
    2. 非階層的クラスタリング手法
      1. k-means法
      2. 自己組織化マップ
      3. scikit-learnを用いたデータのクラスタリング
  6. 深層学習
    1. 機械学習から発展した深層学習
      1. 畳み込みニューラルネットワーク (CNN)
      2. 再帰型ニューラルネットワーク (RNN)
      3. 物体検出
  7. おわりに

受講料

複数名受講割引

アカデミー割引

教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。

アーカイブ配信セミナー