機械学習における特徴選択と過学習の抑制対策

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

日時

開催予定

プログラム

昨今、ディープラーニングを代表とするデータに基づく機械学習が産業界の様々な領域へ導入が進んでいる。しかしながら、実用化にあたり、過学習をいかにして抑えて未知データに対する汎化性能を向上させるか、どのように重要な特徴量を選別するか、また学習では直接最適化が不可能なハイパーパラメータをどのように調整するか、が主要な課題となる。  本セミナーでは、まず機械学習の基本をおさらいし、これらの課題について代表的な対応策と共にそれらのPythonによる実装方法を丁寧に解説します。

  1. 機械学習の概要
    1. 機械学習の分類
    2. 教師あり学習の基本的構造と過学習問題
    3. 深層学習 (ディープラーニング) の発展
    4. 機械学習の基本的な手順
      • 前処理
      • 次元の呪い
      • 主成分分析による次元圧縮
      • バイアスとバリアンス
      • 評価基準の設定:クロスバリエーション
      • 簡単な識別器:k – 近傍法
      • 評価指標:F値,ROC曲線
  2. Pythonによる機械学習の実装方法 (実装解説)
    1. Scikit – learnを用いた実装方法
    2. k近傍法による識別
  3. 過学習の抑制
    1. ロジスティック回帰
    2. L1/L2正則化
    3. ディープラーニングにおける過学習の抑制
      1. DropOut法
      2. Batch Normalization法
    4. L1/L2正則化の比較 (実装解説)
  4. 特徴選択
    1. 逐次特徴選択
    2. モデルベース特徴選択
      1. L1正則化による特徴選択
      2. 決定木学習/Random Forestに基づく特徴選択
    3. 各種特徴選択の比較 (実装解説)
  5. ハイパーパラメータ最適化
    1. サポートベクトルマシン
    2. ハイパーパラメータ最適化問題
    3. Optunaによるハイパーパラメータ最適化方法 (実装解説)

受講料

複数名同時受講割引について

アカデミック割引

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

ライブ配信セミナーについて