強化学習アルゴリズム入門

再開催を依頼する / 関連するセミナー・出版物を探す
会場 開催

日時

開催予定

プログラム

  1. 第1章 平均から学ぶ強化学習の基本概念
    1. はじめに
    2. 平均と期待値
    3. 平均と価値
    4. 平均とマルコフ性
    5. 平均によるベルマン方程式の導出
    6. 平均によるモンテカルロ学習手法の導出
    7. 平均によるTD法の導出
  2. 第2章 各アルゴリズムの特徴と応用
    1. はじめに
    2. 方策π (a | S)
    3. 動的計画法
    4. モンテカルロ法
    5. TD (0) 法
  3. 第3章 関数近似手法
    1. はじめに
    2. 関数近似の基本概念
    3. 関数近似モデルを用いたV (St) の表現
    4. 機械学習による価値関数の回帰
    5. モンテカルロ法を応用した価値関数回帰
    6. Td (0) – SARSA法を適用した行動状態価値関数の回帰
    7. Td (0) – Q法を応用した行動状態価値関数の回帰
  4. 第4章 深層強化学習の原理と手法
    1. TD – Q学習におけるNNによる行動価値関数回帰
    2. DQNによる行動状態価値関数近似
    3. 確率方策勾配法
    4. 決定型方策勾配法
    5. TRPO/PPO法
    6. まとめと展開

会場

中央大学 駿河台記念館
101-0062 東京都 千代田区 神田駿河台3丁目11−5
中央大学 駿河台記念館の地図

受講料

テキストについて

テキストとして、「 機械学習アルゴリズム入門 」 (3,240円) を使用いたします。
テキストが必要な方は、お申し込みのテキスト希望欄から「必要」をご選択下さい。
受講料と、テキスト代(実費)を合わせて請求させていただきます。