強化学習アルゴリズム入門

再開催を依頼する / 関連するセミナー・出版物を探す

会場開催

日時

2019年7月23日 10時30分〜 2019年7月23日 16時30分

開催予定

プログラム

第1章平均から学ぶ強化学習の基本概念
1. はじめに
2. 平均と期待値
3. 平均と価値
4. 平均とマルコフ性
5. 平均によるベルマン方程式の導出
6. 平均によるモンテカルロ学習手法の導出
7. 平均によるTD法の導出
第2章各アルゴリズムの特徴と応用
1. はじめに
2. 方策π (a | S)
3. 動的計画法
4. モンテカルロ法
5. TD (0) 法
第3章関数近似手法
1. はじめに
2. 関数近似の基本概念
3. 関数近似モデルを用いたV (St) の表現
4. 機械学習による価値関数の回帰
5. モンテカルロ法を応用した価値関数回帰
6. Td (0) – SARSA法を適用した行動状態価値関数の回帰
7. Td (0) – Q法を応用した行動状態価値関数の回帰
第4章深層強化学習の原理と手法
1. TD – Q学習におけるNNによる行動価値関数回帰
2. DQNによる行動状態価値関数近似
3. 確率方策勾配法
4. 決定型方策勾配法
5. TRPO/PPO法
6. まとめと展開

会場

中央大学駿河台記念館

101-0062 東京都千代田区神田駿河台3丁目11−5

中央大学駿河台記念館の地図

受講料

1名様: 46,000円(税別) / 50,600円(税込)
複数名: 57,000円(税別) / 62,700円(税込)

テキストについて

テキストとして、「機械学習アルゴリズム入門」 (3,240円) を使用いたします。
テキストが必要な方は、お申し込みのテキスト希望欄から「必要」をご選択下さい。
受講料と、テキスト代（実費）を合わせて請求させていただきます。