基礎から学べる強化学習

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

本セミナーでは、簡単な例題やプログラム演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性を紹介いたします。

日時

開催予定

プログラム

強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みです。囲碁や将棋の世界では、人工知能が人間エキスパートを超えるようになり世の中を驚かせましたが、それには強化学習が大きな貢献を果たしました。では、強化学習を使えば何でもできるのでしょうか?それとも、強化学習にも苦手な応用分野はあるのでしょうか? それを知るには強化学習の基本原理を理解する必要があります。  本セミナーでは、簡単な例題やプログラム演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性をご紹介したいと思います。

  1. はじめに
    1. 例題から学ぶ機械学習と強化学習の位置づけ
    2. 強化学習の歴史
  2. 強化学習の基礎理論
    1. マルコフ決定過程による問題の定式化とその解法
    2. マルコフ決定過程
    3. 価値反復法
    4. 方策反復法
    5. 代表的な強化学習アルゴリズム
    6. モンテカルロ法
    7. TD学習法
    8. Q学習法
    9. SARSA法
    10. モデル同定型強化学習法
    11. アルゴリズム実装時に生じる諸問題とその解決法
    12. 探索と知識利用のジレンマ
    13. メタ学習
    14. 連続空間・高次元空間への対応とDQN
  3. プログラミング演習:Pythonによる強化学習アルゴリズムの実装
  4. 強化学習の応用例
    1. ロボットの自動制御
    2. ゲームエージェントの学習
    3. 脳の意思決定モデルと行動解析

受講料