ロボットや自動車などの自律制御に向けて、深層強化学習が注目されている。強化学習は古くから研究されているが、深層学習の登場により、これらを組み合わせてより高い精度を達成することができている。その代表的な例がAlphaGoであり、世界チャンピオンとの囲碁の対戦で勝利するまで至っている。本講演では、強化学習および深層強化学習の仕組みと最新の事例を紹介する。また、実際に活用するためのフレームワークやコツなどについても深く紹介する。
- 強化学習について
- 強化学習はどんなことができるのか
- 強化学習の概念
- 強化学習とは
- 強化学習の目的
- 深層強化学習のアルゴリズム
- 強化学習アルゴリズムマップ
- Q-Learningとは
- Q-Learningの問題点
- DQN
- Double DQN
- Actor-Critic
- A3C
- UNREAL
- 学習の安定化のために
- 深層強化学習のフレームワーク
- 強化学習を行うために
- OpenAI Gymとは
- OpenAI Gymの使い方とは
- MuJoCoとは
- MuJoCoを使うには
- ChainerRLとは
- ChainerRLの使い方
- 深層強化学習のコツ
- 深層強化学習のメリット・デメリット
- 仮想環境を用いた強化学習
- 強化学習によるロボットの動作獲得
- シミュレータを用いた強化学習