強化学習の基礎から最新動向と機械制御への応用

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

本セミナーでは、強化学習について基礎から解説し、ロボットなどの機械制御への応用が特に期待される最新の強化学習アルゴリズムや、応用の際に悩みの種となりやすい報酬の設計指針や対処法について実際の応用事例と合わせて紹介いたします。

日時

開催予定

プログラム

深層学習の登場によって一躍注目度を高めたAIは、そのほとんどが用意された膨大なデータセットからデータ間に潜む関係性を見出すことを目的としています。これに対して、最近はAIが見出した関係性を基に新たなデータを生成する生成AIへと発展してきました。中でも、その生成を通じて実世界に物理的に作用するフィジカルAIやEmbodied Inteligenceと呼ばれる概念が次世代AIとして大きな注目を集めています。  本セミナーでは、そのようなAI技術の一つである強化学習について紹介します。強化学習では、ロボットやゲームAIなどのエージェントが自ら試行錯誤して得た経験データに基づいて学習して、目的を達成できる行動のルール (方策) を獲得することを目指しますが、一般的なAIと比べて学習の仕組みや使い方が分かりづらいと良く指摘されています。なので、本セミナーでは強化学習の基礎から近年の定番化したアルゴリズムまで簡潔に要点を説明するとともに、その応用時の注意点なども実例を通じて紹介します。

  1. 強化学習とは
    1. 強化学習の目的
    2. マルコフ決定過程
    3. 学習すべき要素
  2. 学習アルゴリズムの基礎
    1. 価値関数の学習
    2. 方策関数の学習
    3. 深層強化学習でのテクニック
  3. 最新のActor-Criticアルゴリズム
    1. 方策更新の制限:TRPO/PPO
    2. 方策エントロピーの最大化:SQL/SAC
  4. モデルベース強化学習
    1. 世界モデルの学習・活用法
    2. 既存モデルの活用法・Sim-to-Real
  5. 報酬設計の課題と対策
    1. 疎な報酬
    2. 安全性の担保

受講料

案内割引・複数名同時申込割引について

R&D支援センターからの案内登録をご希望の方は、割引特典を受けられます。
案内および割引をご希望される方は、お申込みの際、「案内の希望 (割引適用)」の欄から案内方法をご選択ください。

「案内の希望」をご選択いただいた場合、1名様 42,000円(税別) / 46,200円(税込) で受講いただけます。
複数名で同時に申込いただいた場合、1名様につき 22,500円(税別) / 24,750円(税込) で受講いただけます。

ライブ配信対応セミナー / アーカイブ配信対応セミナー

ライブ配信セミナーをご希望の場合

アーカイブ配信セミナーをご希望の場合