強化学習の基礎・発展と機械・ロボット制御への応用

これまでのAIは用意された膨大なデータセットからデータ間に潜む関係性を見出すことが中心的な役割でした。これに対して、最近はロボットやゲームAIなどのエージェントが自ら試行錯誤して得た経験データに基づいて学習して、目的を達成できる行動のルール (方策) を獲得する強化学習への注目が高まっています。　これは明示的な正解データを用意せずとも、望ましい結果を定量的に表すことでユーザーが思いもしない優れた方策を見出す事例が数多く報告され、家電からロボットまで幅広い分野で期待が高まっています。　本講座では、このような期待の技術である強化学習について、これまでのAIとは異なる学習方法が何故必要なのか?という根幹から、学習法の基礎を概説いたします。また、ロボットなどの機械制御への応用が特に期待される最新の強化学習アルゴリズムや、応用の際に悩みの種となりやすい報酬の設計指針や対処法についても実際の応用事例と合わせて紹介します。

強化学習とは
1. 強化学習の目的
2. マルコフ決定過程
3. 学習すべき要素
学習アルゴリズムの基礎
1. 価値関数の学習
2. 方策関数の学習
3. 深層強化学習でのテクニック
最新のActor-Criticアルゴリズム
1. 改善へのエッセンス
2. 方策更新の制限
  - TRPO
  - PPO
3. 直接的な方策勾配の計算
  - DDPG
  - TD3
4. 方策エントロピーの最大化
  - SQL
  - SAC
モデルベース強化学習
1. 世界モデルの学習
2. 世界モデルの活用法
3. 既存モデルの活用法
報酬設計の課題と対策
1. 疎な報酬
2. 多目的性
3. エキスパートの模倣
4. 学習難易度の調整

質疑応答

複数名同時受講割引について

2名様以上でお申込みの場合、1名あたり 45,000円(税別) / 49,500円(税込) で受講いただけます。
5名様以降は、1名あたり 30,000円(税別) / 33,000円(税込) で受講いただけます。
- 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)
- 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 99,000円(税込)
- 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 148,500円(税込)
- 4名様でお申し込みの場合 : 4名で 180,000円(税別) / 198,000円(税込)
- 5名様でお申し込みの場合 : 5名で 210,000円(税別) / 231,000円(税込)

同一法人内による複数名同時申込みのみ適用いたします。
請求書は、代表者にご送付いたします。
他の割引は併用できません。

アカデミック割引

1名様あたり 30,000円(税別) / 33,000円(税込)

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

学校教育法にて規定された国、地方公共団体、および学校法人格を有する大学、大学院、短期大学、附属病院、高等専門学校および各種学校の教員、生徒
病院などの医療機関・医療関連機関に勤務する医療従事者
文部科学省、経済産業省が設置した独立行政法人に勤務する研究者。理化学研究所、産業技術総合研究所など
公設試験研究機関。地方公共団体に置かれる試験所、研究センター、技術センターなどの機関で、試験研究および企業支援に関する業務に従事する方

支払名義が企業の場合は対象外とさせていただきます。
企業に属し、大学、公的機関に派遣または出向されている方は対象外とさせていただきます。

アーカイブ配信セミナー

当日のセミナーを、後日にお手元のPCやスマホ・タブレッドなどからご視聴・学習することができます。
配信開始となりましたら、改めてメールでご案内いたします。
視聴サイトにログインしていただき、ご視聴いただきます。
視聴期間は2025年11月20日〜11月30日を予定しております。
ご視聴いただけなかった場合でも期間延長いたしませんのでご注意ください。
セミナー資料は別途、送付いたします。

強化学習の基礎・発展と機械・ロボット制御への応用

日時

プログラム

受講料

複数名同時受講割引について

アカデミック割引

アーカイブ配信セミナー