強化学習の基礎・発展と機械・ロボット制御への応用

これまでのAIは用意された膨大なデータセットからデータ間に潜む関係性を見出すことが中心的な役割でした。これに対して、最近はロボットやゲームAIなどのエージェントが自ら試行錯誤して得た経験データに基づいて学習して、目的を達成できる行動のルール (方策) を獲得する強化学習への注目が高まっています。　これは明示的な正解データを用意せずとも、望ましい結果を定量的に表すことでユーザーが思いもしない優れた方策を見出す事例が数多く報告され、家電からロボットまで幅広い分野で期待が高まっています。　本講座では、このような期待の技術である強化学習について、これまでのAIとは異なる学習方法が何故必要なのか?という根幹から、学習法の基礎を概説いたします。また、ロボットなどの機械制御への応用が特に期待される最新の強化学習アルゴリズムや、応用の際に悩みの種となりやすい報酬の設計指針や対処法についても実際の応用事例と合わせて紹介します。

強化学習とは
1. 強化学習の目的
2. マルコフ決定過程
3. 学習すべき要素
学習アルゴリズムの基礎
1. 価値関数の学習
2. 方策関数の学習
3. 深層強化学習でのテクニック
最新のActor-Criticアルゴリズム
1. 改善へのエッセンス
2. 方策更新の制限
  - TRPO
  - PPO
3. 直接的な方策勾配の計算
  - DDPG
  - TD3
4. 方策エントロピーの最大化
  - SQL
  - SAC
モデルベース強化学習
1. 世界モデルの学習
2. 世界モデルの活用法
3. 既存モデルの活用法
報酬設計の課題と対策
1. 疎な報酬
2. 多目的性
3. エキスパートの模倣
4. 学習難易度の調整

質疑応答

複数名同時受講割引について

2名様以上でお申込みの場合、1名あたり 45,000円(税別) / 49,500円(税込) で受講いただけます。
5名様以降は、1名あたり 30,000円(税別) / 33,000円(税込) で受講いただけます。
- 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)
- 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 99,000円(税込)
- 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 148,500円(税込)
- 4名様でお申し込みの場合 : 4名で 180,000円(税別) / 198,000円(税込)
- 5名様でお申し込みの場合 : 5名で 210,000円(税別) / 231,000円(税込)

同一法人内による複数名同時申込みのみ適用いたします。
請求書は、代表者にご送付いたします。
他の割引は併用できません。

アカデミック割引

1名様あたり 30,000円(税別) / 33,000円(税込)

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

学校教育法にて規定された国、地方公共団体、および学校法人格を有する大学、大学院、短期大学、附属病院、高等専門学校および各種学校の教員、生徒
病院などの医療機関・医療関連機関に勤務する医療従事者
文部科学省、経済産業省が設置した独立行政法人に勤務する研究者。理化学研究所、産業技術総合研究所など
公設試験研究機関。地方公共団体に置かれる試験所、研究センター、技術センターなどの機関で、試験研究および企業支援に関する業務に従事する方

支払名義が企業の場合は対象外とさせていただきます。
企業に属し、大学、公的機関に派遣または出向されている方は対象外とさせていただきます。

ライブ配信対応セミナー / アーカイブ配信対応セミナー

「Zoom」を使ったライブ配信またはアーカイブ配信セミナーのいずれかをご選択いただけます。
お申し込み前に、 Zoomのシステム要件とテストミーティングへの参加手順をご確認いただき、テストミーティングにて動作確認をお願いいたします。
開催日前に、接続先URL、ミーティングID、パスワードを別途ご連絡いたします。
セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。

ライブ配信セミナーをご希望の場合

セミナー資料は、郵送にて前日までにお送りいたします。
開催まで4営業日を過ぎたお申込みの場合、セミナー資料の到着が、開講日に間に合わない可能性がありますこと、ご了承下さい。
ライブ配信の画面上でスライド資料は表示されますので、セミナー視聴には差し支えございません。
印刷物は後日お手元に届くことになります。
Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。

アーカイブ配信セミナーをご希望の場合

当日のセミナーを、後日にお手元のPCやスマホ・タブレッドなどからご視聴・学習することができます。
配信開始となりましたら、改めてメールでご案内いたします。
視聴サイトにログインしていただき、ご視聴いただきます。
視聴期間は2025年11月20日〜11月30日を予定しております。
ご視聴いただけなかった場合でも期間延長いたしませんのでご注意ください。
セミナー資料は別途、送付いたします。