逆強化学習・模倣学習の基礎と応用
オンライン 開催
日時
-
2022年11月22日 10時00分〜
2022年11月22日 16時00分
開催予定
プログラム
- 逆強化学習の位置づけ・機械学習の基礎
- 逆強化学習と機械学習・最適制御の関係
- 強化学習は制御と関連が強い
- 逆強化学習と強化学習 (最適制御) と何が違う?
- 機械学習の基礎のおさらい
- 生成的 / 識別的
- 経験リスク最小化
- 様々な損失
- 2クラス分類 / 他クラス分類 / 系列ラベル分類
- … 構造的なデータに対しても「識別」は定義できる ⇒ 逆強化学習ではどうやって解く?
- 逆強化学習の定式化・解法
- 強化学習の基礎:マルコフ決定過程、ベルマン方程式
- 動的システム
- マルコフ性
- マルコフ決定過程 / 報酬関数
- 価値関数 / ベルマン方程式
- 逆強化学習の定式化とアルゴリズム
- 報酬期待値の最大化
- 損失関数の設定
- 最大エントロピー逆強化学習
- 周辺分布の獲得前向き・後ろ向き計算
- 逆強化学習を適用しようとすると起きる問題は??
- 逆強化学習の適用例・最近の事例
- 海外での適用事例、下坂研究室での事例
- (簡易版) 車線変更
- 経路選択
- Zone 30マルコフの加減速モデリング
- 連続・高次元化に向けた方向性、深層学習との融合
- 関数近似の利用、離散化の工夫
- 連続空間上のIRL:分配関数 (積分計算) の近似がポイント
- この分野も深層NN、さらにはGANの導入が始まってきている
受講料
- 1名様: 47,000円(税別) / 51,700円(税込)
- 複数名: 57,000円(税別) / 62,700円(税込)
ライブ配信セミナーについて
- 本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
- お申し込み前に、 視聴環境 と テストミーティングへの参加手順 をご確認いただき、 テストミーティング にて動作確認をお願いいたします。
- 開催日前に、接続先URL、ミーティングID、パスワードを別途ご連絡いたします。
- セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
- ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
- タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
- ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
- 講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
- Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。