本セミナーでは、機械学習・強化学習について基礎から解説し、学習エージェントと環境、アルゴリズム、深層強化学習について分かりやすく解説いたします。
人工知能分野では、プロ棋士の経験に基づいて囲碁の打ち方を学習するAlphaGoが一昨年に大きな話題となり、続いてこれを上回るAlphaGo Zeroが昨年提案されました。AlphaGo Zeroは深層強化学習という最先端技術を用いることでプロ棋士の経験を全く使用せずに学習できること、また応用分野が限定されておらず、どのような分野でも適用可能であることから世界中のあらゆる分野で注目を集めております。 本講演では、このように注目を集めて続けている強化学習を基礎から平易に解説します。学習の方法について、伝統的で幅広く用いられているQ学習から最新の深層強化学習まで、様々な学習法を紹介します。例を用い、また練習問題を解くことで理解を深めます。