AI、深層学習は社会基盤となりつつある。このような裾野の広がりから、上部だけの理解ではなく、実用的な知識として活用する手立てが一層求められるようになってきた。ところが百花繚乱のごときフレームワークを使い始めても、数理的な基礎が不完全であると、種々のサンプルコードは実行できても理解したと実感することができない。各モデルに使われている数学を把握してこそ真の理解へと至る。加えて応用やその先の見通しも効きやすく、業務活用への道も拓ける。
そこで今回は数理的な考えに慣れておられる方向けに、数学の演習問題を通して深層学習モデルを捉えることを試みる。
- 線形代数と解析の復習
- 固有値、逆行列、射影行列
- 全微分、偏微分、劣微分、ヤコビアン、ヘシアン、部分積分、置換積分
- 情報理論の基礎、エントロピー、KL、JS
- 多層ニューラルネットワークの基礎
- 出力関数
- ReLU
- tanh
- softmax
- softplus
- Gumbel-softmax
- 確率勾配降下法と最適化アルゴリズム
- 正則化
- 畳み込みニューラルネットワーク
- 畳み込み演算
- データ拡張
- プーリング
- バッチ正則化、レイヤー正則化
- シートカット
- 計算グラフ
- 再帰的ニューラルネットワーク
- BPTT
- 勾配爆発問題
- LSTM、 GRU
- 双方向RNN
- 注意
- 取り上げなかった概念への補足
- 生成敵対ネットワーク
- 変分推論