画像認識の分野ではDeep learningを用いることが標準となり、大量の教師付き画像とConvolutional Neural Network (CNN) の組み合わせが主流である。まずはCNNの構成要素と汎化能力の向上させるための工夫について応用例を交えながら解説する。次に、画像生成や画像変換などに利用されるGenerative Adversarial Network (GAN) の基礎理論から発展までを説明する。また、最近は教師なし表現学習とTransformerが人気のトピックであり、大量の教師付き画像とCNNからの脱却が図られている。これらの方法と最近の発展についても応用例を交えながら丁寧に説明していく。
- Convolutional Neural Network
- Convolutionとその発展
- 活性化関数
- Dropout
- Batch normalizationとその発展
- 応用例
- 対象識別
- 対象検出
- セグメンテーション
- 対象追跡など
- Generative Adversarial Network
- 理論とその発展
- Wasserstein GAN
- Spectral Normalization
- pix2pix
- 応用例
- Transformer
- Self-attentionとSource-target attention
- Self-attention network
- Detection Transformer
- Point Transformer
- Vision Transformerとその発展
- 応用例
- 対象識別
- 対象検出
- セグメンテーション
- 点群認識など
- 教師なし表現学習
- SimCLR
- BYOL
- SimSiam
- Barrow Twins
- 応用例