画像認識の分野ではDeep learningを用いることが標準となり、大量の教師付き画像とConvolutional Neural Network (CNN) の組み合わせが主流である。まずはCNNの構成要素と汎化能力の向上させるための工夫について応用例を交えながら解説する。次に、画像生成や画像変換などに利用されるGenerative Adversarial Network (GAN) の基礎理論から発展までを説明する。また、最近は教師なし表現学習とTransformerが人気のトピックであり、大量の教師付き画像とCNNからの脱却が図られている。
本セミナーでは、これらの方法と最近の発展についても応用例を交えながら丁寧に説明していく。
- Deep learningの理論と応用例
- Convolutional Neural Networkの理論と応用
- Convolutionとその発展
- CondConv
- Dynamic Conv
- Octave Conv
- 活性化関数
- ReLU
- Leaky-ReLU
- ELU
- Swish
- Mish
- FReLU
- GELU
- Dropout
- Batch normalizationとその発展
- Batch renormalization
- Layer normalization
- Instance normalization
- Group normalization
- Generative Adversarial Network
- 理論とその発展
- Wasserstein GAN
- Spectral Normalization
- pix2pix
- 応用例
- Transformerの理論と応用
- Self-attentionとSource-target attentionとその応用
- Non-local net
- Dual attention netなど
- Self-attention network
- Axial attention
- Vision Transformerとその発展
- ViT
- DeiT
- Swin
- MLP Mixer
- MetaFormerなど
- Detection and Tracking Transformer
- Point Transformer
- SuperResolution
- 教師なし表現学習の理論と応用
- SimCLR
- BYOL
- SimSiam
- Barrow Twins
- DINO
- Generative Adversarial Networkの理論と応用
- 理論とその発展
- Wasserstein GAN
- Spectral Normalization
- pix2pix, cycleGAN
- SinGAN