機械学習における画像認識の発展とVision Transformerに関するセミナーです。機械学習に興味のある方であれば誰でも理解可能なように平易なセミナーとなります。最新のVision Transformerに関してもどこが画期的なのか、どのくらい優秀なのかがよくわかります。
- 画像認識の歴史
- 画像認識とは
- DNN以前
- DNN (深層学習)
- CNN (畳み込みとプーリング)
- 物体検出
- Transformer
- Transformerの基礎
- Self Attention
- Bert
- 基盤モデルとファインチューニング
- 基盤モデルとは
- ファインチューニングの考え方
- VisionTransformer
- 概要
- 画像を入力する
- ファインチューニング
- なぜ高い精度なのか?