畳み込みニューラルネットワークとVision Transformerの基礎と画像認識への応用

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

日時

開催予定

プログラム

深層学習の代表的な手法である畳み込みニューラルネットワークは画像認識分野で様々なタスクへの応用が進んでいる。また、近年は自然言語分野で提案されたTransformerを応用したVision Transformerなど新たな手法も提案されている。  本講義では、畳み込みニューラルネットワークとVision Transformerについて、仕組みと画像認識分野への応用事例について説明する。また、畳み込みニューラルネットワークの実装方法についても紹介し、実践的に活用できる知識を身につける。

  1. ディープラーニングの現在
  2. 畳み込みニューラルネットワーク (CNN:Convolutional Neural Networks)
    1. CNNの構成要素
      1. 畳み込み層,プーリング層,全結合層
    2. CNNの学習方法
      1. 誤差逆伝播法,最適化法
    3. 汎化性能向上のテクニック
      1. Dropout,データ拡張 (Mixup, Cutout等)
  3. 代表的なネットワーク構造
    1. VGG
    2. GoogLeNet (Inception module)
    3. ResNet
    4. MobileNet
  4. 画像認識分野への応用
    1. 物体検出
    2. セグメンテーション
    3. 姿勢推定
    4. 異常検知
    5. 判断根拠の可視化
    6. 文章生成
  5. Vision Transformer
    1. アテンション構造
    2. Transformer
    3. Vision Transformer
    4. DINO (自己教師あり学習)
  6. ディープラーニングの実装
    1. 畳み込みニューラルネットワークの実装
    2. Transformerの実装
    3. ディープラーニングのライブラリ

受講料

ライブ配信セミナーについて