畳み込みニューラルネットワークとVision Transformerの基礎と画像認識への応用

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

日時

開催予定

プログラム

深層学習の代表的な手法である畳み込みニューラルネットワークは画像認識分野で様々なタスクへの応用が進んでいる。また、近年は自然言語分野で提案されたTransformerを応用したVision Transformerなど新たな手法も提案されている。  本講義では、畳み込みニューラルネットワークとVision Transformerについて、仕組みと画像認識分野への応用事例について説明する。また、畳み込みニューラルネットワークの実装方法についても紹介し、実践的に活用できる知識を身につける。

  1. ディープラーニングの現在
  2. 畳み込みニューラルネットワーク (CNN:Convolutional Neural Networks)
    1. CNNの構成要素
    2. CNN の学習方法
    3. 汎化性能向上のテクニック
    4. 代表的なネットワーク構造、等
  3. 画像認識分野への応用
    1. 物体検出
    2. セグメンテーション
    3. 姿勢推定
    4. 判断根拠の可視化
    5. 文章生成
  4. Transformerの画像認識応用
    1. アテンション構造
    2. Transformer
    3. Vision Transformer
    4. ViTの発展 (SwinTransformerなど)
    5. Transformerベース物体検出 (DETR)
    6. Transformerベースセマンティックセグメンテーション (SegFormer)
    7. DINO (自己教師あり学習)
  5. ディープラーニングの実装
    1. 畳み込みニューラルネットワークの実装
    2. Transformerの実装

受講料

ライブ配信セミナーについて