畳み込みニューラルネットワークとVision Transformerの基礎と画像認識への応用

深層学習の代表的な手法である畳み込みニューラルネットワークは画像認識分野で様々なタスクへの応用が進んでいる。また、近年は自然言語分野で提案されたTransformerを応用したVision Transformerなど新たな手法も提案されている。　本講義では、畳み込みニューラルネットワークとVision Transformerについて、仕組みと画像認識分野への応用事例について説明する。また、畳み込みニューラルネットワークの実装方法についても紹介し、実践的に活用できる知識を身につける。

ディープラーニングの現在
畳み込みニューラルネットワーク (CNN:Convolutional Neural Networks)
1. CNNの構成要素
  1. 畳み込み層,プーリング層,全結合層
2. CNNの学習方法
  1. 誤差逆伝播法,最適化法
3. 汎化性能向上のテクニック
  1. Dropout,データ拡張 (Mixup, Cutout等)
代表的なネットワーク構造
1. VGG
2. GoogLeNet (Inception module)
3. ResNet
4. MobileNet
画像認識分野への応用
1. 物体検出
2. セグメンテーション
3. 姿勢推定
4. 異常検知
5. 判断根拠の可視化
6. 文章生成
Vision Transformer
1. アテンション構造
2. Transformer
3. Vision Transformer
4. DINO (自己教師あり学習)
ディープラーニングの実装
1. 畳み込みニューラルネットワークの実装
2. Transformerの実装
3. ディープラーニングのライブラリ

ライブ配信セミナーについて

本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
お申し込み前に、視聴環境とテストミーティングへの参加手順をご確認いただき、テストミーティングにて動作確認をお願いいたします。
開催日前に、接続先URL、ミーティングID、パスワードを別途ご連絡いたします。
セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。

畳み込みニューラルネットワークとVision Transformerの基礎と画像認識への応用

日時

プログラム

受講料

ライブ配信セミナーについて