ディープラーニングの推論高速化に役立つモデル軽量化技術の基礎と最新動向

本セミナーでは、画像認識問題を題材として、まず軽量化の観点からディープラーニングの基礎を説明した後、様々な軽量化技術のテクニックを紹介いたします。
各テクニックに関しては、AI系の有力国際会議 (CVPR、ICLRなど) やプレプリントサーバ (ArXiv) に掲載されている最新技術を主に扱い、理論的な厳密さよりもイメージやコンセプト重視でわかりやすくご説明いたします。

日時

プログラム

ディープラーニングのモデルは、その他の機械学習モデルと比べて推論処理に必要なメモリ使用量・演算量が膨大であり、さらにそれらを多く必要とするモデルほど性能 (認識精度など) が良くなる傾向があります。一般に、メモリ使用量や演算量は、処理速度・消費電力・部品コスト等に直接関わるため、なるべく小さく抑えたいところです。そのようなニーズに対し、ディープラーニングモデルの性能をできる限り維持しつつメモリ使用量・演算量を削減する軽量化技術が登場し、研究が進められています。　本講演では、画像認識問題を題材として、まず軽量化の観点からディープラーニングの基礎を説明した後、様々な軽量化技術のテクニックを紹介していきます。各テクニックに関しては、AI系の有力国際会議 (CVPR、ICLRなど) やプレプリントサーバ (ArXiv) に掲載されている最新技術を主に扱い、理論的な厳密さよりもイメージやコンセプト重視でわかりやすくご説明します。

ディープラーニングの基礎
1. データ表現と問題設定
2. 全結合ネットワークモデル
3. 畳み込みネットワークモデル
4. 代表的なモデルとその構成要素
モデルプルーニング
1. 非構造化プルーニング
  - Magnitude-based Pruning
  - Lottery Ticket Hypothesis
  - Weight Rewinding
  - Learning-rate Rewinding
2. 構造化プルーニング
  - L1norm-based Pruning
  - ThiNet
  - PCAS
ネットワーク量子化
1. 二値化
  - XNOR-Net
  - Bi-Real Net
2. 一様量子化
  - Integer Arithmetic Only Inference
  - PACT
  - Learned Step-size Quantization
3. 非一様量子化
  - LogNet
  - Learnable Companding Quantization
軽量アーキテクチャ設計
1. 分岐・合流接続の工夫
  - PeleeNet
  - CSPNet
2. 畳み込みの要素分解
  - MobileNet-V1
  - MobileNet-V2
3. 構造の自動探索
  - FBNet
その他の軽量化技術
1. 重み共有
  - Product Quantization
2. 知識蒸留
  - Few Sample Knowledge Distillation
3. 低ランク近似
  - Compression-aware Training
まとめ

受講料

ライブ配信セミナーについて

本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
お申し込み前に、視聴環境とテストミーティングへの参加手順をご確認いただき、テストミーティングにて動作確認をお願いいたします。
開催日前に、接続先URL、ミーティングID、パスワードを別途ご連絡いたします。
セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。