大規模言語モデルとマルチモーダル基盤モデルの技術動向

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

本セミナーでは、大規模言語モデルについて、画像と言語のマルチモーダル化を中心として、最新の技術動向を解説いたします。

日時

開催予定

プログラム

本セミナーでは、大規模言語モデルについて、画像と言語のマルチモーダル化を中心として、最新の技術動向を解説します。  はじめに、基礎となる自己教師あり学習を解説します。つぎに大規模言語モデルの応用として、推論への適用とマルチモーダル化の技術を解説します。最新の動向として 2023年に参加した国際会議から、画像分野 (CVPR2023, ICCV2023) とデータサイエンス分野 (KDD2023) の関連する研究を紹介します。

  1. 自己教師あり学習の手法
    1. 対比学習による潜在空間への変換
    2. マスクを用いた学習
    3. 自己回帰型モデル (次の要素を予測する)
  2. 大規模言語モデル
    1. 機械翻訳モデルとしてのTransformer
    2. BERT (Bi-directional Encoder Representations from Transformers)
    3. GPT (Generative Pre-trained Transformer)
    4. プロンプトによる指示の有効性 (GPT-3:Few shot learner)
  3. 対話型AI
    1. 強化学習の役割 (InstructGPT)
    2. 対話型 AI (ChatGPT) の登場とその後の発展
    3. 思考の連鎖 (Chain of Thought) と多段推論への展開
    4. 企業における活用には格差が存在する
  4. マルチモーダル基盤モデル
    1. 画像分野における言語処理の重要性
    2. 画像と言語のマルチモーダル基盤モデル
    3. 画像認識・検出・領域分割における言語の役割
    4. マルチモーダルエージェントと言語による指示
    5. 産業分野への適用の可能性について
  5. データサイエンス分野における技術動向
    1. KDD 2023 (Knowledge Discovery and Data Mining)
    2. 大規模言語モデルは様々な分野に影響を与えている
    3. 産業分野における応用事例
  6. 画像分野における技術動向
    1. CVPR 2023 (Computer Vision and Pattern Recognition)
    2. ICCV 2023 (International Conference on Computer Vision)
    3. マルチモーダル基盤モデルに関連する研究の解説
    4. 画像分野における大規模言語モデルの展望

受講料

ライブ配信セミナーについて