自然言語処理の導入と研究開発への活用

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

本セミナーでは、自然言語処理について基礎から解説し、自然言語処理ツールの選定、使い方とその活用、課題を基礎から解説いたします。

日時

開催予定

プログラム

第1部 自然言語処理の導入とR&D活動の効率化

(2023年7月31日 10:30〜12:10)

 ChatGPTの登場により、世の中の根底を変える勢いで急速にAI環境が変化している。今後業務利用が拡大し、R&D分野でも情報抽出などでの活用が進んでいくことが想定される。  本講座では、自然言語処理の基礎知識から始まり、オープンソースのノーコードツールによる解析事例、並びにBERTやGPTといった大規模言語モデルの活用展開について述べる。

  1. 自然言語処理の基礎知識
  2. 文書の分類/判定の進め方
    1. 古典的手法
    2. BERT
  3. 文章生成の汎用的な大規模言語モデル
    1. 大規模言語モデル
    2. GPT-3の登場
    3. ChatGPT
    4. プロンプトエンジニアリング
    5. 生成AIのガイドライン
    6. 文章生成の汎用的な大規模言語モデルの活用
  4. 自然言語処理のR&D活動への活用事例
    1. R&Dにおける自然言語処理の活用事例、よくあるケース
    2. 特許調査・分類
    3. AIを用いた新規用途・材料探索
    4. 生物・化学分野における大規模言語モデルの活用
  5. 自然言語処理ツールの活用
    1. オープンソース (KHCoderなど)
    2. クラウドサービス
  6. 自然言語処理のさらなる応用、今後の展望

第2部 テキストマイニングによる特許情報解析、先行技術調査への活用

(2023年7月31日 13:00〜14:40)

 最初に特許調査とテキストマイニングの基礎について概観します。各種ツールのテキストマイニング関連機能の活用事例を紹介します。テキストマイニングの特許調査への応用事例を単語・文書のベクトル化、文書分類、文書ベクトルの次元圧縮による特許公報の俯瞰可視化と技術動向調査への応用を紹介します。調査目的に応じたツール・アルゴリズム・特徴量の選択が重要であり、ツールの特徴を把握して使いこなすことが大事です。  最近の大規模言語モデルを使ったAI (GPT、BERT等) とテキストマイニングを連携させることの利点と課題についても紹介します。

  1. はじめに 講師自己紹介 アジア特許情報研究会紹介
  2. 特許調査とテキストマイニングの基礎
    1. 調査対象と調査範囲の特定・明確化
    2. マッチングと適合
    3. 特許調査における再現率 (網羅性) と適合率 (効率)
    4. 「完全一致」⇔「最良一致」検索モデルの比較
    5. 検索・分類とテキストマイニングの違い
    6. テキストマイニングの基本的な仕組み
  3. テキストマイニングの概要と特許調査への応用
    1. 商用特許調査ツールのテキストマイニング応用機能
    2. 商用・フリーのテキストマイニングツール
  4. テキストマイニング・AI特許調査ツールの活用事例
    1. 特許調査ツールへの要求性能
    2. 現時点でできること/できないこと、性能レベルなど
    3. 商用AI特許調査ツールの活用事例
    4. 特許のトレンド分析、競合分析、技術の発展パターン分析
  5. テキストマイニングと大規模言語モデルAI (GPT、BERT等) との連携
    1. 自然言語理解能力の向上
    2. 大量データの効率的な分析
    3. 自動化された情報抽出
    4. 洞察の視覚化
    5. 大規模言語モデルとの連携時の課題
  6. 参考文献

第3部 材料科学分野における言語処理技術の応用展望

(2023年7月31日 14:50〜16:30)

 以下のような事柄について、概要を理解していただき、自社で展開する際の参考にしていただく。材料科学分野で自然言語処理技術を利用してどのようなことができるのか、やりたいことを実現するのにどの種類の技術を用いればよいのか、市販ツールがどのような技術を用いているのか、市販ツールを自社カスタマイズする発注の際に言語モデル的に注意すべき点、今後どのようなことができるようになると期待されるか。

  1. 概観
    1. マテリアルズインフォマティクス
      • 物性値
      • 分子構造
      • 結晶構造
      • 化学構造式
      • 物性名
      • 数式
      • 自然言語
    2. 対象とする文書の種類と特徴
      • 論文
      • 特許
      • 書籍
      • 安全・規制に関わる法的文書、社内文書
    3. 求められる処理の種類と特徴
      • 文書分類
      • 検索 (目的文書の抽出)
      • 情報の抽出 (文中の特定情報の抽出)
  2. 言語処理の種類と活用
    1. 統計処理ベース (深層学習を含む)
      • TF-IDE、N-gramなど
      • 単語ベクトル
        • Word2Vec
        • Doc2Vec
      • BERT
        • pre-trainingとfine-tuning
      • ChatGPT
    2. 文法ベース
      • 品詞解析
      • 構文解析/照応解析
    3. 材料関連分野に特化したモデル
      1. 様々なモデル
        • Word2Vec系
        • Mat2Vec
        • BERT系
          • SciBERT
          • BioBERT
          • BatteryBERT
          • MatSciBERT
          • MatBERT
          • MaterialBERT
      2. モデル利用時の注意点
        • 学習データ
        • 単語辞書
        • モデル計算 (初めからor代入?)
        • 学習条件
        • 検証のデータ
  3. NIMSでの活用事例
    1. 超電導データベース
    2. PoLyInfoデータベース
    3. マテリアルキュレーション支援システム
  4. テキストと数値データの関連付け

受講料

複数名同時受講割引について

アカデミック割引

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

ライブ配信セミナーについて