自然言語処理の導入と研究開発への活用

第1部自然言語処理の導入とR&D活動の効率化

(2023年7月31日 10:30〜12:10)

　ChatGPTの登場により、世の中の根底を変える勢いで急速にAI環境が変化している。今後業務利用が拡大し、R&D分野でも情報抽出などでの活用が進んでいくことが想定される。　本講座では、自然言語処理の基礎知識から始まり、オープンソースのノーコードツールによる解析事例、並びにBERTやGPTといった大規模言語モデルの活用展開について述べる。

自然言語処理の基礎知識
文書の分類/判定の進め方
1. 古典的手法
2. BERT
文章生成の汎用的な大規模言語モデル
1. 大規模言語モデル
2. GPT-3の登場
3. ChatGPT
4. プロンプトエンジニアリング
5. 生成AIのガイドライン
6. 文章生成の汎用的な大規模言語モデルの活用
自然言語処理のR&D活動への活用事例
1. R&Dにおける自然言語処理の活用事例、よくあるケース
2. 特許調査・分類
3. AIを用いた新規用途・材料探索
4. 生物・化学分野における大規模言語モデルの活用
自然言語処理ツールの活用
1. オープンソース (KHCoderなど)
2. クラウドサービス
自然言語処理のさらなる応用、今後の展望

質疑応答

第2部テキストマイニングによる特許情報解析、先行技術調査への活用

(2023年7月31日 13:00〜14:40)

　最初に特許調査とテキストマイニングの基礎について概観します。各種ツールのテキストマイニング関連機能の活用事例を紹介します。テキストマイニングの特許調査への応用事例を単語・文書のベクトル化、文書分類、文書ベクトルの次元圧縮による特許公報の俯瞰可視化と技術動向調査への応用を紹介します。調査目的に応じたツール・アルゴリズム・特徴量の選択が重要であり、ツールの特徴を把握して使いこなすことが大事です。　最近の大規模言語モデルを使ったAI (GPT、BERT等) とテキストマイニングを連携させることの利点と課題についても紹介します。

はじめに講師自己紹介アジア特許情報研究会紹介
特許調査とテキストマイニングの基礎
1. 調査対象と調査範囲の特定・明確化
2. マッチングと適合
3. 特許調査における再現率 (網羅性) と適合率 (効率)
4. 「完全一致」⇔「最良一致」検索モデルの比較
5. 検索・分類とテキストマイニングの違い
6. テキストマイニングの基本的な仕組み
テキストマイニングの概要と特許調査への応用
1. 商用特許調査ツールのテキストマイニング応用機能
2. 商用・フリーのテキストマイニングツール
テキストマイニング・AI特許調査ツールの活用事例
1. 特許調査ツールへの要求性能
2. 現時点でできること/できないこと、性能レベルなど
3. 商用AI特許調査ツールの活用事例
4. 特許のトレンド分析、競合分析、技術の発展パターン分析
テキストマイニングと大規模言語モデルAI (GPT、BERT等) との連携
1. 自然言語理解能力の向上
2. 大量データの効率的な分析
3. 自動化された情報抽出
4. 洞察の視覚化
5. 大規模言語モデルとの連携時の課題
参考文献

質疑応答

第3部材料科学分野における言語処理技術の応用展望

(2023年7月31日 14:50〜16:30)

　以下のような事柄について、概要を理解していただき、自社で展開する際の参考にしていただく。材料科学分野で自然言語処理技術を利用してどのようなことができるのか、やりたいことを実現するのにどの種類の技術を用いればよいのか、市販ツールがどのような技術を用いているのか、市販ツールを自社カスタマイズする発注の際に言語モデル的に注意すべき点、今後どのようなことができるようになると期待されるか。

概観
1. マテリアルズインフォマティクス
  - 物性値
  - 分子構造
  - 結晶構造
  - 化学構造式
  - 物性名
  - 数式
  - 自然言語
2. 対象とする文書の種類と特徴
  - 論文
  - 特許
  - 書籍
  - 安全・規制に関わる法的文書、社内文書
3. 求められる処理の種類と特徴
  - 文書分類
  - 検索 (目的文書の抽出)
  - 情報の抽出 (文中の特定情報の抽出)
言語処理の種類と活用
1. 統計処理ベース (深層学習を含む)
  - TF-IDE、N-gramなど
  - 単語ベクトル
    - Word2Vec
    - Doc2Vec
  - BERT
    - pre-trainingとfine-tuning
  - ChatGPT
2. 文法ベース
  - 品詞解析
  - 構文解析/照応解析
3. 材料関連分野に特化したモデル
  1. 様々なモデル
    - Word2Vec系
    - Mat2Vec
    - BERT系
      - SciBERT
      - BioBERT
      - BatteryBERT
      - MatSciBERT
      - MatBERT
      - MaterialBERT
  2. モデル利用時の注意点
    - 学習データ
    - 単語辞書
    - モデル計算 (初めからor代入?)
    - 学習条件
    - 検証のデータ
NIMSでの活用事例
1. 超電導データベース
2. PoLyInfoデータベース
3. マテリアルキュレーション支援システム
テキストと数値データの関連付け

質疑応答

複数名同時受講割引について

2名様以上でお申込みの場合、1名あたり 50,000円(税別) / 55,000円(税込) で受講いただけます。
- 1名様でお申し込みの場合 : 1名で 55,000円(税別) / 60,500円(税込)
- 2名様でお申し込みの場合 : 2名で 100,000円(税別) / 110,000円(税込)
- 3名様でお申し込みの場合 : 3名で 150,000円(税別) / 165,000円(税込)
同一法人内による複数名同時申込みのみ適用いたします。
受講券、請求書は、代表者にご郵送いたします。
他の割引は併用できません。

アカデミック割引

1名様あたり 30,000円(税別) / 33,000円(税込)

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

学校教育法にて規定された国、地方公共団体、および学校法人格を有する大学、大学院、短期大学、附属病院、高等専門学校および各種学校の教員、生徒
病院などの医療機関・医療関連機関に勤務する医療従事者
文部科学省、経済産業省が設置した独立行政法人に勤務する研究者。理化学研究所、産業技術総合研究所など
公設試験研究機関。地方公共団体に置かれる試験所、研究センター、技術センターなどの機関で、試験研究および企業支援に関する業務に従事する方

支払名義が企業の場合は対象外とさせていただきます。
企業に属し、大学、公的機関に派遣または出向されている方は対象外とさせていただきます。

ライブ配信セミナーについて

本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
お申し込み前に、視聴環境とテストミーティングへの参加手順をご確認いただき、テストミーティングにて動作確認をお願いいたします。
開催日前に、接続先URL、ミーティングID、パスワードを別途ご連絡いたします。
セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。

自然言語処理の導入と研究開発への活用

日時

プログラム

第1部自然言語処理の導入とR&D活動の効率化

第2部テキストマイニングによる特許情報解析、先行技術調査への活用

第3部材料科学分野における言語処理技術の応用展望

受講料

複数名同時受講割引について

アカデミック割引

ライブ配信セミナーについて

自然言語処理の導入と研究開発への活用

日時

プログラム

第1部 自然言語処理の導入とR&D活動の効率化

第2部 テキストマイニングによる特許情報解析、先行技術調査への活用

第3部 材料科学分野における言語処理技術の応用展望

受講料

複数名同時受講割引について

アカデミック割引

ライブ配信セミナーについて

第1部自然言語処理の導入とR&D活動の効率化

第2部テキストマイニングによる特許情報解析、先行技術調査への活用

第3部材料科学分野における言語処理技術の応用展望