インフォマティクス実施のための実験データ収集・DB化と少ないデータ対策

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

日時

開催予定

プログラム

第1部 インフォマティクスへの活用を目指した実験データマネジメントとDB構築

(2023年5月19日 10:00〜11:10)

 実験データの活用においては、手元のデータだけではなく、外部データの取得や、能動的にデータを取得するシステムが重要である。近年は、すべてのDBをまとめて構造化する必要はなく、データを収集する手法も多様化しており、複数のDBを関連付けて扱うことができるRDBや、さらにはコストをかけずに、必要時に必要なだけのデータを取得することができる仮想データベース技術も発達している。さらに、自律型実験装置の導入により、人手をかけずに、ロボティクスが能動的にデータを取得する潮流も看過できない。さらには、自然言語処理を活用し、市況情報などとも結び付けて、市場ニーズに見合った製品開発を行うことが重要である。  これらのデータの取得と実験の効率化を結び付け、包括的なデータハーベスティングシステムの構築に向けて概要を説明する。

  1. DBの活用
    1. 実験に必要なデータの取得
    2. DBの種類
    3. 外部データの活用
  2. 実験データマネジメント
    1. マテリアルDXの活用
    2. 自律型実験装置とDBの連携
  3. 新規材料探索
    1. 自然言語処理を活用したデータの可視化
    2. 新規材料探索とマテリアルDXの連携
    3. サプライチェーンを考慮したデータの抽出方法
  4. 実験DBの発展形
    1. 仮想空間上のDB
    2. データハーベスティングシステム

第2部 マテリアルDX基盤におけるデータアーキテクチャ 〜利活用を考慮したデータ構造化の進め方〜

(2023年5月19日 11:20〜12:30)

 データ駆動型研究の進展に伴い、効率的なデータ収集の仕組みが求められている。機械学習等による新規材料を開発するマテリアルズインフォマティックス (MI) では、実験データ等を多角的にデータ収集することが予測モデルの構築や検証において極めて重要である。このようなマテリアル開発におけるデータ駆動型研究のためには、教師データ (学習データ/検証データ) となる計測装置等からのデータおよび、そのデータ構造化の方針を策定しておかなければならない。  物質・材料研究機構では、計測・プロセス技術に特化したデータ構造化の設計指針をもとにICT技術を活用したデータ収集を省人的に進めるDX基盤 (マテリアルDX基盤) を運用している。本セミナーでは、マテリアルDX基盤に必要となるデータ設計 (データアーキテクチャ) の考え方について紹介する。

  1. なぜデータ構造化が必要か – Why -
    • データをとりまく環境の変化
    • データ利活用の研究動向
    • データ収集ができない主な理由
    • 科学技術のデータ収集で直面する三重苦
    • ソリューション: データ構造化とデータ設計
    • データ構造化のポイント
  2. データ構造化で何ができるか – What -
    • データ構造化システムの概要
    • データ構造化のシステムデザイン
    • 機器の分類
    • データ構造化による自動化機能
    • データセットの活用形態例
    • データ構造化のメリット
  3. データ構造化のデータ設計指針 – How -
    • データ構造化のための5D
    • データ利活用におけるデータセットの基本構造
    • 計測分野におけるデータ空間の展開
    • データ取得にかかる負荷 (工数)
    • データ設計の指針
    • データ構造化の開発におけるフロー

第3部 創薬DXにおける研究データのDB化とそのシステム構築

(2023年5月19日 13:20〜14:50)

 演者は、日本たばこ産業株式会社の医薬総合研究所内にある薬物動態研究所 (以下JT薬物動態研究所と記載) においてITの仕事に従事しており、創薬研究のステージでJT薬物動態研究所が実施する各種評価の結果、発生する様々なデータ (創薬ADME評価データ) をDBに登録するシステムを、機械学習ツール「KNIME」を利用して作成して運用している。また、DB登録したデータを検索して可視化・ダウンロードするシステムもKNIMEを用いて構築し、利用してもらっている。  本講演ではJT薬物動態研究所における創薬ADMEデータの管理にKNIME Serverを活用している事例を発表する。また併せてDB登録を含む創薬研究における一般的なKNIMEの利用例についてソフトウェアの実演を通して紹介する。

  1. 日本たばこ産業株式会社 (JT) の医薬事業のご紹介
  2. JT医薬総合研究所における医薬品の研究開発
  3. 創薬研究と薬物動態 (ADME)
  4. 創薬DXにおける創薬ADME評価データの重要性
  5. 評価データのDB化
  6. DB化した評価データの可視化
  7. KNIMEの概要
  8. 創薬研究におけるKNIMEの利用
  9. 製薬企業でのKNIME導入
  10. KNIMEを利用したデータ登録システムのプロセス
  11. データ登録システムに実装している機能の詳細
  12. KNIMEを利用したデータ可視化システム
  13. ソフトウェア (KNIME) を利用した実演 (インフォコム社様)

第4部 ベイズ最適化による少数データでの材料設計

(2023年5月19日 15:00〜16:10)

 企業においてデータ解析を行う際に、データ数が少ない問題に直面することが多い。とりわけ材料分野では、従来にない新しい材料を開発することが必要であり、基本的にはデータがない外挿領域を探索することが必要となる。本講演では、データ数が少ない場合の材料探索の事例としてベイズ最適化の事例をご紹介する。また、その他データ収集・少数データでの解析事例についてもご紹介する。

  1. はじめに
  2. データ解析、マテリアルズインフォマティクスについて
  3. 熱可塑性ポリマー設計の事例紹介
    1. 予測モデル構築
    2. 機械学習と計算科学との比較
    3. ポリマー物性予測と適用限界
    4. ベイズ最適化による少数データでのポリマー設計
  4. その他事例のご紹介

第5部 少ないデータでインフォマティクスを行う際のデータ準備・対応の事例

(2023年5月19日 16:20〜17:30)

 インフォマティクス適用には「大量」のデータが必要とされるが、現実には数十件程度しか使えないことが多い。しかし「大量」とは何だろうか?「少量」であれば、どのようにすれば「役に立つ」のか?そのために必要な技術は何か?これらの疑問への対応方法を、弊社における組成設計の取り組み事例を元に議論する。

  1. はじめに
    • データが「少ない」とは?
    • 少なくなりがちなデータの特徴
  2. 「少ない」データのインフォマティクス事例
    • 組成設計の位置づけ
    • データ前処理とアルゴリズム選択
  3. 発展的な対応方法
    • データを「増やす」アプローチ
    • 「多い」データの活用

受講料

複数名同時受講割引について

アカデミック割引

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

ライブ配信セミナーについて