ケモインフォマティクスにおけるデータ解析手法とそのコツ・応用事例

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

本セミナーでは、ケモインフォマティクスについて基礎から解説し、データセット作成や、ハイパーパラメータ最適化など、解析をスムーズに行うためのコツ、事例を詳解いたします。

日時

開催予定

プログラム

第1部 記述子の種類と各手法の活用法

(2023年3月7日 9:45〜11:15)

 ケモインフォマティクスの重要なタスクの一つは、化合物を分類するモデルを構築したり、その性能を予測する機械学習モデルを作成することである。これらによってこれまで合成されていなかった新規化合物あるいは既知化合物の中から有望な化合物を計算機上で探索する (=バーチャルスクリーニングを行う) ことが可能となる。分類モデルや定量的な性能予測モデル (回帰モデルと呼ばれる) を構築するためには、目的とする性能に関する参照データのみならず、一つ一つの物質を数値的に記述する「記述子」を準備する必要がある。  本講ではケモインフォマティクス研究で用いられている記述子を紹介するとともに、その特徴や用途について解説する。また、目的に応じて記述子を作成ないしは考案するための戦略について議論する。その一例として、演者が考案した電子状態インフォマティクス記述子について紹介する。また、記述子の実際の応用例を紹介し、記述子の用途・特徴などを紹介する。最後に今後の展望について議論したい。

  1. 記述子とは何か?
  2. 記述子とデータ数の関係
  3. 代表的な記述子とその特徴
  4. 記述子を作る・考案する
  5. 電子状態インフォマティクス記述子
  6. 記述子の応用事例
  7. 今後の展望

第2部 データ解析をスムーズに行うためのデータセット作成の留意点

(2023年3月7日 11:30〜13:00)

 データセットはデータ解析の基盤となるものである。当然のことであるが、いくら優れた解析方法があったとしても、データセットが無ければ何も出来ない。また、解析の目的に適合したデータが豊富にあったとしても、そのデータに不備がないことが必要となる。データに不備がなくても、化学構造式のように取り扱いに注意が必要なデータの場合、最大のパフォーマンスを得るためには適切な化学構造情報の処理が必要となる。  そこで本稿では、化学構造情報の前処理を含めた「データ解析をスムーズに行うためのデータセット作成」における留意点について述べたい。

  1. データ解析の目的を明確にする
  2. どのような実験データを採用するか
  3. 化学構造を含むデータセット作成の留意点
    1. 化学構造データの取り扱い
    2. 化学構造のデータ形式
    3. 化学構造データの前処理 (クリーニング)
    4. 構造データに対するその他の前処理
  4. 測定値 (活性値など) の収集における留意点
    1. 一般的な留意点
    2. 公共のデータベースから活性値を収集する際の留意点
    3. その他の留意点

第3部 ケモインフォマティクスにおけるデータ解析手法と活用事例

(2023年3月7日 14:00〜15:30)

 研究開発の効率化を目指し、ケモインフォマティクスの手法を使って化合物の特性を予測するモデルが注目されており、機械学習をはじめとした人工知能の貢献が期待されている。ライブラリに保管している化合物の構造データだけから、化合物の材料、もしくは薬としての特性を予測することができれば、実験規模を縮小しつつ有効な化合物を選び出すことができるため、研究開発にかかる費用や時間の短縮が見込まれる。  本講演では、機械学習を用いて化合物特性を予測する先端研究とともに、特性の予測を行うための注意点について紹介したい。

  1. ケモインフォマティクスの概要
  2. 特性を予測するとは
  3. 課題の設定
  4. データの前処理
  5. モデルの選択
  6. 精度の評価
  7. 活用事例
  8. インフォマティクスを専門とする研究者の役割

第4部 ハイパーパラメータの最適化の事例

(2023年3月7日 15:45〜17:15)

  1. ハイパーパラメータの最適化の概要
    1. ハイパーパラメータの組み合わせの探索アルゴリズム
    2. MLモデルの学習と評価
    3. MLモデルの選択
    4. ハイパーパラメータの種類
      1. MLモデル構造のハイパーパラメータ
      2. 学習制御のハイパーパラメータ
      3. 最適化技法のハイパーパラメータ
  2. 研究事例におけるハイパーパラメータの調整
    1. 分子活性予測
    2. 量子化学計算の運動エネルギー予測
  3. ハイパーパラメータの自動最適化

受講料

複数名同時受講割引について

アカデミック割引

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

ライブ配信セミナーについて