材料・医薬品の効率的な開発のためのケモインフォマティクス・マテリアルズインフォマティクスに基づく実践的な機械学習入門

再開催を依頼する / 関連するセミナー・出版物を探す
会場・オンライン同時 開催

日時

中止

プログラム

昨今、物理学・化学・生物学の様々なデータが膨大に蓄積され、そのような自然科学データに対する機械学習技術の応用と成功が注目されています。  本セミナーでは、材料・医薬品をより効率的に開発するための、ケモインフォマティクス・マテリアルズインフォマティクスに基づく、実践的な機械学習について紹介します。主に適切なイシューの立て方、徹底的なデータ分析、そして機械学習の限界などについて、個々の詳細ではなく、実践に特化したアプローチを紹介します。特に具体例を交えながら、企業の抱える課題 (データの数や多様性が少ない、どのようにデータを集めイシューを洗練させるか、機械学習の予測精度ではなく結果の解釈を考えたい等) について、講演者の研究開発の経験を交えながら講義します。

  1. 機械学習を始める前に (90分)
    1. イシューからはじめよ
      1. 機械学習とデータ分析以前に行うべき、問題・課題・目的の明確化
      2. ケモインフォマティクス・マテリアルズインフォマティクスにおけるイシュー
      3. ビッグデータの落とし穴 〜たくさんデータがあればいいわけではない〜
      4. 機械学習の落とし穴 〜精度が高ければいいわけではない〜
      5. イシューからはじめよ
      6. 様々なイシューの具体例
    2. データ分析の基礎と徹底
      1. 化合物の特徴量の例
      2. 相関分析・頻度分析 〜シンプルな分析でイシューの大枠を把握する〜
      3. 交差項・相互作用分析 〜非線形な分析でイシューに深く切り込む〜
      4. 様々な特徴量を用いた重回帰分析
      5. 重回帰分析における多重共線性の罠
      6. 重回帰分析における解釈の罠
  2. 化合物データのための機械学習手法 (90分)
    1. 機械学習の基礎
      1. 機械学習における訓練データとテストデータの準備
      2. 特徴量の事前チェックと外挿
      3. 線形回帰の基礎
      4. 様々な特徴量を用いた線形回帰
      5. 非線形回帰の基礎
      6. 回帰モデルの安定性 〜多重共線性と過学習〜
    2. 様々な回帰モデル
      1. 多重共線性を抑えるためのリッジ回帰
      2. 過学習を防ぎ変数選択をするためのラッソ回帰
      3. 主成分分析 (PCA) による多重共線性の回避と変数独立化
      4. 変数増加法
      5. 変数増加法と変数減少法の利点と欠点
      6. 回帰モデルの使い分け
  3. 回帰モデルの解釈と機械学習の実践 (90分)
    1. 回帰モデルの解釈
      1. 回帰係数の意味
      2. 変数選択の解釈
      3. タカハシメソッドに基づく回帰モデルの応答分析
    2. 機械学習の実践
      1. 医薬品と材料データの特徴量 〜フィンガープリント・物性値・三次元立体構造・量子化学計算〜
      2. 医薬品と材料データの機械学習・深層学習モデル
      3. 例題と演習 (具体的なデータとプログラミングによる実演)
  4. 質疑応答 (30分)

受講料

会場受講の複数名受講割引

オンライン受講割引

アカデミー割引

教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。

会場受講 / アーカイブ配信対応セミナー

会場受講 または オンラインセミナー (アーカイブ配信) のいずれかをご選択いただけます。
お申し込みの際、受講方法の欄にて、会場受講またはオンライン受講をご指定ください。
オンラインセミナーの申込み受付の締切日も、会場受講のセミナー開催日までです。ご注意ください。​

オンラインセミナーをご選択の場合、以下の流れ・受講内容となります。
※会場で受講の場合、このサービスは付与されませんのでご注意ください。