近年、化学・産業においてデータが蓄積されつつあり、そのデータを解析する動きが活発になっている。しかし、実験結果、高機能性材料などの開発データ、化学・産業プラントにおいて様々な製品を製造する際のデータなど、蓄積されたデータを十分に活用しきれていない状況も存在する。
本セミナーでは、そのような化学・産業データの使い方・解析の仕方を基礎から解説する。情報科学・データサイエンスに基づき、データから種々の材料の機能を予測するモデルを構築したり、構築したモデルを活用することで新たな構造・実験条件・材料・装置を設計したりする方法である。さらに、ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクス分野を中心にして豊富な応用事例も紹介する。
- ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクスの基礎知識
- 機械学習・人工知能
- 定量的構造物性相関・定量的構造活性相関
- 化学構造生成
- 分子設計
- 材料設計
- プロセス設計
- プロセス管理
- ケモインフォマティクス
- マテリアルズインフォマティクス
- プロセスインフォマティクス
- 化学・産業データ解析の進め方・活用方法
- データの形式、記述子
- データの前処理
- 標準化
- 変数選択
- スムージング (平滑化)
- データの可視化・低次元化
- 主成分分析 (Principal Component Analysis, PCA)
- Generative Topographic Mapping (GTM)
- 多様体学習
- 可視化の性能を検討するための指標
- クラスタリング
- 階層的クラスタリング
- k平均法 (k – means)
- 混合ガウスモデル (Gaussian Mixture Model, GMM)
- クラス分類
- 線形判別分析 (Linear Discriminant Analysis, LDA)
- 決定木 (Decision Tree, TD)
- ランダムフォレスト (Random Forest, RF)
- サポートベクターマシン (Support Vector Machine, SVM)
- 回帰分析
- 最小二乗法による重回帰分析 (Multiple Linear Regression (MLR) or Ordinary Least Squares (OLS) )
- 部分的最小二乗法 (Partial Least Squares, PLS)
- 決定木 (Decision Tree, DT)
- ランダムフォレスト (Random Forest, RF)
- サポートベクター回帰 (Support Vector Regression, SVR)
- モデルの予測性能の向上
- アンサンブル学習
- 半教師あり学習 (半教師付き学習)
- モデルの適用範囲
- データ範囲
- データ中心からの距離
- データ密度
- アンサンブル学習
- モデルの逆解析
- グリッドサーチ
- サンプリング
- ベイズの定理
- 実行するためのプログラム紹介
- 分子設計・材料設計・プロセス設計・プロセス管理に関する最新の研究事例
- 化学空間の可視化に基づく分子設計
- 定量的構造物性 (活性) 相関モデルの逆解析に基づく分子設計
- 定量的構造物性 (活性) 相関モデルの適用範囲を考慮した分子設計
- 実験計画法による材料設計?目標達成確率に基づく適応的実験計画法?
- シミュレーションとインフォマティクス技術を活用したプロセス設計
- まとめ・質疑応答