本セミナーでは、マテリアルズ・インフォマティクスについて基礎から解説し、材料開発に機械学習を応用する際に起こる問題点とその解決策を分かりやすく解説いたします。
(2020年7月14日 10:00〜12:00)
近年、各種スペクトルの取得コストが低くなり大量のデータ取得が可能となった。しかしながら、スペクトル解析のためのデータ処理技術は十分進展しておらず、全てのデータを効率に解析して情報を獲得することが困難であった。講演者は機械学習を用いたスペクトル解析技術を開発することでこの問題に取り組んでいる。 本講演では、機械学習を物質科学に適用する概要をまず解説し、機械学習を用いたスペクトル解析の新技術について、特に「分類」「低次元化」「モデリング」の三つに注目した解説を行う。
(2020年7月14日 12:45〜14:45)
従来のスペクトルデータのデータ解析では、スペクトルから所望の物理量を推定するために、計測したスペクトルについて、予め様々な条件でシミュレーションしたスペクトル、あるいは過去の実験データや文献のスペクトルと目視で見比べ、熟練した人間の判断により、計測されたスペクトルとどれが似ているか判断していた。このため解析結果に研究者の主観や思い込みなどのバイアスが含まれる可能性があり、物理量の推定結果が解析した人間に依存してしまうといった問題が生じる。また、データ解析には人間による判断が必要であるため、場合によってはスペクトル1件の解析に数時間以上を要することもあり、研究における大きな時間的ボトルネックとなっていた。近年、機械学習を用いてスペクトルデータ解析を行う研究が注目されている。 本講演では、機械学習を用いたスペクトルのデータ解析について実例を交えながら基礎から応用まで紹介する。
(2020年7月14日 15:00〜17:30)
近赤外分光 (near-infrared spectroscopy; NIRS) スペクトルから検量線を構築するには、少数の潜在変数で線形回帰モデルを構築できる部分的最小二乗法 (partial least squares; PLS) が用いられることが多い。一般に入力変数の数を増加させるにつれ、検量線のモデル構築用サンプルに対するフィッティング性能は向上するが、推定値と物理的に関係のない波数まで検量線の入力変数として用いると、未知サンプルに対する予測性能は低下する。検量線設計では適切な入力波数の組み合わせを選択する必要があるが、しばしば入力変数選択は試行錯誤に頼らざるを得ないため、負担の大きな作業といえる。 そこで講座では、検量線の予測精度改善および設計効率化のため、システマティックな入力変数選択手法を紹介する。
学校教育法にて規定された国、地方公共団体、および学校法人格を有する大学、大学院の教員、学生に限ります。