スモールデータ解析のすすめ方と実問題解決への応用

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

本セミナーでは、スモールデータの解析の実態と、その方法論、データ収集の考え方を、実例を通じて解説いたします。

日時

開催予定

プログラム

生産現場の操業データや医療データにおいては、測定されている変数の数と比較して統計モデリングに使用可能なデータ量が限られることが多い。通常のモデリングでは正例・負例双方のサンプルが必要となるが、装置故障など稀な事象のデータはなかなか収集が困難であり、医療データにおいては、倫理的な問題から多くの患者から臨床データを収集するのは大きな壁が存在する。このように実世界ではしばしば必要なデータが十分に収集できず、スモールなデータからいかに知識を抽出するのかが重要となる。  本セミナーでは、実例を通じ、スモールデータの解析の実態と、その方法論、データ収集の考え方を講義する。

  1. スモールデータとは
    1. スモールデータの特徴
    2. スモールデータ解析の現状
  2. スモールデータ解析の方法論:次元削減と回帰分析
    1. 主成分分析 (PCA)
      1. PCAとは
      2. 直交展開
      3. PCAの導出
      4. PCAと特異値分解
    2. 最小二乗法
      1. 回帰分析とは
      2. 相関係数の意味
      3. 最小二乗法の導出
      4. 最小二乗法の幾何学的意味
      5. 多重共線性の問題
    3. 部分的最小二乗法 (PLS)
      1. PLSとは
      2. 潜在変数モデル
      3. PLSモデルの導出
      4. NIPALSアルゴリズム
      5. PLSから重回帰モデルへの変換
      6. クロスバリデーションによるパラメータチューニング
  3. スモールデータ解析の方法論:入力変数選択
    1. 入力変数選択とは
    2. スパースモデリング
      1. スパースとは
      2. リッジ回帰
      3. Lasso回帰
      4. エラスティックネットモデル
      5. Group Lasso
    3. 変数クラスタリングによる入力変数選択
      1. スペクトラルクラスタリング
      2. NC法のコンセプト
      3. NCSCアルゴリズムの導出
      4. NCSCを用いた変数クラスタリングと入力変数選択
      5. 製薬プロセスへの応用例
  4. スモールデータ解析の方法論:不均衡データ解析
    1. サンプリング手法
      1. サンプリング手法とは
      2. アンダーサンプリングとオーバーサンプリング
    2. ブースティング
      1. ブースティングとは
      2. AdaBoost
      3. RandomForest
    3. ブースティングとサンプリング手法を組み合わせた不均衡データ解析
      1. 何故,ブースティングとサンプリング手法を組み合わせるか
      2. RUSBoost
      3. HUSDOS – Boost
    4. 不均衡データ解析の大規模検診データへの適用例
  5. スモールデータ解析の方法論:異常検出
    1. 異常検出とは
    2. 多変量統計的プロセス管理 (MSPC)
      1. MPSCとは
      2. T2統計量とQ統計量の幾何学的意味
    3. 自己符号化器 (オートエンコーダー)
    4. 異常検出問題の医療データ解析への応用例
  6. スモールデータの収集・解析の考え方
    1. 必要となるデータの質の問題
    2. データ収集の際の留意点
    3. スモールデータ解析の手法選択

受講料

複数名受講割引

アカデミー割引

教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。

ライブ配信セミナーについて