機械学習の効果的活用に必要なデータ前処理の基礎と実践ノウハウ

再開催を依頼する / 関連するセミナー・出版物を探す
会場 開催

日時

開催予定

プログラム

データ活用を検討するとき、まずモデリングの技術 (機械学習アルゴリズム) に目がいきがちです。モデル作成のためにアルゴリズムの知識は必要です。しかし、現場でデータに向き合い始めると、アルゴリズム以上にデータの前処理が重要であることを実感するでしょう。機械学習を効果的に活用できるかどうかは、データを前処理しどのように特徴量を作成するかにかかっています。  本講演では、データを活用して解決したい問題、データの種類、利用するアルゴリズムなどによって、どのような点に気を付けて前処理をするとよいか、その勘所についてデモを含めて解説します。

  1. はじめに
    1. データ活用の現状
    2. データ分析に必要なスキル
    3. データ分析プロセス
  2. 構造化データの前処理
    1. 統計量の確認
    2. 可視化
    3. 欠損値や外れ値の処理
    4. 数値データの処理
    5. カテゴリデータの処理
  3. 非構造化データ (画像) の前処理
    1. カラーチャンネルの変更
    2. ヒストグラムによる特徴量作成
    3. 画像の水増し
  4. 非構造化データ (時系列) の前処理
    1. 時間軸の作成
    2. スライド窓による特徴量作成
    3. 目的変数の作成
  5. 非構造化データ (自然言語) の前処理
    1. 形態素解析・分かち書き処理
    2. 単語文書行列による特徴量作成
    3. 共起語リストによる特徴量作成
  6. おわりに

会場

ビジョンセンター浜松町
105-0013 東京都 港区 浜松町2-8-14
ビジョンセンター浜松町の地図

受講料

複数名同時受講の割引特典について