データ活用を検討するとき、まずモデリングの技術 (機械学習アルゴリズム) に目がいきがちです。モデル作成のためにアルゴリズムの知識は必要です。しかし、現場でデータに向き合い始めると、アルゴリズム以上にデータの前処理が重要であることを実感するでしょう。機械学習を効果的に活用できるかどうかは、データを前処理しどのように特徴量を作成するかにかかっています。 本講演では、データを活用して解決したい問題、データの種類、利用するアルゴリズムなどによって、どのような点に気を付けて前処理をするとよいか、その勘所についてデモを含めて解説します。