機械学習はデータからパターンを抽出します。その際に重要なことは、以下にデータを加工しパターンを抽出しやすくするか、ということです。どんなにすぐれた機械学習の手法でも、データがそのパターンを<<隠して>>いては、パターンの抽出は非常に難しくなります。データがそのパターンを明示してくれていれば解析は非常に簡単に、早くなります。そのためデータ分析者は、まずデータの加工を学習すべきです。そのための第一歩として、初学者に平易に説明いたします。また、実際にサンプルプログラムで、データ加工の有無による精度の差も確認します。
- 機械学習とは
- 概要
- 学習方法の分類
- 活用する箇所
- ディープラーニングとは
- 概要
- 活用する箇所
- 機械学習のためのデータ準備
- データとは
- 画像・言語、音のデータ化
- 機械学習のプロセスと必要なデータ
- 学習の概要
- パラメータ調整
- データ量
- データ加工
- 前処理と特徴量エンジニアリング
- 前処理の概要
- 特徴量エンジニアリングの概要
- プログラムでの確認
- 前処理の実際
- 特徴量エンジニアリングの例
- 画像での特徴量エンジニアリング
- 音での特徴量エンジニアリング
- 言語での特徴量エンジニアリング
- 特徴量エンジニアリングを活用した場合の差