講師は、専門の研究者ではなく、システム開発者なので、とにかく実践で使えることを第一に考えています。そのため、下記2部構成としています。 1日目は、データ分析の未経験者でもわかるように可能な限り数式を排して理論とその実践方法を説明します。ここで、大まかにデータ分析、機械学習を理解します。 2日目は、tensorFlow、chainerというメジャーなフレームワークを使用し、Windowsマシンで、実際にデータを操作しながら、ディープラーニングを実施します。
また、サンプルを動かしての解説ではなく、データ分析を、「データ整理」「前処理」「分析」の一連の流れを解説します。
なお、講義で使用したサンプルソース等はdropbox公開フォルダに置きますで、講演後にダウンロードし使用可能です。
- 機械学習/ディープラーニングを行う際に必要なデータ処理の基本 (1日目)
- データの定義
- 扱うデータの特性を把握する
- 時間軸/場所の考慮
- データを発生させるもの
- データの前処理
- データの抜け、異常値への対応
- データの量を調整する (増やす/減らす)
- データの次元を削減する
- ディープラーニングの精度を上げるためにどのようなデータを用意するか?
- 必要となるデータの量
- データクレジング
- フレームワークでの処理
- サンプルデータの説明
- デモで使用するサンプルデータの説明
- 機械学習/ディープラーニングの数理・確率論
~対象物を数値情報へ変換する~
- 分布
- 次元とベクトル
- 画像を数値情報へ変換する
- 言語を数値情報へ変換する
- 音を数値情報へ変換する
- 状態を数値情報へ変換する
- 機械学習の基礎と実践
- 機械学習の基本
- データがモデルをつくる
- 学習結果をどう受け取るべきか
- 学習の種類
- 教師あり学習の基本
- 教師なし学習の基本
- 強化学習の基本
- 結果の分類
- 回帰
- クラス分類
- Windowsで機械学習環境をオープンソースにて構築
- 使用可能なオープンソース一覧
- Pythonの設定 (Windows10端末の例)
- サンプルデータを機械学習で処理
- Pythonを実行し結果を得る
- 機械学習のプログラム解説
- ディープラーニングの基礎と実践 (2日目)
- 機械学習とディープラーニングの違いは?
- ディープニューラルネットワークとは
- 把握すべきディープニューラルネットワークの特性
- ディープラーニングを分類し、その特徴を把握する
- 畳み込みニューラルネットワーク CNN (Convolutional Neural Network)
- 再帰型ニューラルネットワーク RNN (Recurrent Neural Network)
- 強化学習 (Deep Q – learning)
- Windowsでディープラーニング環境をオープンソースにて構築
- TensorFlow
- Chainer
- サンプルデータをディープラーニングで処理
- TensorFlowで動かし結果を得る
- Chainerで動かし結果を得る
- ディープラーニングのプログラム解説
- TensorFlowの解説
- Chainerの解説
- 解析結果の考察とチューニング
- TensorFlow
- Chainer
- 精度を上げるためにいかにパラメータを最適化するか?
- 過学習の判断基準
- その他、実践にあたり注意すべきこと
- データ分析の手順のまとめ
- データ整理・前処理
- 様々な整理手法
- 「教師なしデータ」から「教師ありデータ」へ
- 機械学習・ディープラーニングによる解析
- どの手法を選択するか
- このセミナーだけで終わらせないために
- twitter/ブログを通じた情報の収集
- より高速な環境を求める場合