大量かつ複雑なデータを分析するのに非常に有効な機械学習はビッグデータの花形技術とも称されます。機械学習はEXCELでの対応が難しいため、実際の業務での利用・活用が増えている統計解析フリーソフト「R」を使用します。
本ワークショップでは、データに基づく意思決定を実践できるようになるための統計的機械学習の概要把握から実装までの一通りの知識と技術が身につきます。さらに、関連資料を読み解く際に重要となるキーワードも習得できる貴重な機会になると思います。
実践的な機械学習について基礎から応用までをわかりやすく解説いたします。
実際のビジネスデータを使った具体的な処理を通して、受講生自らRを操作しながら機械学習と統計解析やR言語プログラミングの応用知識/技術を実践的・体感的に理解できます。また、データに基づく意思決定を実践できるようトレーニングします。
データサイエンス・ワークショップでのコーチング経験が豊富な講師2名の体制でインタラクティブに運営します。
ワークショップ当日の内容すべてをカバーするパワーポイント資料とR資料をテキストとして配布します。使用したRは、USBメモリ等に格納してお持ち帰りいただけます。
- 機械学習のための道具
- 機械学習の全体像、位置付け、他の分析手法との関わり
- 機械学習のプロセス:ビジネスの理解~分析~施策~展開
- 道具としてのR言語プログラミング基礎
- 道具としての統計解析基礎とデータの前処理
- 特徴選択と抽出の演習
- 回帰分析
- モンテカルロMC法
- 時系列分析
- ロジスティックス回帰分析
- 尤度・最尤推定
- ベイズ推定
- クロス集計の特徴と方法など
- 機械学習の流れとアルゴリズムの種類
- Rでケース演習しながら学ぶ機械学習の基礎と実践
- 教師あり学習の考え方と実践
- 最小2乗法
- サポートベクターマシンSVM (カーネル法等)
- ナイーブベイズ
- 階層ベイズ
- マルコフ連鎖モンテカルロ法MCMC
- ニューラルネットワーク など
- 演習課題:各種アルゴリズムの実装
- アンサンブル学習の考え方と実践
- ランダムフォレスト
- バギング
- ブースティング
- 教師なし学習の考え方、アプローチの方法と実践
- クラスタリング (k-meansクラスタリング含む) など
- 演習課題:各種アルゴリズムの実装
- 訓練データから学んだ「既知」の特徴に基づく予測モデルの実践
- モデルの構築
- モデルの評価
- 演習課題:
- 過去データを元に該当店舗における購入者の予測を行い、予測精度を示す。
- Rでケース演習しながら学ぶデータサイエンスのための機械学習基礎
- ディープラーニングの実装
- 機械学習とデータマイニング (「未知」データの特徴の発見)
- テキストマイニングのためのパターン認識と機械学習の基礎