近年、人工知能や機械学習が注目を集めていますが、技術的な大変化が突然起こったのではなく、過去の研究成果の積み重ねによって深層学習などの新しいモデルが誕生しました。つまりホットな技術を活用するためにも、基礎的な周辺知識は重要です。
そこで、本セミナーでは「時系列データ」を対象にし、データの個性を定量化する統計的指標や、数式として表現する時系列モデルを多数紹介します。更にこれらの応用として「将来予測」や「異常検知」に着眼し、より高度な機械学習モデルを取り入れつつ、実務への応用をサポートします。
本セミナーでは図解による分かり易さを重視しますが、その解説のみに終始せず、フリーソフトRやPythonによる実践方法も多数紹介します。これらのプログラムは全て配布しますので、復習やご自身の業務にご活用いただけます。
- 時系列データの特徴を調べる
- ランダムか?法則的か?
- 確率論的モデルと決定論的モデル
- その判別方法 (法則性の可視化)
- 過去は未来に影響するか?
- 相関性と非独立性 (非線形相関) の違い
- 非独立性の確認 (連検定、BDSテスト、相互情報量)
- 相関性の確認 (相関係数、自己相関関数)
- 疑似相関に注意 (偏相関係数)
- 偏自己相関関数
- 他から影響を受けるか?
- 同時刻の関係 (相関性と非独立性の違い)
- 時間遅れを伴う関係 (相関性と因果性の違い)
- 相関性の確認 (相互相関関数)
- 因果性の確認 (グランジャー因果テスト、移動エントロピー)
- 様々な時系列モデル
- 定常モデル
- AR (自己回帰) モデル
- ARMA (自己回帰移動平均) モデル
- ARIMA (自己回帰和分移動平均) モデル
- 過学習を防ぐAIC (赤池情報量基準)
- 残差診断
- 非定常モデル (分散変動モデル)
- ARCH モデル
- GARCH モデル
- AR – GARCH モデル
- モンテカルロシミュレーションによる長期予測
- 異常検知への応用
- 機械学習による時系列データの非線形予測モデル
- 線形モデルと非線形の違い
- 重回帰分析から「非線形重回帰分析」へ
- 最も手軽なのに高性能な「k近傍法」
- 機械学習の失敗につながる「次元の呪い」
- 交差確認法 (CV法)
- ニューラルネットワーク
- 期待と失望の歴史
- 近傍点の隙間を滑らかに埋める
- 深層学習 (ディープラーニング) へ発展
- 決定木
- 因果関係が分かりやすいIf – Thenルール
- 情報エントロピーを低下させる
- 集団学習
- 多数決で予測精度を向上させる
- 予測精度が向上する理由 (集合知定理)
- いろいろな集団学習
- バイアス・バリアンス分解
- バギング、ランダムフォレストの活用事例
- 付録資料
- Rの基本操作ガイド
- Pythonの基本操作ガイド
- RとPythonを連携して使うテクニック