近年、人工知能や機械学習が注目を集めていますが、技術的な大変化が突然起こったのではなく、過去の研究成果の積み重ねによって深層学習などの新しいモデルが誕生しました。つまりホットな技術を活用するためにも、基礎的な周辺知識は重要です。
そこで今回のセミナーでは「時系列データ」を対象にし、データの個性を定量化する統計的分析や、数式として表現する時系列モデルを多数紹介します。更にこれらの応用として「将来予測」や「異常検知」に着眼し、より高度な機械学習モデルを取り入れつつ、実務への応用をサポートします。
本セミナーでは図解による分かり易さを重視しますが、その解説のみに終始せず、フリーソフトPythonやRによる実践方法も多数紹介します。全てのプログラムを配布しますので、復習やお仕事にご活用いただけます。
- 時系列データの特徴を調べる (統計的分析)
- ランダムか?法則的か?
- 確率論的モデルと決定論的モデル
- その判別方法 (法則性の可視化)
- 過去は未来に影響するか?
- 相関性と非独立性 (非線形相関) の違い
- 非独立性の確認 (連検定,BDSテスト,相互情報量)
- 相関性の確認 (相関係数,自己相関関数)
- 疑似相関に注意 (偏相関係数)
- 偏自己相関関数
- 他から影響を受けるか?
- 同時刻の関係 (相関性と非独立性の違い)
- 時間遅れを伴う関係 (相関性と因果性の違い)
- 相関性の確認 (相互相関関数)
- 因果性の確認 (移動エントロピー,グランジャー因果テスト)
- 時系列データの変動パターンを数式で表現する (時系列モデル)
- ランダムウォーク
- 確率的トレンドと確定的トレンド
- 定常性と非定常性
- 定常化と単位根検定
- トレンド成分と季節成分の分解
- 平均値 (期待値) の推定
- AR (自己回帰) モデル
- 過学習を防ぐAIC (赤池情報量基準)
- ARMA (自己回帰移動平均) モデル
- ARIMA (自己回帰和分移動平均) モデル
- SARIMA (季節自己回帰和分移動平均) モデル
- 残差診断
- 分散値 (リスク) の推定
- ARCHモデル
- GARCHモデル
- ARIMA – GARCHモデル
- 将来予測への応用
- モンテカルロシミュレーションによる長期予測
- 残差の時間構造も考慮する方法
- 異常検知への応用
- 予測モデルを使う方法
- 予測モデルを使わない方法
- 機械学習で学習力を強化する (非線形モデル)
- 線形モデルと非線形モデルの違い
- 重回帰分析から「非線形重回帰分析」へ
- 最も手軽なのに高性能な「k近傍法」
- 機械学習の失敗につながる「次元の呪い」
- 交差確認法 (CV法)
- モデルパラメータとハイパーバラメータの違い
- ニューラルネットワーク
- 単一ニューロンモデルの学習則 (最急勾配法)
- ニューラルネットワークの学習則 (逆誤差伝搬法)
- 多層ニューラルネットの問題点 (勾配消失問題,過学習)
- 深層学習 (ディープラーニング) を可能にしたオートエンコーダ
- 決定木
- 因果関係が分かりやすいIf – Thenルール
- 情報エントロピーを低下させる
- 集団学習
- 多数決で予測精度を向上させる (集合知)
- 予測精度が向上する理由 (集合知定理)
- いろいろな集団学習
- 機械学習による異常検知
- k近傍法の場合
- 決定木の場合
- ニューラルネットワークの場合
- 付録資料
- フリーソフトPythonの基本操作ガイド
- フリーソフトRの基本操作ガイド
- PythonとRの連携方法