最近、プログラミング言語として、Pythonが注目の的となっています。Pythonは汎用のスクリプト言語で、多くのプログラミング言語の中でも多目的で使用でき、簡単であり、また無料であるという特長があります。
Pythonによる統計解析は、様々な領域 (医療、画像処理、インフォマティクス、ファイナンス等) に応用されています。システム連携を考慮したデータ分析を目指すのであれば、Pythonは長い目で見て優れたツールといえます。但し、そのためにはプログラミングの知識が必要となります。
本講座では統計解析に必要なPythonのプログラミングと実際の統計解析手法 (記述統計、推測統計、線形モデルによる予測) を基礎から解説し、講座終了後直ちに皆様の業務に活用できることを主旨としております。
- なぜ今、統計解析にPythonか
- 統計解析が重要視される背景【データ分析】
- 統計解析ソフトの選択肢の増大【統計ソフトの現状】
- プログラミング言語の多様化とPythonの位置づけ
- PythonとRの違い【両者の特徴】
- Pythonを使うために【PC環境の構築】
- 簡単プログラミング【演算、変数、条件分岐など】
- 基本モジュールとそのインポート【numpyの使い方】
- データを読み込もう【pandasの使い方】
- Pythonによる記述統計
- データを整理してわかりやすく伝えよう
- データを要約する【要約統計量】
- いろいろな要約統計量【平均値、中央値、標準偏差】
- 要約統計量をPythonで計算する【pandasとnumpy】
- データを視覚化してわかりやすく伝えよう
- データを視覚化する【散布図、ヒストグラム】
- 視覚化をPythonで行う【matplotlibとseaborn】
- Pythonによる推測統計
- 統計解析における確率と統計的推測
- 確率の基本を理解しよう【データの確率的変動】
- 測定値は正規分布をする【正規分布の特徴】
- 統計的推測【母集団と標本】
- 大きな集団を推定しよう
- 母集団を推定する【標本の無作為抽出】
- 標準誤差を理解しよう【母平均の推定】
- 95%信頼区間を理解しよう【母平均の推定】
- Pythonを使って95%信頼区間を計算しよう
- 差があることを証明しよう【仮説検定】
- 仮説検定における仮説の設定
- 2群の平均値の差からp値を求める【t – 検定】
- 2群の有効率の差からp値を求める【カイ2乗検定】
- 多群の群間差からp値を求める【分散分析】
- Pythonを使って仮説検定を行ってみよう【numpy】
- Pythonを用いた線形モデルによる予測
- 直線回帰分析【直線的予測】
- 重回帰分析【説明変数が複数ある場合の予測】
- ロジスティック回帰分析【2値の予測】
- Pythonでモデルによる予測をやってみよう