最近、プログラミング言語として、Pythonが注目の的となっています。Pythonは汎用のスクリプト言語で、多くのプログラミング言語の中でも多目的で使用でき、簡単であり、また無料であるという特長があります。Pythonによる統計解析と機械学習は、様々な領域 (医療、画像処理、インフォマティクス、ファイナンス等) に応用されています。システム連携を考慮したデータ分析を目指すのであれば、Pythonは長い目で見て優れたツールといえます。ただしそのためにはプログラミングの知識が必要となります。本講座では統計解析・機械学習に必要なPythonのプログラミングをハンズオンで実施し、講座終了後直ちに皆様の業務に活用できることを主旨としております。
本講座では、先ずPythonの基礎を学びます。初めての方でも、インストール方法含めわかりやすく解説します。次いで、初日は統計解析 (記述統計、推測統計、線形モデルによる予測) 、2日目は機械学習 (分類問題、回帰問題、次元圧縮、クラスター解析) をPythonを使い具体的事例でわかりやすく紹介します。ソースコードも配布しますので、すぐに実践することが可能です。是非この機会に講座への参加をお待ちしております。
第1日目:Pythonによる統計解析
- なぜ今統計解析にPythonか
- 統計解析が重要視される背景
- 統計解析ソフトの選択肢の増大
- プログラミング言語の多様化とPythonの位置づけ
- PythonとRの違い
- Pythonを使うために~PC環境の構築~
- ANACONDAのインストール
- Jupyter Notebookを使う
- Pythonプログラミング入門
- 簡単プログラミング (演算、変数、条件分岐など)
- 基本モジュールとそのインポート (numpyの使い方)
- データを読み込もう (pandasの使い方)
- Pythonによる記述統計
- データを整理してわかりやすく伝えよう
- データを要約する (要約統計量)
- いろいろな要約統計量 (平均値、中央値、標準偏差など)
- 要約統計量をPythonで計算する (pandasとnumpy)
- データを視覚化してわかりやすく伝えよう
- データを視覚化する (散布図、箱ヒゲ図、ヒストグラム)
- 視覚化をPythonで行う (matplotlibとseaborn)
- Pythonによる推測統計
- 統計解析における確率と統計的推測
- 確率の基本を理解しよう (データは確率的に変動する)
- 測定値は正規分布をする (正規分布の特徴)
- 統計的推測 (母集団と標本)
- 大きな集団を推定しよう
- 母集団を推定する (標本の無作為抽出)
- 標準誤差を理解しよう (母平均の推定)
- 95%信頼区間を理解しよう (母平均の推定)
- Pythonを使って95%信頼区間を計算しよう (statistics)
- 差があることを証明しよう
- 仮説検定における仮説の設定 (帰無仮説と対立仮説)
- 2群の平均値の差からp値を求める (t-検定)
- 2群の有効率の差からp値を求める (カイ2乗検定)
- 多群の群間差からp値を求める (分散分析)
- Pythonを使って仮説検定を行ってみよう (numpy)
- Pythonを用いた線形モデルによる予測
- 直線回帰分析 (直線的予測)
- 重回帰分析 (説明変数が複数ある場合の予測)
- ロジスティック回帰分析 (2値の予測)
- Pythonでモデルによる予測をやってみよう (sklearn)
第2日目:Pythonによる機械学習
- Pythonによる機械学習
- 機械学習とは
- Pythonと機械学習
- 環境構築
- OSとフレームワーク
- CPUとGPU
- NumPy
- matplotlib
- scikit-learn
- Jupiter
- 分類問題
- 分類問題とは
- 学習テストとテストセット
- ホールドアウトと交差検証
- k-分割交差検証
- 正答率・適合率・再現率・F値・ROC曲線下面積
- いろいろな分類器
- 決定木
- Random Forest
- AdaBoost
- Naive Bayes
- サポートベクターマシン (SVM)
- 回帰問題
- 回帰問題の基礎
- 最小二乗法
- 線形単回帰
- 線形重回帰
- 次元圧縮
- 次元の呪い
- 過学習
- 情報量規準
- 次元圧縮
- 主成分分析
- 主成分得点・固有値・因子負荷量
- クラスタリング
- 階層的クラスタリング手法
- 最短距離法
- ウォード法
- 非階層的クラスタリング手法
- k-means法
- 自己組織化マップ
- scikit-learnを用いたデータのクラスタリング
- 深層学習
- 機械学習から発展した深層学習
- 畳み込みニューラルネットワーク (CNN)
- 再帰型ニューラルネットワーク (RNN)
- 物体検出
- おわりに
複数名受講割引
- 2名様以上でお申込みの場合、1名あたり 45,000円(税別) / 49,500円(税込) で受講いただけます。
- 1名様でお申し込みの場合 : 1名で 61,750円(税別) / 67,920円(税込)
- 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 99,000円(税込)
- 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 148,500円(税込)
- 同一法人内 (グループ会社でも可) による複数名同時申込みのみ適用いたします。
- 受講券、請求書は、代表者にご郵送いたします。
- 請求書および領収書は1名様ごとに発行可能です。
申込みフォームの通信欄に「請求書1名ごと発行」とご記入ください。
- 他の割引は併用できません。
- サイエンス&テクノロジー社の「2名同時申込みで1名分無料」価格を適用しています。
アカデミー割引
教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。
- 1名様あたり 20,000円(税別) / 22,000円(税込)
- 企業に属している方(出向または派遣の方も含む)は、対象外です。
- お申込み者が大学所属名でも企業名義でお支払いの場合、対象外です。
ライブ配信対応セミナー / アーカイブ配信対応セミナー
ライブ配信またはアーカイブ配信セミナーのいずれかをご選択いただけます。
ライブ配信セミナーをご希望の場合
- 「Zoom」を使ったライブ配信セミナーとなります。
- お申し込み前に、 視聴環境 と テストミーティングへの参加手順 をご確認いただき、 テストミーティング にて動作確認をお願いいたします。
- 開催日前に、接続先URL、ミーティングID、パスワードを別途ご連絡いたします。
- セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
- セミナー資料は、PDFファイルをダウンロードいただきます。
- タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
- ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
- 講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
- Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。
アーカイブ配信セミナーをご希望の場合
- 「ビデオグ」を使ったアーカイブ配信セミナーとなります。
- 当日のセミナーを、後日にお手元のPCなどからご視聴ができます。
- お申し込み前に、 視聴環境 をご確認いただき、 視聴テスト にて動作確認をお願いいたします。
- 後日(開催終了後から10日以内を目途)に、ID,パスワードをメールにてご連絡申し上げます。
- 視聴期間は10日間です。ご視聴いただけなかった場合でも期間延長いたしませんのでご注意ください。
- セミナー資料は、PDFファイルをダウンロードいただきます。
- ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
- ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
- 講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。