本セミナーでは、データサイエンスや人工知能のためのデータ分析において欠かせないデータの前処理技術についてレクチャー、実演をメインに行います。自らGoogle Colaboratory環境上でサンプルコードを動かすことで実践的な前処理技術を習得することが目標です。
Google Colaboratory上にはじめからインストールされている数値計算、機械学習ライブラリ、深層学習フレームワークは、大変便利で実用的です。しかし、市販の参考書を片手に整理整頓された教科書的なデータを分析するだけでデータサイエンスやAIを理解した気になっていると、実際の業務において、一筋縄ではいかないデータに直面した時、何をどうしてよいのかわからずに思考停止に陥るのではないでしょうか。データサイエンスやAIを一から学びたい人、仕事で使用するためにとにかく手っ取り早く手を動かしながらコツをつかみたい人、ご心配はご無用です。
このセミナーでは、困ったときに参考になる実用的な前処理用のサンプルコードを豊富に準備しています。また、講師の研究経験から、データ前処理だけでなく有用なデータ収集の困難さやその極意、上手くいかないときのチューニングのノウハウなども伝授したいと思います。
- はじめに「AI・機械学習における前処理」
- 準備
- Google ColaboratoryによるPython実行環境と便利な使い方
- NumPy, pandas による数値データの処理
- scikit-learnを用いた簡単な機械学習
- matplotlibによる可視化の基本
- Tensorflow, Keras を用いた深層学習の基本
- 基本的な前処理
- 標準化と正規化、ビニング
- 外れ値や欠損値にどのように対処するか
- 特徴選択・次元削減と可視化
- 機械学習を使わない統計的な方法 … フィルタ法
- 機械学習による効果的な方法 … ラッパ法
- 機械学習アルゴリズムに組み込んで利用する … 正則化
- 線形次元削減と非線形次元削減
- 高度な前処理
- カテゴリカルデータから数値データへの変換
- バランスの悪いデータにいかに対処するか
- 時系列データ処理の基本
- テキストデータの前処理
- テキスト抽出、分かち書きと形態素解析
- 単語分散表現、トピックモデリング
- ニューラルネットワークによる文書分類
- 最新の言語モデル動向
- 画像データ、音声・音楽データにおける前処理
- 畳み込みニューラルネットワークの基本
- データ不足をデータ拡張で補う
- ファインチューニングによる画像分類モデルの構築
- 音声・音楽データの基本と前処理手法
案内割引・複数名同時申込割引について
R&D支援センターからの案内登録をご希望の方は、割引特典を受けられます。
案内および割引をご希望される方は、お申込みの際、「案内の希望 (割引適用)」の欄から案内方法をご選択ください。
「案内の希望」をご選択いただいた場合、1名様 40,000円(税別) / 44,000円(税込) で受講いただけます。
複数名で同時に申込いただいた場合、1名様につき 25,000円(税別) / 27,500円(税込) で受講いただけます。
- R&D支援センターからの案内を希望する方
- 1名様でお申し込みの場合 : 1名で 40,000円(税別) / 44,000円(税込)
- 2名様でお申し込みの場合 : 2名で 50,000円(税別) / 55,000円(税込)
- 3名様でお申し込みの場合 : 3名で 75,000円(税別) / 82,500円(税込)
- R&D支援センターからの案内を希望しない方
- 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)
- 2名様でお申し込みの場合 : 2名で 100,000円(税別) / 110,000円(税込)
- 3名様でお申し込みの場合 : 3名で 150,000円(税別) / 165,000円(税込)
アーカイブ配信セミナー
- 当日のセミナーを、後日にお手元のPCやスマホ・タブレッドなどからご視聴・学習することができます。
- 配信開始となりましたら、改めてメールでご案内いたします。
- 視聴サイトにログインしていただき、ご視聴いただきます。
- 視聴期間は2024年9月13日〜24日を予定しております。
ご視聴いただけなかった場合でも期間延長いたしませんのでご注意ください。
- セミナー資料は別途、送付いたします。