時系列データ、言語データ、画像データに対する機械学習のための前処理

前処理とは何らかの解析処理を行う前に行う処理のことです。前処理の効果は大きく、以降に続く解析処理の成否を決めているのが、実は、前処理とも言われています。ただ前処理は言葉的には明確ですが、具体的にどういう処理を行うかははっきりしていません。それは前処理自体の入出力が様々だからです。まず前処理の入力は、通常、最初に得られた形でのデータですが、どこから得られたデータなのかでその形態は様々です。また前処理の出力は、その後に続く解析処理への入力になるのですが、その解析処理が多様なので、結果的に前処理の出力も様々です。　本セミナーでは上記の点を踏まえ、解析処理としては機械学習の処理を念頭におき、扱うデータとしては時系列データ、言語データ及び画像データを対象とします。データに対する前処理とは何か、標準的にはどういった処理があるのかを解説します。

時系列データ
- 最初に時系列データ分析の前処理について解説します。時系列データは扱いが難しく、分析対象によってどのような
  前処理が必要なのかは様々です。ここでは一般的に時系列データ分析の前処理として扱われるWindowサイズの調整、データの正規化、変数変換、スムージングについて解説します。また周期性に関する注意も行います。更に時系列データから外れ値 (異常値) を検出・削除する処理は前処理とも捉えられますが、外れ値を検出すること自体が独自のタスクである場合もあります。ここでは時系列データから外れ値検出についても代表的手法を紹介します。
言語データ
- 次に自然言語の機械学習処理のための前処理について解説します。扱う言語は日本語と英語に限定します。日本語の場合、まず問題となるコードの問題について解説します。次に自然言語処理の場合、原始データは通常プレーンな文書ではありません。ここでは原始データがhtml 文書の場合に対象を絞って、それをプレーンな文書に変換する方法について解説します。プレーンな文書が得られた後は句読点の統一や無駄な空白の除去などといった俗に言うクリーニング処理が必要であり、どのような処理があるのか、どうすれば簡単に処理できるかを紹介します。その後に行うべき処理では単語分割です。単語分割についてはほぼできあがった技術ですが、単語数を予め定めるニューラルネットワーク翻訳などではSubword の技術が必要なので、この点について解説します。言語が英語の場合、日本語の場合には生じなかった、大文字と小文字の問題や、語尾変化の問題などがあります。このように英語特有の前処理について解説します。最後に単語列から文書に対する特徴ベクトルを作成する手法について解説します。基本はBag of words モデルと TF – IDF の組み合わせです。また文の埋め込み表現についても解説します。
画像データ
- 最後に画像の機械学習処理のための前処理について解説します。まず画像は様々なフォーマットで保存されていますので、それらファーマットの違いと変換処理について解説します。次に画像のノイズ除去の手法を紹介します。また実際に記録されている画像から物体検出を行いたい場合、閾値処理とフィルター処理を前処理として行うことが重要です。これらの処理について解説します。またディープラーニングで画像を扱うためには、実は、入力画像のサイズの問題が深刻です。これについて解説した後に、サイズの変更方法を述べます。最後に画像の機械学習の精度を改善する Data Augmentation の個々の手法について解説します。

質疑応答

複数名同時受講の割引特典について

2名様以上でお申込みの場合、
1名あたり 20,000円(税別) / 22,000円(税込) で受講いただけます。
- 1名様でお申し込みの場合 : 1名で 38,000円(税別) / 41,800円(税込)
- 2名様でお申し込みの場合 : 2名で 40,000円(税別) / 44,000円(税込)
- 3名様でお申し込みの場合 : 3名で 60,000円(税別) / 66,000円(税込)
同一法人内 (グループ会社でも可) による複数名同時申込みのみ適用いたします。
受講券、請求書は、代表者にご郵送いたします。
請求書および領収書は1名様ごとに発行可能です。
申込みフォームの通信欄に「請求書1名ごと発行」と記入ください。
他の割引は併用できません。

アカデミー割引

教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。

1名様あたり 10,000円(税別) / 11,000円(税込)
企業に属している方(出向または派遣の方も含む)は、対象外です。
お申込み者が大学所属名でも企業名義でお支払いの場合、対象外です。

時系列データ、言語データ、画像データに対する機械学習のための前処理

日時

プログラム

受講料

複数名同時受講の割引特典について

アカデミー割引