テキストマイニングの仕組みと活用演習

再開催を依頼する / 関連するセミナー・出版物を探す
オンライン 開催

日時

開催予定

プログラム

企業で扱うデータは、数値などで表せる「定量データ」と音声・画像・テキストといった数値以外のデータに大きく分類できます。前者は、その値を集計することで容易に分析することができます。一方、「お客様の声」など回答者が自分の言葉で自由に記述したテキストデータは単純に集計することができません。テキストマイニングは、テキストデータを定量的に分析する手法です。定量的な分析によって、これまで気が付いていなかった知見を得たり、可視化や統計処理によってデータの傾向を明らかにしたり、あるいは既に担当者が気が付いていたような知見であっても、しっかりとした数字の裏付けをもってそれを主張することができるようになります。  本講座では、KH CoderというWindows用のフリーソフトウェアを使用して、テキストマイニングの手法を学びます。また、演習の時間を設けて、与えられたデータ素材のテキストマイニングを実習します。さらに、進んだ学習として、Pythonを用いて単語の分散表現の演習を行います。

  1. 講義・演習 (PTAアンケートデータ)
    • Part 1 : 演習用データについて知る
    • Part 2 : テキストマイニングの仕組みについて知る
    • Part 3 : テキストマイニングツールの導入
    • Part 4 : 分析演習 (1) 統計処理
    • Part 5 : 分析演習 (2) 可視化
    • Part 6 : 分析演習 (3) 知見の取り出し
    • 補足1:ワードクラウド
    • 補足2:分散表現
  2. 演習2 (沖縄観光アンケートデータ)
    1. 各自実習 (KH Coderを使用)
    2. 有志発表
  3. 演習3 (Pythonを使用した分析)
    1. テキストデータの分散表現
    2. テキストデータの分類技術
  4. まとめとディスカッション

演習の留意点など

本セミナーでは「KH Coder」を使用してテキストマイニングの実習を行います。
事前にWindows PCを用意し「KH Coder」をインストールしておいてください。
インストールの方法は事前に配布するスライド資料に掲載されています。
実習に使用するPTAアンケートデータは、この講義の学習の目的以外に使用することはできません。
再配布は致しません。

また、本セミナーでは「Google Colab」を使用してPythonプログラムを実行します。
Googleアカウントの登録が必要となります。
PC上のブラウザからGoogleアカウントでGoogleのサイトにログイン可能なことを確認しておいてください。
詳細はお申し込み後に担当者より、ご連絡させていただきます。

受講料

複数名同時受講割引について

アカデミック割引

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

ライブ配信セミナーについて