音声認識技術 入門講座

再開催を依頼する / 関連するセミナー・出版物を探す
会場 開催

本セミナーでは、Deep Learningによりブレークスルーがもたらされる音声認識技術を基礎から学べます。
「より便利に」「より正確に」活用するための応用事例、最新動向を解説いたします。

日時

開催予定

プログラム

音声認識技術の基礎と、その応用である対話処理を中心に、音声言語処理について解説する。まずは基礎を知り、そのうえで応用システムなどの構築を考えていく。  近年、深層学習に基づくパターン認識技術が急速な進展を見せているのに伴い、音声認識の性能も劇的に進化した。さらには、言語処理などの記号処理の分野にも深層学習は成果を上げており、音声言語というパターンと記号を融合した分野でも進展している。それらの最新技術についても触れる。

  1. 音声生成のメカニズム
    1. 発声器官と音声
      1. 声帯と調音器官
      2. モデルで見る発声
    2. 工学からみた発声器官 – ソース・フィルタモデル -
    3. 発声器官形状推定としての音声認識
  2. 音声認識のための信号処理
    1. 音声の取り込み
      1. 音声のサンプリング
      2. A/D変換
    2. 短時間分析
      1. 窓かけ
      2. 短時間フーリエ変換
    3. 発声器官形状情報の取り出し – スペクトル包絡の推定 -
      1. フィルタ=スペクトル包絡
      2. フィルタバンク分析
      3. メルフィルタバンク分析
    4. MFCC (Mel – Frequency Cepstral Coefficients) の導出
    5. デルタ係数の利用
  3. 隠れマルコフモデル (Hidden Markov Model; HMM) による音声認識
    1. ベクトル量子化
      1. ベクトル量子化と量子化誤差
      2. LBGアルゴリズム
      3. 音声特徴量系列のラベル系列への変換
    2. 離散分布型HMM
      1. HMMとは
      2. HMMによる音声認識
    3. 連続分布型HMM
      1. 離散分布から連続分布へ
      2. 認識アルゴリズムと学習アルゴリズム
    4. 連続音声認識
    5. WFSTによる音声認識システム
  4. 音声認識の最新動向 – Deep Neural Network (DNN) との融合 -
    1. 音声認識におけるDeep Neural Network (DNN)
      1. 特徴抽出器としてのDNN – TANDEM法 -
      2. 出力確率推定器としてのDNN – DNN – HMM法 -
    2. DNN – HMMとGMM – HMMの比較
    3. 音声認識技術の今後の動向 – End – to – end音声認識に向けて -
  5. 音声認識の応用事例 – 過去から将来まで -
    1. 自動車内インタフェース
    2. テレビ字幕制作システム
    3. CALLシステム
    4. 音声検索 – 音声ドキュメント処理 -
    5. 音声対話システム – 一問一答から知的処理まで -
  6. 音声認識・音声対話・音声言語の今後
  7. まとめ

会場

品川区立総合区民会館 きゅりあん
140-0011 東京都 品川区 東大井5丁目18-1
品川区立総合区民会館 きゅりあんの地図

受講料

複数名同時受講の割引特典について