第1部 雑音に頑強な話者認識技術に向けた深層ニューラルネットワークの応用
(2017年11月8日 10:30~12:10)
雑音環境下での認識技術が最近特に注目を集めている。深層学習を利用する方法の有効性が認知されてきたためであるが、その前に改めて音声と雑音との関係性を考え、 音声強調の必要性を論じる。次に、話者認識問題と特に取り上げ、人間の特徴量として基本周波数の有効利用の必要性を説く。雑音環境下での基本周波数抽出と話者認識の実現について中心的に議論する。最近の研究動向にも最後、言及する予定である。
- 音声と雑音
- 問題設定
- 音声と雑音の性質
- 音声強調技術
- 有力な各種方法
- 相関関数を利用する方法の有効性
- 雑音環境下での話者認識
- 深層学習
- 基本周波数の利用
- 最近の研究動向
第2部 雑音に対してロバスト (頑健) な音声認識の研究開発
(2017年11月8日 12:50〜14:30)
- 音声認識システムの分類と応用例の紹介
- 音声認識システムの普及阻害要因
- 音声認識の原理
- ロバストな音声認識手法
- 加法性雑音の影響とその対策
- 乗法性雑音の影響とその対策
- ハンズフリー音声認識システム
- 音声区間検出
- 未知語・不要語自動棄却
- 開発した音声認識システムの紹介
- 最新の研究成果紹介
第3部 周囲環境に頑健な音声インタフェースの実現に向けた体内伝導音声情報処理
(2017年11月8日 14:40〜16:20)
音声インタフェースを利用する上で、人前での発話自体が躊躇われる、雑音の影響を受けるなど、音声という媒体の特徴に伴う本質的な問題が存在するため、その利便性は周囲の環境に大きく依存する。本講座では、周囲環境に対して頑健な音声インタフェースを実現する枠組みとして、体内伝導音声を活用する技術について述べる。基盤技術を概説するとともに、各種応用技術についても具体例を交えつつ紹介する。
- 音声インタフェースの問題点
- 周囲環境の影響
- 体内伝導音声
- 体内伝導音声の収録
- 体内伝導音声の音響的特徴
- 体内伝導音声強調技術
- 音声変換技術
- 体内伝導音声強調への適用
- 体内伝導音声認識技術
- 音声認識技術
- 体内伝導音声認識への適用
- 空気/体内伝導音声の相補的活用技術
- 空気/体内伝導音声の相補的特徴
- 空気/体内伝導音声情報処理
- まとめと今後の課題