雑音補正LPC 分析を用いたRNPM による単語音 声認識
範頴, 高橋康博, 呂建明, 関屋大雄, 谷萩隆嗣
2007年電子情報通信学会総合大会, vol.D-14-1, pp.137, Mar., 2007. [pdf document]

<Abstract>

音声認識は音声処理において重要な研究課題の一つで ある。近年、ニューラルネットワークを用いた単語音声 認識システムの一つとしてリカレントニューラル予測モ デル(recurrent neural prediction model;RNPM)を用 いたシステムが提案されている[1]。RNPM では、まず LPC(linear prediction coding)分析を用いて音声の特 徴ベクトルを生成する。次に、得られた音声の特徴ベク トルをVSRN +(very simple recurrent neural network plus)を用いて認識を行う。VSRN+は隠れ層と出力層 に自己フィードバック構造があるため、高い時系列処理 能力を持つ。故に、高い認識率が得ることができる。し かし、雑音環境下ではLPC 分析の精度が劣化するため、 正確な音声の特徴ベクトルが生成できない。これにより、 認識率が低下してしまう問題点がある。そのため、実環 境への応用を考えた場合、雑音環境下での認識率の向上 は重要な研究課題である。  一方、雑音環境下においても正確なLPC 分析が行え る方法として雑音補正LPC 分析[2] が提案されている。 この手法は音声信号の自己相関関数から雑音のパワー を調節しつつ、繰り返しLevinson-Durbin 法を適用する ことで、線形予測係数を推定する手法である。雑音補正 LPC 分析法を用いることで、特徴ベクトルを抽出する 時点で雑音の影響を抑止できると考えられる。