@misc{oai:uec.repo.nii.ac.jp:00010242,
 author = {Wu, Xiaoting},
 month = {2022-05-02},
 note = {2021, 近年コンピュータ技術の進展や膨大な音声データの集積などに伴い、音声認識の実用化に向けた研究が加速している。音声認識では、認識をするための特徴量としてケプストラム領域の特徴量であるメル周波数ケプストラム係数(Mel-Frequency Cepstral Coefficients:MFCC)を用いるのが一般的である。しかし、現在組み込みシステムの音声MFCCを抽出するプロセスにおいて、大半の時間が高速 フーリエ変換(Fast Fourier Transform:FFT)に使用され、システムのリアルタイム性と消費電力に影響が大きいと考えられる。
本研究では、RISC-Vベースのマイクロコントローラを使用し、Field Programmable Gate Array(以下 FPGA)に実装されるFFTアクセラレータを提案しする。アクセラレータの原理として、通常のFFTアルゴリズムで行う浮動小数点演算を整数に置き換え、ハードウェア回路に実装することで処理速度の向上が期待できる。RISC-V Rocketのマイクロコントローラを評価ボードFPGAに実装し、長さが異なる3種類の音声サンプルデータに対してアナログ・デジタル変換(ADC)、フィルタリング、窓関数処理、FFT、およびメル特徴抽出の流れで処理を行った。そして、FFTの処理において、浮動小数点演算FFT処理と整数演算FFT処理を実装したハードウェアFFTで実験を行い、実行時間とハードウェアリソース使用率を比較した。 
結果として、整数演算FFTアクセラレータの実装により、処理速度が160倍以上に向上した。MFCC全体的な抽出パフォーマンスが20.7%向上した。ハードウェアリソース使用率として、マイクロプロセッサはSystem on Chip (SoC)の19%を占め、DDR3コントローラーとFFTアクセラレータは、それぞれ59%と16%のリソースを占めた。FFT1024、FFT512、FFT256はRISC-Vプロセッサのハードウェアリソース使 用率よりそれぞれ16%、57%、77%と少なった。 
浮動小数点演算を整数演算に置き換え、そしてハードウェア化によって効率が大幅に向上することができた。今後の展望として、メル特徴抽出処理の整数演算の置き換え及びハードウェア化の課題は将来の最適化方向になると期待できる。},
 title = {FFTアクセラレーションを活用したRISC-Vベースの音声認識に関する研究},
 year = {}
}