@misc{oai:uec.repo.nii.ac.jp:00010242, author = {Wu, Xiaoting}, month = {2022-05-02}, note = {2021, 近年コンピュータ技術の進展や膨大な音声データの集積などに伴い、音声認識の実用化に向けた研究が加速している。音声認識では、認識をするための特徴量としてケプストラム領域の特徴量であるメル周波数ケプストラム係数(Mel-Frequency Cepstral Coefficients:MFCC)を用いるのが一般的である。しかし、現在組み込みシステムの音声MFCCを抽出するプロセスにおいて、大半の時間が高速 フーリエ変換(Fast Fourier Transform:FFT)に使用され、システムのリアルタイム性と消費電力に影響が大きいと考えられる。 本研究では、RISC-Vベースのマイクロコントローラを使用し、Field Programmable Gate Array(以下 FPGA)に実装されるFFTアクセラレータを提案しする。アクセラレータの原理として、通常のFFTアルゴリズムで行う浮動小数点演算を整数に置き換え、ハードウェア回路に実装することで処理速度の向上が期待できる。RISC-V Rocketのマイクロコントローラを評価ボードFPGAに実装し、長さが異なる3種類の音声サンプルデータに対してアナログ・デジタル変換(ADC)、フィルタリング、窓関数処理、FFT、およびメル特徴抽出の流れで処理を行った。そして、FFTの処理において、浮動小数点演算FFT処理と整数演算FFT処理を実装したハードウェアFFTで実験を行い、実行時間とハードウェアリソース使用率を比較した。 結果として、整数演算FFTアクセラレータの実装により、処理速度が160倍以上に向上した。MFCC全体的な抽出パフォーマンスが20.7%向上した。ハードウェアリソース使用率として、マイクロプロセッサはSystem on Chip (SoC)の19%を占め、DDR3コントローラーとFFTアクセラレータは、それぞれ59%と16%のリソースを占めた。FFT1024、FFT512、FFT256はRISC-Vプロセッサのハードウェアリソース使 用率よりそれぞれ16%、57%、77%と少なった。 浮動小数点演算を整数演算に置き換え、そしてハードウェア化によって効率が大幅に向上することができた。今後の展望として、メル特徴抽出処理の整数演算の置き換え及びハードウェア化の課題は将来の最適化方向になると期待できる。}, title = {FFTアクセラレーションを活用したRISC-Vベースの音声認識に関する研究}, year = {} }