FFTアクセラレーションを活用したRISC-Vベースの音声認識に関する研究

Wu, Xiaoting

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

{"_buckets": {"deposit": "6b018ab3-a71a-4e06-9bc2-0362a313753e"}, "_deposit": {"created_by": 13, "id": "10242", "owners": [13], "pid": {"revision_id": 0, "type": "depid", "value": "10242"}, "status": "published"}, "_oai": {"id": "oai:uec.repo.nii.ac.jp:00010242", "sets": ["285"]}, "author_link": ["27226"], "control_number": "10242", "item_10006_date_granted_11": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2022-03-24"}]}, "item_10006_degree_grantor_9": {"attribute_name": "学位授与機関", "attribute_value_mlt": [{"subitem_degreegrantor": [{"subitem_degreegrantor_name": "電気通信大学"}]}]}, "item_10006_degree_name_8": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "修士"}]}, "item_10006_description_10": {"attribute_name": "学位授与年度", "attribute_value_mlt": [{"subitem_description": "2021", "subitem_description_type": "Other"}]}, "item_10006_description_7": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "近年コンピュータ技術の進展や膨大な音声データの集積などに伴い、音声認識の実用化に向けた研究が加速している。音声認識では、認識をするための特徴量としてケプストラム領域の特徴量であるメル周波数ケプストラム係数(Mel-Frequency Cepstral Coefficients:MFCC)を用いるのが一般的である。しかし、現在組み込みシステムの音声MFCCを抽出するプロセスにおいて、大半の時間が高速 フーリエ変換(Fast Fourier Transform:FFT)に使用され、システムのリアルタイム性と消費電力に影響が大きいと考えられる。\n本研究では、RISC-Vベースのマイクロコントローラを使用し、Field Programmable Gate Array(以下 FPGA)に実装されるFFTアクセラレータを提案しする。アクセラレータの原理として、通常のFFTアルゴリズムで行う浮動小数点演算を整数に置き換え、ハードウェア回路に実装することで処理速度の向上が期待できる。RISC-V Rocketのマイクロコントローラを評価ボードFPGAに実装し、長さが異なる3種類の音声サンプルデータに対してアナログ・デジタル変換(ADC)、フィルタリング、窓関数処理、FFT、およびメル特徴抽出の流れで処理を行った。そして、FFTの処理において、浮動小数点演算FFT処理と整数演算FFT処理を実装したハードウェアFFTで実験を行い、実行時間とハードウェアリソース使用率を比較した。 \n結果として、整数演算FFTアクセラレータの実装により、処理速度が160倍以上に向上した。MFCC全体的な抽出パフォーマンスが20.7%向上した。ハードウェアリソース使用率として、マイクロプロセッサはSystem on Chip (SoC)の19%を占め、DDR3コントローラーとFFTアクセラレータは、それぞれ59%と16%のリソースを占めた。FFT1024、FFT512、FFT256はRISC-Vプロセッサのハードウェアリソース使 用率よりそれぞれ16%、57%、77%と少なった。 \n浮動小数点演算を整数演算に置き換え、そしてハードウェア化によって効率が大幅に向上することができた。今後の展望として、メル特徴抽出処理の整数演算の置き換え及びハードウェア化の課題は将来の最適化方向になると期待できる。", "subitem_description_type": "Abstract"}]}, "item_10006_text_22": {"attribute_name": "専攻", "attribute_value_mlt": [{"subitem_text_value": "情報理工学研究科"}, {"subitem_text_value": "情報・ネットワーク工学専攻"}]}, "item_10006_version_type_18": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_ab4af688f83e57aa", "subitem_version_type": "AM"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "Wu, Xiaoting", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "27226", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2022-05-02"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "2031071.pdf", "filesize": [{"value": "2.2 MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 2200000.0, "url": {"label": "2031071.pdf", "url": "https://uec.repo.nii.ac.jp/record/10242/files/2031071.pdf"}, "version_id": "0e3dbfd4-fcf0-4ea1-acf6-5c103e721a68"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "thesis", "resourceuri": "http://purl.org/coar/resource_type/c_46ec"}]}, "item_title": "FFTアクセラレーションを活用したRISC-Vベースの音声認識に関する研究", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "FFTアクセラレーションを活用したRISC-Vベースの音声認識に関する研究", "subitem_title_language": "ja"}]}, "item_type_id": "10006", "owner": "13", "path": ["285"], "permalink_uri": "https://uec.repo.nii.ac.jp/records/10242", "pubdate": {"attribute_name": "PubDate", "attribute_value": "2022-05-02"}, "publish_date": "2022-05-02", "publish_status": "0", "recid": "10242", "relation": {}, "relation_version_is_last": true, "title": ["FFTアクセラレーションを活用したRISC-Vベースの音声認識に関する研究"], "weko_shared_id": -1}

FFTアクセラレーションを活用したRISC-Vベースの音声認識に関する研究

https://uec.repo.nii.ac.jp/records/10242

名前 / ファイル	ライセンス	アクション
2031071.pdf (2.2 MB)

Item type

学位論文 / Thesis or Dissertation(1)

公開日

2022-05-02

タイトル

言語

タイトル

FFTアクセラレーションを活用したRISC-Vベースの音声認識に関する研究

言語

jpn

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_46ec

資源タイプ

thesis

著者

Wu, Xiaoting

抄録

内容記述タイプ

Abstract

内容記述

近年コンピュータ技術の進展や膨大な音声データの集積などに伴い、音声認識の実用化に向けた研究が加速している。音声認識では、認識をするための特徴量としてケプストラム領域の特徴量であるメル周波数ケプストラム係数(Mel-Frequency Cepstral Coefficients:MFCC)を用いるのが一般的である。しかし、現在組み込みシステムの音声MFCCを抽出するプロセスにおいて、大半の時間が高速フーリエ変換(Fast Fourier Transform:FFT)に使用され、システムのリアルタイム性と消費電力に影響が大きいと考えられる。
本研究では、RISC-Vベースのマイクロコントローラを使用し、Field Programmable Gate Array(以下 FPGA)に実装されるFFTアクセラレータを提案しする。アクセラレータの原理として、通常のFFTアルゴリズムで行う浮動小数点演算を整数に置き換え、ハードウェア回路に実装することで処理速度の向上が期待できる。RISC-V Rocketのマイクロコントローラを評価ボードFPGAに実装し、長さが異なる3種類の音声サンプルデータに対してアナログ・デジタル変換(ADC)、フィルタリング、窓関数処理、FFT、およびメル特徴抽出の流れで処理を行った。そして、FFTの処理において、浮動小数点演算FFT処理と整数演算FFT処理を実装したハードウェアFFTで実験を行い、実行時間とハードウェアリソース使用率を比較した。
結果として、整数演算FFTアクセラレータの実装により、処理速度が160倍以上に向上した。MFCC全体的な抽出パフォーマンスが20.7%向上した。ハードウェアリソース使用率として、マイクロプロセッサはSystem on Chip (SoC)の19%を占め、DDR3コントローラーとFFTアクセラレータは、それぞれ59%と16%のリソースを占めた。FFT1024、FFT512、FFT256はRISC-Vプロセッサのハードウェアリソース使用率よりそれぞれ16%、57%、77%と少なった。
浮動小数点演算を整数演算に置き換え、そしてハードウェア化によって効率が大幅に向上することができた。今後の展望として、メル特徴抽出処理の整数演算の置き換え及びハードウェア化の課題は将来の最適化方向になると期待できる。

学位名

修士

学位授与機関

学位授与機関名

電気通信大学

学位授与年度

内容記述タイプ

Other

内容記述

2021

学位授与年月日

2022-03-24

著者版フラグ

出版タイプ

出版タイプResource

http://purl.org/coar/version/c_ab4af688f83e57aa

専攻

情報理工学研究科

専攻

情報・ネットワーク工学専攻

戻る

views

See details

	Views

Versions

Ver.1

2023-05-15 09:26:30.225959

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

FFTアクセラレーションを活用したRISC-Vベースの音声認識に関する研究

× Wu, Xiaoting

Versions

Share

Cite as

エクスポート