WEKO3
アイテム
{"_buckets": {"deposit": "c7a52a4f-d342-4306-8e1b-33571ff28b09"}, "_deposit": {"created_by": 3, "id": "5015", "owners": [3], "pid": {"revision_id": 0, "type": "depid", "value": "5015"}, "status": "published"}, "_oai": {"id": "oai:uec.repo.nii.ac.jp:00005015", "sets": ["38"]}, "author_link": ["13809"], "control_number": "5015", "item_10006_date_granted_11": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2015-03-25"}]}, "item_10006_degree_grantor_9": {"attribute_name": "学位授与機関", "attribute_value_mlt": [{"subitem_degreegrantor": [{"subitem_degreegrantor_name": "電気通信大学"}]}]}, "item_10006_description_10": {"attribute_name": "学位授与年度", "attribute_value_mlt": [{"subitem_description": "2014", "subitem_description_type": "Other"}]}, "item_10006_description_7": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "IoT(Internet of Things)の進展に伴い,これまで以上に大規模なデータが収集されるようになり,蓄積の速度が上がっている.このようなデータはビッグデータと呼ばれ,それらを高速に扱う新たな仕組みが必要となる.近年,MapReduceを始めとする分散処理を利用して,複数ノードで並列に処理を行う仕組み(並列化)が研究されている. 蓄積された大規模データベースを扱う問題の例として,生物データベースの配列類似性検索問題が挙げられる.配列類似性検索は,多数の塩基配列がレコードとして格納されたデータベースから,クエリ配列の類似文字列を探し出す問題である.文字列を比較する計算は文字列アラインメントと呼ばれる.文字列のアラインメントに用いる検索アルゴリズムとしてBLAST(Basic Local Alignment Search Tool)が主に使われている.しかし,塩基配列を格納したデータベース の規模は年々増加しており,それにともなって検索に要する時間も長大化している.このため,複数ノードによる分散処理で並列にスコアリング計算を行う.分散処理を適用した実装としてmpiBLASTがる.mpiBLASTはMPI(Message-Passing Interface)を用いて処理を並列化することで処理の高速化を図っている.また,計算時間を短縮するため,各ノードに分配するデータ量を一定にし,負荷分散を図っている.こうしたデータの分散はホストPC上のプロセッサとネットワークに高い負荷を掛ける. 本研究では,PCクラスタの各ノードにストレージとネットワークI/Fを搭載するFPGAボードを導入し,これを用いてデータ分割する手法を提案する.FPGAに実装するユーザロジックは,専用ネットワークから入力されるデータについて,ヘッダ情報から格納するデータを選択することで,ホストPCの負荷を上げることなく,データの分散を実現する. est_humanデータベースを対象に評価した結果,ソフトウェアによる同様の処理であるmpiBLAST でのデータ分散と比較して,プロセッサとネットワークの負荷を低く維持したまま,約24~27倍の高速化を確認した.", "subitem_description_type": "Abstract"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "工藤, 龍", "creatorNameLang": "ja"}, {"creatorName": "クドウ, リュウ", "creatorNameLang": "ja-Kana"}], "nameIdentifiers": [{"nameIdentifier": "13809", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2016-09-23"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "1352008.pdf", "filesize": [{"value": "6.1 MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 6100000.0, "url": {"label": "1352008.pdf", "url": "https://uec.repo.nii.ac.jp/record/5015/files/1352008.pdf"}, "version_id": "bc80ef6d-e4db-4581-8aee-e441e8b305ae"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "thesis", "resourceuri": "http://purl.org/coar/resource_type/c_46ec"}]}, "item_title": "複数FPGAボードを用いたビッグデータ分割処理に関する研究", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "複数FPGAボードを用いたビッグデータ分割処理に関する研究", "subitem_title_language": "ja"}]}, "item_type_id": "10006", "owner": "3", "path": ["38"], "permalink_uri": "https://uec.repo.nii.ac.jp/records/5015", "pubdate": {"attribute_name": "PubDate", "attribute_value": "2015-03-25"}, "publish_date": "2015-03-25", "publish_status": "0", "recid": "5015", "relation": {}, "relation_version_is_last": true, "title": ["複数FPGAボードを用いたビッグデータ分割処理に関する研究"], "weko_shared_id": -1}
複数FPGAボードを用いたビッグデータ分割処理に関する研究
https://uec.repo.nii.ac.jp/records/5015
https://uec.repo.nii.ac.jp/records/5015b0463c67-73aa-49c9-8c52-334f4b320bba
名前 / ファイル | ライセンス | アクション |
---|---|---|
1352008.pdf (6.1 MB)
|
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2015-03-25 | |||||
タイトル | ||||||
言語 | ja | |||||
タイトル | 複数FPGAボードを用いたビッグデータ分割処理に関する研究 | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_46ec | |||||
資源タイプ | thesis | |||||
著者 |
工藤, 龍
× 工藤, 龍 |
|||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | IoT(Internet of Things)の進展に伴い,これまで以上に大規模なデータが収集されるようになり,蓄積の速度が上がっている.このようなデータはビッグデータと呼ばれ,それらを高速に扱う新たな仕組みが必要となる.近年,MapReduceを始めとする分散処理を利用して,複数ノードで並列に処理を行う仕組み(並列化)が研究されている. 蓄積された大規模データベースを扱う問題の例として,生物データベースの配列類似性検索問題が挙げられる.配列類似性検索は,多数の塩基配列がレコードとして格納されたデータベースから,クエリ配列の類似文字列を探し出す問題である.文字列を比較する計算は文字列アラインメントと呼ばれる.文字列のアラインメントに用いる検索アルゴリズムとしてBLAST(Basic Local Alignment Search Tool)が主に使われている.しかし,塩基配列を格納したデータベース の規模は年々増加しており,それにともなって検索に要する時間も長大化している.このため,複数ノードによる分散処理で並列にスコアリング計算を行う.分散処理を適用した実装としてmpiBLASTがる.mpiBLASTはMPI(Message-Passing Interface)を用いて処理を並列化することで処理の高速化を図っている.また,計算時間を短縮するため,各ノードに分配するデータ量を一定にし,負荷分散を図っている.こうしたデータの分散はホストPC上のプロセッサとネットワークに高い負荷を掛ける. 本研究では,PCクラスタの各ノードにストレージとネットワークI/Fを搭載するFPGAボードを導入し,これを用いてデータ分割する手法を提案する.FPGAに実装するユーザロジックは,専用ネットワークから入力されるデータについて,ヘッダ情報から格納するデータを選択することで,ホストPCの負荷を上げることなく,データの分散を実現する. est_humanデータベースを対象に評価した結果,ソフトウェアによる同様の処理であるmpiBLAST でのデータ分散と比較して,プロセッサとネットワークの負荷を低く維持したまま,約24~27倍の高速化を確認した. | |||||
学位授与機関 | ||||||
学位授与機関名 | 電気通信大学 | |||||
学位授与年度 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 2014 | |||||
学位授与年月日 | ||||||
学位授与年月日 | 2015-03-25 |