WEKO3
アイテム
{"_buckets": {"deposit": "7eda701c-3ae8-4672-9e07-4c1b722cd246"}, "_deposit": {"created_by": 3, "id": "8526", "owners": [3], "pid": {"revision_id": 0, "type": "depid", "value": "8526"}, "status": "published"}, "_oai": {"id": "oai:uec.repo.nii.ac.jp:00008526", "sets": ["10"]}, "author_link": ["23289"], "control_number": "8526", "item_10006_date_granted_11": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2017-03-24"}]}, "item_10006_degree_grantor_9": {"attribute_name": "学位授与機関", "attribute_value_mlt": [{"subitem_degreegrantor": [{"subitem_degreegrantor_name": "電気通信大学"}], "subitem_degreegrantor_identifier": [{"subitem_degreegrantor_identifier_name": "12612", "subitem_degreegrantor_identifier_scheme": "kakenhi"}]}]}, "item_10006_degree_name_8": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "博士(工学)"}]}, "item_10006_description_10": {"attribute_name": "学位授与年度", "attribute_value_mlt": [{"subitem_description": "2016", "subitem_description_type": "Other"}]}, "item_10006_description_7": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "クラウドソーシングはCrowd(群衆) + Sourcing(調達) の造語であり,「企業,組織が,自社もしくはアウトソースの人材により実施していた業務を,よりオープンかつ不特定多数のCrowd(群衆) から人材を集め実施すること」と定義されている.このようなクラウドソーシング技術は,大規模データの解析や構築などを低コストで行うことが可能であり様々な分野や用途で利用されている.しかしその特性上,処理速度の速さや低コストの利点に対して処理結果の精度においては専門家による処理よりも劣るため問題視されており,様々な精度向上手法が研究されている.それらの研究では作業(タスク) を処理する作業者(ワーカー) が不特定多数ということもあり,安易に低品質なワーカーを排除する傾向がある.\n しかし,その利用範囲の拡大に従いワーカーの数も増大しており,将来的にクラウドソーシングにおける作業が社会における一つの就労形態となることが予想される.そのような傾向にあるにもかかわらず,現状のクラウドソーシングではワーカーに対する安易な排除が中心となり,育成や労働環境の改善と言ったサポートが十分であるとは言い難い.これらの問題はクラウドソーシング市場自体の縮小にもつながりかねない.これらの問題に対応するためには,クラウドソーシング運用において通常の労働環境と同様に人材(ワーカー)のマネジメントや育成が重要になってくると予想される.\n 我々はこのようなクラウドソーシングの精度問題において,ワーカーのフィルタリングと教育の二つの手法の組み合わせで対応を行っている.ワーカーのフィルタリングで適材適所な作業環境を用意し,その上で低品質なワーカーを高品質なワーカーへと成長させるべく教育を行う.\n しかし従来のクラウドソーシングサービスでは我々の提唱するフィルタリングや段階的教育を実現するには外部のサービスが提供している機能の範囲では十分ではなく,外部のサービスに新規の機能を追加することも難しいという問題がある.我々はこれらの問題を解決するために,独自のクラウドソーシングシステム(PCSS) を構築し,システム内にて精度向上手法を適用することで問題の解決を試みている.PCSS は2011 年から運用を継続しており,1853 万個のタスクを処理した実績を持っている.\n PCSS におけるワーカーのフィルタリングは事前フィルタリング,動的フィルタリング,結果フィルタリング,推測フィルタリングという4 つの独自のフィルタリングの組み合わせで行われている.その過程でワーカーの各タスクに対する特性の解析を行い,適したタスクのアロケーション,または不適なタスクからの排除などを行う.また,その過程で低品質であることが判明したワーカーに対し,ワーカーがタスクを処理する過程で適切な学習タスクをこなすことで能力を向上させる段階的な学習方式を提案する.このような段階的な学習法式としては,学習支援システム(Intelligent tutoring system,ITS) における学習モデルをベイジアンネットワークによって表現する研究[Ueno 00] が提案されており,その有効性が示されている.我々はこのベイジアンネットワークを用いた段階的学習手法のマイクロタスク型クラウドソーシングへの適用を提案する.具体的な手法として,まずワーカーのタスク処理結果からベイジアンネットワークを用いてタスク間の関係性の解析を行う.次にタスクを処理することで段階的な学習が可能となるような学習タスクを自動生成する.これによってワーカーの能力の育成を狙う.\n さらに,これらのフィルタリングを実装したPCSS を用いて知識処理研究に必要な語彙の収集を行った.Web クローラを用いて5.2 億ページのWeb データの収集を行い,そこから形態素解析で得られた語彙候補に対してPCSS でノイズ除去,読み仮名などのデータ付与を行なうことで14 万語の未知語を得ることに成功した.\n この語彙収集の課程で行ったクラウドソーシング処理において,ワーカーのフィルタリングを行うことにより精度が32.4 ポイント上昇していることを確認した.また,同様に低品質な結果の多いタスクに対して学習タスクの算出を行ったところ,9 種類のタスクに対して合計31 種類の学習タスクを導出することが出来た.また,この導出された学習タスクを用いて低品質なワーカーに学習させ,改善効果を測定したところ平均7.8 ポイントの改善効果が確認できた.比較対象として決定木でも学習タスクを導出したが,ベイジアンネットワークを用いて導出した学習タスクよりも効果が低いことが確認できた.\n このようにクラウドソーシングにおいても適切なワーカーマネジメントと育成を行うことで,安易にワーカーを排除すること無く高精度なデータ処理結果を高速かつ低コストで取得することが可能であることを示すことが出来た.", "subitem_description_type": "Abstract"}]}, "item_10006_dissertation_number_12": {"attribute_name": "学位授与番号", "attribute_value_mlt": [{"subitem_dissertationnumber": "甲第898号"}]}, "item_10006_text_22": {"attribute_name": "専攻", "attribute_value_mlt": [{"subitem_text_value": "情報システム学研究科"}, {"subitem_text_value": "社会知能情報学専攻"}]}, "item_10006_text_23": {"attribute_name": "学術成果タイプ", "attribute_value_mlt": [{"subitem_text_value": "博士学位論文"}]}, "item_10006_version_type_18": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_970fb48d4fbd8a85", "subitem_version_type": "VoR"}]}, "item_access_right": {"attribute_name": "アクセス権", "attribute_value_mlt": [{"subitem_access_right": "open access", "subitem_access_right_uri": "http://purl.org/coar/access_right/c_abf2"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "芦川, 将之", "creatorNameLang": "ja"}, {"creatorName": "アシカワ, マサユキ", "creatorNameLang": "ja-Kana"}, {"creatorName": "Asikawa, Masayuki", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "23289", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2017-04-24"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "1461007.pdf", "filesize": [{"value": "9.5 MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 9500000.0, "url": {"label": "1461007.pdf", "url": "https://uec.repo.nii.ac.jp/record/8526/files/1461007.pdf"}, "version_id": "032f5e2e-18b8-47c7-99da-18e7e6933cf9"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "doctoral thesis", "resourceuri": "http://purl.org/coar/resource_type/c_db06"}]}, "item_title": "マイクロタスク型クラウドソーシングを用いた大規模データ処理における精度向上手法ならびにシステム開発と運用に関する研究", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "マイクロタスク型クラウドソーシングを用いた大規模データ処理における精度向上手法ならびにシステム開発と運用に関する研究", "subitem_title_language": "ja"}]}, "item_type_id": "10006", "owner": "3", "path": ["10"], "permalink_uri": "https://uec.repo.nii.ac.jp/records/8526", "pubdate": {"attribute_name": "PubDate", "attribute_value": "2017-03-24"}, "publish_date": "2017-03-24", "publish_status": "0", "recid": "8526", "relation": {}, "relation_version_is_last": true, "title": ["マイクロタスク型クラウドソーシングを用いた大規模データ処理における精度向上手法ならびにシステム開発と運用に関する研究"], "weko_shared_id": -1}
マイクロタスク型クラウドソーシングを用いた大規模データ処理における精度向上手法ならびにシステム開発と運用に関する研究
https://uec.repo.nii.ac.jp/records/8526
https://uec.repo.nii.ac.jp/records/8526c5180c32-d658-4925-929f-4983215c4937
名前 / ファイル | ライセンス | アクション |
---|---|---|
1461007.pdf (9.5 MB)
|
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2017-03-24 | |||||
タイトル | ||||||
言語 | ja | |||||
タイトル | マイクロタスク型クラウドソーシングを用いた大規模データ処理における精度向上手法ならびにシステム開発と運用に関する研究 | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_db06 | |||||
資源タイプ | doctoral thesis | |||||
アクセス権 | ||||||
アクセス権 | open access | |||||
アクセス権URI | http://purl.org/coar/access_right/c_abf2 | |||||
著者 |
芦川, 将之
× 芦川, 将之 |
|||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | クラウドソーシングはCrowd(群衆) + Sourcing(調達) の造語であり,「企業,組織が,自社もしくはアウトソースの人材により実施していた業務を,よりオープンかつ不特定多数のCrowd(群衆) から人材を集め実施すること」と定義されている.このようなクラウドソーシング技術は,大規模データの解析や構築などを低コストで行うことが可能であり様々な分野や用途で利用されている.しかしその特性上,処理速度の速さや低コストの利点に対して処理結果の精度においては専門家による処理よりも劣るため問題視されており,様々な精度向上手法が研究されている.それらの研究では作業(タスク) を処理する作業者(ワーカー) が不特定多数ということもあり,安易に低品質なワーカーを排除する傾向がある. しかし,その利用範囲の拡大に従いワーカーの数も増大しており,将来的にクラウドソーシングにおける作業が社会における一つの就労形態となることが予想される.そのような傾向にあるにもかかわらず,現状のクラウドソーシングではワーカーに対する安易な排除が中心となり,育成や労働環境の改善と言ったサポートが十分であるとは言い難い.これらの問題はクラウドソーシング市場自体の縮小にもつながりかねない.これらの問題に対応するためには,クラウドソーシング運用において通常の労働環境と同様に人材(ワーカー)のマネジメントや育成が重要になってくると予想される. 我々はこのようなクラウドソーシングの精度問題において,ワーカーのフィルタリングと教育の二つの手法の組み合わせで対応を行っている.ワーカーのフィルタリングで適材適所な作業環境を用意し,その上で低品質なワーカーを高品質なワーカーへと成長させるべく教育を行う. しかし従来のクラウドソーシングサービスでは我々の提唱するフィルタリングや段階的教育を実現するには外部のサービスが提供している機能の範囲では十分ではなく,外部のサービスに新規の機能を追加することも難しいという問題がある.我々はこれらの問題を解決するために,独自のクラウドソーシングシステム(PCSS) を構築し,システム内にて精度向上手法を適用することで問題の解決を試みている.PCSS は2011 年から運用を継続しており,1853 万個のタスクを処理した実績を持っている. PCSS におけるワーカーのフィルタリングは事前フィルタリング,動的フィルタリング,結果フィルタリング,推測フィルタリングという4 つの独自のフィルタリングの組み合わせで行われている.その過程でワーカーの各タスクに対する特性の解析を行い,適したタスクのアロケーション,または不適なタスクからの排除などを行う.また,その過程で低品質であることが判明したワーカーに対し,ワーカーがタスクを処理する過程で適切な学習タスクをこなすことで能力を向上させる段階的な学習方式を提案する.このような段階的な学習法式としては,学習支援システム(Intelligent tutoring system,ITS) における学習モデルをベイジアンネットワークによって表現する研究[Ueno 00] が提案されており,その有効性が示されている.我々はこのベイジアンネットワークを用いた段階的学習手法のマイクロタスク型クラウドソーシングへの適用を提案する.具体的な手法として,まずワーカーのタスク処理結果からベイジアンネットワークを用いてタスク間の関係性の解析を行う.次にタスクを処理することで段階的な学習が可能となるような学習タスクを自動生成する.これによってワーカーの能力の育成を狙う. さらに,これらのフィルタリングを実装したPCSS を用いて知識処理研究に必要な語彙の収集を行った.Web クローラを用いて5.2 億ページのWeb データの収集を行い,そこから形態素解析で得られた語彙候補に対してPCSS でノイズ除去,読み仮名などのデータ付与を行なうことで14 万語の未知語を得ることに成功した. この語彙収集の課程で行ったクラウドソーシング処理において,ワーカーのフィルタリングを行うことにより精度が32.4 ポイント上昇していることを確認した.また,同様に低品質な結果の多いタスクに対して学習タスクの算出を行ったところ,9 種類のタスクに対して合計31 種類の学習タスクを導出することが出来た.また,この導出された学習タスクを用いて低品質なワーカーに学習させ,改善効果を測定したところ平均7.8 ポイントの改善効果が確認できた.比較対象として決定木でも学習タスクを導出したが,ベイジアンネットワークを用いて導出した学習タスクよりも効果が低いことが確認できた. このようにクラウドソーシングにおいても適切なワーカーマネジメントと育成を行うことで,安易にワーカーを排除すること無く高精度なデータ処理結果を高速かつ低コストで取得することが可能であることを示すことが出来た. |
|||||
学位名 | ||||||
学位名 | 博士(工学) | |||||
学位授与機関 | ||||||
学位授与機関識別子Scheme | kakenhi | |||||
学位授与機関識別子 | 12612 | |||||
学位授与機関名 | 電気通信大学 | |||||
学位授与年度 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 2016 | |||||
学位授与年月日 | ||||||
学位授与年月日 | 2017-03-24 | |||||
学位授与番号 | ||||||
学位授与番号 | 甲第898号 | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||
専攻 | ||||||
情報システム学研究科 | ||||||
専攻 | ||||||
社会知能情報学専攻 | ||||||
学術成果タイプ | ||||||
博士学位論文 |