WEKO3
アイテム
{"_buckets": {"deposit": "1a0b115f-057d-46fe-b603-db6c45f7f1fa"}, "_deposit": {"created_by": 13, "id": "8703", "owners": [13], "pid": {"revision_id": 0, "type": "depid", "value": "8703"}, "status": "published"}, "_oai": {"id": "oai:uec.repo.nii.ac.jp:00008703", "sets": ["175"]}, "author_link": ["23538"], "control_number": "8703", "item_10006_date_granted_11": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2018-03-23"}]}, "item_10006_degree_grantor_9": {"attribute_name": "学位授与機関", "attribute_value_mlt": [{"subitem_degreegrantor": [{"subitem_degreegrantor_name": "電気通信大学"}]}]}, "item_10006_degree_name_8": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "修士"}]}, "item_10006_description_10": {"attribute_name": "学位授与年度", "attribute_value_mlt": [{"subitem_description": "2017", "subitem_description_type": "Other"}]}, "item_10006_description_7": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "データ集合を教師データを用いた事前学習をおこなうことなくクラスタと呼ばれる部分集合に分割する手法をクラスタリングと呼ぶ。クラスタリングの基本は、類似したデータ同士を同じクラスタに所属させることである。このため、データ間の類似度の設定はクラスタリングにおいて非常に重要である。一般的に用いられる代表的な類似度としては、ユークリッド空間上の多次元ベクトルに対するユークリッド距離やcosine 類似度が知られている。Cosine 類似度は、文書データのような高次で疎なデータに対する類似度指標としてよく用いられる。\nNguyenらはcosine類似度における原点を複数用いた多観点類似度(Multiviewpoint-Based Similarity:MVS) を提案した。そして、MVS を非階層クラスタリングに適用することで、文書データのクラスタリングにおいて優れた結果を示した。ただし、非階層クラスタリングは事前に分割するクラスタの数を人為的に指定する必要がある。\n 本研究では、この多観点類似度に関する2 つのテーマを取り扱う。\n 1つ目は、Nguyenらの提案した多観点なcosine 類似度を階層クラスタリングについて適用した手法の開発である。階層クラスタリングは非階層クラスタリングのように事前に分割するクラスタ数を指定する必要がなく、階層的な分割構造を抽出できる。ただしMVSはcosine類似度より計算量が大きいため、階層クラスタリング全体の計算量を悪化させる恐れがある。そこで提案手法では、クラスタ間類似度の計算を高速化する手法を開発し、一般的な階層クラスタリングと同様の計算量O(mn2+n2logn)でのクラスタリングを実現した。さらに文書データを用いた実験により、MVS を用いた階層クラスタリングが既存手法と同程度の計算時間で、より高い分類精度を示すことを確認した。\n 2つ目は、cosine類似度以外への多観点類似度の適用である。本研究では、ユークリッド距離に対して基準点が影響を与えるような新しい距離定義である多観点距離(Multiviewpoint-Based Distance:MVD) を提案する。さらに、このMVD を、非階層クラスタリングの代表的手法であるk-meansに対して適用したクラスタリング手法を開発した。また、開発したMVDを用いた分割クラスタリング手法が、k-meansのクラスタリング結果を改善することを実験的に示した。", "subitem_description_type": "Abstract"}]}, "item_10006_text_22": {"attribute_name": "専攻", "attribute_value_mlt": [{"subitem_text_value": "情報理工学研究科"}, {"subitem_text_value": "情報ネットワーク工学専攻"}]}, "item_10006_version_type_18": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_ab4af688f83e57aa", "subitem_version_type": "AM"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "藤原, 勇二", "creatorNameLang": "ja"}, {"creatorName": "フジワラ, ユウジ", "creatorNameLang": "ja-Kana"}], "nameIdentifiers": [{"nameIdentifier": "23538", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2018-04-13"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "1631129.pdf", "filesize": [{"value": "490.4 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 490400.0, "url": {"label": "1631129", "url": "https://uec.repo.nii.ac.jp/record/8703/files/1631129.pdf"}, "version_id": "2553b946-a1be-40b9-9bc7-f1f87053e051"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "thesis", "resourceuri": "http://purl.org/coar/resource_type/c_46ec"}]}, "item_title": "多観点類似度を用いたクラスタリングに関する研究", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "多観点類似度を用いたクラスタリングに関する研究", "subitem_title_language": "ja"}]}, "item_type_id": "10006", "owner": "13", "path": ["175"], "permalink_uri": "https://uec.repo.nii.ac.jp/records/8703", "pubdate": {"attribute_name": "PubDate", "attribute_value": "2018-04-13"}, "publish_date": "2018-04-13", "publish_status": "0", "recid": "8703", "relation": {}, "relation_version_is_last": true, "title": ["多観点類似度を用いたクラスタリングに関する研究"], "weko_shared_id": -1}
多観点類似度を用いたクラスタリングに関する研究
https://uec.repo.nii.ac.jp/records/8703
https://uec.repo.nii.ac.jp/records/870382da05ee-9c3c-49b2-a875-10c17d680199
名前 / ファイル | ライセンス | アクション |
---|---|---|
1631129 (490.4 kB)
|
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2018-04-13 | |||||
タイトル | ||||||
言語 | ja | |||||
タイトル | 多観点類似度を用いたクラスタリングに関する研究 | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_46ec | |||||
資源タイプ | thesis | |||||
著者 |
藤原, 勇二
× 藤原, 勇二 |
|||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | データ集合を教師データを用いた事前学習をおこなうことなくクラスタと呼ばれる部分集合に分割する手法をクラスタリングと呼ぶ。クラスタリングの基本は、類似したデータ同士を同じクラスタに所属させることである。このため、データ間の類似度の設定はクラスタリングにおいて非常に重要である。一般的に用いられる代表的な類似度としては、ユークリッド空間上の多次元ベクトルに対するユークリッド距離やcosine 類似度が知られている。Cosine 類似度は、文書データのような高次で疎なデータに対する類似度指標としてよく用いられる。 Nguyenらはcosine類似度における原点を複数用いた多観点類似度(Multiviewpoint-Based Similarity:MVS) を提案した。そして、MVS を非階層クラスタリングに適用することで、文書データのクラスタリングにおいて優れた結果を示した。ただし、非階層クラスタリングは事前に分割するクラスタの数を人為的に指定する必要がある。 本研究では、この多観点類似度に関する2 つのテーマを取り扱う。 1つ目は、Nguyenらの提案した多観点なcosine 類似度を階層クラスタリングについて適用した手法の開発である。階層クラスタリングは非階層クラスタリングのように事前に分割するクラスタ数を指定する必要がなく、階層的な分割構造を抽出できる。ただしMVSはcosine類似度より計算量が大きいため、階層クラスタリング全体の計算量を悪化させる恐れがある。そこで提案手法では、クラスタ間類似度の計算を高速化する手法を開発し、一般的な階層クラスタリングと同様の計算量O(mn2+n2logn)でのクラスタリングを実現した。さらに文書データを用いた実験により、MVS を用いた階層クラスタリングが既存手法と同程度の計算時間で、より高い分類精度を示すことを確認した。 2つ目は、cosine類似度以外への多観点類似度の適用である。本研究では、ユークリッド距離に対して基準点が影響を与えるような新しい距離定義である多観点距離(Multiviewpoint-Based Distance:MVD) を提案する。さらに、このMVD を、非階層クラスタリングの代表的手法であるk-meansに対して適用したクラスタリング手法を開発した。また、開発したMVDを用いた分割クラスタリング手法が、k-meansのクラスタリング結果を改善することを実験的に示した。 |
|||||
学位名 | ||||||
学位名 | 修士 | |||||
学位授与機関 | ||||||
学位授与機関名 | 電気通信大学 | |||||
学位授与年度 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 2017 | |||||
学位授与年月日 | ||||||
学位授与年月日 | 2018-03-23 | |||||
著者版フラグ | ||||||
出版タイプ | AM | |||||
出版タイプResource | http://purl.org/coar/version/c_ab4af688f83e57aa | |||||
専攻 | ||||||
情報理工学研究科 | ||||||
専攻 | ||||||
情報ネットワーク工学専攻 |