チェス人工知能が提示する複数の選択肢から着手する人工知能の強化学習

吉田, 直人; ヨシダ, ナオト

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

{"_buckets": {"deposit": "0fbfcf79-dacf-4dae-8834-43f7838e684b"}, "_deposit": {"created_by": 13, "id": "9150", "owners": [13], "pid": {"revision_id": 0, "type": "depid", "value": "9150"}, "status": "published"}, "_oai": {"id": "oai:uec.repo.nii.ac.jp:00009150", "sets": ["198"]}, "author_link": ["24987"], "control_number": "9150", "item_10006_date_granted_11": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2019-03-25"}]}, "item_10006_degree_grantor_9": {"attribute_name": "学位授与機関", "attribute_value_mlt": [{"subitem_degreegrantor": [{"subitem_degreegrantor_name": "電気通信大学"}]}]}, "item_10006_degree_name_8": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "修士"}]}, "item_10006_description_10": {"attribute_name": "学位授与年度", "attribute_value_mlt": [{"subitem_description": "2018", "subitem_description_type": "Other"}]}, "item_10006_description_7": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "人工知能が活躍する場面が増えつつある現代において、人工知能は大量の情報を適切に集約し意思決定を行わなければならない。多数の知識が集まれば全体としてより良い意思決定を行うことができることが一般には知られており、このような性質を持つ知能を集合知と呼ぶ。近年大きな成果を上げているゲーム人工知能の分野で集合知に関連する研究が行われており、その例としてAlthöferらのMultiple Choice Systemの研究などがある。Multiple Choice Systemは人工知能がゲームの候補手を提示し、ボスと呼ばれる人間がそれらの中から一つを選択するシステムである。AlthöferらはチェスにおいてMultipleChoice SystemのEloレーティングがベースとなるゲーム人工知能のEloレーティングより高くなる可能性を示した。\n本研究の目的は知識を適切に集約し意思決定を行う人工知能、ボス人工知能を強化学習やニューラルネットワークを用いて作成し、その性能を調査することである。題材はチェスとし、Multiple Choice System のボスをボス人工知能に置き換える。強化学習法はWatkinsのQ(λ)と方策オフ型モンテカルロ法を用いる。ニューラルネットワークは畳み込み層を用いた様々な構成を用いる。実験の結果、WatkinsのQ(λ)と一部のニューラルネットワークの構成の組み合わせで、単純にチェスの指し手を選択する方法より良い選択方法を学習したボス人工知能が作成できた。一番性能の良い強化学習法はQ(0.9)であった。ニューラルネットワークの構成について、各構成要素がどのように性能に関係しているかは明らかにならなかった。明らかにならなかった原因として学習が収束していないことが考えられ、その理由として重み更新回数が足りなかった、訓練サンプルを再利用すべきだった、訓練サンプルが独立でなかった、学習係数を段階的に小さくしていく必要があった、などの事項が考えられる。", "subitem_description_type": "Abstract"}]}, "item_10006_text_22": {"attribute_name": "専攻", "attribute_value_mlt": [{"subitem_text_value": "情報理工学研究科"}, {"subitem_text_value": "情報・ネットワーク工学専攻"}]}, "item_10006_version_type_18": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_ab4af688f83e57aa", "subitem_version_type": "AM"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "吉田, 直人", "creatorNameLang": "ja"}, {"creatorName": "ヨシダ, ナオト", "creatorNameLang": "ja-Kana"}], "nameIdentifiers": [{"nameIdentifier": "24987", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2019-04-24"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "1731167.pdf", "filesize": [{"value": "451.4 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_free", "mimetype": "application/pdf", "size": 451400.0, "url": {"label": "1731167.pdf", "url": "https://uec.repo.nii.ac.jp/record/9150/files/1731167.pdf"}, "version_id": "00c07347-2f50-4230-bcd0-62de4fe64dc4"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "thesis", "resourceuri": "http://purl.org/coar/resource_type/c_46ec"}]}, "item_title": "チェス人工知能が提示する複数の選択肢から着手する人工知能の強化学習", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "チェス人工知能が提示する複数の選択肢から着手する人工知能の強化学習", "subitem_title_language": "ja"}]}, "item_type_id": "10006", "owner": "13", "path": ["198"], "permalink_uri": "https://uec.repo.nii.ac.jp/records/9150", "pubdate": {"attribute_name": "PubDate", "attribute_value": "2019-04-24"}, "publish_date": "2019-04-24", "publish_status": "0", "recid": "9150", "relation": {}, "relation_version_is_last": true, "title": ["チェス人工知能が提示する複数の選択肢から着手する人工知能の強化学習"], "weko_shared_id": -1}

チェス人工知能が提示する複数の選択肢から着手する人工知能の強化学習

https://uec.repo.nii.ac.jp/records/9150

名前 / ファイル	ライセンス	アクション
1731167.pdf (451.4 kB)

Item type

学位論文 / Thesis or Dissertation(1)

公開日

2019-04-24

タイトル

言語

タイトル

チェス人工知能が提示する複数の選択肢から着手する人工知能の強化学習

言語

jpn

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_46ec

資源タイプ

thesis

著者

吉田, 直人

WEKO 24987

ja	吉田, 直人
ja-Kana	ヨシダ, ナオト

Search repository

抄録

内容記述タイプ

Abstract

内容記述

人工知能が活躍する場面が増えつつある現代において、人工知能は大量の情報を適切に集約し意思決定を行わなければならない。多数の知識が集まれば全体としてより良い意思決定を行うことができることが一般には知られており、このような性質を持つ知能を集合知と呼ぶ。近年大きな成果を上げているゲーム人工知能の分野で集合知に関連する研究が行われており、その例としてAlthöferらのMultiple Choice Systemの研究などがある。Multiple Choice Systemは人工知能がゲームの候補手を提示し、ボスと呼ばれる人間がそれらの中から一つを選択するシステムである。AlthöferらはチェスにおいてMultipleChoice SystemのEloレーティングがベースとなるゲーム人工知能のEloレーティングより高くなる可能性を示した。
本研究の目的は知識を適切に集約し意思決定を行う人工知能、ボス人工知能を強化学習やニューラルネットワークを用いて作成し、その性能を調査することである。題材はチェスとし、Multiple Choice System のボスをボス人工知能に置き換える。強化学習法はWatkinsのQ(λ)と方策オフ型モンテカルロ法を用いる。ニューラルネットワークは畳み込み層を用いた様々な構成を用いる。実験の結果、WatkinsのQ(λ)と一部のニューラルネットワークの構成の組み合わせで、単純にチェスの指し手を選択する方法より良い選択方法を学習したボス人工知能が作成できた。一番性能の良い強化学習法はQ(0.9)であった。ニューラルネットワークの構成について、各構成要素がどのように性能に関係しているかは明らかにならなかった。明らかにならなかった原因として学習が収束していないことが考えられ、その理由として重み更新回数が足りなかった、訓練サンプルを再利用すべきだった、訓練サンプルが独立でなかった、学習係数を段階的に小さくしていく必要があった、などの事項が考えられる。

学位名

修士

学位授与機関

学位授与機関名

電気通信大学

学位授与年度

内容記述タイプ

Other

内容記述

2018

学位授与年月日

2019-03-25

著者版フラグ

出版タイプ

出版タイプResource

http://purl.org/coar/version/c_ab4af688f83e57aa

専攻

情報理工学研究科

専攻

情報・ネットワーク工学専攻

戻る

views

See details

	Views

Versions

Ver.1

2023-05-15 09:42:40.987378

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

チェス人工知能が提示する複数の選択肢から着手する人工知能の強化学習

× 吉田, 直人

Versions

Share

Cite as

エクスポート