対戦ログに基づいた多様な戦略を持つポーカーAIの構築

小山, 祐希; コヤマ, ユウキ

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

対戦ログに基づいた多様な戦略を持つポーカーAIの構築

https://uec.repo.nii.ac.jp/records/9541

名前 / ファイル	ライセンス	アクション
1830047.pdf (1.4 MB)

Item type

学位論文 / Thesis or Dissertation(1)

公開日

2020-03-26

タイトル

言語

タイトル

対戦ログに基づいた多様な戦略を持つポーカーAIの構築

言語

jpn

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_46ec

資源タイプ

thesis

著者

小山, 祐希

抄録

内容記述タイプ

Abstract

内容記述

コンピュータゲームの普及により、勝つことだけを目的にするのではなく、人間プレイヤーを楽しませるためのゲームAIの需要が高まっている。これらのAIにはプレイヤーを飽きさせないための性格付けや、違和感を感じさせない人間らしさが求められる。AIの持つパラメータの調整を自動化することで、AIを生成する手法は従来から研究されている。しかしAIパラメータとして利用する特徴量の選択に人の知識を必要とする点や、AIの行動アルゴリズムの設計の困難さ、人間プレイヤーに違和感を感じさせない範囲でパラメータ調整を行う困難さなどいくつかの課題がある。
本研究ではゲームにおけるプレイヤーのログから類似の戦略を分類するとともに、各クラスタを代表する戦略を学習する手法を提案する。提案手法ではニューラルネットワークを使用することで、特徴量抽出や行動アルゴリズムの設計を必要としないAIの生成が可能である。また、対戦ログに基づいて戦略を学習することで、人間プレイヤーから乖離した戦略が生成されるのを防止することができる。提案手法を評価するためテキサスホールデムポーカーにおいて、人の知識に基づくルールベースのエージェントと、パラメータを持つルールベースエージェントそれぞれから生成された対戦ログを用いて実験を行った。どちらの実験においても提案手法は対戦ログから類似する戦略を分類できることを確認した。また、パラメータを持つエージェントを用いた実験では、学習された戦略がエージェントの特性の一部を再現することが示された。

学位名

修士

学位授与機関

学位授与機関名

電気通信大学

学位授与年度

内容記述タイプ

Other

内容記述

2019

学位授与年月日

2020-03-25

著者版フラグ

出版タイプ

出版タイプResource

http://purl.org/coar/version/c_ab4af688f83e57aa

専攻

情報理工学研究科

専攻

情報学専攻

戻る

views

See details

	Views

Versions

Ver.1

2023-05-15 09:34:57.885380

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

対戦ログに基づいた多様な戦略を持つポーカーAIの構築

× 小山, 祐希

Versions

Share

Cite as

エクスポート