WEKO3
アイテム
対戦ログに基づいた多様な戦略を持つポーカーAIの構築
https://uec.repo.nii.ac.jp/records/9541
https://uec.repo.nii.ac.jp/records/9541ef995197-d6fd-48fb-b805-51ff34d6641d
名前 / ファイル | ライセンス | アクション |
---|---|---|
1830047.pdf (1.4 MB)
|
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2020-03-26 | |||||||||
タイトル | ||||||||||
言語 | ja | |||||||||
タイトル | 対戦ログに基づいた多様な戦略を持つポーカーAIの構築 | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_46ec | |||||||||
資源タイプ | thesis | |||||||||
著者 |
小山, 祐希
× 小山, 祐希
|
|||||||||
抄録 | ||||||||||
内容記述タイプ | Abstract | |||||||||
内容記述 | コンピュータゲームの普及により、勝つことだけを目的にするのではなく、人間プレイヤーを楽しませるためのゲームAIの需要が高まっている。これらのAIにはプレイヤーを飽きさせないための性格付けや、違和感を感じさせない人間らしさが求められる。AIの持つパラメータの調整を自動化することで、AIを生成する手法は従来から研究されている。しかしAIパラメータとして利用する特徴量の選択に人の知識を必要とする点や、AIの行動アルゴリズムの設計の困難さ、人間プレイヤーに違和感を感じさせない範囲でパラメータ調整を行う困難さなどいくつかの課題がある。 本研究ではゲームにおけるプレイヤーのログから類似の戦略を分類するとともに、各クラスタを代表する戦略を学習する手法を提案する。提案手法ではニューラルネットワークを使用することで、特徴量抽出や行動アルゴリズムの設計を必要としないAIの生成が可能である。また、対戦ログに基づいて戦略を学習することで、人間プレイヤーから乖離した戦略が生成されるのを防止することができる。提案手法を評価するためテキサスホールデムポーカーにおいて、人の知識に基づくルールベースのエージェントと、パラメータを持つルールベースエージェントそれぞれから生成された対戦ログを用いて実験を行った。どちらの実験においても提案手法は対戦ログから類似する戦略を分類できることを確認した。また、パラメータを持つエージェントを用いた実験では、学習された戦略がエージェントの特性の一部を再現することが示された。 |
|||||||||
学位名 | ||||||||||
学位名 | 修士 | |||||||||
学位授与機関 | ||||||||||
学位授与機関名 | 電気通信大学 | |||||||||
学位授与年度 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 2019 | |||||||||
学位授与年月日 | ||||||||||
学位授与年月日 | 2020-03-25 | |||||||||
著者版フラグ | ||||||||||
出版タイプ | AM | |||||||||
出版タイプResource | http://purl.org/coar/version/c_ab4af688f83e57aa | |||||||||
専攻 | ||||||||||
情報理工学研究科 | ||||||||||
専攻 | ||||||||||
情報学専攻 |