2015年01月12日

理論上絶対に負けない無敵のポーカー・プログラム完成、カナダ研究

1 : Mogtan ★@\(^o^)/[sageteoff] :2015/01/11(日) 22:21:30.88 ID:???.net
掲載日:2015年1月9日

 プレーヤー2人に限定したポーカーの「テキサス・ホールデム(Texas hold'em)」で、理論上絶対に負けないコンピュータープログラムを開発したとする研究論文が、8日の米科学誌サイエンス(Science)に掲載された。

 論文の主執筆者、カナダ・アルバータ大学(University of Alberta)のマイケル・ボーリング(Michael Bowling)氏はAFPの取材に、研究チームは2003年より「現在の超一流プレーヤーに負けない、またどんな戦略にも負けない、完璧なプレーヤーを作り出すこと」を目標に掲げてきたと語る。

 研究チームは2008年、ポラリス(Polaris)と呼ばれる最初のポーカー実行プログラムを完成させた。ポラリスは、2人のプレーヤー勝負のホールデムで人間の一流プレイヤーに勝つことができた。「この時点で、コンピューターはこの形式のポーカーでは全ての人間より強いプレーヤーとしての地位を確立した」とボーリング氏は言う。

 ポラリスがポーカーで人間に勝てることが判明した後、「論理上の次なるステップは(このゲームを)解くことができるかの検討だった」と同氏は続けた。4800個の中央演算処理装置(CPU)群がゲームを解決するための計算を開始した。「本質的にゲームを解決するという目標に到達するのに2か月あまりの計算を要した」と同氏は話す。

 結果は、世界中でプレーされている最も人気の高い形式のポーカーがこれで「本質的に弱解決する」というものだった。これは、人間が一生分プレーしても、統計的有意性を持って打ち負かすのは不可能であることを意味する。

 ボーリング氏は、電子メール取材に対し「ゲームを解決する完全な戦略の算出を目指したが、われわれの戦略はゲームを本質的に解決するものにとどまった。これはつまり、戦略がほぼ完璧であるため(人間が一生涯にプレーできるゲーム数に近い)6000万回プレーした後でも、負ける可能性が運によるものか否かさえも区別できないほど非常に小さいことを意味する」と説明した。

■コンピューター対人間

 ゲームで人間を打ち負かしたコンピューターとしては、ポーカーの他にも1994年にボードゲーム「チェッカー」の世界選手権で初めて人間を破ったプログラム「チヌーク(Chinook)」や、1997年に当時のチェス世界チャンピオン、ガルリ・カスパロフ(Garry Kasparov)氏に勝った「ディープ・ブルー(Deep Blue)」などがある。米コンピューター大手IBMが開発した高性能コンピューター「ワトソン(Watson)」は2011年、米国のクイズ番組「ジョパディ!(Jeopardy !)」で優勝した。だがポーカーのテキサス・ホールデムは、特に難題であることが判明していた。プレーヤーが2人だけでも、どのカードがすでに相手の手札に入っているかなどの未知の情報が大量にあるからだ。

 米カーネギーメロン大学(Carnegie Mellon University)のコンピュータ科学者、トゥオマス・サンドホルム(Tuomas Sandholm)氏は、数多くある「不完全情報ゲーム」のなかでも、ポーカーは人工知能(AI)にとっては最大級の挑戦だと、サイエンス誌に同時掲載された解説記事に記している。

 同氏の説明によると、これらのいわゆる「不完全情報ゲーム」を解決するための一般的手法では、最初にゲーム全体を抽象化して「規模はより小さいが、戦略的に同様なゲームを生成し、均衡発見アルゴリズムで対応可能なサイズにまで縮小する」という。次に、抽象化した各ゲームを解決して均衡または均衡近傍を導き出し、それらの戦略を元のゲームに対応づける。

 ゲーム解決への挑戦は、現代社会に進歩をもたらす助けになるかもしれない。ボーリング氏によると、空港検問所の保安体制の強化、沿岸警備パトロールの向上、医療上の決定の改善などに役立つ可能性があるという。このポーカーに利用されたようなアルゴリズムの進歩は、現実世界の不確定性と不明情報を含む状況に対して意思決定を下す場合に、より効果的な解決策を見つける助けになるかもしれないと、論文は結論付けている。(c)AFP/Kerry SHERIDAN

<画像>
テーブルを囲んで行われる「テキサス・ホールデム」。仏領コルシカ島で(2007年2月撮影、資料写真)。(c)AFP/STEPHAN AGOSTINI



<参照>
Science - Heads-up limit hold’em poker is solved
http://www.sciencemag.org/content/347/6218/145


<記事掲載元>
http://www.afpbb.com/articles/-/3036040


転載元スレッド:http://anago.2ch.sc/test/read.cgi/scienceplus/1420982490/
【IT/ゲーム理論】無敵のポーカー・プログラム完成、カナダ研究





2 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 22:28:26.82 ID:yASJmtdk.net
論理と心理の狭間が割り切れるという説明


3 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 22:34:32.48 ID:G4ulDx5h.net
で、そのプログラムどうして対戦したら 両方負けることがないと?
引き分けってポーカーにあるの?



4 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 22:37:01.51 ID:G4ulDx5h.net
ちょっ これやたら重要なやつじゃん
「不完全情報ゲーム」の2者対戦における最適解なの?

ゲーム解決への挑戦は、現代社会に進歩をもたらす助けになるかもしれない。ボーリング氏によると、空港検問所の
保安体制の強化、沿岸警備パトロールの向上、医療上の決定の改善などに役立つ可能性があるという。

マジだとすると、このアルゴを理解できれば相当有利になれるのか?



5 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 22:46:30.30 ID:yASJmtdk.net
>>4
戦略そのものの統計を元にしたアルゴリズムは統計に沿わないものには無力である。
神のアルゴリズムであっても、次に配られる手配を支配できないかぎり運に支配される。
勝とうとするアルゴリズムは負ける戦略をしない。

負けない戦略と勝つ戦略で戦うとき、勝つ戦略で負けない戦略を倒すのはムリゲー。



13 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 23:13:18.08 ID:G4ulDx5h.net
>>5
なんか詳しそうじゃん この分野の参考書みたいなのない?



17 : 名無しのひみつ@\(^o^)/[sage] :2015/01/11(日) 23:27:40.76 ID:MKMZyUCU.net
>>4
不完全情報ゲームの解法の統一理論じゃないでしょ。



6 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 22:46:41.80 ID:27r6j11G.net
絶対勝てない麻雀ゲームならあったな。


8 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 23:00:39.90 ID:eiIA2/DY.net
このコンピュータ―プログラムどうしなら
前者と後者のどちらが勝の?



29 : 名無しのひみつ@\(^o^)/ :2015/01/12(月) 07:42:50.94 ID:xZxtkdSi.net
>>8
回数を重ねるほど五分の成績になる。



9 : 名無しのひみつ@\(^o^)/[sage] :2015/01/11(日) 23:00:58.00 ID:fzDTGtyc.net
つーか何をもって無敵というんだ?
ポーカーなんて一回勝負なら役がそろわなくて負けることもあるだろ
何千万回もやれば必ず勝ち越すとかそういうこと?



12 : 名無しのひみつ@\(^o^)/[sage] :2015/01/11(日) 23:11:45.12 ID:h4ZixQ9G.net
>>9
統計的に見て勝ち越す、だから収支とは別問題。



20 : 名無しのひみつ@\(^o^)/[sage] :2015/01/11(日) 23:56:39.22 ID:yzigMGRV.net
>>9
精神と時の部屋に入って自分自身と何万年分の修行を積んできた、俺Tueee!!!!

ってことをコンピュータがやったってことでしょ。

そのタイプの俺とは千年前にやったことがあるから最善手が分かってるぞ!
てな感じ



10 : 名無しのひみつ@\(^o^)/[sage] :2015/01/11(日) 23:02:01.98 ID:XL2RE+fa.net
捨てられたカードから、確率的に相手の手札の強さが分かるってことかね
カジノって瞬間記憶みたいな人がカード全部覚えるのはイカサマ扱いなんだろ。



11 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 23:08:25.41 ID:yASJmtdk.net
>>10
>捨てられたカードから
捨てたカードで敵の戦略を縛るのも戦略である。



14 : 名無しのひみつ@\(^o^)/[sage] :2015/01/11(日) 23:23:52.40 ID:p6bwAKvC.net
最も期待値の高い選択を選び続けることで、負けることがない。
相手が間違った選択をすることで、勝てる。

同じプログラムでお互い最適な選択をすれば5分の勝負。
人間でもプロは、完全ではないけど、期待値の高い選択をし続けている。



15 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 23:25:16.02 ID:G4ulDx5h.net
>「Cepheus」は、CFRと呼ばれるアルゴリズム(あの時ああしていれば! という
後悔を最小化するアルゴリズム:参考)の改良版「CFR+」を用いて、
自分自身と対戦することで最適戦略を学習。2カ月にわたって、
秒間60億以上の手を考えるCPUを4000個稼働し、完璧に近い腕前になったそうです。



16 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 23:26:26.02 ID:G4ulDx5h.net
>>15のソース
http://nlab.itmedia.co.jp/nl/articles/1501/09/news108.html



18 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 23:27:54.38 ID:tVvdMuQv.net
総当りとか?


19 : 名無しのひみつ@\(^o^)/ :2015/01/11(日) 23:51:56.47 ID:G4ulDx5h.net
これは解説記事なの?
http://www.pokercity.nl/uploads/bowling150109.pdf



21 : 名無しのひみつ@\(^o^)/[sage] :2015/01/12(月) 00:22:59.67 ID:+RfcajcF.net
将棋のCPUトーナメントみたいにポーカーでもそういうのやればいいのに
それで殿堂入り出来るくらい優勝したら実力認められる

つってもこれリミット・ホールデムの話だからな
今メジャーになってるノーリミット・ホールデムはまだ解けてない
リミットとノーリミットの違いは賭け額が決まってるか決まってないかの違い
大ざっぱに説明すると
リミットは賭けられる額が決まってるがノーリミットは自由、いきなり全額賭けても問題ない
逆に言うとリミットは最初から全額賭けるみたいなことは不可能
リミットとノーリミットは人間レベルでも戦略が違ってるので
ノーリミット解けるのはまだまだ先、そこまでいかないと使いものにはならんだろリミットとかマイナーだし
個人的にはオマハ解けるぐらいになったら大変素晴らしいと思うがそれは当分先だな…w



22 : 名無しのひみつ@\(^o^)/ :2015/01/12(月) 02:23:13.32 ID:UMXntrkM.net
人間には「ルール変更」と云う大技があるわな。


23 : 名無しのひみつ@\(^o^)/ :2015/01/12(月) 03:48:13.16 ID:dFxMhv3r.net
>>1
言っとくけど、カードカウンティングは、カジノでやったら、ルール違反



24 : 名無しのひみつ@\(^o^)/ :2015/01/12(月) 03:55:33.65 ID:Ko58y1hJ.net
>>1(人間が一生涯にプレーできるゲーム数に近い)6000万回プレーした後

80年生きるとして、1ゲーム42秒。そこまで積み重ねないといけないなんてただの地獄です



28 : 名無しのひみつ@\(^o^)/[sage] :2015/01/12(月) 07:26:32.38 ID:qfA73ZkY.net
>>24
おまえ、アホだなw



25 : 名無しのひみつ@\(^o^)/[sage] :2015/01/12(月) 04:03:10.79 ID:n/r7WGzP.net
ポーカーの面白いのは、プレーヤー同士の駆け引きなのに・・・


26 : 名無しのひみつ@\(^o^)/ :2015/01/12(月) 04:13:30.78 ID:By256xVa.net
これ対人で常時勝利してないだろ。プログラムvsプログラムじゃ勝負とはいえない


27 : 名無しのひみつ@\(^o^)/ :2015/01/12(月) 05:48:36.81 ID:xNk+unqJ.net
ほぅ無敵なのか
戦わなければ負けないから駄目だな
気になるAmazonの本


トラックバックURL

 コメント一覧 (7)

    • 1. 名無しさん@まとめたニュース
    • 2015年01月12日 13:25
    • うんこ
    • 2. 名無しさん@まとめたニュース
    • 2015年01月12日 13:26
    • 捨てたカードを全部記憶しとくんでしょ、ずるいわw
    • 3. 名無しさん@まとめたニュース
    • 2015年01月12日 15:19
    • ポーカーって言うと俺らの知ってる昔ながらのポーカーは今じゃほとんどやられてないとかいう奴いるけど、正直気持ち悪いわ。
      別にそんなのしらねーよと思う。トランプなんてやらねーし。
    • 4. 名無しさん@まとめたニュース
    • 2015年01月12日 15:21
    • よく分からんが
      サーモグラフィと集音マイクと赤外線レーザーがあれば負けないだろ
    • 5. 名無しさん@まとめたニュース
    • 2015年01月12日 15:31
    • これ国際大会決勝でブタでもブラフで勝利したやつとかあるっしょ
      そこらへんどうなん?
    • 6. 名無しさん@まとめたニュース
    • 2015年01月13日 00:41
    • ポーカーて自分が捨てたカード自分以外にわかったっけ?
    • 7. 名無しさん@まとめたニュース
    • 2015年01月13日 04:08
    • こんなもん全然凄くないやろ
      コンピュータが不正してないってどうやって俺らは確かめるんだよ
      囲碁や将棋とかチェスで無敵ってなら凄いけど、ポーカーw


コメントフォーム
記事の評価
  • リセット
  • リセット

コメントを投稿してくれる方へ
いくつかのエロい単語やURL等は使えません。
下記の投稿は無断で削除する場合があります。予めご了承ください。
・荒らし行為(宣伝行為含む)
・犯罪的なコメント
・差別的なコメント
・過激な下ネタ

他ブログのネタ満載 アンテナページへ


スポンサードリンク
記事検索
月別アーカイブ
QRコード
QRコード
読者登録
LINE読者登録QRコード
スポンサードリンク