少兒編程 > 文章資訊 > 機(jī)器人 > 人工智能靠直覺(jué)戰(zhàn)勝撲克職業(yè)選手
人工智能靠直覺(jué)戰(zhàn)勝撲克職業(yè)選手
童程童美 2017-01-16
2017年新年開(kāi)局,人工智能在與人類(lèi)智慧對(duì)局上連下數(shù)城,先是升級(jí)版的阿爾法狗圍棋接連擊敗中韓等國(guó)頂尖高手,近日又橫空殺出名為DeepStack的人工智能新算法,在一對(duì)一無(wú)限注德州撲克中完美碾壓人類(lèi)智商。
摘要2017年新年開(kāi)局,人工智能在與人類(lèi)智慧對(duì)局上連下數(shù)城,先是升級(jí)版的阿爾法狗圍棋接連擊敗中韓等國(guó)頂尖高手,近日又橫空殺出名為DeepStack的人工智能新算法,在一對(duì)一無(wú)限注德州撲克中完美碾壓人類(lèi)智商。
來(lái)自加拿大阿爾伯塔大學(xué)和捷克兩所高校的研究人員近日在阿奇夫論文預(yù)印本網(wǎng)站(arXiv)上提交論文,介紹其研發(fā)的新算法DeepStack首次在一對(duì)一無(wú)限注德州撲克中擊敗人類(lèi)職業(yè)撲克玩家。
研究人員稱(chēng),這種人工智能算法是一種可用于撲克等不完整信息博弈的通用算法。在與33位來(lái)自國(guó)際撲克聯(lián)合會(huì)的職業(yè)撲克選手進(jìn)行的4.4萬(wàn)手撲克比賽中,這種算法平均贏率超過(guò)450mbb/g。(mbb/g是衡量撲克玩家表現(xiàn)的指數(shù),一般50mbb/g就被認(rèn)為是較大的優(yōu)勢(shì)。)
德州撲克是人工智能的熱門(mén)挑戰(zhàn)領(lǐng)域。此前,被人工智能攻克的圍棋是一種完全信息公開(kāi)的博弈,玩家可以看到棋盤(pán)上的棋子,并預(yù)測(cè)落子可能性;而德州撲克玩家手中的底牌是其他玩家看不到的,是不完整信息博弈,要求更復(fù)雜的推理能力,對(duì)人工智能更具挑戰(zhàn)。
一對(duì)一無(wú)限注德州撲克擁有超過(guò)10的160次方個(gè)決策點(diǎn)。研究人員稱(chēng),DeepStack在處理?yè)淇酥械男畔⒉粚?duì)稱(chēng)性時(shí)用到了循環(huán)推理,并使用分解法將計(jì)算集中在相關(guān)決策上;它還運(yùn)用深度學(xué)習(xí)技術(shù)從自我對(duì)戰(zhàn)中自動(dòng)學(xué)習(xí)了一種關(guān)于任意牌的“直覺(jué)”。
這一研究成果無(wú)疑搶了卡耐基梅隆大學(xué)研究人員的風(fēng)頭。他們也設(shè)計(jì)了一場(chǎng)類(lèi)似于阿爾法圍棋挑戰(zhàn)李世石的人機(jī)對(duì)戰(zhàn),于當(dāng)?shù)貢r(shí)間11日在匹茲堡的賭場(chǎng)盛大啟幕。卡耐基梅隆大學(xué)的人工智能系統(tǒng)Libratus將在20天的時(shí)間內(nèi)與四位頂尖德州撲克選手玩12萬(wàn)手一對(duì)一不限注的德州撲克,獎(jiǎng)金高達(dá)20萬(wàn)美元。據(jù)悉,Libratus與DeepStack采用了相似的計(jì)算方法。
不過(guò),參與設(shè)計(jì)Libratus的卡耐基梅隆大學(xué)教授桑德霍爾姆在接受媒體采訪(fǎng)時(shí)就持有異議,他認(rèn)為DeepStack并未與最頂尖的人類(lèi)選手比賽,所以暫時(shí)不能說(shuō)是超越了人類(lèi)。