少兒編程 > 文章資訊 > 機器人 > 人工智能靠直覺戰勝撲克職業選手
人工智能靠直覺戰勝撲克職業選手
童程童美 2017-01-16
2017年新年開局,人工智能在與人類智慧對局上連下數城,先是升級版的阿爾法狗圍棋接連擊敗中韓等國頂尖高手,近日又橫空殺出名為DeepStack的人工智能新算法,在一對一無限注德州撲克中完美碾壓人類智商。
摘要2017年新年開局,人工智能在與人類智慧對局上連下數城,先是升級版的阿爾法狗圍棋接連擊敗中韓等國頂尖高手,近日又橫空殺出名為DeepStack的人工智能新算法,在一對一無限注德州撲克中完美碾壓人類智商。
來自加拿大阿爾伯塔大學和捷克兩所高校的研究人員近日在阿奇夫論文預印本網站(arXiv)上提交論文,介紹其研發的新算法DeepStack首次在一對一無限注德州撲克中擊敗人類職業撲克玩家。
研究人員稱,這種人工智能算法是一種可用于撲克等不完整信息博弈的通用算法。在與33位來自國際撲克聯合會的職業撲克選手進行的4.4萬手撲克比賽中,這種算法平均贏率超過450mbb/g。(mbb/g是衡量撲克玩家表現的指數,一般50mbb/g就被認為是較大的優勢。)
德州撲克是人工智能的熱門挑戰領域。此前,被人工智能攻克的圍棋是一種完全信息公開的博弈,玩家可以看到棋盤上的棋子,并預測落子可能性;而德州撲克玩家手中的底牌是其他玩家看不到的,是不完整信息博弈,要求更復雜的推理能力,對人工智能更具挑戰。
一對一無限注德州撲克擁有超過10的160次方個決策點。研究人員稱,DeepStack在處理撲克中的信息不對稱性時用到了循環推理,并使用分解法將計算集中在相關決策上;它還運用深度學習技術從自我對戰中自動學習了一種關于任意牌的“直覺”。
這一研究成果無疑搶了卡耐基梅隆大學研究人員的風頭。他們也設計了一場類似于阿爾法圍棋挑戰李世石的人機對戰,于當地時間11日在匹茲堡的賭場盛大啟幕。卡耐基梅隆大學的人工智能系統Libratus將在20天的時間內與四位頂尖德州撲克選手玩12萬手一對一不限注的德州撲克,獎金高達20萬美元。據悉,Libratus與DeepStack采用了相似的計算方法。
不過,參與設計Libratus的卡耐基梅隆大學教授桑德霍爾姆在接受媒體采訪時就持有異議,他認為DeepStack并未與最頂尖的人類選手比賽,所以暫時不能說是超越了人類。