在韓國圍棋界,獲得多項世界冠軍的職業九段李世石在與谷歌電腦alphago的人機大戰中,3連敗后,白手起家挽回一局。
大眾把這場圍棋人機大戰看得太重了,看成是人腦和計算機的徹底競爭,其實不然。 因為,進行比賽就像下圍棋一樣。 如果人類在圍棋人機大戰中輸了,人類的大腦也并不會比不上計算機。
事實上,圍棋變化多端,紛繁復雜,但理論上并不是無限的。 只不過可以看成是數學主題,用計算機編程運算得到答案。 在假時間里,人類在國際象棋這方面遲早很難與計算機匹敵。 即使李世石3連敗后,挽回了2局,那又如何呢? 在圍棋方面,人類遲早比不上人工智能。
圍棋人工智能的第一代算法采用窮舉法,計算所有的棋步,選擇必勝的棋步。 但是圍棋的一些變化太多了,一時半會兒不會。
第二代算法是在抽樣判斷中選擇勝率高的算法,大幅削減運算量,使得人工智能終于能夠與業余圍棋選手競爭。
Googlealphago是第三代算法,利用人工智能的自我學習能力飛躍性地提高了自己的象棋實力。 看起來輾壓世界職業高手的阿爾法·戈在第四局中遭到了冷遇,有什么問題呢?
阿爾法go的算法有問題。 第三代算法的問題實際上也是第二代算法的問題。 因為第三代算法基于第二代算法的采樣判斷進行自我學習。 即使alpha go能和自己下國際象棋提高棋藝水平,它也能這樣下國際象棋是基于抽樣判斷的。
抽樣判斷有弱點。 勝率高的下法未必是正確的下法,只不過是統計。 有些冷門的方法,反而可能會贏得驚人的勝利。
阿爾法go下臭棋時,思考速度特別快恰恰證明了此時樣本很少。 李世石78手是奇招,下這一手的棋手很少,阿爾法go按照程序運算后認為李世石的勝算不高,反應特別快。 這是個大錯誤。
在圍棋程序下象棋的棋手,感覺在計算機處于劣勢時的應對非常混亂。 不僅是阿爾法go,zen也是。 電腦處于勝率低的狀況,已經很難考慮了。 根據樣本統計,在勝率低的情況下當然輸贏多,逆轉取勝的樣本很難找。 勝率越低的情況下,alpha go的想法越混亂。 極端的情況下,找到的樣本中勝率低的一方已經認輸,可能沒有之后的棋譜。 我不擅長阿爾法戈該怎么辦。
阿爾法GO的失敗也是人類的失敗,畢竟程序也是人類編的。 另一方面,由于算法基于人類樣本,導致了alpha go的失敗。 如果李世石手上有對應的樣本,alphago也不會這樣評價錯誤。
alpha go的父親哈比斯說:“alpha go的訓練并不是特別要和李世石比較,而是讓普通棋手像比賽前一樣,只做日常的準備。 阿爾法go準備就是從網上下載很多業余棋手的棋譜研究,沒有什么特別之處。 之后,和某棋手進行比較準備也不容易,我們至少需要幾百萬到幾億的棋譜,只有整體提供給alpha go,才能接收它進行深度學習。
哈比斯的話也證實了圍棋人工智能第二代第三代的死穴,也就是樣本判斷的問題。 李世石逆轉取勝的奇招,能找到的樣本很少。 阿爾法go顯然有很多職業棋手的質量很高,需要參考非常全面的對局,這是行不通的。
圍棋難題還得處理
第四局,李世石交手反而能贏,這很不可思議。 因為奧賽羅有先手的特點,勝率很高。
人機大戰引出了長期困擾圍棋界的問題。 是圍棋規則中關于貼目的的規定。 不下圍棋的人可能不知道,但圍棋迷很清楚。 國際象棋棋手是先手,有其特點,所以為了公平起見,黑棋棋手需要盯著白棋棋。
1949年(昭和24年)日本棋院圍棋規則規定,黑方貼4目半。 從1955年第三期王座戰開始,黑棋貼目從4目半變更為5目半。 但據統計,黑方仍占特點。 截止到2001年底,在日本棋院近5年進行的1.5萬局官方公開對局中,(黑膠5目半的情況下)黑膠勝率達到51.86% )。 雖然黑白勝率差別不大,但在激烈的圍棋比賽中,這種差別是致命的。
在國際比賽中實力明顯優異的韓國,在很多比賽中都轉入了第6輪半制。 中國也從2002年春天開始,全部改貼3/3/4子(相當于7目半)。 日本棋院對50年來實行的黑白棋5目半的制度也進行了改革,使一部分比賽接近中韓,從2003年開始使用了所有黑白棋6目半的規則。
截止到年底,中國大陸主辦的第3局和第3/4局(相當于7局半)世界錦標賽共有380局對局,其中小黑贏了200局,勝率為52.6% ( )前3局春蘭杯相當于5局半,未計入)。 另一方面,在臺灣舉行的應氏杯( 8點貼,相當于7目半)為黑勝100局、白勝97局。 據此,即使貼上7目半,黑色似乎也有點特色。
那么,到底黑側對白側盯上多少才是公平的呢? 現在,這個數值是根據很多人的對局統計計算出來的,在數學上并不是完美的答案。
說不定是阿爾法go讓金庸武俠小說的周伯通和郭靖左右勢均力敵,用左手和右手下棋,根據大量內戰結果統計了粘貼目的的合理數值? o,這也不是完美的解答。
如前所述,alpha go之所以能自己下棋,還是根據與人類對局的抽樣來判斷的。 這和直接統計人類對局沒有區別。
完美的解答,還是要回到開頭,用原始的窮舉法,找到下圍棋的優秀解。 這樣,就可以徹底確定粘貼目的的數值。 只是,運算量這么大的工程,不知道什么時候才能實現。
想象一下圍棋被徹底解讀后的樣子。 某國際圍棋大賽開始引起全世界的關注,手持黑手的棋手獲得了第一個孩子。 裁判馬上宣布,手持白手的棋手不必再干了。 比賽結果已經確定,很明顯是誰贏了還是打成平局。 觀眾發出了歡呼聲。
阿爾法go打麻將是如何兼具桌游設計的隨機性的?
雖然圍棋人機大戰人類輸了,但一些網民表示,人類的智慧中還保護著中國麻將。 (詳情請參閱鈦媒體的文案“贏了圍棋也沒什么大不了的。 阿爾法狗敢挑戰麻將嗎? |是鈦做的)。 但是,中搜網絡創始人、北京圍棋業余比賽陳沛對采訪他的記者說:“如果是麻將,人類會輸得更慘吧! 麻將一共那么多,很容易計算。
但是陳沛的話其實是錯的。 如果有一棵傻大樹,他麻將打得不怎么樣,但是他運氣好,快要爆炸了,一開局就自己摸13嗎? 阿爾法go有破解度高的招數嗎?
麻將之類的棋牌游戲是隨機抽牌的,所以有運氣的因素。
一位網友對戲言說,如果麻將時三人聯手對付阿爾法go,阿爾法go會輸得很慘。 這是作弊,但也有大問題。 多人游戲中,局面非常多且復雜,人工智能該如何應對呢?
例如,3只身體在和alpha go打麻將,沒有人作弊,但是甲玩家技術不行,錯了牌,乙玩家受益。 這是阿爾法go無法控制的。
本來,alpha go學習麻將也必須根據與眾多人類對局的樣本來判斷。 阿爾法go只知道什么樣的打法勝率高,但是麻將沒有必勝的打法。
圍棋棋子擺在棋盤上是有目共睹的。 你聽說過倒扣將棋棋子玩的黑暗將棋嗎? 陸戰隊員也有暗手的游戲。 麻將實際上也類似于國際象棋的游戲。 卡片加蓋玩。 建造的棋牌是什么,還得推測。 阿爾法go最多通過計算來判斷,被覆蓋的棋牌是什么的可能性很高,無法通過正確的推論得到結果。 也就是說,阿爾法go只有永遠獲勝才能進化。
圍棋沒有運氣的要素,麻將有運氣的要素,哪一個都有吸引力。
從廣義上說,圍棋、麻將這些棋牌游戲,其實屬于桌游的范疇。 圍棋英語是go,阿爾法GO GO就是從那里來的。 圍棋進入bgg桌游排行榜前100名,中國國際象棋卡牌類游戲排名很高。
在民間,象棋和圍棋這種沒有運氣要素的棋牌(桌游)正在沒落。 現在關注圍棋人機大戰的網民是圍棋迷嗎?
因為大眾想要的是更娛樂的。 像象棋和圍棋這樣沒有運氣因素的,游戲水平比較穩定。 他是名人。 普通人不容易贏。 除非你能找到象棋力量正好和你水平差不多的東西,否則玩起來沒意思。 強的東西太強了,太弱了。
因此,新興桌游的設計宗旨必須保證隨機性,具有運氣因素。 像萬智牌、游戲王、爐石傳說那樣隨機抽牌,像國際象棋和大富翁一樣擲骰子,都會產生隨機數,帶來運氣成分。 如果有運氣的要素,所有玩家發揮的水平就不會太大不同,可以聚在一起開心地玩。
另一方面,沒有運氣因素的棋牌(桌游),理論上一定會存在優秀的解,所以一旦出現優秀的解,一定會引起興趣。 圍棋變化太多,至今也沒有優秀的解,所以一直活到了今天。 現在,阿爾法go并沒有完全打敗李世石,圍棋的生命力看起來還很頑強。
相關查詢
溫馨提示:尊敬的[]站點管理員,將本頁鏈接加入您的網站友情鏈接,下次可以快速來到這里更新您的站點信息哦!每天更新您的[“AlphaGo首出Bug,圍棋算法的死穴在哪兒?”]站點信息,可以排到首頁最前端的位置,讓更多人看到您站點的信息哦。
