但是AlphaGo首戰的水準漂浮不定,在比賽開始前期犯下了一些低級錯誤,但後來又有一些妙招,讓李世石難以判斷對手下棋的方式,並且可能是這個開始的錯誤導致李世石的輕敵。

不過,如果他能與這位「阿光」多談談,或許就能多瞭解AlphaGo的「個性」。因為這位坐在他對面的人類棋手黃士傑,其實不光只是一個人類傀儡而已,他也是負責打造AlphaGo大腦的團隊核心人物之一。

根據他在論文中表示,雖然電腦圍棋的研究開始於1970年,但是圍棋程式從未被人們認為是強大的。一直到2006年,當「蒙地卡羅樹搜尋」與「樹狀結構信賴上界法」出現之後,才帶來了圍棋程式的革命。

蒙地卡羅是一種大數法則的方法,使用隨機取樣,而不用把所有的可能都估算到。但是當取樣的次數越多,其所得出的平均值將趨近於理論值。這個方式應用在圍棋時,會隨機下子直到盤末,由此依據各點模擬的結果,來對於盤面進行優劣的評估,從中選出最好的下子方式。



棋類比賽基本上都是利用搜尋樹展開演算法,用搜尋樹來判斷對手下子的可能性,然後依照一些資訊來進行優劣判斷,再來從多種可能的結果選出最好的一步來下子。

▲之前AlphaGo擊敗歐洲歐洲圍棋冠軍樊麾(左)時,也是由黃士傑(右)擔任人房屋貸款類棋手。





「深藍」不是已經打敗過西洋棋王了嗎?圍棋有什麼難的?

內容來自YAHOO新聞

負債整合

在第一場比賽,根據職業棋貸款手認為,首戰導致李世石落敗的原因並不在於 AlphaGo 的強大,而是他的輕敵。最明顯表現是他的思考並不充分,所用的時間遠遠少於對手。

有些網友說,早在多年前IBM的深藍不是已經在1997年打敗過棋王了嗎?這次AlphaGo打敗棋王又有什麼大驚小怪?

問題是那次深藍打敗的是西洋棋的冠軍,這次打敗的是圍棋冠軍。圍棋,被視為是目前難度最高的一項棋類比賽,難就難在圍棋的變化高出西洋棋許多。因此擊敗人類的圍棋冠軍,一直是科學界發展人工智慧的重要目標。

新聞來源https://tw.news.yahoo.com/幫alphago擊敗南韓李世石的那個人-台灣資工博士黃士傑-033200506.html

以複雜度來說:
● 西洋棋的複雜度為:10的123次方。
● 中國象棋的複雜度為:10的150次方。
● 日本將棋的複雜度為:10的226次方。
● 圍棋的複雜度為:10的360次方。

▲西洋棋每走一步,有24種可能性。而圍棋則每一步有兩百種,再往下算下去將無窮無盡。

在西洋棋裡面,電腦的搜尋樹可以利用棋子的位置、棋子的數量來判斷優劣,因此在樹的展開可以依照每個棋局的局面來往下進行深度的搜尋。但是圍棋的邏輯性沒有那麼強,比較難得到判斷的方式。甚至有時你問頂尖棋手為什麼當時要下某一子的時候,他也只能回答你「靈光乍現」,這也是為什麼科技人工智慧這麼想要在圍棋上取得成果的原因。

黃士傑,一位熱愛圍棋的資工人

黃士傑是土生土長的台灣人,業餘圍棋六段,台灣師範大學資訊工程系碩士、台灣師範大學資訊工程系博士。他在91年的碩士論文為「電腦圍棋打劫的策略」,99年(西元2010年)的博士論文為「應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法」。

他在這次比賽之後接受採訪時表示:「deepmind應該是在14年底之前、在AlphaGo團隊出現之前就創建了。我本人喜歡下圍棋,棋力是臺灣業餘六段,去年在德國的比賽我甚至贏過一位日本職業棋手。但AlphaGo肯定是比我強太多了。職業水準的圍棋軟體,應該最慢在1-2年之內就會在市面上普及。」

貸款幫AlphaGo擊敗南韓李世石的那個人:台灣資工博士黃士傑

這個方法多少帶有點運氣,但是當取樣數量越多的時候,誤差會相對變低。2006 年,法國科學家以蒙地卡羅方式發展出的 Crazy Stone 在 第十一屆電腦奧林匹克 9*9 比賽中獲得了冠軍。



而「應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法」這篇博士論文的指導教授之一,正是Crazy Stone 的那位法國開發者Rémi Coulom博士。而拿到了博士學位的黃士傑,之後也曾獲2012年臺灣電腦對局學會博士論文獎與2010 年19 路電腦圍棋金牌。

最後,值得一提的是,在這份2010年他才發表的博士論文摘要中,有這樣一段話:

「雖然電腦圍棋的研究開始於1970年,但是圍棋程式從未被人們認為是強大的。一直到2006年,當「蒙地卡羅樹搜尋」與「樹狀結構信賴上界法」出現之後,才帶來了圍棋程式的革命。人們才開始相信,圍棋程式在10年或者20年之後,將能夠擊敗頂尖的人類棋手」

現在,這份論文才發表不過6年的時間,他就親手把自己的預言給打破。

資料來源:pingwest、中央社



跟機器對戰與跟人類對戰的差異點在於,棋手原本會從現場對手的表現、下子的姿態來判斷對方的心情、狀況。但信貸是與 AlphaGo對決,那個「人」只是一個替代電腦下子的工具。李世石無法從這個棋手的表現來判斷,只能從對方下子的策略來觀察。

8445B2162FF7B790
arrow
arrow

    j57fd77pdr 發表在 痞客邦 留言(0) 人氣()