柯潔輸瞭,柯潔又贏瞭。
排名第一的柯潔九段大意失荊州,在 11 月 16 日的第 22 屆 LG 杯世界棋王賽半決賽上,意外輸給日本七冠王井山裕太九段,再度無緣 LG 杯決賽。
不知道是不是受到瞭今年 5 月份在烏鎮輸給 AlphaGo 的影響,今年以來,柯潔已經無緣春蘭杯、三星杯、LG 杯三大賽冠軍,隻剩下 12 月中下旬的新奧杯可以滿足一下他對冠軍的爭奪。
但這似乎並沒有影響到柯潔的心情。
11 月 18 日凌晨零點剛過,柯潔發瞭一條微博,稱他昨天終結瞭一個昵稱叫 " 符合預期 " 的圍棋 AI 的 41 連勝," 一度覺得沒法繼續瞭的棋,很艱苦贏瞭下來。"
柯潔認為 " 符合預期 " 的實力在去年戰勝李世乭的 AlphaGo 之上,他還發出瞭一個世紀之問:" 若是當初第一個與 AlphaGo 對弈的人是我?結果到底會是如何?今夜未成眠 ……"
顯然,在柯潔眼裡,戰勝圍棋 AI" 符合預期 " 是要比贏得 LG 杯冠軍更值得慶祝的事情,畢竟自從 AlphaGo 去年 3 月份贏瞭李世乭後,人類就沒有在這項古老的技藝上挽尊過。
2017 年 1 月初,披著 Master 馬甲的 AlphaGo 一路過五關斬六將,幹掉樸廷桓、元晟溱、柯潔、聶衛平等一眾世界頂尖圍棋高手,豪取 59 連勝後,在電腦上幽幽地飄出一句話:" 我是 AlphaGo 的黃博士。" 隨後又毫無懸念地贏瞭古力,以 60 勝 0 敗收場。
3 月 19 日,在第十屆 UEC 杯世界圍棋 AI 大賽上,中國 AI 絕藝在決賽中逆襲,一舉擊敗瞭奪冠呼聲最高的日本 AI DeepZenGo,獲得冠軍。
然後就是今年 5 月 23 日在烏鎮舉行的世紀之戰,世界排名第一的柯潔對戰 AlphaGo,第一盤在耗時 4 小時 25 分後,柯潔以四分之一子敗給瞭 AlphaGo,聶衛平表示這還是 "AlphaGo 一再退讓的結果 ",柯潔說:" 我很早就知道自己要輸 1/4 子,AlphaGo 每步棋都是勻速,在最後單官階段也是如此,所以我就有時間點目,看清自己輸 1/4 子,所以隻好苦笑。感覺 AlphaGo 和去年判若兩人,當時覺得他的棋很接近人,現在感覺越來越像圍棋上帝。"
5 月 25 日,第二盤,柯潔執白再次輸給瞭 AlphaGo,盤面上大龍橫死,隻是這次輸得快多瞭。
5 月 27 日,柯潔在第三盤還是輸瞭,他哭瞭,在認輸之後,他起身走到宣傳板後沒有攝像機鏡頭的區域獨自流淚,哭得像個孩子。
後來,AlphaGo 獲得瞭九段稱號,但隨後從世界排名中停留瞭一段時間被消失瞭。
就在我們都以為 AlphaGo 就此收手時,在 10 月 19 日又投下一個炸彈。DeepMind 團隊在 Nature 上發表瞭題為 Mastering the game of Go without human knowledge 的重磅論文,稱新一代的 AlphaGo Zero,完全從零開始,不需要任何歷史棋譜的指引,更不需要參考人類任何的先驗知識,完全靠自己一個人強化學習(Reinforcement learning)和參悟,以 100:0 的成績戰勝瞭 AlphaGo。
作為 AlphaGo 的主要設計者之一,也是 AlphaGo 的 " 人肉手臂 ",Deepmind 資深研究員的黃士傑日前在臺灣中研院舉辦的 "2017 年人工智慧年會 " 上談到 AlphaGo 的幾次比賽,談到 AlphaGo Zero 時,他說:" 什麼是 AlphaGo Zero?我們拿掉所有人類對圍棋的知識,隻喂 AlphaGo Zero 圍棋規則,讓它自己學習下棋。"
"AlphaGo 的成功就是深度學習與強化學習的勝利,因為兩者結合在一起,建構判斷形式的價值網絡 ( Value Network ) ,後來也成為 AlphaGo Zero 的主要理論。" 黃世傑說,"AlphaGo Zero 是從亂下開始,找出圍棋的下法,它隻用瞭三天,走過瞭人類研究圍棋的千年歷程。"
據悉,隻經過瞭 40 天的訓練,AlphaGo Zero 就超越瞭 Master。
在人類已經絕無可能贏下圍棋 AI 的時候,柯潔在前一天輸掉 LG 杯、輸給同類後,他反而贏瞭圍棋 AI" 符合預期 ",並終結瞭後者的 41 連勝,非常戲劇性。
柯潔說:" 這個昵稱為‘符合預期’的 AI 尤其強,實力應該已經遠超當時與李世石對弈的 AlphaGo 瞭吧?"
那這位 " 符合預期 " 是誰傢的 AI 呢?你給我出來。