柯潔這次輸給瞭人類，卻贏瞭圍棋 AI

柯潔輸瞭，柯潔又贏瞭。

排名第一的柯潔九段大意失荊州，在 11 月 16 日的第 22 屆 LG 杯世界棋王賽半決賽上，意外輸給日本七冠王井山裕太九段，再度無緣 LG 杯決賽。

不知道是不是受到瞭今年 5 月份在烏鎮輸給 AlphaGo 的影響，今年以來，柯潔已經無緣春蘭杯、三星杯、LG 杯三大賽冠軍，隻剩下 12 月中下旬的新奧杯可以滿足一下他對冠軍的爭奪。

但這似乎並沒有影響到柯潔的心情。

11 月 18 日凌晨零點剛過，柯潔發瞭一條微博，稱他昨天終結瞭一個昵稱叫 " 符合預期 " 的圍棋 AI 的 41 連勝，" 一度覺得沒法繼續瞭的棋，很艱苦贏瞭下來。"

柯潔認為 " 符合預期 " 的實力在去年戰勝李世乭的 AlphaGo 之上，他還發出瞭一個世紀之問：" 若是當初第一個與 AlphaGo 對弈的人是我？結果到底會是如何？今夜未成眠 ……"

顯然，在柯潔眼裡，戰勝圍棋 AI" 符合預期 " 是要比贏得 LG 杯冠軍更值得慶祝的事情，畢竟自從 AlphaGo 去年 3 月份贏瞭李世乭後，人類就沒有在這項古老的技藝上挽尊過。

2017 年 1 月初，披著 Master 馬甲的 AlphaGo 一路過五關斬六將，幹掉樸廷桓、元晟溱、柯潔、聶衛平等一眾世界頂尖圍棋高手，豪取 59 連勝後，在電腦上幽幽地飄出一句話：" 我是 AlphaGo 的黃博士。" 隨後又毫無懸念地贏瞭古力，以 60 勝 0 敗收場。

3 月 19 日，在第十屆 UEC 杯世界圍棋 AI 大賽上，中國 AI 絕藝在決賽中逆襲，一舉擊敗瞭奪冠呼聲最高的日本 AI DeepZenGo，獲得冠軍。

然後就是今年 5 月 23 日在烏鎮舉行的世紀之戰，世界排名第一的柯潔對戰 AlphaGo，第一盤在耗時 4 小時 25 分後，柯潔以四分之一子敗給瞭 AlphaGo，聶衛平表示這還是 "AlphaGo 一再退讓的結果 "，柯潔說：" 我很早就知道自己要輸 1/4 子，AlphaGo 每步棋都是勻速，在最後單官階段也是如此，所以我就有時間點目，看清自己輸 1/4 子，所以隻好苦笑。感覺 AlphaGo 和去年判若兩人，當時覺得他的棋很接近人，現在感覺越來越像圍棋上帝。"

5 月 25 日，第二盤，柯潔執白再次輸給瞭 AlphaGo，盤面上大龍橫死，隻是這次輸得快多瞭。

5 月 27 日，柯潔在第三盤還是輸瞭，他哭瞭，在認輸之後，他起身走到宣傳板後沒有攝像機鏡頭的區域獨自流淚，哭得像個孩子。

後來，AlphaGo 獲得瞭九段稱號，但隨後從世界排名中停留瞭一段時間被消失瞭。

就在我們都以為 AlphaGo 就此收手時，在 10 月 19 日又投下一個炸彈。DeepMind 團隊在 Nature 上發表瞭題為 Mastering the game of Go without human knowledge 的重磅論文，稱新一代的 AlphaGo Zero，完全從零開始，不需要任何歷史棋譜的指引，更不需要參考人類任何的先驗知識，完全靠自己一個人強化學習（Reinforcement learning）和參悟，以 100:0 的成績戰勝瞭 AlphaGo。

作為 AlphaGo 的主要設計者之一，也是 AlphaGo 的 " 人肉手臂 "，Deepmind 資深研究員的黃士傑日前在臺灣中研院舉辦的 "2017 年人工智慧年會 " 上談到 AlphaGo 的幾次比賽，談到 AlphaGo Zero 時，他說：" 什麼是 AlphaGo Zero？我們拿掉所有人類對圍棋的知識，隻喂 AlphaGo Zero 圍棋規則，讓它自己學習下棋。"

"AlphaGo 的成功就是深度學習與強化學習的勝利，因為兩者結合在一起，建構判斷形式的價值網絡 ( Value Network ) ，後來也成為 AlphaGo Zero 的主要理論。" 黃世傑說，"AlphaGo Zero 是從亂下開始，找出圍棋的下法，它隻用瞭三天，走過瞭人類研究圍棋的千年歷程。"

據悉，隻經過瞭 40 天的訓練，AlphaGo Zero 就超越瞭 Master。

在人類已經絕無可能贏下圍棋 AI 的時候，柯潔在前一天輸掉 LG 杯、輸給同類後，他反而贏瞭圍棋 AI" 符合預期 "，並終結瞭後者的 41 連勝，非常戲劇性。

柯潔說：" 這個昵稱為‘符合預期’的 AI 尤其強，實力應該已經遠超當時與李世石對弈的 AlphaGo 瞭吧？"

那這位 " 符合預期 " 是誰傢的 AI 呢？你給我出來。

意見反饋

柯潔這次輸給瞭人類，卻贏瞭圍棋 AI