2017年12月25日 星期一

AlphaGo Zero

AlphaGo時認為人機對弈:現有規則下,除非出現艾西莫夫基地中的騾,勝負已無懸念。人就算贏了AlphaGo也贏不了BetaGo

沒有BetaGoAlphaGo後繼者非常美學的加上ZeroZero意指「零先備知識」,輸入圍棋規則後,不再採取棋譜輸入的教育方式,讓其透過自主學習發展出定石劫爭諸般圍棋技巧,兩三天後即打敗深度學習型的前輩版本。AlphaGo/AlphaGo Master屢出鬼手探索了人力不及的圍棋世界,AlphaGo Zero則從侷限條件出發,重新發明輪子重新建構世界。

AI的樂觀派認為,
1. AI運用範圍通常具備特定指向;
2. AI無情緒無慾望;
所以,不會因為慾望而與人類競爭或仇視人類,不會對人產生敵意來消滅人類。

現成有真實而低階的例子。微軟曾推出聊天機器人TAY,不到一天就因學會歧視及攻擊式回應而下架。如果人類是藉由人際互動學習,把純潔的AI丟入社會,不難想像會教出甚麼學生。
如果AI不經由學習,而採取純粹乾淨的理性思考,那,面對持續傷害地球的人類,又會採取甚麼態度。

AlphaGo Zero揭示了特定領域中,如何用一個支點撐起全世界。AI未來會撐起甚麼樣的世界?人類不會是仇視對象,不會是競爭對手,或者只是需要予以侷限或移除的不利因素。

7C25

沒有留言:

張貼留言