国产成人精品三级麻豆,色综合天天综合高清网,亚洲精品夜夜夜,国产成人综合在线女婷五月99播放,色婷婷色综合激情国产日韩

當(dāng)前位置:首頁 > 嵌入式培訓(xùn) > 嵌入式學(xué)習(xí) > 講師博文 > 從AlphaGo大戰(zhàn)李世乭,看人工智能的現(xiàn)在與未來

從AlphaGo大戰(zhàn)李世乭,看人工智能的現(xiàn)在與未來 時間:2018-09-25      來源:未知

這些天,一場世紀(jì)大對決了輿論焦點。谷歌人工智能程序AlphaGo與人類圍棋大師李世乭于2016年3月9日~15日進(jìn)行5場廝殺,而此前AlphaGo已經(jīng)在2015年10月以5:0的比分完勝歐洲職業(yè)冠軍樊麾。這將是比較人工智能與人類智慧孰高孰下的一次重要的對抗展示。

19年前,計算機(jī)擊敗象棋大師卡斯帕羅夫,震驚一時。當(dāng)時的情景還歷歷在目,19年過去,計算機(jī)又來攻克號稱“只有人類才能玩”的圍棋了么?

一、淺析AlphaGo的原理

首先我們要對圍棋進(jìn)行一下簡單的了解。圍棋棋盤有19*19路,共361個交叉點,每個交叉點可以有三種狀態(tài):黑子(用1表示)白子(用-1表示)無子(用0表示)。再加上其他信息(例如這個棋子的“氣”等問題),我們可以用一個n維向量來表示一個棋盤的狀態(tài)。把這個棋盤狀態(tài)向量記為s。

在狀態(tài)s下,可供下一步落子的空間也可以用n維向量來表示,記為a。這樣,針對圍棋的人工智能程序的基本思想就是:任意給定一個s狀態(tài),計算(或?qū)ふ?好的應(yīng)對策略a。讓程序按照這個思想運行下去,即可贏得比賽。

那么,設(shè)計一個驚世駭俗的圍棋程序,從哪里開始呢?在Google工作的黃世杰團(tuán)隊祭出了第一招:

“深度卷積神經(jīng)網(wǎng)絡(luò)”

深度卷積神經(jīng)網(wǎng)絡(luò)在98年就已經(jīng)攻克了手寫數(shù)字識別,近年來在人臉圖像識別、圖像分類、天氣預(yù)報等領(lǐng)域已基本達(dá)到了人類水平,是深度學(xué)習(xí)的基礎(chǔ)算法之一。黃世杰團(tuán)隊借助圍棋對戰(zhàn)平臺KGS,獲得了大約3000萬個對戰(zhàn)樣本。將每個樣本處理成19*19的二維圖像,輸入一個卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)。在學(xué)習(xí)過程中,針對某個棋局狀態(tài)s,計算機(jī)可以計算出人類選手可能選取的落子點若干,每個點的落子概率不同,以概率排序,選擇大概率的點作為應(yīng)對a’。重復(fù)這個過程,就能夠完成一盤對局。通過不斷訓(xùn)練這個網(wǎng)絡(luò)(樣本數(shù)增加,對神經(jīng)網(wǎng)絡(luò)的刺激增加),計算機(jī)得到的落子結(jié)果a’就能無限接近人類高手的落子結(jié)果a。

然而基于這個算法的程序的棋力如何?老實說,不咋地。只能達(dá)到業(yè)余6段水平左右,戰(zhàn)勝一般圍棋愛好者似乎足夠,但要挑戰(zhàn)一等一的圍棋高手還相差甚遠(yuǎn)。

所以,黃世杰改進(jìn)了算法,祭出了第二招:

“MCTS”(蒙特卡洛搜索樹)

蒙特卡洛搜索樹是這樣做的:面對一個空白棋盤s0,假設(shè)我們用扔骰子的方式隨機(jī)選擇一個位置落子,得到一個狀態(tài)s1,對方也隨機(jī)扔骰子,選擇一個位置落子,得到狀態(tài)s2。不斷重復(fù)這個過程,直至完成對局sn。若這局贏了,記分r記為1,輸了記為0,這樣便模擬出了一盤圍棋的對局。于是,針對起始位置s0和其應(yīng)對a0,便有了一個分?jǐn)?shù)r=1。

之后從開始再重復(fù)對局一次,不過對手的應(yīng)對換了一個a1。若對局完成還是能夠獲勝,則將的分?jǐn)?shù)r再加一分。不斷增加樣本,終會得到一個分?jǐn)?shù)高的起始位置,這個位置就是“有前途”的起始位置。選擇“有前途”的起始位置落子,再針對下一步進(jìn)行同樣的思考。

可以發(fā)現(xiàn),蒙特卡洛搜索樹與卷積神經(jīng)網(wǎng)絡(luò)有2點不同:

1)沒有人工干預(yù),完全可以自發(fā)“想像”來提高對弈能力。

2)在思考完這步的策略后,還可以繼續(xù)思考下一步策略。即可以不斷思考直至對局完成。

從這兩點可以看出,使用蒙特卡洛搜索樹模擬的程序,已經(jīng)與人類玩家的思考模式高度類似了。

為了進(jìn)一步提高M(jìn)CTS的棋力,黃世杰團(tuán)隊又祭出的第三招:

“左右互博,自我進(jìn)化”

通過蒙特卡洛搜索樹來對抗蒙特卡洛搜索樹,不僅能夠快速獲得大量樣本用于學(xué)習(xí),而且還能不斷訓(xùn)練蒙特卡洛搜索樹,對蒙特卡洛搜索樹進(jìn)行優(yōu)化。

萬事俱備,將卷積神經(jīng)網(wǎng)絡(luò)與蒙特卡洛搜索樹進(jìn)行結(jié)合,AlphaGo的基本“大腦”便完成了。AlphaGo有兩個“大腦”:落子選擇器(Move Picker)用來預(yù)測每一步的佳落子位置;棋局評估器(Position Evaluator)用來輔助落子選擇器,通過判斷整體棋局的形式來分析落子選擇器得出的結(jié)果是“好”還是“壞”。深度學(xué)習(xí)、蒙特卡洛搜索樹、自我進(jìn)化,三招齊出,AlphaGo對于其他的圍棋對戰(zhàn)程序勝率已達(dá)到95%以上,甚至還在讓4子的基礎(chǔ)上以77%的勝率擊敗了另一個圍棋對抗程序crazystone,絕對是當(dāng)今人工智能領(lǐng)域的巔峰之作。

二、AlphaGo挑戰(zhàn)圍棋的意義

圍棋是NP-hard問題,平均每回合有250種可能,一盤棋平均長達(dá)150回合,有3^361種局面,綜合所有情況我們能得到的所有情況數(shù)字大概是10^170,而已知的宇宙中原子總數(shù)量才10^80。如此龐大的數(shù)目,根本不可能使用暴力窮舉法來破解,而人類棋手卻能夠看穿棋局的本質(zhì),這也是人類有思考能力的體現(xiàn)。如果AlphaGo能夠挑戰(zhàn)人類棋手成功,至少說明AlphaGo的自我學(xué)習(xí)能力與自我思考能力方面已與人類無異,人工智能的黎明已經(jīng)到來。

而未來,人工智能可以應(yīng)用在諸如股市、工業(yè)生產(chǎn)制造、交通、能源等領(lǐng)域,甚至我們可能制造出搭載人工智能的飛船去代替人類尋找其他文明!AlphaGo的神經(jīng)網(wǎng)絡(luò)與自我學(xué)習(xí)的能力無疑是十分強(qiáng)大的。

但是,現(xiàn)階段AlphaGo仍有許多不足。首先AlphaGo對于大局的把控仍不夠好。AlphaGo在局部小規(guī)模戰(zhàn)斗上會十分厲害,因為它能給出各種對抗人類的下法,而對于全局局勢的判斷則明顯弱于人類。例如對戰(zhàn)樊麾時的第二局中的第31步,雖然在局部來說這一手棋是正確的落子法,而對于大局而言,這一手并沒有什么實質(zhì)作用,可以說是丟了西瓜撿芝麻。另外,AlphaGo對于“隨機(jī)變化”的應(yīng)對還不夠充分。在與李世乭對戰(zhàn)的第四局中,李世乭下出被稱為“驚天一手”、“足以載入史冊”的第78手,而面對突如其來的變數(shù),AlphaGo在接下來的幾步棋中竟連連判斷失誤,雖然后期奮起直追努力搬回局面,但仍回天乏力,輸?shù)袅诉@一局。

未來,AlphaGo還將挑戰(zhàn)更多“只有人類才擅長”的領(lǐng)域,據(jù)說AlphaGo的下一個目標(biāo)是挑戰(zhàn)熱門的RTS類游戲——星際爭霸2,相信在不遠(yuǎn)的未來,AlphaGo與其他人工智能設(shè)備能夠完成挑戰(zhàn),開啟人工智能新時代。

三、AlphaGo戰(zhàn)勝李世乭——機(jī)器學(xué)習(xí)的進(jìn)步和機(jī)器的覺醒?

電影《終結(jié)者》講述了在未來世界,擁有人工智能的機(jī)器向人類大舉宣戰(zhàn)的場景。AlphaGo贏得李世乭的優(yōu)異表現(xiàn),使得部分人類開始驚恐起來——人工智能的時代已經(jīng)來臨,人類被機(jī)器奴役的時代還遠(yuǎn)嗎?

實際上,現(xiàn)階段的人工智能和我們的想像(或電影的描述)完全不同。AI的行為邊界是圖靈測試。現(xiàn)階段還沒有一臺機(jī)器能夠通過圖靈測試,F(xiàn)階段的人工智能只是進(jìn)行這樣的操作——接收一些輸入,改變輸入狀態(tài)(計算結(jié)果),給出一些輸出。有人會問,機(jī)器不會自己修改計算參數(shù)嗎?修改過計算參數(shù)后,輸出不就不確定了嗎?也就是不可控了嗎?實際上,“參數(shù)改變”這件事也是確定的,可變的參數(shù)以及變化范圍也是人類已知的。目前AI超過人類的地方,只有計算量大、計算速度快、記憶力爆棚,僅此而已。

而且,現(xiàn)階段的人工智能還只能處理離散問題。對于一些非離散問題(例如哲學(xué)、情感、人際關(guān)系等“不可量化”的量),還沒有合適的算法將其轉(zhuǎn)化為離散問題。因此,機(jī)器還不具備逆天的能力來奴役人類。

AI發(fā)展到目前,與其他的工具——電視、手機(jī)、扳手、衣架等——沒什么本質(zhì)區(qū)別,那就是還沒有“思維”。目前AlphaGo戰(zhàn)勝了李世乭,好比汽車提速到了100km/h以上,電視能播放4K視頻……并沒有質(zhì)的變化,只是量的變化而已。

至于未來,若有秘密科學(xué)組織,已經(jīng)破解了人類的“思維”,研究透了思維的形成、運作原理,以此發(fā)明非圖靈機(jī),讓機(jī)器有思想。若真有這樣的組織,我只能說——年輕人,不要看科幻小說了。

總而言之,AlphaGo所代表的人工智能并不能挑戰(zhàn)甚至奴役人類,我們只是又發(fā)明了一個趁手的計算工具而已。

上一篇:綁定服務(wù)時什么時候調(diào)用onRebind

下一篇:師兄碼字2000談在華清學(xué)習(xí)的感受

熱點文章推薦
華清學(xué)員就業(yè)榜單
高薪學(xué)員經(jīng)驗分享
熱點新聞推薦
前臺專線:010-82525158 企業(yè)培訓(xùn)洽談專線:010-82525379 院校合作洽談專線:010-82525379 Copyright © 2004-2022 北京華清遠(yuǎn)見科技集團(tuán)有限公司 版權(quán)所有 ,京ICP備16055225號-5,京公海網(wǎng)安備11010802025203號

回到頂部