成人av无码一区二区三区,最近日本mv字幕免费观看视频,国产精品美女久久久久av爽

當(dāng)前位置：首頁 > 嵌入式培訓(xùn) > 嵌入式學(xué)習(xí) > 講師博文 > 從AlphaGo大戰(zhàn)李世乭，看人工智能的現(xiàn)在與未來

從AlphaGo大戰(zhàn)李世乭，看人工智能的現(xiàn)在與未來時間：2018-09-25 來源：未知

這些天，一場世紀(jì)大對決了輿論焦點。谷歌人工智能程序AlphaGo與人類圍棋大師李世乭于2016年3月9日~15日進(jìn)行5場廝殺，而此前AlphaGo已經(jīng)在2015年10月以5:0的比分完勝歐洲職業(yè)冠軍樊麾。這將是比較人工智能與人類智慧孰高孰下的一次重要的對抗展示。

19年前，計算機(jī)擊敗象棋大師卡斯帕羅夫，震驚一時。當(dāng)時的情景還歷歷在目，19年過去，計算機(jī)又來攻克號稱“只有人類才能玩”的圍棋了么?

一、淺析AlphaGo的原理

首先我們要對圍棋進(jìn)行一下簡單的了解。圍棋棋盤有19*19路，共361個交叉點，每個交叉點可以有三種狀態(tài)：黑子(用1表示)白子(用-1表示)無子(用0表示)。再加上其他信息(例如這個棋子的“氣”等問題)，我們可以用一個n維向量來表示一個棋盤的狀態(tài)。把這個棋盤狀態(tài)向量記為s。

在狀態(tài)s下，可供下一步落子的空間也可以用n維向量來表示，記為a。這樣，針對圍棋的人工智能程序的基本思想就是：任意給定一個s狀態(tài)，計算(或?qū)ふ?好的應(yīng)對策略a。讓程序按照這個思想運行下去，即可贏得比賽。

那么，設(shè)計一個驚世駭俗的圍棋程序，從哪里開始呢?在Google工作的黃世杰團(tuán)隊祭出了第一招：

“深度卷積神經(jīng)網(wǎng)絡(luò)”

深度卷積神經(jīng)網(wǎng)絡(luò)在98年就已經(jīng)攻克了手寫數(shù)字識別，近年來在人臉圖像識別、圖像分類、天氣預(yù)報等領(lǐng)域已基本達(dá)到了人類水平，是深度學(xué)習(xí)的基礎(chǔ)算法之一。黃世杰團(tuán)隊借助圍棋對戰(zhàn)平臺KGS，獲得了大約3000萬個對戰(zhàn)樣本。將每個樣本處理成19*19的二維圖像，輸入一個卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)。在學(xué)習(xí)過程中，針對某個棋局狀態(tài)s，計算機(jī)可以計算出人類選手可能選取的落子點若干，每個點的落子概率不同，以概率排序，選擇大概率的點作為應(yīng)對a’。重復(fù)這個過程，就能夠完成一盤對局。通過不斷訓(xùn)練這個網(wǎng)絡(luò)(樣本數(shù)增加，對神經(jīng)網(wǎng)絡(luò)的刺激增加)，計算機(jī)得到的落子結(jié)果a’就能無限接近人類高手的落子結(jié)果a。

然而基于這個算法的程序的棋力如何?老實說，不咋地。只能達(dá)到業(yè)余6段水平左右，戰(zhàn)勝一般圍棋愛好者似乎足夠，但要挑戰(zhàn)一等一的圍棋高手還相差甚遠(yuǎn)。

所以，黃世杰改進(jìn)了算法，祭出了第二招：

“MCTS”(蒙特卡洛搜索樹)

蒙特卡洛搜索樹是這樣做的：面對一個空白棋盤s0，假設(shè)我們用扔骰子的方式隨機(jī)選擇一個位置落子，得到一個狀態(tài)s1，對方也隨機(jī)扔骰子，選擇一個位置落子，得到狀態(tài)s2。不斷重復(fù)這個過程，直至完成對局sn。若這局贏了，記分r記為1，輸了記為0，這樣便模擬出了一盤圍棋的對局。于是，針對起始位置s0和其應(yīng)對a0，便有了一個分?jǐn)?shù)r=1。

之后從開始再重復(fù)對局一次，不過對手的應(yīng)對換了一個a1。若對局完成還是能夠獲勝，則將的分?jǐn)?shù)r再加一分。不斷增加樣本，終會得到一個分?jǐn)?shù)高的起始位置，這個位置就是“有前途”的起始位置。選擇“有前途”的起始位置落子，再針對下一步進(jìn)行同樣的思考。

可以發(fā)現(xiàn)，蒙特卡洛搜索樹與卷積神經(jīng)網(wǎng)絡(luò)有2點不同：

1)沒有人工干預(yù)，完全可以自發(fā)“想像”來提高對弈能力。

2)在思考完這步的策略后，還可以繼續(xù)思考下一步策略。即可以不斷思考直至對局完成。

從這兩點可以看出，使用蒙特卡洛搜索樹模擬的程序，已經(jīng)與人類玩家的思考模式高度類似了。

為了進(jìn)一步提高M(jìn)CTS的棋力，黃世杰團(tuán)隊又祭出的第三招：

“左右互博，自我進(jìn)化”

通過蒙特卡洛搜索樹來對抗蒙特卡洛搜索樹，不僅能夠快速獲得大量樣本用于學(xué)習(xí)，而且還能不斷訓(xùn)練蒙特卡洛搜索樹，對蒙特卡洛搜索樹進(jìn)行優(yōu)化。

萬事俱備，將卷積神經(jīng)網(wǎng)絡(luò)與蒙特卡洛搜索樹進(jìn)行結(jié)合，AlphaGo的基本“大腦”便完成了。AlphaGo有兩個“大腦”：落子選擇器(Move Picker)用來預(yù)測每一步的佳落子位置;棋局評估器(Position Evaluator)用來輔助落子選擇器，通過判斷整體棋局的形式來分析落子選擇器得出的結(jié)果是“好”還是“壞”。深度學(xué)習(xí)、蒙特卡洛搜索樹、自我進(jìn)化，三招齊出，AlphaGo對于其他的圍棋對戰(zhàn)程序勝率已達(dá)到95%以上，甚至還在讓4子的基礎(chǔ)上以77%的勝率擊敗了另一個圍棋對抗程序crazystone，絕對是當(dāng)今人工智能領(lǐng)域的巔峰之作。

二、AlphaGo挑戰(zhàn)圍棋的意義

圍棋是NP-hard問題，平均每回合有250種可能，一盤棋平均長達(dá)150回合，有3^361種局面，綜合所有情況我們能得到的所有情況數(shù)字大概是10^170，而已知的宇宙中原子總數(shù)量才10^80。如此龐大的數(shù)目，根本不可能使用暴力窮舉法來破解，而人類棋手卻能夠看穿棋局的本質(zhì)，這也是人類有思考能力的體現(xiàn)。如果AlphaGo能夠挑戰(zhàn)人類棋手成功，至少說明AlphaGo的自我學(xué)習(xí)能力與自我思考能力方面已與人類無異，人工智能的黎明已經(jīng)到來。

而未來，人工智能可以應(yīng)用在諸如股市、工業(yè)生產(chǎn)制造、交通、能源等領(lǐng)域，甚至我們可能制造出搭載人工智能的飛船去代替人類尋找其他文明!AlphaGo的神經(jīng)網(wǎng)絡(luò)與自我學(xué)習(xí)的能力無疑是十分強(qiáng)大的。

但是，現(xiàn)階段AlphaGo仍有許多不足。首先AlphaGo對于大局的把控仍不夠好。AlphaGo在局部小規(guī)模戰(zhàn)斗上會十分厲害，因為它能給出各種對抗人類的下法，而對于全局局勢的判斷則明顯弱于人類。例如對戰(zhàn)樊麾時的第二局中的第31步，雖然在局部來說這一手棋是正確的落子法，而對于大局而言，這一手并沒有什么實質(zhì)作用，可以說是丟了西瓜撿芝麻。另外，AlphaGo對于“隨機(jī)變化”的應(yīng)對還不夠充分。在與李世乭對戰(zhàn)的第四局中，李世乭下出被稱為“驚天一手”、“足以載入史冊”的第78手，而面對突如其來的變數(shù)，AlphaGo在接下來的幾步棋中竟連連判斷失誤，雖然后期奮起直追努力搬回局面，但仍回天乏力，輸?shù)袅诉@一局。

未來，AlphaGo還將挑戰(zhàn)更多“只有人類才擅長”的領(lǐng)域，據(jù)說AlphaGo的下一個目標(biāo)是挑戰(zhàn)熱門的RTS類游戲——星際爭霸2，相信在不遠(yuǎn)的未來，AlphaGo與其他人工智能設(shè)備能夠完成挑戰(zhàn)，開啟人工智能新時代。

三、AlphaGo戰(zhàn)勝李世乭——機(jī)器學(xué)習(xí)的進(jìn)步和機(jī)器的覺醒?

電影《終結(jié)者》講述了在未來世界，擁有人工智能的機(jī)器向人類大舉宣戰(zhàn)的場景。AlphaGo贏得李世乭的優(yōu)異表現(xiàn)，使得部分人類開始驚恐起來——人工智能的時代已經(jīng)來臨，人類被機(jī)器奴役的時代還遠(yuǎn)嗎?

實際上，現(xiàn)階段的人工智能和我們的想像(或電影的描述)完全不同。AI的行為邊界是圖靈測試。現(xiàn)階段還沒有一臺機(jī)器能夠通過圖靈測試�，F(xiàn)階段的人工智能只是進(jìn)行這樣的操作——接收一些輸入，改變輸入狀態(tài)(計算結(jié)果)，給出一些輸出。有人會問，機(jī)器不會自己修改計算參數(shù)嗎?修改過計算參數(shù)后，輸出不就不確定了嗎?也就是不可控了嗎?實際上，“參數(shù)改變”這件事也是確定的，可變的參數(shù)以及變化范圍也是人類已知的。目前AI超過人類的地方，只有計算量大、計算速度快、記憶力爆棚，僅此而已。

而且，現(xiàn)階段的人工智能還只能處理離散問題。對于一些非離散問題(例如哲學(xué)、情感、人際關(guān)系等“不可量化”的量)，還沒有合適的算法將其轉(zhuǎn)化為離散問題。因此，機(jī)器還不具備逆天的能力來奴役人類。

AI發(fā)展到目前，與其他的工具——電視、手機(jī)、扳手、衣架等——沒什么本質(zhì)區(qū)別，那就是還沒有“思維”。目前AlphaGo戰(zhàn)勝了李世乭，好比汽車提速到了100km/h以上，電視能播放4K視頻……并沒有質(zhì)的變化，只是量的變化而已。

至于未來，若有秘密科學(xué)組織，已經(jīng)破解了人類的“思維”，研究透了思維的形成、運作原理，以此發(fā)明非圖靈機(jī)，讓機(jī)器有思想。若真有這樣的組織，我只能說——年輕人，不要看科幻小說了。

總而言之，AlphaGo所代表的人工智能并不能挑戰(zhàn)甚至奴役人類，我們只是又發(fā)明了一個趁手的計算工具而已。

上一篇：綁定服務(wù)時什么時候調(diào)用onRebind

下一篇：師兄碼字2000談在華清學(xué)習(xí)的感受

熱點文章推薦

華清學(xué)員就業(yè)榜單

高薪學(xué)員經(jīng)驗分享

熱點新聞推薦

国产成人精品三级麻豆,色综合天天综合高清网,亚洲精品夜夜夜,国产成人综合在线女婷五月99播放,色婷婷色综合激情国产日韩