free性欧美人与dog,成年免费视频黄网站zxgk,久热国产精品视频一区二区三区,.欧美精品一区二区三区,国产人与zoxxxx另类

AlphaGo的神奇全靠它,詳解人工神經(jīng)網(wǎng)絡(luò)!

導(dǎo)讀Alphago在不被看好的情況下,以4比1擊敗了圍棋世界冠軍李世石,令其名震天下。隨著AlphaGo知名度的不斷提高,人們不禁好奇,究竟是什么使得AlphaGo得以戰(zhàn)勝人類大腦?AlphaGo的核心依托——人工神經(jīng)網(wǎng)絡(luò)。什么是神經(jīng)網(wǎng)絡(luò)?人工神經(jīng)網(wǎng)絡(luò)是一種模仿生物神經(jīng)網(wǎng)絡(luò)(動物的中樞神經(jīng)系統(tǒng),特別是大腦)的結(jié)構(gòu)和功能的數(shù)學(xué)模型或計算模型。神經(jīng)網(wǎng)絡(luò)由大量的人工神經(jīng)元聯(lián)結(jié)進(jìn)行計算。大多數(shù)情況下人工神經(jīng)網(wǎng)絡(luò)能在外界信息的基礎(chǔ)上改變內(nèi)部結(jié)構(gòu),是一種自適應(yīng)系統(tǒng)?,F(xiàn)代神經(jīng)網(wǎng)絡(luò)是一種非線性統(tǒng)計性數(shù)據(jù)建模工具,常...

Alphago在不被看好的情況下,以4比1擊敗了圍棋世界冠軍李世石,令其名震天下。隨著AlphaGo知名度的不斷提高,人們不禁好奇,究竟是什么使得AlphaGo得以戰(zhàn)勝人類大腦?AlphaGo的核心依托——人工神經(jīng)網(wǎng)絡(luò)。

什么是神經(jīng)網(wǎng)絡(luò)?

人工神經(jīng)網(wǎng)絡(luò)是一種模仿生物神經(jīng)網(wǎng)絡(luò)(動物的中樞神經(jīng)系統(tǒng),特別是大腦)的結(jié)構(gòu)和功能的數(shù)學(xué)模型或計算模型。神經(jīng)網(wǎng)絡(luò)由大量的人工神經(jīng)元聯(lián)結(jié)進(jìn)行計算。大多數(shù)情況下人工神經(jīng)網(wǎng)絡(luò)能在外界信息的基礎(chǔ)上改變內(nèi)部結(jié)構(gòu),是一種自適應(yīng)系統(tǒng)?,F(xiàn)代神經(jīng)網(wǎng)絡(luò)是一種非線性統(tǒng)計性數(shù)據(jù)建模工具,常用來對輸入和輸出間復(fù)雜的關(guān)系進(jìn)行建模,或用來探索數(shù)據(jù)的模式。

神經(jīng)網(wǎng)絡(luò)是一種運(yùn)算模型,由大量的節(jié)點(diǎn)(或稱“神經(jīng)元”,或“單元”)和之間相互聯(lián)接構(gòu)成。每個節(jié)點(diǎn)代表一種特定的輸出函數(shù),稱為激勵函數(shù)。每兩個節(jié)點(diǎn)間的連接都代表一個對于通過該連接信號的加權(quán)值,稱之為權(quán)重,這相當(dāng)于人工神經(jīng)網(wǎng)絡(luò)的記憶。網(wǎng)絡(luò)的輸出則依網(wǎng)絡(luò)的連接方式,權(quán)重值和激勵函數(shù)的不同而不同。而網(wǎng)絡(luò)自身通常都是對自然界某種算法或者函數(shù)的近,也可能是對一種邏輯策略的表達(dá)。

例如,用于手寫識別的一個神經(jīng)網(wǎng)絡(luò)是被可由一個輸入圖像的像素被激活的一組輸入神經(jīng)元所定義的。在通過函數(shù)(由網(wǎng)絡(luò)的設(shè)計者確定)進(jìn)行加權(quán)和變換之后,這些神經(jīng)元被激活然后被傳遞到其他神經(jīng)元。重復(fù)這一過程,直到最后一個輸出神經(jīng)元被激活。這樣決定了被讀取的字。

它的構(gòu)筑理念是受到人或其他動物神經(jīng)網(wǎng)絡(luò)功能的運(yùn)作啟發(fā)而產(chǎn)生的。人工神經(jīng)網(wǎng)絡(luò)通常是通過一個基于數(shù)學(xué)統(tǒng)計學(xué)類型的學(xué)習(xí)方法得以優(yōu)化,所以人工神經(jīng)網(wǎng)絡(luò)也是數(shù)學(xué)統(tǒng)計學(xué)方法的一種實際應(yīng)用,通過統(tǒng)計學(xué)的標(biāo)準(zhǔn)數(shù)學(xué)方法我們能夠得到大量的可以用函數(shù)來表達(dá)的局部結(jié)構(gòu)空間,另一方面在人工智能學(xué)的人工感知領(lǐng)域,我們通過數(shù)學(xué)統(tǒng)計學(xué)的應(yīng)用可以來做人工感知方面的決定問題(也就是說通過統(tǒng)計學(xué)的方法,人工神經(jīng)網(wǎng)絡(luò)能夠類似人一樣具有簡單的決定能力和簡單的判斷能力),這種方法比起正式的邏輯學(xué)推理演算更具有優(yōu)勢。

人工神經(jīng)網(wǎng)絡(luò)是一個能夠?qū)W習(xí),能夠總結(jié)歸納的系統(tǒng),也就是說它能夠通過已知數(shù)據(jù)的實驗運(yùn)用來學(xué)習(xí)和歸納總結(jié)。人工神經(jīng)網(wǎng)絡(luò)通過對局部情況的對照比較(而這些比較是基于不同情況下的自動學(xué)習(xí)和要實際解決問題的復(fù)雜性所決定的),它能夠推理產(chǎn)生一個可以自動識別的系統(tǒng)。與之不同的基于符號系統(tǒng)下的學(xué)習(xí)方法,它們也具有推理功能,只是它們是建立在邏輯算法的基礎(chǔ)上,也就是說它們之所以能夠推理,基礎(chǔ)是需要有一個推理算法則的集合。

2AlphaGo的原理回頂部

AlphaGo的原理

首先,AlphaGo同優(yōu)秀的選手進(jìn)行了150000場比賽,通過人工神經(jīng)網(wǎng)絡(luò)找到這些比賽的模式。然后通過總結(jié),它會預(yù)測選手在任何位置高概率進(jìn)行的一切可能。AlphaGo的設(shè)計師通過讓其反復(fù)的和早期版本的自己對戰(zhàn)來提高神經(jīng)網(wǎng)絡(luò),使其逐步提高獲勝的機(jī)會。

從廣義上講,神經(jīng)網(wǎng)絡(luò)是一個非常復(fù)雜的數(shù)學(xué)模型,通過對其高達(dá)數(shù)百萬參數(shù)的調(diào)整來改變的它的行為。神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的意思是,電腦一直持續(xù)對其參數(shù)進(jìn)行微小的調(diào)整,來嘗試使其不斷進(jìn)行微小的改進(jìn)。在學(xué)習(xí)的第一階段,神經(jīng)網(wǎng)絡(luò)提高模仿選手下棋的概率。在第二階段,它增加自我發(fā)揮,贏得比賽的概率。反復(fù)對極其復(fù)雜的功能進(jìn)行微小的調(diào)整,聽起來十分瘋狂,但是如果有足夠長的時間,足夠快的計算能力,非常好的網(wǎng)絡(luò)實施起來并不苦難。并且這些調(diào)整都是自動進(jìn)行的。

經(jīng)過這兩個階段的訓(xùn)練,神經(jīng)網(wǎng)絡(luò)就可以同圍棋業(yè)余愛好者下一盤不錯的棋了。但對于職業(yè)來講,它還有很長的路要走。在某種意義上,它并不思考每一手之后的幾步棋,而是通過對未來結(jié)果的推算來決定下在哪里。為了達(dá)到職業(yè)級別,AlphaGp需要一種新的估算方法。

為了克服這一障礙,研究人員采取的辦法是讓它反復(fù)的和自己進(jìn)行對戰(zhàn),以此來使其不斷其對于勝利的估算能力。盡可能的提高每一步的獲勝概率。(在實踐中,AlphaGo對這個想法進(jìn)行了稍微復(fù)雜的調(diào)整。)然后,AlphaGo再結(jié)合多線程來使用這一方法進(jìn)行下棋。

我們可以看到,AlphaGo的評估系統(tǒng)并沒有基于太多的圍棋知識,通過分析現(xiàn)有的無數(shù)場比賽的棋譜,以及無數(shù)次的自我對戰(zhàn)練習(xí),AlphaGo的神經(jīng)網(wǎng)絡(luò)進(jìn)行了數(shù)以十億計的微小調(diào)整,即便每次只是一個很小的增量改進(jìn)。這些調(diào)整幫助AlphaGp建立了一個估值系統(tǒng),這和那些出色圍棋選手的直覺相似,對于棋盤上的每一步棋都了如指掌。

此外AlphaGo也使用搜索和優(yōu)化的思想,再加上神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)功能,這兩者有助于找到棋盤上更好的位置。這也是目前AlphaGo能夠高水平發(fā)揮的原因。

3神經(jīng)網(wǎng)絡(luò)的延伸和回頂部

神經(jīng)網(wǎng)絡(luò)的延伸和

神經(jīng)網(wǎng)絡(luò)的這種能力也可以被用在其他方面,比如讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)一種藝術(shù)風(fēng)格,然后再將這種風(fēng)格應(yīng)用到其他圖像上。這種想法很簡單:首先讓神經(jīng)網(wǎng)絡(luò)接觸到大量的圖像,然后來確認(rèn)這些圖像的風(fēng)格,接著將新的圖像帶入這種風(fēng)格。

這雖然不是偉大的藝術(shù),但它仍然是一個顯著的利用神經(jīng)網(wǎng)絡(luò)來捕捉直覺并且應(yīng)用在其他地方的例子。

在過去的幾年中,神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域被用來捕捉直覺和模式識別。許多項目使用神經(jīng)這些網(wǎng)絡(luò),涉及的任務(wù)如識別藝術(shù)風(fēng)格或好的視頻游戲的發(fā)展戰(zhàn)略。但也有非常不同的網(wǎng)絡(luò)模擬的直覺驚人的例子,比如語音和自然語言。

由于這種多樣性,我看到AlphaGo本身不是一個性的突破,而是作為一個極其重要的發(fā)展前沿:建立系統(tǒng),可以捕捉的直覺和學(xué)會識別模式的能力。此前計算機(jī)科學(xué)家們已經(jīng)做了幾十年,沒有取得長足的進(jìn)展。但現(xiàn)在,神經(jīng)網(wǎng)絡(luò)的成功已經(jīng)大大擴(kuò)大,我們可以利用電腦攻擊范圍內(nèi)的潛在問題。

事實上,目前現(xiàn)有的神經(jīng)網(wǎng)絡(luò)的理解能力是非常差的。神經(jīng)網(wǎng)絡(luò)很容易被愚弄。用神經(jīng)網(wǎng)絡(luò)識別圖像是一個不錯的手段。但是實驗證明,通過對圖像進(jìn)行細(xì)微的改動,就可以愚弄圖像。例如,下面的圖像左邊的圖是原始圖,研究人員對中間的圖像進(jìn)行了微小的調(diào)整后,神經(jīng)網(wǎng)絡(luò)就無法區(qū)分了,就將原圖顯示了出來。

另一個是,現(xiàn)有的系統(tǒng)往往需要許多模型來學(xué)習(xí)。例如,AlphaGo從150000場對戰(zhàn)來學(xué)習(xí)。這是一個很龐大額度數(shù)字!很多情況下,顯然無法提供如此龐大的模型案例。

為你推薦
資訊專欄
熱門視頻
相關(guān)推薦
谷雨節(jié)氣常識中祭海習(xí)俗的意義,講究的是什么? 華為手機(jī)如何調(diào)夜間模式 手機(jī)wifi限速如何設(shè)置,如何解除wifi網(wǎng)速 100m寬帶速度速度很慢是什么原因 lol難以獲取玩家信息如何解決 饑荒巖石巢穴如何用 使用釘釘上直播課后如何查看學(xué)生的聽課情況 關(guān)于南瓜先生2九龍城寨第三章城北圖文攻略 關(guān)于c語言三個數(shù)求最大值_輸入三個數(shù)求最大值c語言 如何在電腦上用韓劇tv 微信怎么設(shè)置獨(dú)立密碼 如何連接網(wǎng)絡(luò)機(jī)頂盒與電視? win10沒響度均衡如何解決 steam如何隱身玩游戲 如何隱藏正在游戲狀態(tài) office 2013最新激活密鑰 及破解激活方法 刺激戰(zhàn)場訓(xùn)練場煙霧彈在什么地方找到 怎么處理程序運(yùn)行時經(jīng)常出現(xiàn)程序未響應(yīng)的問題? 剪映如何調(diào)整視頻比例 如何查看手機(jī)以前安裝過的應(yīng)用 快手上發(fā)視頻播放的時候如何全屏顯示? 這是迄今為止,AlphaGo算法最清晰的解讀! 100:0,新AlphaGo放棄了人類? 通用AlphaGo誕生?MuZero在多種棋類游戲中超越人類 人機(jī)大戰(zhàn)四周年:圍棋界發(fā)生了哪些巨變? 暑去秋來,秋燥來襲,養(yǎng)生從“每天多睡1小時”開始 處暑到,要變天,12個養(yǎng)生常識幫你踩下秋涼急剎車~ 處暑養(yǎng)生:常吃一湯二粥三瓜,謹(jǐn)記四注意五坑! 舌尖上的處暑:蓮藕、南瓜、馬蹄、銀耳,每樣都能做出新意 處暑送鴨,無病各家,經(jīng)典老鴨湯配方獻(xiàn)上 油膩了一個夏天,8款處暑養(yǎng)生食譜幫助你清理腸胃 明日處暑!這些防秋燥美食保你滋潤一整個秋天~ 今天處暑用這個方子告別夏天!補(bǔ)對了不長肉,還健康 天氣干燥,晝熱夜涼,寒露清秋,教你這樣保持心懷暖陽 寒露養(yǎng)生4步曲,從衣食住行4方面令你安度“多事之秋” “白露身不露,寒露腳不露” 看中醫(yī)傳承下來的時令養(yǎng)生 長壽老人養(yǎng)生經(jīng)驗:寒露前后吃八寶粥、八寶茶、八寶飯 寒露養(yǎng)生,除了保暖防寒,養(yǎng)陰潤燥也要注重精神愉悅 寒露少吃一種瓜,多吃四種白,為過冬打好身體基礎(chǔ) 美寒露美食養(yǎng)生,這道清燉羊肉千萬別錯過 寶媽寒露節(jié)氣食譜,清甜爽滑,還強(qiáng)身暖胃,寶寶增強(qiáng)體質(zhì)就靠它
Top