前沿拓展:
深度搜
深度搜是專業(yè)的搜索知識的搜索引擎。搜索到的內(nèi)容沒有雜亂無章的**,報道,博客,和門戶網(wǎng)頁等內(nèi)容。
5 月 28 日,機(jī)器之心全球機(jī)器智能峰會(GMIS 2017)進(jìn)入第二天,全天議程中最受關(guān)注的是多位重要嘉賓出席的領(lǐng)袖峰會,包括《人工智能:一種現(xiàn)代方法》的作者 Stuart Russell、第四范式聯(lián)合創(chuàng)始人兼首席科學(xué)家楊強(qiáng)、科大訊飛執(zhí)行總裁兼消費(fèi)者事業(yè)群總裁胡郁、阿爾伯塔大學(xué)教授及計(jì)算機(jī)圍棋頂級專家 Martin Müller、Element AI 聯(lián)合創(chuàng)始人 Jean-Sebastien Cournoyer 等。
下午,大會迎來又一位引人關(guān)注的學(xué)者。阿爾伯塔大學(xué)計(jì)算機(jī)科學(xué)教授,計(jì)算機(jī)圍棋專家 Martin Müller 發(fā)表了主題為《深度學(xué)習(xí)時代的啟發(fā)式搜索》的演講。昨天,AlphaGo 與柯潔的系列比賽剛剛結(jié)束,而此前大會其他嘉賓在演講中也紛紛提到了這場比賽。Martin 作為 AlphaGo 開發(fā)者們的導(dǎo)師,對計(jì)算機(jī)圍棋及其背后的技術(shù)進(jìn)行了深度解讀。
作為計(jì)算機(jī)圍棋研究的先驅(qū),Martin Müller 教授所帶領(lǐng)的團(tuán)隊(duì)在博弈樹搜索和規(guī)劃的蒙特卡洛方法、大規(guī)模并行搜索和組合博弈論方面頗有建樹。在此前 AlphaGo 與柯潔烏鎮(zhèn)人機(jī)交鋒的比賽期間,機(jī)器之心曾與他共同觀戰(zhàn)。圍棋程序 AlphaGo 的設(shè)計(jì)研發(fā)的 David Silver 和黃士杰(Aja Huang)(分別是 DeepMind AlphaGo 發(fā)表在 Nature 上的論文的兩位并列第一作者)都曾師從于他。
「啟發(fā)式搜索不是搜索引擎式的搜索,」Martin 說道。「在真實(shí)情況下,由于可能性過多,很多時候你是不能搜索全部信息的。在圍棋中,這種情況尤為突出。」
多年來,人工智能研究者們一直以攻克各類游戲?yàn)槟繕?biāo),因?yàn)檫@些任務(wù)規(guī)則簡單,可以為真實(shí)世界的應(yīng)用鋪平道路。人工智能研究者們不僅在國際象棋上,也在跳棋、雙陸棋等棋盤游戲中有過很多研究。在圍棋之前,人工智能領(lǐng)域的一個里程碑**是 IBM 的「深藍(lán)」擊敗世界國際象棋冠軍卡斯帕羅夫(剛剛過去 20 周年)。在 20 年前,IBM 的系統(tǒng)已經(jīng)使用了深度搜索與并行計(jì)算,大大提升了效率。
在棋類游戲中,最引人注目的自然是被認(rèn)為最具復(fù)雜性的圍棋了。深度學(xué)習(xí)是近幾年來科技界火熱的話題,但它并不是人工智能的全部?!溉绻阒魂P(guān)注深度學(xué)習(xí),那你就會錯過很多東西,」Martin 說道。
AlphaGo 的學(xué)習(xí)過程是線下的。它通常是先發(fā)展出若干神經(jīng)網(wǎng)絡(luò)以待比賽中使用。蒙特卡洛樹搜索(MCTS)是其主要的決策算法,用于決定一局比賽中每一步棋。MCTS 結(jié)合了博弈樹搜索、機(jī)器學(xué)習(xí)到的知識和模擬的全局游戲來決定每一步。這些知識中最重要的部分是上面提到的深度神經(jīng)網(wǎng)絡(luò)。其中有一個網(wǎng)絡(luò)(策略網(wǎng)絡(luò))選擇搜索中最有希望的落子位置,另一個網(wǎng)絡(luò)(價值網(wǎng)絡(luò))可以評估其在搜索中遇到的數(shù)千乃至數(shù)百萬個棋盤局面。
在獲取棋局信息后,AlphaGo 的策略網(wǎng)絡(luò)會探索哪些位置具備潛在價值,在分配的搜索時間結(jié)束時,模擬過程中被系統(tǒng)最繁瑣考察的位置將成為 AlphaGo 的最終選擇。在經(jīng)過先期的全盤探索和過程中對最佳落子的不斷揣摩后,高效的算法與強(qiáng)大的計(jì)算能力實(shí)現(xiàn)了超越人類的直覺判斷。
除了備受關(guān)注的圍棋以外,阿爾伯塔大學(xué)在計(jì)算機(jī)德州撲克等方面的研究也處于領(lǐng)先地位。在今年 1 月,阿爾伯塔大學(xué)、捷克布拉格查理大學(xué)和捷克理工大學(xué)共同發(fā)布了論文《DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker》,展示了他們在人工智能打德州撲克方面的研究。在論文中,研究人員表示 DeepStack 已經(jīng)在無限制撲克(No-Limit Poker)游戲上達(dá)到了專家級的水平。
大多數(shù)棋盤游戲都屬于完美信息(perfect information)游戲,針對它們的研究難以應(yīng)用到真實(shí)世界中;而撲克是一個典型的不完美信息(imperfect information)游戲,一直以來都是人工智能領(lǐng)域內(nèi)的一個挑戰(zhàn)。DeepStack 是適用于德州撲克這種不完美信息環(huán)境的新算法。
DeepStack 結(jié)合了回歸推理來處理信息不對稱性,還結(jié)合了分解(decomposition)來將計(jì)算集中到相關(guān)的決策上,以及一種形式的關(guān)于任意牌的直覺——該直覺可以使用深度學(xué)習(xí)進(jìn)行自我玩牌而自動學(xué)習(xí)到。在一項(xiàng)涉及到數(shù)十位參與者和 44000 手撲克的研究中,DeepStack 成為了世界上第一個在一對一無限制德州撲克(heads-up no-limit Texas hold’em)上擊敗了職業(yè)撲克玩家的計(jì)算機(jī)程序。
撲克游戲的狀態(tài)可以被分成玩家的私有信息(兩張牌面朝下的手牌)和公共狀態(tài)(包括牌面朝上的牌和玩家采取的**動作序列)。游戲中的公開狀態(tài)的可能序列構(gòu)成一個公開樹(public tree),其中每一個公開狀態(tài)都有一個相關(guān)的公開子樹(public subtree)。
HUNL 中公開樹的一部分。紅色和天藍(lán)色的邊表示玩家動作。綠色邊表示公開的公共牌。帶有**的葉節(jié)點(diǎn)表示游戲結(jié)束,其中,如果一個玩家根據(jù)之前的動作和玩家手牌的聯(lián)合分布而棄牌或做出決定,那么收益就可能是固定的。
DeepStack 架構(gòu)概覽(見 a)。對于每一個公開狀態(tài),DeepStack 都要重新計(jì)算它需要的動作,這會用到一個深度有限的向前預(yù)測——其中子樹值(subtree value)會通過一個訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò) Neural net(見 b)來計(jì)算,該深度神經(jīng)網(wǎng)絡(luò) Neural net 是比賽前通過隨機(jī)生成的撲克情境(見 c)來訓(xùn)練的。Martin 表示,它的成功之處在于第一次將啟發(fā)式搜索應(yīng)用于不完美信息游戲中,并獲得成功。
啟發(fā)式方法雖然已經(jīng)在多種應(yīng)用中獲得成功,但仍然面臨一些挑戰(zhàn)。「在自動駕駛、醫(yī)療等性命攸關(guān)的應(yīng)用上,人類不能允許深度學(xué)習(xí)和啟發(fā)式搜索可能出現(xiàn)的小概率偏差,」Martin 說道?!高@意味著我們還有很長一段路要走。我們目前還面臨著兩個挑戰(zhàn),如何把啟發(fā)式搜索和精準(zhǔn)的確切法聯(lián)結(jié)在一起;以及當(dāng)不知道全局規(guī)則的時候,如何讓機(jī)器解決問題?!?/p>
啟發(fā)式學(xué)習(xí)經(jīng)歷過三四十年的發(fā)展,它是 AlphaGo 背后的動力,也可以在未來應(yīng)用于其他領(lǐng)域。「通過與深度學(xué)習(xí)相結(jié)合,同時有了新算法與硬件,啟發(fā)式學(xué)習(xí)可以讓計(jì)算機(jī)系統(tǒng)學(xué)會真正的知識,」Martin 說道?!杆茏屛覀兊乃阉髯兊酶佑行В軌蜃層?jì)算機(jī)幫助我們做出越來越好的決策。」
拓展知識:
深度搜
第一將手機(jī)屏幕打開,輸入密碼解鎖;
2、第二用手指將手機(jī)屏幕劃到有文件管理的一頁;
3、打開文件管理,第二選擇分類瀏覽功能,這樣手機(jī)文件就可以進(jìn)行分類瀏覽,文檔文件,壓縮包文件,安卓包文件,照片,視頻都可以分類瀏覽;
4、分類成功后,點(diǎn)擊視頻文件,在視頻文件即可查找到所要的視頻;
5、如果沒有找到,也可以點(diǎn)擊搜索,輸入視頻名字即可查找到所需視頻。
前沿拓展:
深度搜
深度搜是專業(yè)的搜索知識的搜索引擎。搜索到的內(nèi)容沒有雜亂無章的**,報道,博客,和門戶網(wǎng)頁等內(nèi)容。
5 月 28 日,機(jī)器之心全球機(jī)器智能峰會(GMIS 2017)進(jìn)入第二天,全天議程中最受關(guān)注的是多位重要嘉賓出席的領(lǐng)袖峰會,包括《人工智能:一種現(xiàn)代方法》的作者 Stuart Russell、第四范式聯(lián)合創(chuàng)始人兼首席科學(xué)家楊強(qiáng)、科大訊飛執(zhí)行總裁兼消費(fèi)者事業(yè)群總裁胡郁、阿爾伯塔大學(xué)教授及計(jì)算機(jī)圍棋頂級專家 Martin Müller、Element AI 聯(lián)合創(chuàng)始人 Jean-Sebastien Cournoyer 等。
下午,大會迎來又一位引人關(guān)注的學(xué)者。阿爾伯塔大學(xué)計(jì)算機(jī)科學(xué)教授,計(jì)算機(jī)圍棋專家 Martin Müller 發(fā)表了主題為《深度學(xué)習(xí)時代的啟發(fā)式搜索》的演講。昨天,AlphaGo 與柯潔的系列比賽剛剛結(jié)束,而此前大會其他嘉賓在演講中也紛紛提到了這場比賽。Martin 作為 AlphaGo 開發(fā)者們的導(dǎo)師,對計(jì)算機(jī)圍棋及其背后的技術(shù)進(jìn)行了深度解讀。
作為計(jì)算機(jī)圍棋研究的先驅(qū),Martin Müller 教授所帶領(lǐng)的團(tuán)隊(duì)在博弈樹搜索和規(guī)劃的蒙特卡洛方法、大規(guī)模并行搜索和組合博弈論方面頗有建樹。在此前 AlphaGo 與柯潔烏鎮(zhèn)人機(jī)交鋒的比賽期間,機(jī)器之心曾與他共同觀戰(zhàn)。圍棋程序 AlphaGo 的設(shè)計(jì)研發(fā)的 David Silver 和黃士杰(Aja Huang)(分別是 DeepMind AlphaGo 發(fā)表在 Nature 上的論文的兩位并列第一作者)都曾師從于他。
「啟發(fā)式搜索不是搜索引擎式的搜索,」Martin 說道?!冈谡鎸?shí)情況下,由于可能性過多,很多時候你是不能搜索全部信息的。在圍棋中,這種情況尤為突出?!?/p>
多年來,人工智能研究者們一直以攻克各類游戲?yàn)槟繕?biāo),因?yàn)檫@些任務(wù)規(guī)則簡單,可以為真實(shí)世界的應(yīng)用鋪平道路。人工智能研究者們不僅在國際象棋上,也在跳棋、雙陸棋等棋盤游戲中有過很多研究。在圍棋之前,人工智能領(lǐng)域的一個里程碑**是 IBM 的「深藍(lán)」擊敗世界國際象棋冠軍卡斯帕羅夫(剛剛過去 20 周年)。在 20 年前,IBM 的系統(tǒng)已經(jīng)使用了深度搜索與并行計(jì)算,大大提升了效率。
在棋類游戲中,最引人注目的自然是被認(rèn)為最具復(fù)雜性的圍棋了。深度學(xué)習(xí)是近幾年來科技界火熱的話題,但它并不是人工智能的全部?!溉绻阒魂P(guān)注深度學(xué)習(xí),那你就會錯過很多東西,」Martin 說道。
AlphaGo 的學(xué)習(xí)過程是線下的。它通常是先發(fā)展出若干神經(jīng)網(wǎng)絡(luò)以待比賽中使用。蒙特卡洛樹搜索(MCTS)是其主要的決策算法,用于決定一局比賽中每一步棋。MCTS 結(jié)合了博弈樹搜索、機(jī)器學(xué)習(xí)到的知識和模擬的全局游戲來決定每一步。這些知識中最重要的部分是上面提到的深度神經(jīng)網(wǎng)絡(luò)。其中有一個網(wǎng)絡(luò)(策略網(wǎng)絡(luò))選擇搜索中最有希望的落子位置,另一個網(wǎng)絡(luò)(價值網(wǎng)絡(luò))可以評估其在搜索中遇到的數(shù)千乃至數(shù)百萬個棋盤局面。
在獲取棋局信息后,AlphaGo 的策略網(wǎng)絡(luò)會探索哪些位置具備潛在價值,在分配的搜索時間結(jié)束時,模擬過程中被系統(tǒng)最繁瑣考察的位置將成為 AlphaGo 的最終選擇。在經(jīng)過先期的全盤探索和過程中對最佳落子的不斷揣摩后,高效的算法與強(qiáng)大的計(jì)算能力實(shí)現(xiàn)了超越人類的直覺判斷。
除了備受關(guān)注的圍棋以外,阿爾伯塔大學(xué)在計(jì)算機(jī)德州撲克等方面的研究也處于領(lǐng)先地位。在今年 1 月,阿爾伯塔大學(xué)、捷克布拉格查理大學(xué)和捷克理工大學(xué)共同發(fā)布了論文《DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker》,展示了他們在人工智能打德州撲克方面的研究。在論文中,研究人員表示 DeepStack 已經(jīng)在無限制撲克(No-Limit Poker)游戲上達(dá)到了專家級的水平。
大多數(shù)棋盤游戲都屬于完美信息(perfect information)游戲,針對它們的研究難以應(yīng)用到真實(shí)世界中;而撲克是一個典型的不完美信息(imperfect information)游戲,一直以來都是人工智能領(lǐng)域內(nèi)的一個挑戰(zhàn)。DeepStack 是適用于德州撲克這種不完美信息環(huán)境的新算法。
DeepStack 結(jié)合了回歸推理來處理信息不對稱性,還結(jié)合了分解(decomposition)來將計(jì)算集中到相關(guān)的決策上,以及一種形式的關(guān)于任意牌的直覺——該直覺可以使用深度學(xué)習(xí)進(jìn)行自我玩牌而自動學(xué)習(xí)到。在一項(xiàng)涉及到數(shù)十位參與者和 44000 手撲克的研究中,DeepStack 成為了世界上第一個在一對一無限制德州撲克(heads-up no-limit Texas hold’em)上擊敗了職業(yè)撲克玩家的計(jì)算機(jī)程序。
撲克游戲的狀態(tài)可以被分成玩家的私有信息(兩張牌面朝下的手牌)和公共狀態(tài)(包括牌面朝上的牌和玩家采取的**動作序列)。游戲中的公開狀態(tài)的可能序列構(gòu)成一個公開樹(public tree),其中每一個公開狀態(tài)都有一個相關(guān)的公開子樹(public subtree)。
HUNL 中公開樹的一部分。紅色和天藍(lán)色的邊表示玩家動作。綠色邊表示公開的公共牌。帶有**的葉節(jié)點(diǎn)表示游戲結(jié)束,其中,如果一個玩家根據(jù)之前的動作和玩家手牌的聯(lián)合分布而棄牌或做出決定,那么收益就可能是固定的。
DeepStack 架構(gòu)概覽(見 a)。對于每一個公開狀態(tài),DeepStack 都要重新計(jì)算它需要的動作,這會用到一個深度有限的向前預(yù)測——其中子樹值(subtree value)會通過一個訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò) Neural net(見 b)來計(jì)算,該深度神經(jīng)網(wǎng)絡(luò) Neural net 是比賽前通過隨機(jī)生成的撲克情境(見 c)來訓(xùn)練的。Martin 表示,它的成功之處在于第一次將啟發(fā)式搜索應(yīng)用于不完美信息游戲中,并獲得成功。
啟發(fā)式方法雖然已經(jīng)在多種應(yīng)用中獲得成功,但仍然面臨一些挑戰(zhàn)?!冈谧詣玉{駛、醫(yī)療等性命攸關(guān)的應(yīng)用上,人類不能允許深度學(xué)習(xí)和啟發(fā)式搜索可能出現(xiàn)的小概率偏差,」Martin 說道?!高@意味著我們還有很長一段路要走。我們目前還面臨著兩個挑戰(zhàn),如何把啟發(fā)式搜索和精準(zhǔn)的確切法聯(lián)結(jié)在一起;以及當(dāng)不知道全局規(guī)則的時候,如何讓機(jī)器解決問題。」
啟發(fā)式學(xué)習(xí)經(jīng)歷過三四十年的發(fā)展,它是 AlphaGo 背后的動力,也可以在未來應(yīng)用于其他領(lǐng)域?!竿ㄟ^與深度學(xué)習(xí)相結(jié)合,同時有了新算法與硬件,啟發(fā)式學(xué)習(xí)可以讓計(jì)算機(jī)系統(tǒng)學(xué)會真正的知識,」Martin 說道?!杆茏屛覀兊乃阉髯兊酶佑行?,能夠讓計(jì)算機(jī)幫助我們做出越來越好的決策?!?/p>
拓展知識:
深度搜
第一將手機(jī)屏幕打開,輸入密碼解鎖;
2、第二用手指將手機(jī)屏幕劃到有文件管理的一頁;
3、打開文件管理,第二選擇分類瀏覽功能,這樣手機(jī)文件就可以進(jìn)行分類瀏覽,文檔文件,壓縮包文件,安卓包文件,照片,視頻都可以分類瀏覽;
4、分類成功后,點(diǎn)擊視頻文件,在視頻文件即可查找到所要的視頻;
5、如果沒有找到,也可以點(diǎn)擊搜索,輸入視頻名字即可查找到所需視頻。
原創(chuàng)文章,作者:九賢生活小編,如若轉(zhuǎn)載,請注明出處:http://m.xiesong.cn/36451.html