麻豆 videos,37集黄色片,中文字幕乱码一区二区三区免费

前沿拓展：

深度搜

深度搜是專業(yè)的搜索知識的搜索引擎。搜索到的內(nèi)容沒有雜亂無章的**，報道，博客，和門戶網(wǎng)頁等內(nèi)容。

5 月 28 日，機(jī)器之心全球機(jī)器智能峰會（GMIS 2017）進(jìn)入第二天，全天議程中最受關(guān)注的是多位重要嘉賓出席的領(lǐng)袖峰會，包括《人工智能：一種現(xiàn)代方法》的作者 Stuart Russell、第四范式聯(lián)合創(chuàng)始人兼首席科學(xué)家楊強(qiáng)、科大訊飛執(zhí)行總裁兼消費(fèi)者事業(yè)群總裁胡郁、阿爾伯塔大學(xué)教授及計(jì)算機(jī)圍棋頂級專家 Martin Müller、Element AI 聯(lián)合創(chuàng)始人 Jean-Sebastien Cournoyer 等。

下午，大會迎來又一位引人關(guān)注的學(xué)者。阿爾伯塔大學(xué)計(jì)算機(jī)科學(xué)教授，計(jì)算機(jī)圍棋專家 Martin Müller 發(fā)表了主題為《深度學(xué)習(xí)時代的啟發(fā)式搜索》的演講。昨天，AlphaGo 與柯潔的系列比賽剛剛結(jié)束，而此前大會其他嘉賓在演講中也紛紛提到了這場比賽。Martin 作為 AlphaGo 開發(fā)者們的導(dǎo)師，對計(jì)算機(jī)圍棋及其背后的技術(shù)進(jìn)行了深度解讀。

作為計(jì)算機(jī)圍棋研究的先驅(qū)，Martin Müller 教授所帶領(lǐng)的團(tuán)隊(duì)在博弈樹搜索和規(guī)劃的蒙特卡洛方法、大規(guī)模并行搜索和組合博弈論方面頗有建樹。在此前 AlphaGo 與柯潔烏鎮(zhèn)人機(jī)交鋒的比賽期間，機(jī)器之心曾與他共同觀戰(zhàn)。圍棋程序 AlphaGo 的設(shè)計(jì)研發(fā)的 David Silver 和黃士杰（Aja Huang）（分別是 DeepMind AlphaGo 發(fā)表在 Nature 上的論文的兩位并列第一作者）都曾師從于他。

「啟發(fā)式搜索不是搜索引擎式的搜索，」Martin 說道。「在真實(shí)情況下，由于可能性過多，很多時候你是不能搜索全部信息的。在圍棋中，這種情況尤為突出。」

多年來，人工智能研究者們一直以攻克各類游戲?yàn)槟繕?biāo)，因?yàn)檫@些任務(wù)規(guī)則簡單，可以為真實(shí)世界的應(yīng)用鋪平道路。人工智能研究者們不僅在國際象棋上，也在跳棋、雙陸棋等棋盤游戲中有過很多研究。在圍棋之前，人工智能領(lǐng)域的一個里程碑**是 IBM 的「深藍(lán)」擊敗世界國際象棋冠軍卡斯帕羅夫（剛剛過去 20 周年）。在 20 年前，IBM 的系統(tǒng)已經(jīng)使用了深度搜索與并行計(jì)算，大大提升了效率。

在棋類游戲中，最引人注目的自然是被認(rèn)為最具復(fù)雜性的圍棋了。深度學(xué)習(xí)是近幾年來科技界火熱的話題，但它并不是人工智能的全部?！溉绻阒魂P(guān)注深度學(xué)習(xí)，那你就會錯過很多東西，」Martin 說道。

AlphaGo 的學(xué)習(xí)過程是線下的。它通常是先發(fā)展出若干神經(jīng)網(wǎng)絡(luò)以待比賽中使用。蒙特卡洛樹搜索（MCTS）是其主要的決策算法，用于決定一局比賽中每一步棋。MCTS 結(jié)合了博弈樹搜索、機(jī)器學(xué)習(xí)到的知識和模擬的全局游戲來決定每一步。這些知識中最重要的部分是上面提到的深度神經(jīng)網(wǎng)絡(luò)。其中有一個網(wǎng)絡(luò)（策略網(wǎng)絡(luò)）選擇搜索中最有希望的落子位置，另一個網(wǎng)絡(luò)（價值網(wǎng)絡(luò)）可以評估其在搜索中遇到的數(shù)千乃至數(shù)百萬個棋盤局面。

在獲取棋局信息后，AlphaGo 的策略網(wǎng)絡(luò)會探索哪些位置具備潛在價值，在分配的搜索時間結(jié)束時，模擬過程中被系統(tǒng)最繁瑣考察的位置將成為 AlphaGo 的最終選擇。在經(jīng)過先期的全盤探索和過程中對最佳落子的不斷揣摩后，高效的算法與強(qiáng)大的計(jì)算能力實(shí)現(xiàn)了超越人類的直覺判斷。

除了備受關(guān)注的圍棋以外，阿爾伯塔大學(xué)在計(jì)算機(jī)德州撲克等方面的研究也處于領(lǐng)先地位。在今年 1 月，阿爾伯塔大學(xué)、捷克布拉格查理大學(xué)和捷克理工大學(xué)共同發(fā)布了論文《DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker》，展示了他們在人工智能打德州撲克方面的研究。在論文中，研究人員表示 DeepStack 已經(jīng)在無限制撲克（No-Limit Poker）游戲上達(dá)到了專家級的水平。

大多數(shù)棋盤游戲都屬于完美信息（perfect information）游戲，針對它們的研究難以應(yīng)用到真實(shí)世界中；而撲克是一個典型的不完美信息（imperfect information）游戲，一直以來都是人工智能領(lǐng)域內(nèi)的一個挑戰(zhàn)。DeepStack 是適用于德州撲克這種不完美信息環(huán)境的新算法。

DeepStack 結(jié)合了回歸推理來處理信息不對稱性，還結(jié)合了分解（decomposition）來將計(jì)算集中到相關(guān)的決策上，以及一種形式的關(guān)于任意牌的直覺——該直覺可以使用深度學(xué)習(xí)進(jìn)行自我玩牌而自動學(xué)習(xí)到。在一項(xiàng)涉及到數(shù)十位參與者和 44000 手撲克的研究中，DeepStack 成為了世界上第一個在一對一無限制德州撲克（heads-up no-limit Texas hold’em）上擊敗了職業(yè)撲克玩家的計(jì)算機(jī)程序。

撲克游戲的狀態(tài)可以被分成玩家的私有信息（兩張牌面朝下的手牌）和公共狀態(tài)（包括牌面朝上的牌和玩家采取的**動作序列）。游戲中的公開狀態(tài)的可能序列構(gòu)成一個公開樹（public tree），其中每一個公開狀態(tài)都有一個相關(guān)的公開子樹（public subtree）。

HUNL 中公開樹的一部分。紅色和天藍(lán)色的邊表示玩家動作。綠色邊表示公開的公共牌。帶有**的葉節(jié)點(diǎn)表示游戲結(jié)束，其中，如果一個玩家根據(jù)之前的動作和玩家手牌的聯(lián)合分布而棄牌或做出決定，那么收益就可能是固定的。

DeepStack 架構(gòu)概覽（見 a）。對于每一個公開狀態(tài)，DeepStack 都要重新計(jì)算它需要的動作，這會用到一個深度有限的向前預(yù)測——其中子樹值（subtree value）會通過一個訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò) Neural net（見 b）來計(jì)算，該深度神經(jīng)網(wǎng)絡(luò) Neural net 是比賽前通過隨機(jī)生成的撲克情境（見 c）來訓(xùn)練的。Martin 表示，它的成功之處在于第一次將啟發(fā)式搜索應(yīng)用于不完美信息游戲中，并獲得成功。

啟發(fā)式方法雖然已經(jīng)在多種應(yīng)用中獲得成功，但仍然面臨一些挑戰(zhàn)。「在自動駕駛、醫(yī)療等性命攸關(guān)的應(yīng)用上，人類不能允許深度學(xué)習(xí)和啟發(fā)式搜索可能出現(xiàn)的小概率偏差，」Martin 說道?！高@意味著我們還有很長一段路要走。我們目前還面臨著兩個挑戰(zhàn)，如何把啟發(fā)式搜索和精準(zhǔn)的確切法聯(lián)結(jié)在一起；以及當(dāng)不知道全局規(guī)則的時候，如何讓機(jī)器解決問題?！?/p>

啟發(fā)式學(xué)習(xí)經(jīng)歷過三四十年的發(fā)展，它是 AlphaGo 背后的動力，也可以在未來應(yīng)用于其他領(lǐng)域。「通過與深度學(xué)習(xí)相結(jié)合，同時有了新算法與硬件，啟發(fā)式學(xué)習(xí)可以讓計(jì)算機(jī)系統(tǒng)學(xué)會真正的知識，」Martin 說道?！杆茏屛覀兊乃阉髯兊酶佑行В軌蜃層?jì)算機(jī)幫助我們做出越來越好的決策。」

拓展知識：

深度搜

第一將手機(jī)屏幕打開，輸入密碼解鎖；

2、第二用手指將手機(jī)屏幕劃到有文件管理的一頁；

3、打開文件管理，第二選擇分類瀏覽功能，這樣手機(jī)文件就可以進(jìn)行分類瀏覽，文檔文件，壓縮包文件，安卓包文件，照片，視頻都可以分類瀏覽；

4、分類成功后，點(diǎn)擊視頻文件，在視頻文件即可查找到所要的視頻；

5、如果沒有找到，也可以點(diǎn)擊搜索，輸入視頻名字即可查找到所需視頻。

前沿拓展：

深度搜

深度搜是專業(yè)的搜索知識的搜索引擎。搜索到的內(nèi)容沒有雜亂無章的**，報道，博客，和門戶網(wǎng)頁等內(nèi)容。

「啟發(fā)式搜索不是搜索引擎式的搜索，」Martin 說道?！冈谡鎸?shí)情況下，由于可能性過多，很多時候你是不能搜索全部信息的。在圍棋中，這種情況尤為突出?！?/p>

啟發(fā)式方法雖然已經(jīng)在多種應(yīng)用中獲得成功，但仍然面臨一些挑戰(zhàn)?！冈谧詣玉{駛、醫(yī)療等性命攸關(guān)的應(yīng)用上，人類不能允許深度學(xué)習(xí)和啟發(fā)式搜索可能出現(xiàn)的小概率偏差，」Martin 說道?！高@意味著我們還有很長一段路要走。我們目前還面臨著兩個挑戰(zhàn)，如何把啟發(fā)式搜索和精準(zhǔn)的確切法聯(lián)結(jié)在一起；以及當(dāng)不知道全局規(guī)則的時候，如何讓機(jī)器解決問題。」

啟發(fā)式學(xué)習(xí)經(jīng)歷過三四十年的發(fā)展，它是 AlphaGo 背后的動力，也可以在未來應(yīng)用于其他領(lǐng)域?！竿ㄟ^與深度學(xué)習(xí)相結(jié)合，同時有了新算法與硬件，啟發(fā)式學(xué)習(xí)可以讓計(jì)算機(jī)系統(tǒng)學(xué)會真正的知識，」Martin 說道?！杆茏屛覀兊乃阉髯兊酶佑行?，能夠讓計(jì)算機(jī)幫助我們做出越來越好的決策?！?/p>