從前有隻壞豬提示您:看後求收藏(第254章 倒行逆施,讀書成神豪,從前有隻壞豬,大文學小說網),接著再看更方便。

請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。

像圖象識別、語音識別這類認知性的任務,aI之所以做得好,是因為這些任務是靜態的,所謂靜態就是給定輸入,預測結果不會隨著時間改變。

但是決策性問題,往往和環境有很複雜的互動,在某些場景裡面,如何做最優決策,這些最優決策往往是動態的,會隨著時間改變。

現在有人嘗試把aI用到金融市場,例如如何用aI技術來分析股票,預測股票漲跌,對股票交易給出建議,甚至是代替人來進行股票交易,這類問題就是動態決策性問題。

決策性問題的第二個難點在於各種因素相互影響,牽一而動全身。

一支股票的漲跌會對其他股票產生影響,一個人的投資決策,特別是大的機構的投資決策,可能會對整個市場產生影響,這就和靜態的認知性任務不一樣的。

在靜態認知性任務我們的預測結果不會對問題(例如其他的影象或者語音)產生任何影響。

但是在股票市場,任何一個決定,特別是大的機構的投資策略會對整個市場產生影響,對別的投資者產生影響,對將來會產生影響。

當前深度學習已經在靜態任務裡面取得了很大的成功,如何把這種成功延續和擴充套件到這種複雜的動態決策問題中,也是當前一個深度學習的挑戰之一。

章杉認為,一個可能的思路是博弈機器學習。

在博弈機器學習裡,透過觀察環境和其他個體的行為,對每個個體構建不同的個性化行為模型,aI就可以三思而後行。

選擇一個最優策略,該策略會自適應環境的變化和其他個體的行為的改變。

……

章杉在這篇論文繼提出了一種幾乎是完全反深度學習思路的機器學習——淺度學習。

強調增強博弈機器學習的重要性,強調aI的邏輯性和思辨性,大幅度降低“機器學習”任務量。

毫無疑問,這是一種全新的機器學習方式!

最起碼,這種全新的模型在處理動態資訊上取得的成績將是革命性的。

淺度學習名字聽起來有點怪異!

之所以不叫聽起來更直白明瞭的淺層學習。

是因為事實上淺層學習曾經出現在歷史的舞臺上!

由於人工神經網路的反向傳播演算法(也叫Banet演算法或者Bp演算法)的明,給機器學習帶來了希望,掀起了“基於統計模型“的機器學習熱潮。這個熱潮一直持續到今天。人們現,利用Bp演算法可以讓一個人工神經網路模型從大量訓練樣本中學習出統計規律,從而對未知事件做預測。這種基於統計的機器學習方法比起過去基於人工規則的系統,在很多方面顯示出優越性。這個時候的人工神經網路,雖然也被稱作多層感知機(mu1ti-1ayerpernet),但實際上是一種只含有一層隱層節點的淺層模型。

到了9o年代,各種各樣的淺層機器學習模型相繼被提出,例如支撐向量機(sVm,supportVenetg、最大熵方法(如LR,Logistinet)等。這些模型的結構基本上可以看成帶有一層隱層節點(如sVm、Boosting),或沒有隱層節點(如LR)。這些模型無論是在理論分析還是應用中都獲得了巨大的成功。相比之下,由於理論分析的難度大,訓練方法又需要很多經驗和技巧,這個時期淺層人工神經網路反而相對沉寂。

不過叫淺度學習似乎也不太妥當,之前的淺度學習通常指的是淺度監督式學習~

淺度的監督式的具有1個隱藏層的神經網路具有一些受人喜愛的性質,使得它們比深度網路更容易被解釋、分析和最佳化;但它們的表徵能力卻不及深度網路。

一般使用了具有1個隱藏層的學習問題來序列式地逐層構建深度網路,其能夠繼承淺度網路的屬性。

章杉在論文中也提及了這些~

淺度監督學習透過反向傳播演算法在大規模有監督資料上訓練的深度卷積神經網路已經成為了大多數計算機視覺任務中的主導方法。

這也推動了深度學習在其它領域的成功應用,比如語音識別、自然語言處理和強化學習。但是,我們仍然還難以理解深度網路的行為以及它們表現出色的原因。這種困難的一大原因是網路的層中採用了端到端的學習方式。

監督式的端到端學習是神經網路最佳化的標準方法。

但是其也存在一些值得考慮的潛在問題。

先,使用全域性目標就意味著一個深度網路的單箇中間層的最終函式行為只能以間接的方式確定這些層是如何協同工作以得到高準確度的預測結果的,這一點卻完全不明晰。

有一些研究者認為並且透過實驗表明net能夠學習實現這樣的機制將不變性逐漸誘導成複雜但不相關的可變性,同時增加資料的線性可分性。

本章未完,點選下一頁繼續閱讀。

都市小說相關閱讀More+

最強軍校生:讓你鍍金,你成將軍

一直哭

重生之救贖之路

擾辰

後來好雨知時節+番外

山有嘉卉

小城三月:蕭紅小說精選集

蕭紅

清雨海棠

狂奔的羊肉串

人外魔境

小慄蟲太郎