從前有隻壞豬提示您:看後求收藏(第252章 淺度學習,讀書成神豪,從前有隻壞豬,大文學小說網),接著再看更方便。

請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。

在影象理解裡面,看圖說話,也就是給一張圖生成一句描述性的語句,生成式對抗網路的對偶任務是給一句話生成一張圖,這兩個任務一個是從影象到文字,另外一個是從文字到影象。在對話系統裡面,回答問題和問題生成也是互為對偶的兩個問題,前者是給定問題生成答案,後者是給定答案生成問題。

在搜尋引擎裡面,給定檢索詞返回相關文件和給定文件或者廣告返回關鍵詞也是互為對偶的問題搜尋引擎最主要的任務是針對使用者提交的檢索詞匹配一些文件,返回最相關的文件;當廣告商提交一個廣告之後,廣告平臺需要給他推薦一些關健詞使得他的廣告在使用者搜尋這些詞能夠展現出來被使用者點選。

對偶學習試圖把這種結構的對偶屬性應用在機器學習裡。

其基本思想比較簡單,章杉以機器翻譯為例子來說明。

當我們想把一箇中文句子翻譯成英文,可以先用一箇中文到英文的翻譯模型,把這個句子翻譯成英文的句子,因為沒有英文的標註,所以不知道這個英文的翻譯是好還是壞以及有多好多壞。章杉再利用從英文到中文的翻譯模型,把這個英文的句子翻譯成中文的句子,這樣一來,章杉就得到了一個新的中文句子。

整個過程包含了正向翻譯和反向翻譯互為對偶的兩個步驟。

然後章杉比較原始中文的句子和後來得到的中文句子,如果兩個翻譯模型都很好的話,這兩個中文的句子應該比較相似,如果兩個模型不好或者有一個模型不好的話,得到的兩個中文句子就不相似。因此章杉可以透過這種對偶過程從無標註的資料獲得反饋資訊,知道章杉的模型工作的好還是不好,進而根據這些反饋資訊來訓練更新正向反向模型,從而達到從無標註資料學習的目的。

章杉在機器翻譯裡面做了一些實驗,現透過對偶學習的過程,章杉只需要用1o%標註的資料(大概1oo萬英法雙語句對),再加上很多沒有標註的資料,達到用1oo%標註資料(12oo萬英法雙語句對)訓練的模型的準確度。

一千萬個訓練語料標註的費用差不多22oo萬美元,如果章杉能把標註的人工費用從22oo萬美元降到2oo萬美元,這會是一個非常好的結果,能夠大大降低公司運營成本提高運營效率。

很多問題以前是因為受限於沒有標註的資料,沒有辦法用深度學習技術。

現在章杉能夠從無標註的資料進行學習,那麼很多應用很多問題裡面都可以應用深度學習技術。

論文到這裡已經很牛了!

但僅僅如此嗎~

章杉繼續讀完,很快就震驚了!

因為論文裡似乎提出了一種嶄新的概念。

現在雖然深度學習很受歡迎,但是說到底深度學習主要是從大資料進行學習,就是透過很多標註的資料,使用深度學習演算法學習得到一些模型。

雖然叫著人工智慧的名字。

但是這種學習方式和人的智慧是非常不一樣的。

人是從小樣本進行學習。

人對影象進行分類,只需要很少幾個樣本就可以做到準確分類。

兩三歲小孩,開始認識世界的時候,他如果想知道什麼樣的動物是狗,我們給他看幾張狗的圖片,並且告訴他狗有什麼特徵,和其他動物像貓或者羊有什麼區別的話,小孩可以很快很準確的識別狗。

但是像深度殘差神經網路,一般來說一個類別大概需要上千張圖片才能進行比較充分的訓練,得到比較準確的結果。

再比如汽車駕駛,一般來說,透過在駕校的培訓,也就是幾十個小時的學習,幾百公里的練習,大多數人就可以開車上路了。

但是像現在的無人車可能已經行駛了上百萬公里,還是達不到人的全自動駕駛的水平。

原因在於,人經過有限的訓練,結合規則和知識能夠應付各種複雜的路況,但是當前的aI還沒有邏輯思考、聯想和推理的能力,必須靠大資料來覆蓋各種可能的路況,但是各種可能的路況幾乎是無窮的。

隨著一項項能力的提升,章杉現在對人的理解也很深。

人的智慧包含了很多方面,最基本的階段是認知性智慧,也就是對整個世界的認知。

儘管現在對於圖象識別、語音識別,aI已經差不多能達到人類的水平,當然可能是在某些特定的約束條件下,能夠達到人類的水平。

但是其實這種認知性的任務,對人類而言都是非常簡單的,現在aI所能做的這種事情或者能達到的水平,人其實也很容易做到。

只是aI可能在度上更快,並且規模上去之後成本更低,並且24小時都不需要休息。更有挑戰的問題是,人工智慧能不能做一些人類做不了或者是很難做好的事情。

像圖象識別、語音識別這類認知性的任務,aI之所以做得好,是因為這些任務是靜態的,所謂靜態就是給定輸入,預測結果不會隨著時間改變。

但是決策性問題,往往和環境有很複雜的互動,在某些場景裡面,如何做最優決策,這些最優決策往往是動態的,會隨著時間改變。

現在有人嘗試把aI用到金融市場,例如如何用aI技術來分析股票,預測股票漲跌,對股票交易給出建議,甚至是代替人來進行股票交易,這類問題就是動態決策性問題。

決策性問題的第二個難點在於各種因素相互影響,牽一而動全身。

一支股票的漲跌會對其他股票產生影響,一個人的投資決策,特別是大的機構的投資決策,可能會對整個市場產生影響,這就和靜態的認知性任務不一樣的。

在靜態認知性任務我們的預測結果不會對問題(例如其他的影象或者語音)產生任何影響。

但是在股票市場,任何一個決定,特別是大的機構的投資策略會對整個市場產生影響,對別的投資者產生影響,對將來會產生影響。

當前深度學習已經在靜態任務裡面取得了很大的成功,如何把這種成功延續和擴充套件到這種複雜的動態決策問題中,也是當前一個深度學習的挑戰之一。

章杉認為,一個可能的思路是博弈機器學習。

在博弈機器學習裡,透過觀察環境和其他個體的行為,對每個個體構建不同的個性化行為模型,aI就可以三思而後行。

選擇一個最優策略,該策略會自適應環境的變化和其他個體的行為的改變。

……

章杉在這篇論文繼提出了一種幾乎是完全反深度學習思路的機器學習——淺度學習。

強調增強博弈機器學習的重要性,強調aI的邏輯性和思辨性,大幅度降低“機器學習”任務量。

毫無疑問,這是一種全新的機器學習方式!

最起碼,這種全新的模型在處理動態資訊上取得的成績將是革命性的。

喜歡讀書成神豪請大家收藏讀書成神豪本站更新度全網最快。

本章未完,點選下一頁繼續閱讀。

都市小說相關閱讀More+

神藏

打眼

浪花

瓊瑤

我的極品任性美女總裁

凱明

原來我是帝都拆遷戶[重生]

白夜未明

年少不知初戀好,錯把女神當成寶

失戀的海

仙子很兇(太莽)

關關公子