第二章 AI復興:深度學習+大資料=人工智慧
李開復、王詠剛提示您:看後求收藏(第二章 AI復興:深度學習+大資料=人工智慧,人工智慧ai時代普通人能做什麼,李開復、王詠剛,大文學小說網),接著再看更方便。
請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。
圖靈測試與第一次AI熱潮</h2>
2016年是電腦科學領域的最高獎項——圖靈獎設立50週年。1966年,美國計算機協會(ACM)以開創電腦科學和人工智慧基本理論的科學巨匠——艾倫·圖靈的名字設立了這項“計算機界的諾貝爾獎”。
<img src="/uploads/allimg/200412/1-2004120Q20AH.jpg" />
圖21 布萊切利園的圖靈雕像(CC BY-SA 3.0,Wikipedia)
艾倫·圖靈的人生本身就是一個傳奇。他利用自己卓越的數學、密碼學和計算理論知識,在第二次世界大戰期間,幫助英國軍方成功破譯了德軍使用的著名密碼系統——恩尼格瑪(Enigma)密碼機。他早在20世紀30年代就提出了指導所有現代計算機(那個時候,通用電子計算機還沒有誕生)的計算原理設計的圖靈機理論。他還是個擅長馬拉松的運動健將,卻因為性取向問題受到英國政府的迫害,最終服毒身亡。有關圖靈的傳奇故事,2014年的電影《模仿遊戲》很值得推薦,該片曾於2015年7月在中國大陸公映。
艾倫·圖靈是人工智慧的開拓者,他所提出的圖靈測試,直到今天仍然是我們判定一部機器是否具有人類智慧的重要手段。那麼,到底什麼是圖靈測試呢?
<h3>
AI小百科 圖靈測試</h3>
1945年到1948年,圖靈在英國國家物理實驗室負責自動計算引擎(ACE)的研究。1949年,圖靈出任曼徹斯特大學計算機實驗室副主任,負責英國最早的可程式設計計算機之一——曼徹斯特一號(Manchester Mark 1)的軟體工作。
這是通用電子計算機剛剛誕生的時代。電子計算機的使用者,無論是軍方、科學家、研究員,還是學生,都將計算機視為一臺運算速度特別快的數學計算工具。很少有人去琢磨,計算機是不是可以像人一樣思考。圖靈卻走在了所有研究者的最前沿。
1950年10月,圖靈發表了一篇名為《計算機械和智慧》(Computing Machinery and Intelligence)的論文,試圖探討到底什麼是人工智慧。在文章中,圖靈提出了一個有趣的實驗:
假如有一臺宣稱自己會“思考”的計算機,人們該如何辨別計算機是否真的會思考呢?一個好方法是讓測試者和計算機透過鍵盤和螢幕進行對話,測試者並不知道與之對話的到底是一臺計算機還是一個人。如果測試者分不清幕後的對話者是人還是機器,即,如果計算機能在測試中表現出與人等價,或至少無法區分的智慧,那麼,我們就說這臺計算機透過了測試並具備人工智慧。
簡單地說,圖靈從人們心理認知的角度,為“人工智慧”下了一個定義。圖靈認為,人們很難直接回答一般性的,有關人工智慧的問題,比如“機器會思考嗎?”但是,如果把問題換一種形式,也許就變得易於操作和研究了。圖靈所提出的新問題是:
在機器試圖模仿人類與評判者對話的“模仿遊戲”中,有思考能力的電子計算機可以做得和人一樣好嗎?
圖靈所說的“模仿遊戲”,後來也被人們稱為“圖靈測試”。這個定義更接近我們現在說的“強人工智慧”或“通用人工智慧”。另外,在論文中,圖靈還對人工智慧的發展給出了非常有益的建議。他認為,與其去研製模擬成人思維的計算機,不如去試著製造更簡單的,也許只相當於一個小孩智慧的人工智慧系統,然後再讓這個系統去不斷學習——這種思路正是我們今天用機器學習來解決人工智慧問題的核心指導思想。
在20世紀50年代到60年代,人們對人工智慧普遍持過分樂觀的態度。圖靈測試剛提出沒幾年,人們似乎就看到了計算機透過圖靈測試的曙光。
1966年,麻省理工學院(MIT)教授約瑟夫·維森鮑姆(Joseph Weizenbaum)發明了一個可以和人對話的小程式,名叫ELIZA。這個名字來自蕭伯納的戲劇《賣花女》——其中,賣花女的名字就叫伊萊莎·杜立德(Eliza Doolittle)。
第一次使用ELIZA程式的人幾乎都被驚呆了。約瑟夫·維森鮑姆將ELIZA設計成一個可以透過談話幫助病人完成心理恢復的心理治療師。人們不敢相信自己的眼睛,ELIZA竟真的能夠像人一樣,與病人一聊就是好幾十分鐘,而且,有的病人還特別願意與ELIZA聊天。
今天,我們還可以從網路上找到許多不同的ELIZA的實現版本,比如,在程式設計師愛用的編輯器Emacs中,有一個名叫醫生(Doctor)的現代版本的ELIZA對話程式。圖22是病人與這位“精神治療醫生”的一段對話記錄。怎麼樣?還挺像兩個真人在聊天吧?
想象一下,20世紀60年代的人第一次看到類似這樣的人機對話,會是怎樣一種既驚訝又興奮的神情。但約瑟夫·維森鮑姆公佈出來的程式原理和原始碼又讓當時的人大跌眼鏡:ELIZA的程式邏輯非常簡單!
ELIZA所做的,幾乎就是在一個相當有限的話題庫裡,用關鍵字對映的方式,根據病人的問話,找到自己的回答。比如,當使用者說“你好”時,ELIZA就說:“我很好。跟我說說你的情況。”此外,ELIZA會用“為什麼?”“請詳細解釋一下”之類引導性的句子,來讓整個對話不停地持續下去。同時,ELIZA還有一個非常聰明的技巧,它可以透過人稱和句式替換來重複使用者的句子。比如,使用者說“我感到孤獨和難過”時,ELIZA會說“為什麼你感到孤獨和難過?”這樣一來,雖然根本不理解使用者到底說了什麼,但ELIZA表面上卻用這些小技巧“裝作”自己可以理解自然語言的樣子。
<img src="/uploads/allimg/200412/1-2004120Q20A20.jpg" />
圖22 ELIZA對話程式的一個現代實現:Emacs Doctor
ELIZA是那種第一眼會讓人誤以為神通廣大,仔細看又讓人覺得不過爾爾的小程式。當年雖有人宣稱ELIZA可以透過圖靈測試,但更多人只是非常客觀地將ELIZA看成是人們第一次實現聊天機器人(Chatbot)的嘗試。追本溯源,ELIZA是現在流行的微軟小冰、蘋果Siri、谷歌Allo乃至亞馬遜Alexa的真正鼻祖!
針對圖靈測試,人工智慧領域還專門設立了一個每年一度的羅布納獎(Loebner Prize),專門頒發給在圖靈測試中表現最優秀的計算機程式。所有聊天機器人程式都可以參加羅布納獎的評測,以判定是否有程式透過圖靈測試。羅布納獎的競賽規則和評測方式歷經許多次變化與調整。1995年以前以限定話題領域的測試為主,1995年起,羅布納獎不再限定話題領域。對話時長則從最初的5分鐘逐漸增加到2010年之後的25分鐘。
評測時,人類評判員坐在電腦前,同時與一個計算機程式和一個真人透過鍵盤和螢幕對話。對話結束後,評判員根據對話內容,判定與自己對話的兩位中,哪一位是電腦,哪一位是真人。如果判定錯誤,就表明計算機程式在這一次對話中“愚弄”了人類。如果計算機程式愚弄人類的次數超過30%(圖靈本人建議的比例數字),就可以認為,該計算機程式透過了圖靈測試。羅布納獎成立至今,尚未有任何程式超過30%的關口。2008年時,一個名叫Elbot的程式騙過了12名人類評測員中的3位,這已經很接近30%的界限 了34。
非常有趣的是,2014年,為了紀念圖靈去世60週年,雷丁大學在倫敦皇家學會舉辦了另一場圖靈測試。測試中,一個名叫尤金·古斯曼(Eugene Goostman)的聊天機器人程式取得了33%的成功率。這個聊天機器人程式是由一個名叫普林斯頓人工智慧(Princeton AI,雖然叫普林斯頓,但和普林斯頓大學沒有任何關係)的小團隊設計實現的,它成功地在33%的評判輪次中,讓評判員誤以為尤金·古斯曼是一個真實的、13歲左右的小孩子。雷丁大學隨即宣稱,尤金·古斯曼第一次透過了圖靈測試!
尤金·古斯曼真的透過了圖靈測試嗎?訊息剛一傳出,質疑聲就隨之而來。根據公佈的尤金·古斯曼的聊天記錄,羅布納獎的創立者休·羅布納認為,雷丁大學的測試時長只有5分鐘,遠沒有達到羅布納獎25分鐘的標準。用5分鐘的聊天記錄來判定一個程式是否具有智慧,這太簡單和草率了35。許多學者在親自與尤金·古斯曼進行過網上聊天后,都覺得這個聊天程式離真正的智慧還遠得很。至少到目前為止,尤金·古斯曼還沒有得到學界的一致認可。
<h3>
我挑戰圖靈測試的故事</h3>
說起圖靈測試,我總會想起我在哥倫比亞大學讀書時的一段趣事。
在哥倫比亞大學,我讀的不是計算機系,卻對計算機相關的課程最感興趣。當時,教我們自然語言處理課程的老師是邁克爾·萊博維奇(Michael Lebowitz)。他為我們講述了諾姆·喬姆斯基(Noam Chomsky)的語言學基本理論,比如基本的詞法、句法關係,以及人是如何透過語法結構理解自然語言的。
學到了這些語言學方面的基本知識,年輕的我就大膽提出:“我能不能挑戰一下圖靈測試呢?”其實,我當時提出的想法很簡單,就是做一個聊天機器人,而且,是一個只關注自然語言處理這個領域,且在說話風格上模仿我們的老師邁克爾·萊博維奇的小程式。我當時和另一位非常有才華的華人同學胡林肯(Lincoln Hu)一起,完成了程式的設計和開發。
我們做的那個程式,名字就叫邁克爾·萊博維奇。學生可以把這個程式當作老師,與“他”聊任何與自然語言處理課程相關的話題。比如,我們可以問這個程式說:“你能告訴我,語言學是什麼嗎?”這個程式就會裝出老師邁克爾·萊博維奇的口吻說:“語言學就是關於人類語言的科學研究,包含句法、詞法、語音學等研究方向。”更有趣的是,這個程式甚至會講許多老師邁克爾·萊博維奇當年常講的課堂笑話。
我們的程式還很幼稚,有些時候表現得比較呆笨,根本不像一個聰明的人類對話者。但這個小程式還是讓老師邁克爾·萊博維奇笑逐顏開,無論是程式本身的幽默感,還是程式碼中的技術含量,都超過了老師的期望。老師給了我們A+的高分。
從技術上說,今天那些流行的聊天機器人程式和我們那個時代做的小程式相比,已經有了很大的進步。它們都在模仿人類語言風格之外,引入了更大的知識平臺作為後盾。例如,聊天程式基於搜尋引擎索引到的網際網路網頁建立知識庫,從海量的頁面資訊中搜集可能的常見問題、常見回答的組合,這已經成為一種非常成熟的技術。當我們與這些程式聊天時,實際上既是一次人機間的對話,也是一次對機器背後龐大知識庫的搜尋操作。
另一方面,那些以參加圖靈測試比賽為目標的聊天機器人程式,往往在對話策略方面有著非常針對性的設計。比如,不少在羅布納獎測試中排名靠前的聊天程式,都刻意使用了一種攻擊性強的對話風格,它們試圖更多地控制聊天時的話語權,不給評判員太多深入追問的空間,並用挑戰性的問句或引導性的話語,儘量將聊天控制在自己熟悉的話題領域內。這也是羅布納獎測試為什麼在近年要將聊天的時長從5分鐘擴充套件到25分鐘的重要原因——沒有足夠的時間,評判員根本來不及根據自己的思路,與對方深入交流。
無論如何,圖靈測試以及為了透過圖靈測試而開展的技術研發,都在過去的幾十年時間裡,推動了人工智慧特別是自然語言處理技術的飛速發展。我們憧憬著計算機程式真正使人信服地透過圖靈測試的那一天,但我們更希望看到自然語言處理技術在文字理解與分類、語音識別、自動客服應答、自然語言控制介面等領域取得更多商業上的成功。
<h2>
語音識別與第二次AI熱潮</h2>
<h3>
生不逢時的我</h3>
20世紀80年代到90年代的第二次AI熱潮中,語音識別是當時最具代表性的幾項突破性進展之一,而我自己恰恰在那個時代站到了人工智慧特別是語音識別研究的最前沿。
讓計算機聽懂人們說的每一句話、每一個字詞,這是人工智慧這門學科誕生第一天科學家就努力追求的目標。但直到我從事博士研究的那個時代,語音識別才真正取得實質性的進展——很大程度上是因為我和同時代學者對傳統符號主義方法的摒棄。
很多人說,我在人工智慧的發展史上留下了自己的名字。這的確是事實。但就像人工智慧前兩次熱潮中的許多研究者一樣,我提出的語音識別演算法雖然在那個時代處於領先地位,但距離人們覺得系統可用的心理閾值還有一定的距離。我博士畢業後,在蘋果公司研發的語音識別系統就難以滿足當時市場上人們對聽寫、輸入、控制等功能的需要,很難真正變成暢銷的產品。
今天回想起來,我真的有些感慨自己生不逢時。如果我晚生30年,在2010年前後讀博士並從事人工智慧的研究,那我一定會基於這個時代被證明最為神奇、最有效的人工智慧演算法——深度學習來重新打造語音識別的整個演算法架構,就像今天谷歌、微軟乃至國內的科大訊飛在語音識別領域所做的那樣。如果我生在今天這個時代,我所開發的技術和產品一定會被億萬人使用,並深刻改變人們的生活方式。
科技發展瞬息萬變,每個時代都有每個時代的領軍人物和代表性的技術方向。從20世紀70年代末到20世紀90年代中,比爾·蓋茨和史蒂夫·喬布斯所代表的PC時代的創業者們,締造出微軟、蘋果等科技神話。從20世紀90年代末到2015年前後,谷歌、Facebook、騰訊、阿里、百度等科技巨頭以及後生可畏的優步、Snapchat、美團、滴滴、小米等新興獨角獸公司,先後在網際網路領域和移動網際網路領域引領科技大潮。錯過了PC時代的創業者,要在2010年前後去創立一家與聯想、惠普、戴爾競爭的PC公司,簡直就是痴人說夢。錯過了網際網路時代的企業家,要在今天去打造一個世界級的通用搜尋引擎,就更沒有任何可行性。
今天的主角是人工智慧。移動網際網路的浪潮尚未平息,人工智慧的創投就已經進入了讓創業者無比興奮的上升期。只有順應潮流,在對的時間做對的事情,創業才最有可能成功。
正因為如此,當人工智慧開始真正在產業發展中成為核心推動力的時候,我才不無遺憾地發現,如果晚生20年,如果在今天這個時代到來前夕才開始做人工智慧相關的研究,那麼,我也能在一個對的時代站到科研第一線,享受科技風口帶給前沿研究者的巨大機遇與挑戰。
本章未完,點選下一頁繼續閱讀。