• |

使用社交賬號登陸

當前位置︰ > 觀點 > 訪談

嘀嗒出行上线出租车打车助手 可查看出租车实时信息

時間: 2019年05月09日 | 作者: 褚波 | 來源: 環球科學(huanqiukexue.com)
澳大利亞悉尼大學人工智能學家陶大程教授(右) 澳大利亞悉尼大學的人工智能學家陶大程在接受《環球科學》專訪時認為,深度學習算法在基礎理論上還有很多問題需要回答。另外,



QQ圖片20190509095409.png

澳大利亞悉尼大學人工智能學家陶大程教授(右)


澳大利亞悉尼大學的人工智能學家陶大程在接受《環球科學》專訪時認為,深度學習算法在基礎理論上還有很多問題需要回答。另外,由于目前對自然智能所知甚為有限,短時間內人工智能很難在真正意義上超越人類。


我 和同事按約定時間趕到陶大程下榻的酒店時,他剛開完一個電話會議。見到我們之後,他快步從房間里走出,熱情地和我們握手,然後招呼我們在會客廳的沙發上坐下。這是2018年12月上旬的一天,陶大程受邀前來北京,參加由《環球科學》與中國數字科技館聯合主辦的“科學連線”活動——我們舉辦這個活動的目的,是希望邀請全球知名科學家,通過現場或視頻連線的方式,向中國公眾分享各個科學領域的最新進展。就在我們見面的前一天傍晚,他剛乘飛機從澳大利亞抵達北京,下榻在鳥巢附近的一家酒店。

在這家酒店,我第一次見到陶大程,年輕、沉穩、真誠、睿智,這是他給我的第一印象。雖然是首次見面,但早在兩三年前,陶大程這個名字就通過我的同事、同行和一些合作伙伴那里,多次傳入我的耳朵。

陶大程于2002年從中國科技大學畢業,隨後分別在香港中文大學、倫敦大學取得碩士和博士學位。博士畢業後,他又先後任教于香港理工大學、新加坡南洋理工大學、澳大利亞悉尼科技大學。目前,他就職于悉尼大學,是工程與信息技術學院的教授,也是優必選人工智能首席科學家,同時領導優必選悉尼大學人工智能研究中心。

過去10多年里,陶大程在機器學習、機器視覺等領域成果頗豐,尤其是在表征學習領域,他做出了突出貢獻。迄今為止,陶大程發表的論文的被引用次數超過3萬次,是人工智能領域論文引用次數最高的華人科學家之一。他的學術成就,也給他帶來了很多的“明星光環”︰2015年獲得澳大利亞最高科學獎項尤里卡獎、2016年當選歐洲科學院外籍院士、2018年當選澳大利亞科學院院士。2017年,他還和吳恩達、李飛飛等科學家一起,入選了“中國AI英雄風雲榜技術創新人物”。

那一天,當我在陶大程的對面坐下,希望從他的過往中挖掘更多故事,讓讀者更深入地了解這位明星科學家的人生經歷時,他卻謙虛地表示,“我的個人經歷和大多數在海外的老師一樣非常普通”,于是我們的對話很快回到了人工智能上。


《環球科學》︰你的代表性貢獻之一,就是表征學習,能否介紹一下什麼是表征學習?

陶大程︰我們可以很容易地理解現實場景,認出場景中的人和各種物體。但是,同樣的任務對于計算機來說卻充滿了挑戰,因為計算機並不知道攝像機獲取到的圖像和視頻里的每一個像素表征了什麼。這就需要我們有非常高效的表征學習算法來有效地表達這些像素,以幫助理解圖像和視頻。

表征學習並不是新的概念。比如傳統機器學習、統計分析里面常用的主成分分析、鑒別分析,都是對原始數據(或者是原始特征數據)進行變換,找到有效的數據表征方式,為後面的檢測、分類等任務做好服務。表征學習的目的是從原始數據中學到更精確、更魯棒的特征,同時去除或者盡可能的減弱數據中的冗余信息以及噪聲。


《環球科學》︰近幾年,深度學習得到了廣泛應用,那麼基于深度學習的表征學習算法的優勢是什麼?

陶大程︰相比于傳統的針對特定任務設計的特征,基于深度學習的表征學習能夠自動地從原始輸入數據中提取出更加適合目標任務的特征表達。近年來,隨著算力的提高以及深度學習技術的迅速發展,基于深度學習的表征學習取得了巨大的成功。當前最好的表征學習模型可以從數據中提取出高度抽象的語義信息,用以高效地完成識別和推理等任務。即使在數據噪聲較多、環境干擾較強的情形下,基于深度學習的特征學習方法也能取得魯棒的效果。特別值得一提的是,借助先進的表征學習方法,計算機已經能夠在識別、檢測、分割等各類視覺識別任務中達到甚至超越人類的表現。


《環球科學》︰除了表征學習,你目前還對哪些研究方向感興趣?

陶大程︰人類智能可以分為四個方面︰感知(perceiving)、學習(learning)、推理(reasoning)和行為(behaving)。我們之所以研究人工智能,是為了盡可能地讓機器來模擬人的智能,讓機器幫助我們做一些事情。所以,我們希望機器也具有這四個方面的能力。在優必選悉尼大學人工智能研究中心,我們的研究也主要是圍繞這四個方面展開的。


《環球科學》︰在未來3~5年,你認為人工智能的哪些領域會出現較大的突破?

陶大程︰我對兩個方向抱有較大的期望。

第一是機器視覺。在未來的3~5年,生成對抗網絡(GAN)將會產成更逼近真實場景的數據,比如自動駕駛仿真平台可以產生逼真的道路、交通標志、建築物,還可以模擬天氣變化、時間變化等。生成對抗網絡的迅速發展將進一步提升感知模型在目標檢測、識別、分割等任務上的性能。另外,機器視覺感知時域信息的能力也將得到進一步提高。基于視頻的感知模型將在行為識別、姿態估計、場景的理解和重建等任務中表現得更加高效,為安防視頻分析、機器人定位導航、虛擬現實、增強現實等應用提供更加強大的技術支持。

第二是自然語言理解。未來幾年內,在對話任務上如何更好的結合檢索式和生成式、利用好知識圖譜(先驗知識)、利用好預訓練模型進行數據增強都是有待完善的。在翻譯任務上,因為端到端架構在短期內還很難被替代,所以更多是增量性工作和提升模型效率的工作,比如改進模型,使之便于部署和訓練、借鑒統計機器翻譯的思想和特征到transformer中、多語種翻譯、低資源甚至零資源翻譯、融入更多語義特征等等。在基礎詞法、句法任務上,如何更好地表征和解釋會很重要。


《環球科學》︰如果做一個類比,人工智能目前能達到哪個年齡段的人類智力水平?

陶大程︰在某些方面,人工智能的表現完全碾壓人類,或者達到了人類的最高水平,比如下圍棋、在一定環境中的認人識物。但在更多方面人工智能可能還不如五六歲的孩子,比如做加減法(基于固定計算規則的計算器不是AI)、圖像的語義理解等等。人類演化了這麼多年,達到了今天的狀態,雖然人工智能的目標是模擬人的智能,但實際上,這只是一種期望,甚至是奢望,讓目前的機器達到人類的智能水平還非常困難。

首先,人有很強的泛化能力(即使訓練數據和測試數據來自不同的地方),而目前要獲取高性能的人工智能算法(具體來說是機器學習算法或者深度學習算法)都要求訓練和測試數據是相同分布的獨立采樣。舉個例子,我記得我的孩子2~3歲的時候我給他看過很多卡通圖片來幫助他認識各種動物,比如大象、長頸鹿等等。後來,我帶他去動物園,他一下子就認出來了現實生活中活靈活現的大象、長頸鹿。可是如果我們用卡通動物圖像訓練機器學習算法,然後在真實的動物照片上去進行測試,那效果將會很差。即使我們考慮遷移學習,雖然有相當的提升,但是和人相比,差距依然非常明顯。

其次,人是一個“綜合體”,而目前的算法大多只能執行一個具體的功能。盡管研究人員已在努力實現多任務學習,並且取得了矚目的進展,但依然困難重重。因為任務和任務之間的關系可以是相互促進的,也可以是互相矛盾的。如何有效地組織不同類型的任務依然是一個難題。

另外,對于什麼是創造力、想象力、意識等問題,我們的認知還十分有限。著名的物理學家、諾獎得主費曼教授曾說過"What I cannot create, I do not understand"(我無法創造我不能理解的東西),這句話放在人工智能領域也非常恰當︰要想賦予機器相關的能力,我們首先得深刻理解我們人類的自然智能到底是什麼。 


《環球科學》︰但是,隨著人工智能的增強,大家都在談“奇點理論”,還是有人擔心人工智能會超越人類,甚至威脅到人類的生存。

陶大程︰相對于“奇點理論”,我更相信事物的發展是循序漸進的,人工智能技術也會遵循這樣的基本規律。剛才我們談到了人工智能的四個基本方面︰感知、學習、推理以及行為。如果從這四個方面來說,很悲觀地講,目前沒有任何一個算法能夠達到人類的水平。但是,如果說到具體的例子,就有很多智能算法達到、甚至超過了人類的水平,比如AlphaGo、AlphaZero下圍棋比世界冠軍還厲害。類似的例子,大家應該听說過不少了。

總的來說,目前的人工智能算法還有很多缺陷,無法在真正意義上達到人類自然智能的水平。目前所謂的超越,都是在特定條件下、具體任務中達成的,需要通過大量數據訓練或者大量的搜索來實現。時至今日,目前開發出的智能系統還沒有自我學習、自我進化的能力,甚至是一些相對復雜的功能,比如無人駕駛,也還有相當的路要走。

另外,目前所謂的人工智能,跟人的思維方式、思維能力完全不一樣。距離所謂的“奇點”也非常遙遠。不過,這些技術已經在改善我們的生活,改善我們的工作環境,提高我們的工作效率了。未來五年,我們還可以期待有更多、更好、更成熟的技術出現,進一步提高生產力、幫助我們更好地認識世界、改善我們的生活環境。我相信,人工智能作為一種普世工具,將在各個方面惠及每一個人,讓我們有更多的機會更好地實現自我價值、挖掘自我潛能。


《環球科學》︰在基礎研究層面上,人工智能科學家會考慮道德監管的問題嗎?

陶大程︰雖然目前的人工智能技術還有很多缺陷,甚至可以說還很弱,距離我們的期望還很遙遠,但它的發展速度很快,因此考慮人工智能的倫理道德問題還是有必要的。目前在國際上,這方面的倫理道德研究已經在一定程度上展開了,所涵蓋的科研人員非常廣泛,涉及基礎技術、社會科學、法律、藝術、行業應用等很多領域。

值得注意的是,我們需要在不同的階段,考慮不同層次的人工智能理論的道德問題,而不是一開始就把方方面面都卡死。如果這樣,技術就沒法發展。從算法的層面來說,我們首先要搞清楚我們的算法為什麼能夠運行、如何運行、在什麼條件下可以運行以及算法的局限在哪里。然後我們要去思考,它到了哪個階段,我們應該如何去監管。

總的來說,人工智能的倫理道德問題非常重要。我們要盡早地理解人工智能未來能發展到什麼狀態,在每一個狀態上,又應該如何從倫理道德層面進行監管。只有這樣才能保證我們的算法在每個階段都對人類是安全的,都能讓大多數人受益。


《環球科學》︰那麼,理想的人工智能應該是什麼樣子?

陶大程︰我們期望的人工智能首先是穩定的、魯棒的,其次是普適的、大眾的,是惠及每一個人的,而不只是對一小群人有益。我們還希望,人工智能可以跟人和諧地共存,提升人類的能力,而不是對人類造成威脅。

另外,我們還希望人工智能是可解釋的。現在,我們總說人工智能是黑箱理論,深度神經網絡是黑箱理論,如果一直是這樣,相關技術在未來的應用就會面臨很多障礙。就好比人與人之間的溝通,只有大家相互了解,才最容易達成一致。這對人和機器來說都一樣。如果我們無法解釋一個機器正在做的事,那麼人也無法理解它的行為。此時,人就很難放心讓機器去做這件事。因為我們永遠無法知道下一步會發生什麼。所以,當涉及人工智能本質時,還有很多問題。在基礎理論等方面,也還有很長的路要走。


《環球科學》︰我們距離通用人工智能還有多遠?

陶大程︰我理解的通用人工智能是能夠像人一樣聰明,不需要基于大量數據的復雜訓練,或者通過快速的訓練後,就可以有非常好的泛化能力,能夠有效完成不同類型的任務。但是,今天的人工智能的主要能力是記憶和搜索,推理能力還非常有限,更不要說應用、分析和創造了。所以在人工智能的基礎技術研究上,我們還有很多的事情要做,這與通用人工智能的距離還非常遙遠。一句話概括人工智能技術當前的狀態就是,它還在路上。


  • 相關文章