人民網
人民網>>知識產權>>首頁滾動

深度學習的下一站在哪裡

2019年04月01日08:23 | 來源:科技日報
小字號
原標題:深度學習的下一站在哪裡

近日,人工智能領域傳來好消息——美國計算機學會宣布將2018年圖靈獎頒發給深度學習領域三位先驅——約書亞·本吉奧、杰弗裡·辛頓和雅恩·勒昆,以褒獎他們推動深度神經網絡成為計算機技術的重要組成部分。感謝他們拯救了AI、改變了世界。

之前,業內有人提出“深度學習已死”的基調,讓深度學習的熱度大大下降,而此消息一出,猶如按下重啟鍵,人們再次將目光鎖定深度學習。那麼,作為人工智能的一種形式,目前深度學習如何突破瓶頸,迎接新一代人工智能的到來?讓我們聽聽國內外專家如何說。

已然改變人們生活

事實上,用深度學習進行分析的目的在於識別真實數據中的真實模式。如果這種建設性能力可應用於總結經驗、設計方案以及記錄歷史,甚至能夠以驚人的逼真性反饋於人們的身體,那麼現實與幻想之間的界線將變得非常模糊。

“深度學習雖然有種種局限,但在很多領域已然切切實實發揮作用,比如在語音識別、機器翻譯等,這是一些可算作‘無限但可枚舉’(Infinite but enumerable)的數據對象。在這些領域中,訓練數據集及其變種可以包括大部分我們可能遇到的實際數據,深度學習可以解決。”新一代人工智能產業技術創新戰略聯盟聯合秘書長、科大訊飛副總裁兼AI研究院聯席院長李世鵬在接受科技日報記者採訪時指出。

他說:“而另外一些領域則屬於‘無限也不可枚舉’的數據對象,比如說自動駕駛場景下的各種環境圖像和視頻,計算機視覺中通用識別問題的數據對象等。這些問題,深度學習可能會解決其中某些子問題,但整體來看,會出現不久前全球人工智能計算機視覺領域奠基人之一艾倫·尤爾教授所提及‘深度學習在計算機視覺領域已至瓶頸’的問題。”

“實際上,深度學習主要依賴於大量的數據和數據標注。在醫療領域,可對採集到上萬個病例數據庫的醫學影像進行分析,供放射學和病理學方面訓練,幫助醫生做出更為精准高效的診斷,實現大規模應用。不過,對於應用本身其是受限的,因為很多領域並無那麼多數據,也沒太多真正意義上的訓練。如在自動駕駛領域,正常駕駛很多的數據可以採集到,但有些非正常數據像事故方面卻很難採集。” 遠望智庫人工智能事業部部長、圖靈機器人首席戰略官譚茗洲認為。

法國泰雷茲集團首席技術官馬克·厄曼表示:“在眾多的人工智能技術中,深度學習是為我們所熟知的一種。當你擁有大量的數據和少量知識的時候,它是一種非常強大的技術。例如,人臉識別,但是這需要採集大量的圖像來訓練。在許多情況下,用於學習的數據庫極為龐大,有時候需要千萬甚至幾億數據。學習方法也有快慢之別,但是本質上來說,它不及人類大腦聰明。”

可行方法揚長避短

“深度學習肯定不是解決通用人工智能問題的全部,但是人類探索機器智能的必經之路。我們應該意識到現在深度學習的一些限制,要做的是揚長避短——用可行的方法解決現在可以解決的問題。”李世鵬指出。

如何解決數據短缺問題?李世鵬說,目前很多科學家在對此研究。一類是從數據源方面解決,比如,借助更高效的數據標注工具幫助人快速獲取更多標注數據、用對抗網絡生成數據等﹔一類是從深度學習算法本身改進,比如遷移學習、少樣本學習、無監督學習和弱監督學習等。

我們看到,AI在自動駕駛領域若達到99.9%的准確率,也意味著很多次駕駛活動中可能出現一次機器不能處理或者不能處理得很好的例子。這是否說明自動駕駛就不能做了?“當然不是。解決方法是通過人機耦合來實現穩定可靠的人工智能。”李世鵬答道。

李世鵬解釋道,今天的人工智能即使在可以發揮得很好的領域,也不是百分之百可靠。在一些不是很關鍵的領域,某些AI技術也許是可用甚至好用,但在某些關鍵領域卻遠遠不能符合要求。因此,不要把人工智能當作萬全技術,在設計一個產品或者系統時,要充分考慮機器失敗的時候,人類怎麼能很好地接手。

具體而言涉及兩個問題:一是系統如何識別什麼情況下它處理不好,就是說在AI給出某種決定的同時,也給出做此決定的可信度。在可信度很低的情況下,是否可以喚醒人類接應?

另一個是人機如何和諧地在一起工作,這涉及到用戶體驗設計和AI的結合。至少AI在現階段還只是作為提高人類效率的工具,所以在用戶體驗設計中應該做到不需要人時刻盯著,但在有狀況時應及時提醒反饋給人類無縫接手。

探索未來突破之路

國內外專家表示,盡管人工智能的發展水平令人矚目,但目前的人工智能系統有一定智商沒情商、會計算不會“算計”、有專才無通才。就目前既有的解決方法,還不夠具有革命性,要讓未來的AI更“智慧”,需要加強對人類大腦等方面的研究,探索突破深度學習瓶頸之路。

“尤爾等指出的組合模型訓練及用組合數據測試,實質上應該認為是個分解過程,但難點就在於分解。就像計算機視覺裡最難的問題是圖像或物體分割一樣,這本身可能需要更多高層次上的語義理解。更具顛覆性的方法是賦予AI引擎一些推理功能,即使沒有見過的數據,也能通過推理進行解決。”李世鵬指出。(華凌)

李世鵬進一步說,腦科學和認知科學的發展給我們很多啟示,MIT等一些大學院所的科學家正沿著這條路徑探索。其實,上世紀90年代盛行的專家系統很多時候就是給機器一些規則(推理法制),讓機器按規則去推理從而解決一些問題。但專家系統的問題是規則制定本身是件很麻煩的事,遠不及今天數據標注來得簡單。將來的思路可能是需要深度學習從大數據中歸納出一些可以解釋的規則,然后,將它們應用到新的數據中去解決問題。知識圖譜和深度學習的結合也許是這條路線的一個實用分支。

在某些方面,我們發現深度學習如同挖掘機一樣,能夠採集相當多的數據,然而,卻不像小孩子那樣,不需要千萬次的學習即會認出自己的母親。

厄曼說,這是因為實際上孩子認媽媽是將多種信息混合在一起判定,其中包括形象、氣味、身體接觸、出生記憶以及許多復雜因素。盡管深度學習是受到生物啟發,基於我們所說的神經元,但是,當你與神經科學家交談時,會覺得深度學習僅是一種對人腦的過於簡單的再現,人腦可比這復雜得多。所以深度學習只是AI使用的眾多技術中的一種,希望其他技術可以對其加以補充。

“正如現在的自動駕駛,隻能說是試水階段,其技術本身肯定不是主要依賴深度學習,而是多模態感知,運算也不是簡單依賴於視覺,而是與人類認識這個世界一樣,通過眼、耳、鼻、舌、身、意多個感知來綜合認知,而人腦本身在大多數情況下不依賴於大量數據,而是借助‘觸類旁通’等能力。因此,人腦科學、計算機科學、生理學和認知科學等跨界交融應用才是未來AI的發展方向。”譚茗洲指出。

他認為,深度學習是一個好的開始,但是不能解決一切問題,需要和更高維度的方式疊加。而跨學科的研究會在語義、知識圖譜、機器記憶、想像、邏輯推理等類人腦的領域,彌補深度學習的一些短板。

(責編:王小艷、王珩)

分享讓更多人看到

返回頂部