浙江大學吳飛:AI邁向數據和知識雙輪驅動,可避免林黛玉倒拔垂楊柳的幻覺問題

導讀原標題:浙江大學吳飛:AI邁向數據和知識雙輪驅動,可避免林黛玉倒拔垂楊柳的幻覺問題搜狐科技《思想大爆炸——對話科學家》欄目第30期,對...

原標題:浙江大學吳飛:AI邁向數據和知識雙輪驅動,可避免林黛玉倒拔垂楊柳的幻覺問題

搜狐科技《思想大爆炸——對話科學家》欄目第30期,對話浙江大學上海高等研究院常務副院長、人工智能研究所所長吳飛教授。

嘉賓簡介:吳飛,浙江大學求是特聘教授,博士生導師,浙江大學上海高等研究院常務副院長、人工智能研究所所長,國家杰出青年科學基金獲得者。主要研究領域為人工智能、多媒體分析與檢索、統計學習理論,著有《走進人工智能》《人工智能導論:模型與算法》等。

出品 | 搜狐科技

作者 | 梁昌均

“目前已經出現了100多個大模型,雖然百花齊放,但是模型質量參差不齊,最終通過迭代優化與合并重組進行大浪淘沙,只會剩下來若干個性能卓越、與智能技術鏈更好適配的通用大模型。”談及百模大戰,浙江大學上海高等研究院常務副院長、人工智能研究所所長吳飛教授對搜狐科技表示。

據不完全統計,目前國內已有超過130個大模型。而在經過前期的技術喧囂后,如何推動大模型落地已成為巨頭和創企關注的重點,但目前尚沒有誰能真正實現規模應用。

在吳飛看來,大模型在真實場景難以使用,還是因為當前AI模型算法尚未擺脫海量數據驅動而暴力出奇跡這一模式,使得模型能力不夠,讓大模型具備“通用能力”還需要在理論上突破。

或也正是因如此,很多人都感覺ChatGPT所引領的這一波大模型熱潮已逐漸歸于平靜。吳飛認為,這一方面是大模型在解決實際問題時遇到了固有難題,另外一方面是所謂的人工智能現象。

他解釋稱,人工智能現象是指實現了AI技術后都不再是人工智能,人們大腦中想象的人工智能是具有一定距離的遙遠技術。比如,每天使用的文字識別、語音合成、路徑導航等APP,一般不會認為這些技術是人工智能,而是認為人腦數字孿生、意識涌現等是人工智能。

談到爆火的ChatGPT,吳飛表示,這是“數據是燃料,模型是引擎,算力是加速器”三者有機結合的科技創新現象。

這其中AI算力爆發式增長,從2012年AlexNet的6000萬參數,到GPT-3的1750億參數,為了應對如此快速增長的模型參數,以GPU為代表的AI算力迅猛增長。據OpenAI報告,自2012年以來,AI訓練算力需求每3-4個月就會翻倍,AI算力增長超過30萬倍。

不過,吳飛認為,大模型本身不是人工智能發展的唯一路徑。“在數據驅動的人工智能時代,應該推動人工智能從依賴數據向依賴數據和知識雙輪驅動的路徑轉變,這也可以解決類似林黛玉倒拔垂楊柳的AI幻覺問題。”

盡管大模型還存在幻覺問題,目前也無法理解智能涌現的機理,但其被普遍視為給通用人工智能(AGI)帶來了曙光。馬斯克在成立xAI時提到,要在2029年前實現AGI,這比他于2015年在波多黎各參加的一場科學會議上確認的時間中位數2045年提前了16年。

吳飛對搜狐科技表示,討論這個問題,首先要定義清楚AGI。在他看來,如果將AGI等同于人類智能,那能應該定義清楚人類智能。目前現階段通過計算機這一計算器械所實現的人工智能算法只能完成定義清楚的任務。

“OpenAI將AGI定義為通常意義下比人類更聰明的人工智能系統,但現在我們對AGI還沒有一個共識,因此說2029年或什么時間節點可以實現AGI,這就難以評判了。”吳飛說。

從這個意義上而言,人類的某個工作如果能被清晰描述,那就可以用計算機來進行仿真模擬,從而在完成這個工作上人工智能系統會比人類更高效,代替人類工作。

可以說,大模型的誕生推動人工智能進入新的時刻。英偉達CEO黃仁勛等人均認為,以ChatGPT為代表的大模型出現,意味著人類社會已經進入“人工智能的iPhone時刻”。

吳飛對此也強調到,一定要認識到大模型不單純是一個技術、一項產品、一個應用或一個服務,它正快速將人工智能算法、芯片、基礎軟件、模型、應用和服務等融合在一起,以自然語言這一簡單交互方式讓每一個人與信息空間、物理世界和人類社會彼此相連,因此大模型正在構建一個技術生態、社會生態和服務生態。

“在這樣一個生態中,不同創新要素成己成物,則生態發展將郁郁蔥蔥、永葆活力。”吳飛說。在即將舉辦的2023中國計算機大會(CNCC2023)上,擔任多個論壇共同主席的吳飛教授也將圍繞大模型生態探索等多個話題進行探討分享。

此外,作為長期研究AI的學者,吳飛也越發感受到人工智能具有學科交叉的內稟。“今天我們在大多數學科前面加上計算應該都沒有問題,比如計算語言學、計算生物學等。”

2009年,吳飛前往加州大學伯克利分校統計系做訪問學者,那時正是統計學習大行其道的時候,在那里也讓他對AI基礎研究產生了更大興趣。他非常認同印度裔統計學大師C.R.勞(C. Radhakrishna Rao)的觀點:在抽象的意義下,一切科學都是數學;在理性的世界里,所有的判斷都是統計學。

“ChatGPT的誕生給了我們一個反思企業文化、人才培養或科技創新體制的機會。”吳飛表示,科技創新本質是人的創造性活動,科技創新實質是人才驅動,高等學校在人工智能時代一方面培養AI理論和技術高質量人才,也可拔除學科藩籬,在人工智能賦能學科范式變革等方面做出貢獻。

以下是對話實錄(經編輯整理)

搜狐科技:ChatGPT引發的生成式AI和大模型浪潮,很多人都說有所降溫,您有什么感覺?

吳飛:ChatGPT確實取得了巨大進步,但在AI領域一旦實現了某個技術,大家就不再把它當成人工智能,開始寄希望于下一代的AI或下一代的ChatGPT,比如說希望它推理得更深、回答得更廣,甚至在某些專業問題上發揮出能力,但這還存在巨大困難。這一現象被稱為人工智能現象。同時,ChatGPT在商業賦能上也正遇到一些挑戰,所以(降溫)很正常,大家都安靜些攻堅克難,形成好的成果,人工智能的熱度自然而言就帶起來了。

搜狐科技:從AI概念被提出到現在已近70年,它的發展超出了期待和想象嗎?能代替人嗎?

吳飛:人類的某一個工作如果能被清晰描述,那就可以用計算機來進行仿真模擬,從而代替人類工作。但我覺得不應該片面來比較AI和人,不能把AI等同人的大腦,這種觀念對人工智能的發展非常不利。目前對人的大腦的終極秘密尚未攻破,我們不可能設計出來和人腦一樣的機器人。

搜狐科技:您提到在數據為王、大力出奇跡的人工智能算法中,需要試錯探索和暴力計算,隨著GPT-5或更大模型推出,有擺脫試錯的可能嗎?

吳飛:很多時候用計算機解決一個問題,它的答案是浩瀚如星辰。比如要開一把鎖,有1000萬把鑰匙,要求10秒內之內找到開鎖的鑰匙,只能試錯。理論計算機之父圖靈在二戰領導英軍工程師隊伍研制了被稱為圖靈炸彈的計算機,破譯了德軍的密碼,就是不斷產生新的密碼去攻擊密文。圖靈認為,“機器創造出來的密碼怪獸,只有用機器才能戰勝”。

AI算法也是一樣,深度學習中進行模型訓練采用的一種方法叫做誤差反向傳播,即通過模型產生的錯誤來糾正模型本身。我們現在仍然處于數據為王、大力出奇跡的人工智能模型時代,GPT5或其他模型仍然依靠人類反饋或監督信息來優化參數。

搜狐科技:高算力是大模型的基礎條件之一,暴力計算會是AI發展的關鍵推動力嗎?

吳飛:數據是燃料,模型是引擎,算力是加速器。光有算力,沒有好的模型,或者光有模型,沒有好的算力,沒有好的燃料也沒用。數據、模型、算力是最重要的因素,三者缺一不可,并不是說只要有好的算力,人工智能就會大功告成,而是數據、模型和算力一起合力斷金。

搜狐科技:算力需求快速增長,很多企業都在搶芯片,這會是未來AI發展的阻礙嗎?在算力受限情況下,有什么解決辦法?

吳飛:現在遭遇了人工智能天花板,就是人工智能如何從依賴數據向數據和知識雙輪驅動的方式轉變,不讓它過于依賴數據,而是依賴小數據、強推理的模型和算法。一些學者也開始研究在現在的架構上解決算力墻、內存墻、通訊墻等困惑,激發更大算力效能,這是目前比較重要的一個方向。

搜狐科技:您認為大模型接下來的發展趨勢是什么?

吳飛:第一,我認為會從通用大模型向垂直領域大模型發展,利用具體領域豐富的專業知識,推動通用大模型去解決專業問題,“大珠小珠落玉盤、聲聲入耳賦新機”。

第二、大小模型端云協同,在移動互聯時代,靠近用戶、數據和場景的終端小模型與云端大模型協同進化,共同完成復雜任務,既提供云上服務和端側推理能力,又推動云上模型和端側模型的協同進化,從云計算和端智能向端云協同進化計算模式進行跨越,充分發揮出云上、端側和端云鏈中各類計算資源最佳效用。

第三、用數據驅動和知識引導的雙輪方法去解決AI幻覺問題。AI出現幻覺不是大模型故意在騙人類,ChatGPT會在計算某個單詞和哪些單詞一起出現的概率,比如訓練數據中林黛玉和倒拔垂楊柳等單詞一起出現,就會以概率方式合成林黛玉倒拔垂楊柳這一非事實故事。如何克服?就要外掛知識。假設有知識說林黛玉和魯智深不是一個朝代,那它就能對幻覺結果進行修改。

搜狐科技:大模型被視為AGI的曙光,馬斯克提出要在2029年之前實現AGI。對此您怎么看?AGI能實現嗎?

吳飛:如果能定義清楚AGI,那就能討論這個問題。如果說AGI像人類的智能,那么人類的智能是什么?所以要把人類智能定義清楚,能定義清楚的人類智能,計算機就能實現,而不能定義清楚的,計算機也不會實現。

OpenAI對AGI的定義是計算機能夠完成某一個任務,其完成的效率和性能與人類相當。所以要定義具體的任務和場景,現在都定義不清楚什么叫AGI,那怎么能說2029年或什么時間就能實現,這一說法的準確性難以評判。

搜狐科技:很多企業都在探索大模型應用,這個過程會面臨什么問題?什么時候能迎來規模落地?

吳飛:凡貴通者,貴其能用之也。每個企業所淬煉大模型,都想應用起來,如果應用效果不理想,肯定是碰到了技術或其他方面問題。我認為還是AI模型算法本身的問題,目前大量依賴數據的模型,只能種瓜得瓜、種豆得豆,一旦碰到了以前沒有訓練的數據和案例,仍然無法用起來。所以還是模型的能力不行,還需要繼續用更多的數據,更多的知識,更好的模型來解決這些問題。

搜狐科技:您將在CNCC大會上討論大模型生態,現在大廠都說要打造生態,您認為國內AI生態做得怎么樣?

吳飛:生態一定是一個協同體,不可能我家有一個生態,你家有個生態,就像我們生活在社會里面,水廠、電廠、交通公司等各司其職,就形成了信息相融的社會。人工智能也是一樣,芯片、編譯、軟件、場景、數據等各方聯合起來才叫一個比較完好的生態。顯然,現在我們在這方面還尚未形成。

搜狐科技:您也會在CNCC上討論大模型在數學領域面臨的挑戰,您怎么看待AI和其它學科的關系?

吳飛:AI最可貴的就是學科的交叉能力,任何一個學科前面加上人工智能或可計算都沒有問題,比如可計算化學、可計算心理學、可計算語言學。這說明我們已經進入了一個數據驅動或科學計算的時代,希望不同的學科能夠用好人工智能,來改變學科今后的發展方式。

在即將于今年10月26-28日在沈陽舉辦的CNCC2023期間,在129個涵蓋人工智能、安全、計算+、軟件工程、教育、網絡、芯片、云計算等30個熱門專業領域的技術論壇上,包括國際知名學者、兩院院士、產學研各界代表在內的700余位報告嘉賓將著力探討計算技術與未來宏觀發展趨勢,為參會者提供深度的學術和產業交流機會,當中不乏在各領域深具影響力的重磅學者專家親自擔綱論壇主席。

免責聲明:本文由用戶上傳,如有侵權請聯系刪除!