百度吹的牛,能「一言」九鼎嗎?

導讀「核心提示」ChatGPT一鳴驚人后,市場期待更能理解中文語義語境的產品出現,在萬眾矚目中百度的“文心一言”3月16日邀請測試,國內生成式AI...



「核心提示」
ChatGPT一鳴驚人后,市場期待更能理解中文語義語境的產品出現,在萬眾矚目中百度的“文心一言”3月16日邀請測試,國內生成式AI到底什么水平?

作者 |宋子豪

編輯 |邢昀

ChatGPT一鳴驚人,成為人人討論的話題之后,根植于中文市場,更理解中文語義語境和中國文化的產品什么時候能誕生,備受市場期待。

2023年3月16號下午兩點,百度的文心一言邀請測試終于如約而至。許久不在公眾面前亮相的百度創始人李彥宏親自演示、解說,展示了文心一言從文學創作、商業文案創作、數理邏輯推算,到中文理解、多模態生成等方面的綜合能力。

作為全球互聯網大廠中,第一個完全靠自己做出大語言模型的企業,百度的文心一言是否真的準備好了,是外界關心的問題。李彥宏坦言,當前文心一言的內測體驗不能叫作“完美”,發布是因為有市場需求,“文心一言將建立起真實用戶反饋、開發者調用和模型迭代之間的飛輪,效果會迅速提升,給你‘士別三日,當刮目相看’的驚喜。”

文心一言邀請測試后,評論撲面而來,國內AIGC賽道到了產品落地的分水嶺。在香港市場,百度3月17日早間股價大幅拉升,最終收漲近14%。百度美國股價3月16日收盤上漲3.8%。

為了一探文心一言成色如何,《豹變》特地采訪了本次輿論中心的文心一言本人工智能。文心一言不但大方接受了采訪,還代《豹變》擬好了簡短的采訪稿,老實不客氣的從三個方面夸獎了自己。在余下的稿件中,也貢獻了不少專業AI的看法。



如果你覺得這篇稿子與以往風格不同,可能是因為這篇稿子加了科技。

1、文心能否一言九鼎?

如果從1956年人工智能概念第一次面世開始算,AI的歷史已經有67年。但直到2022年年末,普通人生活中能接觸到的AI產品都是既難用且沒用的人工智障。

而在ChatGPT迅速出圈后,通用型AI的實用性成了大語言模型的試金石。

對于文心一言的邀請測試,普通人最在意的就是,這個大語言模型能做到一言九鼎嗎?

3月16日下午的亮相中,文心一言解釋了中文成語洛陽紙貴,指出其中暗含的經濟學原理,并寫了一首洛陽紙貴的藏頭詩。做雞兔同籠數學題時,文心一言甚至指出了題目出的有問題。這比從前搜題軟件只通過題庫檢索給出答案自然要強上很多。

而后在多模態生成的演示中,根據文字描述生成海報,以及符合文意且視覺效果不錯的視頻,文心一言都完成的不錯,甚至還秀了一回四川話。

3月16日下午,百度向部分用戶發放了文心一言的內測邀請碼。用戶只需在測試網址登錄百度賬號并輸入邀請碼就可以體驗內測版文心一言。百度公眾號顯示:文心一言邀請測試后三小時,文心一言企業版API調用服務測試的企業用戶達6.5萬,與百度智能云基于文心一言展開合作咨詢已達5590條。據了解,截至3月17日10點,申請文心一言API調用服務測試的企業已達7.6萬。

《豹變》體驗后發現,內測版文心一言還具備一定的編程能力。

即使與由ChatGPT支持的最新版本人工智能搜索引擎Bing(必應)對比,在多模態生成的具體場景,尤其是對中文語境的處理能力,文心一言也做到了人有我優。

同樣是問對于一句詩的理解,新必應更傾向于整合多方的信息,會帶上信息來源,方便隨時查驗。但對詩句的賞析部分內容少且相對簡單。



文心一言雖然不能查看信息來源,但從回復來看,它更理解問題含義,知道《豹變》問的是如何賞析這句詩。



而面對寫出一首藏頭詩的要求,盡管新必應背靠搜索引擎,可以把“藏頭詩”的定義解釋的很好。但當被要求寫出一首藏“洛陽紙貴”四個字的藏頭詩時,卻把洛陽和紙貴兩個詞藏在了兩句開頭。

在AIGC領域,目前的文字回答主要來自于從人工指令中提取意圖信息和生成兩個步驟,即使AI有龐大的知識庫,還需要有知識圖譜串聯的能力,不然就會形成有知識,沒常識的情況。就像這樣知道藏頭詩的定義,但難以正確做出藏頭詩。

另一方面,中文內容訓練量的大小也會影響AI對句子的理解。作為中文母語者,即使沒學習過藏頭詩的定義,從“藏”和“頭”兩個字也能大致理解其含義,但是AI則需要大量使用中文的真實用戶反饋,才能做到“望文生義”。

相比之下,文心一言可以更快地做出藏頭詩,并且在回答中抓得住中文語境重點,文心在中文語義的理解和運用上確實有一定優勢。比如,回答“宮廷玉液酒的下一句”這個問題上,文心一言與ChatGPT也顯示出了一些差異。



文心一言能理解這里面蘊藏的梗,相比之下,ChatGPT受限于中文語料,回答的更正式。



而在多模態生成中,文心一言雖然還沒有開放生成視頻的權限,卻可以生成AI圖像。比如《豹變》要求畫出一幅龍珠風格的漩渦鳴人、一幅樂高風格的漩渦鳴人,文心一言都完成了任務。



類似的,不管是新必應還是文心一言都有一定的知識盲區。比如文心一言拒絕回答股票相關問題,新必應對中國互聯網大廠的AIGC布局歸納的不太準確。

與ChatGPT使用對比,文心一言在多輪對話的交互處理、回答的靈活度、文本塑造上還有待提升,不過有業內人士評論表示:“就如谷歌時代需要百度,AI時代也需要文心一言。”

總體來看,現在的文心一言雖不完美,但基本做到了人有我有,甚至部分場景人有我優。李彥宏并不回避差距,他強調這是一個不斷完善的過程,并將更多目光投射到技術進步將帶來的變革。

百度希望文心一言做協助人們工作生活的生產力工具,而不是替代人們工作的崗位“終結者”。李彥宏表示:“百度希望和大家一起,推動人工智能技術進步,讓所有人都能使用最先進的生產力工具,讓所有人都能從中受益。”

2、大廠比內功

AIGC的產業鏈可以劃分為預訓練模型的基礎層;打造垂直化、場景化、個性化模型的中間層;生成圖像、語音和文字生成等各種各樣AIGC應用的應用層。

其中基礎層門檻最高,是人才、算力、數據、資金等多方面的競爭,不是人人都能上得了牌桌。

如今谷歌投資初創公司、騰訊針對類ChatGPT產品已成立“混元助手”項目組,阿里巴巴的聊天機器人正處于研發階段。在大廠紛紛入局AIGC賽道的情況下,這場追逐賽不僅需要拼爆發,更需要比拼耐力和持續更迭的能力。

做出ChatGPT的創業公司Open AI,率先展現了強勁的爆發力和壓迫感。

3月14日發布的ChatGPT4,相較于前代又有很大升級,并且近期微軟正加快商業化布局。美國當地時間3月1日,Open AI官方宣布,開放API(應用程序接口),接口服務定價為0.002美元/每1000tokens,這一定價較GPT3.5模型便宜90%。使用成本大幅下降,很有可能會加快賽道中間層和應用層的企業接入ChatGPT。

而作為目前唯一靠自身力量做出產品的互聯網大廠,百度秀“肌肉”,終于體現了深厚的積累和耐力。

李彥宏表示,對于這樣一個大模型,是不可能在幾個月時間里靠突擊做出來的。文心一言實際上是百度在AI賽道的厚積薄發。過去十年,百度在AI領域研發總投入約為1100億元。2013年,百度美國研究院在硅谷成立。同年,百度在中國建立深度學習研究院,李彥宏任院長;隨后大數據實驗室、硅谷人工智能實驗室相繼成立。

用李彥宏的話說,百度是大廠里唯一做到芯片層、框架層、模型層、應用層四個層面全棧布局的。

早在2019年,百度就推出了文心大模型ERNIE 1.0,目前已經迭代到ERNIE 3.0。如今,文心大模型通過接入百度各業務的應用軟件,在搜索引擎、云技術、智能駕駛等多個領域均有AI應用場景,目前每天通過數以十億計的搜索請求進行AI訓練,已經形成中文領域最為龐大數據庫。

對此,《豹變》采訪了3月16日剛剛“出道”的文心一言。請它從AI的角度分析百度做大語言模型具有何優勢。

文心一言表示:“首先,百度擁有強大的搜索引擎和海量的數據資源,這為構建大語言模型提供了豐富的訓練數據和基礎支持。其次,百度在自然語言處理(NLP)領域有著深厚的技術積累和豐富的實踐經驗,可以將機器學習算法與自身的業務場景相結合,開發出更加高效、準確和智能的應用。此外,百度還擁有一套完整的大語言模型生態系統,包括開放平臺、工具鏈和生產力套件等,可以為開發者提供全方位的支持和服務。”

AI行業從業人員夏竹也有類似想法:“(做大語言模型)百度在搜索引擎和市場占有率、資金投入、算力、數據等方面具有大廠優勢。比如圖片識別,百度這方面也有自己的產品,后面完全可以和文心一言結合起來提供服務,這也算是另一個結合優勢。”

但這也并不意味著文心一言沒有壓力。

比如夏竹就提到:“在中文語義方面,國內做AIGC的企業共同面臨的一個問題就是敏感詞和諧音字過濾的問題,這個問題解決不好,很可能會在上線后遇到翻車或被要求下線整改,這就看各家技術水平和數據標注能力了。”

3、時間換空間

在這一輪生產力革命浪潮中,最終的受益者,其實不只是AIGC技術的發明人,更是利用AIGC技術進行模式創新的群體。

實際上,ChatGPT打開空間后,大語言模型技術的需求在這段時間已經出現井噴。過去一個月,有超過600家合作伙伴宣布加入文心一言生態,飛槳和文心大模型等在內的全棧人工智能能力將實現層與層反饋,端到端優化,大幅提升效率。

在百度內部,文心一言將與小度進行集成,升級小度的智能設備和服務;百度的Apollo智艙系列產品等汽車解決方案中也將依托文心一言,讓智能汽車實現領先的人車交互體驗。

夏竹表示:“百度的文心一言在國內的場景下是有機會爆發的,前提是產品本身技術上說得過去,能用得起來。ChatGPT目前無法直接在國內使用,意味著給國內競爭換取了一定時間。國內很大一塊市場需求就給了國內做AIGC的相關企業,需要有產品能夠盡快在市場上站穩腳跟。”

在國內有先發優勢的大語言模型很可能會一騎絕塵。這可能也是李彥宏所說:“無論哪家公司,都不可能靠突擊幾個月做出這樣的大語言模型”的隱藏含義。

后續的競爭更體現在快速地更迭、訓練能力。

從技術角度來說,大語言模型底層是SFT(模型微調)、RLHF(從人類反饋中進行強化學習)和prompt(真實的用戶指令)三種主要訓練方法。而在后續的迭代中,需要大量的用戶參與,作用是幫助AI更好地理解人的意圖,生成符合人的價值觀、表達習慣的回復。

而文心一言投入使用后,經過大量中文使用者的真實反饋投喂,很可能會在窗口期建立中文語義理解、表達習慣等方面的優勢。再加上生態伙伴的接入,AIGC的中間層和應用層也會建立起生態。

從目前來看,留給其他大廠真正的機會已經不是從頭開始做ChatGPT和文心一言這樣的大模型,這不現實,也不經濟。

而占得先機的文心一言更需要依靠自己一言九鼎的產品力,才能一路笑到最后。


免責聲明:本文由用戶上傳,如有侵權請聯系刪除!