智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 漠影
生成式AI(AIGC)正引爆全球,各行各業的CEO和開發者們都在尋找機會,搭上這趟數智化“快班車”,從而實現業務轉型、業績增長。
在國內,接入百度對話機器人“文心一言”無疑成為企業進入AIGC賽道“掘金”的一張入場券。根據官方數據,已有超400家企業宣布接入文心一言,覆蓋消費、工業、旅游、傳媒等各個領域。
無論是讓文心一言做搜索引擎的“大腦”,還是基于其開發智能媒體小編、智能家居助手、電商金牌客服等應用……我們看到,AI不僅在口口相傳中名氣大漲,也在這一過程中變得更加規模化、平民化、普惠化。
百度創始人兼董事長李彥宏在近日的內部信中說:“AI技術已經發展到一個臨界點,各行各業都不可避免地被改變,中國AI市場即將迎來爆發性的需求增長。”
在生成式AI爆發的前夕,企業接入文心一言這樣的應用,無疑意味著其搭上了通往數智化高地的“快班車”。但這顯然只是“長征”的第一步。如何讓AI技術真正跨越工程化鴻溝,飛躍AI落地的“最后一公里”?這是各行各業的CEO和開發人員眼下關注的問題,因為過去幾年AI工程化確實經歷了不少挫折。
近日,通過對話百度AI中臺的三位資深專家,智東西對這一問題進行了深入探討。百度AI中臺,簡單說是百度智能云旗下的AI開發PaaS(平臺即服務)平臺,后續將推動文心一言大規模產業落地,面向企業提供一系列AI開發和運維工具。
一、400+企業接入文心一言,有多少能抵達“最后一公里”?
根據官方消息,百度文心一言將在3月16日正式推出。屆時,百度多項主流業務將接入文心一言,包括百度搜索,以及基于百度智能云的智能語音助手小度、智能駕駛阿波羅(Apollo)等;同時,目前已有超400家企業宣布加入文心一言生態圈,享用這一服務。
從AI產業落地的流程來看,接入文心一言或許只是一個開始。
要實現技術到產品的“最后一公里”飛躍并不容易,AI開發工程化尤為重要。如果把AI模型比成一個汽車發動機,AI工程化就好比讓一臺發動機成為一輛可以自如行駛汽車的工程化過程。
百度AI中臺相關負責人告訴智東西,在過去很長時間里,AI工程化面臨以下幾個顯著問題:
1、AI開發流程長且復雜,行業缺乏規范。AI開發流程大致包括:數據采集和標注、模型訓練、應用部署、數據回流和模型觀察,沒有規范意味著混亂無序。
2、市面上眾多AI工具使用門檻高。AI模型面對碎片化場景會效果衰減,企業需要做二次開發,但市面上的AI開發工具不是不好用,就是不符合需求。
3、客戶基礎設施不完善、內部孤島嚴重、人才短缺。比如某銀行客戶各部門建立的17個云系統,同時各部門孤島嚴重、需求難以聚合,加之缺乏專業AI人才,眾多因素使得花大成本購入的AI技術成為爛尾工程。
為了應對這些AI工程化難題,整套百度AI中臺的價值在文心一言的落地中凸顯了出來。
簡單來說,百度AI中臺是一個助力企業AI模型開發和運維的PaaS平臺。其面向金融、能源、互聯網、教育等多行業提供人臉識別、OCR、圖像、AR、自然語言處理等多種AI能力(文心一言是其中一項AI服務),并幫助其實現簡單、快速部署和驗證。
百度AI中臺相關負責人告訴智東西,一方面,文心一言本身的數據準備、標注、模型訓練、應用評估等開發過程,都是基于百度AI中臺完成。另一方面用途可能更受企業關注,那就是助力文心一言的應用開發。
具體來說,在文心一言相關模型開發過程中,百度AI中臺可提供從數據模型評估、推理優化、數據回流等全生命周期開發工具,以保證模型訓練效果。比如:在數據標注環節,百度AI中臺提供智能標注方式和標注標準,最高可使成本降低70%;在算力消耗方面,百度AI中臺能依照規范提高GPU利用率,能提升資源利用率40%~80%。
總的來說,有了AI中臺中一整套工具鏈,企業將能更好地飛躍產品落地的“最后一公里”,從而實現AI投入變現。
二、生成式AI爆發前夕,產業呼喚更適合跑AI的云
眾所周知,算法、算力和數據是AI落地的三大要素。
當下,基于大模型的AIGC正進入爆發前夜,新的海量智能算力需求也隨之產生。知名調查機構IDC預測,人工智能產業的軟件、硬件和服務有望在2023年突破5000億美元大關。智能算力成為產業最大增量。
百度AI中臺相關負責人告訴智東西,在這種背景下,產業需要“更適合跑AI的云”。
何謂“更適合跑AI的云”?該負責人解讀道,從傳統思路來看,云計算主要支撐企業數字化,AI契合智能化升級,往往分階段完成;但現在,很多企業會選擇將數字化和AI化一起規劃、齊頭并進,效率會高得多——這就需要更適合跑AI的云。而隨著生成式AI爆發,適合跑AI的云無疑需要支持大模型,支持更高速效的訓練和推理,需要更好的異構算力支持。
這位負責人稱,百度AI大底座正是提供了這樣的新型AI基礎設施。
簡單來說,百度AI大底座是集百度十年AI研發之大成的“全棧自研的AI基礎設施”。百度AI大底座將AI生產全要素,包括自研芯片、大模型、深度學習框架、AI應用集于一身,并可面向企業真實業務場景進行端到端的全流程調優。
縱觀人工智能產業,我們看到當下市面上實際上已經出現了“AI大裝置”等同類產品。但就像“發動機”有很多車企造,每一家的質量水平有所區別一樣,百度AI中臺負責人告訴智東西,百度AI大底座相比同行競品的一大特征就是:“全要素”和“端到端”。
▲百度AI大底座架構圖
具體來看,百度AI大底座由前文提到的AI中臺、底層百舸異構計算平臺兩部分構成。百度AI中臺是用戶“界面”,文心大模型是其中可調用的一個關鍵模型PaaS服務。百舸異構計算平臺是底層基礎設施服務平臺,通過自研芯片、計算、存儲、加速等多方面技術提供加速算力IaaS(基礎設施即服務)服務。
▲百度AI大底座產品圖譜
這位負責人指出,這種端到端的能力十分關鍵。比如有些企業可能買了最好的AI模型,但由于在開發中缺乏對數據的標注和結果監控,就導致AI應用中間斷層,久而久之AI模型就被閑置了。舉個具體案例,比如某銀行在布局OCR技術中,曾就有旗下七八個部門采購了不同廠商的產品,并不會考慮數據回流等全鏈條問題,就導致整體效果大打折扣。
可以看到,基于AI大底座,百度一定程度上建立了在生成式AI爆發前夕的技術優勢。根據IDC數據,百度智能云已連續四年居AI公有云市場第一。而這種先發優勢,很有可能在AI大模型時代保持疊層效果。
三、AI走向平民化,百度要打造人人能用的AI開發平臺
生成式AI的爆發也意味著AI進一步走向“平民化”。
這種核心價值層面的升維,不僅大大提升了AI的知名度,實際上也對AI開發工具提出了更加深刻的要求。
具體來說,大模型本身就幫企業簡化了AI工程化流程,企業只需結合業務具體場景進行小樣本調優就能獲得所需應用。
但與此同時,承載了“平民化”期待的生成式AI,需要在工程化中延續這一“普惠”價值。新的問題就出現了:大模型擁有巨量參數,一次調優涉及的資源消耗依然可觀;同時這類技術往往進入企業業務核心,帶來更高價值的同時,一旦出問題后果會更嚴重。
因此要實現真正的AI平民化,一整套高效易用的AI規范與標準、工具平臺尤為重要,而這需要產學研多方力量共同努力。
面向AI普惠發展訴求,百度已積極參與行動。2022年底,為了引導產業有序發展,中國信息通信研究院聯合百度、阿里、華為、“AI四小龍”等幾十家優秀企業編制了MLOps系列標準。MLOps(Machine Learning s),簡單來說,是指AI開發與運維的全流程。信通院MLOps標準則可以理解為一本匯集AI開發全流程的最佳實踐“寶典”,其誕生標志國內AI開發從混亂無序走向標準統一,將大幅提升AI開發質量和效率。
在這一背景下,百度AI中臺已首批通過信通院MLOps系列標準,意味著其能夠讓企業獲得最專業的AI開發服務,以業界較低的成本開發出需要的AI應用。換句話說,MLOps標準提供了一套AI軟件項目研發和運營的方法論,百度AI中臺則為企業提供了對應方法論的“絕佳工具”。
百度AI中臺相關負責人說,百度智能云企業AI開發平臺的整體能力在需求管理、數據工程和模型開發三個模塊均達到了旗艦級水平。
在功能上,百度AI中臺具有完善的需求和代碼管理流程,AI模型生產過程具備可視化建模、自動化建模、作業建模、工作流等建模方式,對底層計算資源具有完備高效的管理模式,對模型具有全面的管理能力,對數據具有功能豐富的管理平臺和質檢能力。
在服務過程上,百度AI中臺從組織結構到流程管理,再到管理工具方面,均具有較高的服務水平,能夠為外部企業客戶的需求提供較為快速和較高質量的響應。
百度AI中臺相關負責人告訴智東西,在AI基礎設施能力獲得權威認證背后,AI普惠實際上是百度智能云長期以來的一大核心價值。
這不是一蹴而就的。他回顧道,2016年,百度發布了國內第一個深度學習框架——飛槳,隨之百度內部開始“賽馬”做多個機器學習平臺。2018年,高級開發能力的BML、低門檻開發的EasyDL、以及用戶實訓比賽社區的AI Studio三大平臺脫穎而出。
“分久必合,合久必分”。2020年百度將這三大平臺整合,并按照MLOps的過程將業務劃分為樣本數據中心、開發中心、模型中心和服務運行平臺四大階段板塊,基本涵蓋了人工智能開發運維的全生命周期。通過2021~2022年的一年三到四次迭代,這一平臺最終實現了AI開發低門檻目標。
可以看到,通過八年內部賽馬打造百度AI中臺,百度正將其“反饋驅動創新”的科學方法論賦能給企業,更將其AI普惠價值傳達給行業。
結語:生成式AI風起,云智一體趨勢凸顯
當下,我國人工智能產業在經歷了十幾年波峰波谷之后,正乘著生成式AI技術的東風迎來新的春天。憑借技術屬性和社會人才等各方面條件,AI技術落地的廣度深度延展,正走向規模化、平民化、普惠化。
從企業角度來看,他們正通過接入文心一言等產品的方式,實現數字化與智能化轉型的齊頭并進。盡管正如科技部部長在兩會“部長通道”中所說,國產力量與OpenAI等國際公司仍存在差距。但百度文心一言無疑是國內企業吃到AI技術新紅利的一條“快車道”入口。
與此同時,企業接入大平臺大模型也只是一個開始。下一步,如何基于AI大模型進行二次開發、數據挖掘、優化調優及部署測試,讓AI實現“最后一公里”飛躍,成為更關鍵的問題。
這也使我們越來越意識到,AI落地是一條算法、算力和數據跨越漫長開發鏈條的握手合作。產業呼喚更適合跑AI的云,云智一體也成為云計算產業發展的重要趨勢。