百度集團副總裁侯震宇
出品|搜狐科技
作者|鄭松毅
5月9日,百度文心一言技術交流會在北京百度科技園舉辦,百度集團副總裁侯震宇、百度智能云AI與大數據平臺總經理忻舟在會上介紹,百度將堅持貫徹“云智一體,深入產業”戰略,遵循“芯片層”、“框架層”、“模型層”、“應用層”的“四層邏輯”,文心千帆大模型將為企業用戶同時提供公有云及私有化部署。
近日,百度董事長李彥宏曾在一次內部講話中表示,“算力可以買來,創新能力買不來”。 侯震宇在與搜狐科技對話時表示,下一階段人工智能大模型的創新還要從前沿理論研究方面尋找突破口,例如探尋突破Transformer框架的方式,以及深度思考為什么大模型在千億參數以上的情況下會出現智能涌現能力等問題。
據介紹,文心千帆大模型平臺提供的公有云服務包括推理、微調及托管,私有化部署包括軟件授權、軟硬一體、及租賃服務。侯震宇在接受搜狐科技等媒體訪談時表示,對于一些相對來說使用大模型頻率不高,且對模型要求不高的企業,租賃是非常劃算的一個選擇。
據忻舟介紹,從高質量數據標注、強化學習、大模型評估及壓縮、自動化Prompt工程,到快速應用編排,文心千帆大模型平臺在經歷全流程洗禮過后,已支持豐富的應用場景,包括但不限于智能問答、內容創作、產品營銷、代碼編寫、及人員培訓,如今大模型的應用已深入金融、工業、政府服務等領域。
在百度工作人員的現場演示下,Suger文心問數Demo模型向觀眾展示了企業如何通過上傳自己的數據集,快速實現大模型微調功能,從而使大模型在垂直行業中具備更好的服務能力。演示中,文心問數模型根據用戶在系統中上傳的數據集,通過數據分析實現對“各省份銷售額”等問題的回答,并將分析結果可視化呈現。
據忻舟介紹,在文心大模型的助力下,升級后的百度搜索問題分類準確率上升4.5%,百度地圖信息搜索滿意率上升6%,小度意圖理解能力上升3.1%。
據搜狐科技不完全統計,目前國內大模型主要玩家總和已40有余,學院派、大廠派、創業派紛紛躋身于大模型研發的競爭行列之中。從早期的單一模型到現在通用性更強的人工智能大模型,人工智能技術正在不斷演化和發展。百度集團執行副總裁沈抖曾表示,“AI技術,正成為貫穿上下行業場景和算力基礎的橋梁。”
據國際權威資訊機構IDC發布的《2022中國大模型發展白皮書》顯示,百度文心大模型在市場格局中處于第一梯隊,產品能力和應用能力領先。智能云方面,IDC數據顯示,在AI公有云市場,百度智能云已連續4年獲得第一名。
侯震宇對搜狐科技表示,在人工智能高速發展的時代,數據信息安全、倫理道德等問題也是非常需要被關注的,研發人員應從數據收集階段到數據應用階段嚴格按照數據標準把控數據質量。同時,侯震宇表示企業用于模型微調的數據并不會進入到文心模型核心層,研發人員也會對數據進行再處理,避免信息泄漏問題發生。
在侯震宇看來,在當前各類大模型不斷涌出的階段,判斷大模型好壞的標準不僅要看大模型解決問題的能力,還要看服務平臺針對特定垂直領域模型調教的能力。百度AI大底座可以為大模型提供高效、穩定的訓練和有效的收斂。千卡加速比達到90%,資源利用率70%,開發效率提升100%。這是AI大底座為大模型的開發和應用帶來的價值。”他表示,B端用戶并不像大多數C端用戶抱著看熱鬧的心態看待大模型,他們往往會從更挑剔且專業的視角審視大模型。侯震宇強調,對于企業而言,基于好的大模型基礎進行垂直領域針對性微調是最智慧的選擇,因為大模型微調的成本相較于從頭訓練研發大模型的成本根本不是一個數量級。