對話科大訊飛劉慶峰:國內大模型發展要推動自主可控,國外算力難以保證安全

導讀 原標題:對話科大訊飛劉慶峰:國內大模型發展要推動自主可控,國外算力難以保證安全出品 | 搜狐科技作者 | 梁昌均距5月6日首次發布星火...

原標題:對話科大訊飛劉慶峰:國內大模型發展要推動自主可控,國外算力難以保證安全

出品 | 搜狐科技

作者 | 梁昌均

距5月6日首次發布星火認知大模型后,科大訊飛在8月15日迎來“百日會戰”節點。在這次發布會上,星火大模型V2.0在代碼和多模態能力上實現突破,并推出多項應用和產品。

“代碼能力不僅對我們的軟件開發有幫助,也可以大幅降低創業者的創業門檻,同時是將來大模型連接真實世界和數字世界的工具和橋梁。”在與搜狐科技等媒體對話中,科大訊飛董事長劉慶峰強調稱。

這也是為什么星火大模型要堅持升級代碼能力的原因。劉慶峰表示,星火大模型的代碼生成和補齊上已超ChatGPT,到今年10月24日全面超越ChatGPT,明年上半年要對標GPT-4。

目前,通用人工智能主要具備七大核心能力,包括文本生成、知識問答、邏輯推理、語義理解、數學能力、代碼能力以及多模態能力。

劉慶峰表示,星火大模型在多輪對話和長鏈條的邏輯推理能力提升得不夠快。“模型尺度要進一步提升,此外還沒有完全開放,用戶規模不夠大,訓練不夠。”

對于星火大模型下一步的發展,劉慶峰表示,將繼續提升七大能力,并構建更大規模算力,推動自主可控。“國外的算力現在不見得能買得到,就算買到訓練完以后,安全性也很難得到保障。”

“我們有信心成為中國最早能夠把大模型紅利兌現到內部產品,同時能在行業快速落地的企業。”劉慶峰說,訊飛會理清主要賽道,哪些自己做,哪些通過生態開放給創業者。

在此次發布會上,頗為外界關注的還有,科大訊飛聯手華為發布星火一體機,合作共建國產化算力底座。劉慶峰提到,這是首個基于國產算力可以一體化部署給企業,既能做大模型的訓練和推理,又能做大模型定制優化的設備。

“華為跟我們聯手打造,從算力、網絡、存儲等方面把算子庫做得更透徹,效率就能更好的發揮。”劉慶峰透露,星火一體機能夠對標英偉達A100的性能。

對于當前的百模大戰,劉慶峰認為現階段應該是鼓勵為主,讓更多人參與進來并不是壞事,可以讓它更快成熟,發展得更好。

不過,他建議,為避免魚龍混雜和誤導投資人、消費者,國家有關部門或行業協會要制定相對比較權威科學的測評方法,讓國內知道跟國外的差距還有多少,怎么補齊。

“到明年,通用大模型國內應該剩不了幾家,但垂直行業會有很多家,而且應該百花齊放。”劉慶峰認為,這個過程中,哪些企業真正具有創新能力,哪些企業是瞎吹牛包裝概念,慢慢就會水落石出。

在商業化方面,劉慶峰認為,大模型在各個行業深度應用,最關鍵要具備三大要素。一是安全可控,內容要安全,算力要安全,要把未來發展構建在完全自主可控的平臺上。

第二是要從原來一昧構建概念去推廣回歸到場景驅動,看清楚帶來的價值是什么;最后要構建專屬模型,讓用戶非常快速和低門檻的去學習和訓練,才能夠使它賦能千行百業。

目前,大模型也逐漸分化為通用大模型和垂直大模型兩派。對此劉慶峰認為,通用大模型是做好垂直大模型的前提。

“對創業公司或沒有太多技術積累的公司來說,去做垂直大模型先解決行業的應用剛需,是一個比較科學合理的選擇。”劉慶峰表示,但訊飛必須一開始去做通用大模型,否則未來在國際舞臺上連上桌的機會都沒有。

此外,他也希望,有數據、懂場景的行業細分龍頭要多跟訊飛合作。“做大模型還是很專業的事情,很多企業以為拿開源的就能做出來,但最后可能做不下去,潛在風險也很高。”

“我們提供通用的能力底座和訓練平臺,他們來做優化,在內部滿足各種場景需要,甚至可以聯合起來往行業去推廣。”他表示,訊飛會跟行業伙伴一起構建起星火大模型的新生態。

以下是部分對話節選(經編輯整理):

媒體:星火大模型自發布以來,最讓您驚喜的能力是什么?還不太滿意的能力是什么?

劉慶峰:第一個比較驚喜的是任意風格的長文本生成,中文大家都不錯,但英文我們接近ChatGPT。我們的數學能力也迅速做到行業第一,比ChatGPT還要好,國內也是遙遙領先。當時搜狐測的10道高考數學題,我們對了5道。這次的代碼能力也很驚喜,非常接近ChatGPT,多模態理解能力在業界也是最好。

相對不滿意的是,多輪對話和長鏈條的邏輯推理能力提升得不夠快。模型尺度還要進一步提升,到了GPT-4的規模會更好,此外我們還沒有完全開放,用戶規模不夠大,訓練不夠。

媒體:為什么這次星火大模型的升級把代碼能力放在第一位,它的價值體現在哪些方面?

劉慶峰:代碼能力不僅對我們的軟件開發有幫助,可以大幅降低創業者的創業門檻,同時是將來大模型連接真實世界和數字世界的工具和橋梁。無論是軟件產業還是數字經濟發展,中國如果在大模型時代不把代碼能力提升到國際領先水平,整個國民生產效率一定沒法跟國際巨頭去比,所以我覺得這件事情很關鍵。

媒體:訊飛星火功能的進一步的豐富或完善,現在有什么樣的限制或困難?

劉慶峰:今天影響我們更快進步的主要是兩個方面,一個是算力,我們也在構建更大規模的算力,預計到今年10月份會構建成功幾千P的算力。同時要構建自主可控的國產算力平臺,國外的算力現在不見得能買得到,就算買到訓練完以后,安全性也很難得到保障。我們也需要理清主要賽道,要確定哪些自己做,哪些通過生態開放給創業者。

媒體:做大模型對于科大訊飛來說意味著什么,對您來說意味著什么?

劉慶峰:對科大訊飛和對我的意義應該是相通的,訊飛就是我奮斗的舞臺。大模型的通用能力可以進一步推動我們在各個維度和領域的人工智能應用更加成熟和相互協同。大模型也可以徹底改變內容生產的方式和人機交互的方式,將來能做各種智能助手。最后大模型可以帶來人工智能生態進一步極大的反哺,我們有信心成為中國最早能夠把大模型紅利兌現到內部產品,同時能在行業快速落地的企業。

媒體:國內大模型已經過百,您怎么看待目前現狀和未來趨勢?

我覺得到明年,通用大模型國內應該剩不了幾家,但垂直行業會有很多家,而且應該百花齊放。同時,哪些是用的第三方開源模型,去瞎吹牛包裝概念,哪些真正具有原創新能力、平臺開發能力和賽道應用能力,慢慢就會水落石出。

媒體:大模型的商業化落地有哪些難點?

劉慶峰:我覺得有兩個,一個是我們需要在國產算力安全和數據安全的前提下給各領域賦能,基于完全不可控的第三方開源平臺,不知道訓練的數據怎么來,也不知道會產生什么結果。

第二要從原來一昧構建概念去推廣回歸到場景驅動,要看明白帶來的價值是什么,是新增效益、節約成本,還是提高質量。最后要構建專屬模型,能夠讓用戶非常快速和低門檻的去學習和訓練,才能夠使它賦能千行百業。

媒體:從技術躍升潛力和市場規模前景兩個維度,您更看好通用大模型還是垂直大模型?

劉慶峰:我肯定是首先看好通用大模型,這是做好垂直大模型的前提。對創業公司或沒有太多技術積累的公司來說,去做垂直大模型先解決行業的應用剛需,是一個比較科學合理的選擇。但訊飛必須一開始去做通用大模型,否則未來就不可能在國際舞臺有一席之地,連上桌的機會都沒有。

媒體:現在很多垂直領域的領軍或龍頭企業去做垂直大模型,您怎么看或有什么建議?

劉慶峰:我覺得挺好,大家要擁抱,但我認為將來比較科學、可能做到效果最好的方式,是這些有數據、懂場景的行業細分龍頭要跟訊飛這樣的公司來合作。

我們提供通用的能力底座和訓練的平臺,他們來做優化,在內部滿足各種場景需要,甚至可以聯合起來往行業去推廣。做大模型還是很專業的事情,自己從頭到尾做不值得,很多企業以為拿一個開源的能做出來,但最后可能做不下去,潛在風險也很高。

媒體:大模型越來越強調生態,訊飛未來生態建設會怎么來做,跟合作伙伴怎么分工?

劉慶峰:訊飛是平臺+賽道的雙輪驅動,平臺就是構建生態。但中國整個產業的價值鏈分解并不夠科學和合理,微笑曲線在國內是一個拋物線,技術和生產公司都掙不到錢,主要掌握在有用戶資源的企業手中,沒有給核心技術合理的定價。這導致我們不得不去做垂直行業,否則就沒法盈利,沒法支撐技術夢想的實現。

我們會跟開發者說清楚,保證開發者做的事情不會跟我們撞車。這一次星火是新生態,是用戶做各種小助手,做插件,比原來的生態更加豐富,也更加容易激活。我們也跟國產算力、操作系統深度聯合,除華為外,跟寒武紀、曙光及國產操作系統企業等都有長期合作,構建起國產的軟硬件生態體系。第三就是行業生態,用訊飛的人工智能能力,用行業龍頭的場景和影響力,聯合打造場景,然后去全面推廣。

免責聲明:本文由用戶上傳,如有侵權請聯系刪除!