出品 | 搜狐科技
作者 | 梁昌均
“做通義聽悟的初心不是做宣傳做引流,或者造一波聲勢,而是希望借助技術能力能讓AI產生真實的價值,通過更多的AI助手,真正幫助工作生活等日常的方方面面。”阿里云CTO周靖人在近日的阿里云峰會上對搜狐科技等媒體表示。
周靖人認為,大模型將帶來新的機會,各種APP、業務場景及業務系統都可以基于大模型重新做,而通義聽悟就是一款大模型應用,可以真正把大模型的能力變成工作學習的AI助手。
至于為什么要選擇音視頻賽道做這款產品,通義聽悟技術負責人鄢志杰解釋稱,通義聽悟的前身是聽悟,此前主要做語音記錄等,只是一款工具。“當我們第一次看到大模型能夠提取摘要能力的時候,覺得這就是game-changer,它在客觀指標和主觀體驗上都帶來明顯的提升。”
因此鄢志杰認為,當大模型的能力跟工具相結合以后,很有可能它已經不再是工具,而是變成了智能助手,不僅是幫助用戶,還可能提供建議來激發、啟發用戶。
據介紹,通義聽悟是一款聚焦在音視頻領域的產品,能夠幫助用戶高效完成對音視頻內容的轉寫、翻譯、檢索、摘要和整理,適用于開會、上課、訪談、培訓、面試、直播、看視頻、聽播客等場景,已自6月1日起開啟公測。
搜狐科技實測顯示,通義聽悟的音頻轉寫速度比市面上部分產品較快,對于轉寫記錄能自動生成關鍵詞、摘要、章節速覽和發言人總結,但生成內容也會有錯別字、不準確等瑕疵,英文提煉能力也相對較弱。此外,該產品還與阿里云盤打通,生成PPT、chorme插件等功能也將在后續上線。
在商業化方面,聽悟除個人版本外,還將推出企業版。“企業版是為企業的場景所定制,每個企業有不同的需求,也有數據安全、數據隱私等要求,這方面會有完整的企業級產品系列。”周靖人表示。
他還介紹稱,目前聽悟企業版已在阿里集團內部使用,釘釘的“釘閃記”背后也集成了聽悟,后續也將在夸克APP、阿里云盤等端口提供服務。對于企業用戶擔心的潛在的數據安全和隱私的問題,周靖人表示,大模型技術并不代表損失隱私,更多是提高了開發的效率。
“在智能化時代,所有的企業都站在同一起跑線,誰能更有效利用好模型,就能更好跟自己的業務場景有機結合,這樣的企業就會脫穎而出,更加敏捷、更加地快速探索出一條業務發展創新的道路,從而在新的時代占據有利位置。”周靖人表示。
隨著大模型的蓬勃興起,阿里云提出了模型即服務(MaaS)的云服務模式,但這也導致和SaaS之間的界限越來越模糊。
對此,周靖人表示,通義聽悟即屬于MaaS,但歡迎它被各種各樣的業務系統集成,集成進更多智能化服務中,最終打造基于業務場景的SaaS服務。
他判斷,模型即服務將變成行業標準。“通過一系列基礎模型,把創新的能力用在上層的二次開發,甚至根據技術模型以及業務場景來做一系列的創新。”
周靖人還透露,阿里云在持續進行大模型的研發投入的同時,也會做基于大模型一系列產品的創新。除了聽悟,接下來還會推出其它更多的產品。
“我們希望務實地把技術真正做到普惠,通過技術創新不斷降低模型訓練和模型服務的成本,能夠讓大家快速使用起來,更多在云上進行創新,只有這樣能夠讓大模型真正意義上大規模地去服務全社會。”周靖人表示。