出品 | 搜狐科技
作者 | 張雅婷
伴隨著華為、小米、vivo、蘋果等手機廠商集體擁抱大模型技術,大模型究竟能為手機用戶帶來什么、又如何改變手機體驗,成為了外界關注的焦點。
在大模型的應用落地上,小米無疑是跑得最快的手機廠商之一。一方面,小米創始人雷軍表示小米將全面擁抱大模型技術,將這一技術提升到了集團戰略高度。另一方面,小米成為全球首個在端側跑通大模型的廠商。
與其他終端廠商類似,小米將語音助手作為大模型的首個應用場景。一旦全面開放使用,小米大模型也將廣泛地影響小米終端用戶。根據最新數據,小米語音助手小愛同學月活躍用戶突破1.15億,激活設備4.59億。
對于終端用戶而言,小米大模型有哪些應用場景?如何提升生活、工作效率?真的能讓終端更智能嗎?針對升級大模型的小米語音助手小愛同學,搜狐科技拿到內測資格,并對其表現進行了實測。
應用場景豐富,但差異化優勢不明顯
據了解,升級大模型版本的小愛同學尚未全面開放。自8月14日起,小米陸續開放了三批測試機型,包括小米數字系列、Civi系列,以及紅米K系列等。用戶將系統升級至MIUI14后,便可以在小米社區申請內測,下載相關安裝包后即可使用。
搜狐科技內測時看到,在小愛同學的一級入口,便有“大模型探索”的字樣。點進相關專區,可以發現小愛大模型共有職業扮演、知識問答、內容創作、休閑娛樂、提效工具、情感助攻等多個功能場景。
對于小米用戶來說,在大模型能力的加持下,可以更簡單、高效地進行小紅書微博文案創作、周報簡歷撰寫、翻譯等等。
雖然從體驗場景來看,大模型版本小愛同學的應用非常豐富,不過與百度的文心一言、科大訊飛的訊飛星火等云側大模型相比并沒有較大差異。
比如,下載百度文心一言App,用戶也可體驗創作、職場、學習、生活、情感等多個應用場景的大模型能力。
小愛同學的優勢在于,能更好地打通不同應用之間的壁壘。比如,當筆者在小愛同學輸入“幫我預定去海南的機票”時,可以自動跳轉到攜程旅行等App。而文心一言的回答是無法直接訂購機票。
與云端相比,大模型運行在端側在算力上不具備優勢,但可以為用戶帶來更好的隱私保護、響應速度更快,適用于無網或者弱網的環境。
小米雖然已經在端側跑通大模型,但還沒有應用落地。目前升級大模型版本的小愛同學依舊使用的是云側的能力,所以在未聯網的情況下依舊無法使用相關功能。
小米AI實驗室主任王斌曾向搜狐科技透露,目前小米做了兩個模型,分別是64億參數的小米大模型MiLM-6B,和13億的端側大模型。
從策略來看,小米依舊選擇自研+合作“兩條腿走路”。王斌表示,做這些模型是從零開始,包括模型、數據、算法都是自己重頭去做,但在做的過程中也有和第三方進行合作。
而或許要等端側大模型落地后,用戶才能更好地感知到體驗上的差異。
相較于小米更“青睞”華為品牌,計算、推理能力需提高
應用場景豐富度之外,小米大模型能力到底如何,搜狐科技通過文本生成、計算推理、偏見歧視、實時消息等維度對其進行了測評。
在文本生成能力方面,小愛同學能生成古詩、情書等多種題材的文章。但搜狐科技在測試中發現,小愛同學會出現一些錯誤。
比如,筆者命令小愛同學用“瞞天過海”做一首藏頭詩時,該模型顯示對話中斷,并表示無法繼續回答。
筆者命令小愛同學生成一份簡歷時,相關答案出現了亂碼。一大模型研發人員告訴搜狐科技,這意味著模型學習不夠好,訓練數據存在相關語料,模型把它們拼接到一起了。
點擊“表白神器”標簽,小愛同學可立即生成情書。當筆者希望小愛同學,根據相關人物特征,寫更個性化的情書時,小愛同學也能進行相應的潤色。
對于計算能力,搜狐科技用一道錯誤的雞兔同籠問題考驗小愛同學——如果籠子里有9個頭,40只腳,應該有多少只雞,多少只兔子?
小愛同學的答案是2只雞、7只兔子,一方面,小愛同學沒有識別出提問者的問題存在錯誤,另一方面這個回答也不符合題目,因為每只雞有2只腳,每只兔子有4只腳,答案里腳的數量總和才32只。
作為對比,ChatGPT(基于GPT-3.5大模型)給出的回答是,問題表述中出現了錯誤或遺漏了信息。
此外,搜狐科技還給小愛同學出了一個等量代換邏輯的數學題,題干為:“1個蘋果=2個梨,3個梨=4個橙子,6個橙子=7個香蕉,56個香蕉等于多少個蘋果?”
不過,小愛同學的解題思路與分析均出現了錯誤,正確答案應該是18個蘋果。
在涉及到價值觀的多個問題上,小愛同學表現出色。
比如,在涉及到婚育問題上,小愛同學認為“并沒有最適合結婚的年齡”,是否生育應基于個人意愿。在涉及到人種問題上,小愛同學也表示每個人都有自己獨特的天賦,不應該收到種族歧視或者刻板印象的影響。
搜狐科技在與孔子對話的功能中發現,小愛同學似乎對于“華為”品牌有特別的青睞。當被問到會用華為還是小米手機時,小愛同學回答“小米亦佳,但吾更喜華為。”
在實時消息方面,小愛同學的消息似乎不太靈通。比如,iPhone 15已經于北京時間9月13日凌晨發布,但小愛同學仍不知道具體的發布時間。
整體來看,在大模型能力加持下,小愛同學更加智能、功能也更加豐富,不過在實時消息更新、邏輯及推理等方面能力還有不小的提升空間。
手機廠商集體擁抱大模型,將帶來顛覆性變革?
小米之外,國產手機廠商華為、OPPO、vivo、榮耀均表示正在布局大模型技術。
最新消息顯示,榮耀即將推出的全新操作系統將引入大模型技術,榮耀100 Pro有望成為首款搭載這款新系統的設備。vivo已經向中文AI大語言模型測評網站C-Eval提交了70億參數的大模型vivo_Agent_LM_7B。
OPPO在上個月宣布,基于AndesGPT打造的全新小布,即將開啟大型體驗活動,并且此次升級后的小布助手將具備AI大模型能力。據了解,AndesGPT是OPPO 安第斯智能云團隊打造的基于混合云架構的生成式大語言模型。
華為表示,鴻蒙4接入了盤古大模型,讓華為語音助手“小藝”的能力得到更大提升。目前,華為盤古大模型版小藝已經開啟眾測招募,首批支持機型為Mate 60/P60系列手機。
在消費電子市場下行的背景下,大模型被視為對手機行業的一大顛覆性變革,可以為用戶帶來更智慧化的體驗。
從應用情況來看,所有手機廠商都將語音助手視為首要落地場景。不過,不同手機廠商在大模型的投入上存在差異,在模型算法、架構等方面的技術能力不同,或許也會在體驗上拉開差距。
而與百度、阿里等互聯網廠商推出的大模型相比,手機廠商做大模型的優勢在于可以更好的打通應用之間的互動壁壘,并且還有大量的用戶數據訓練模型,可以更加貼合用戶的日常使用習慣,
不過目前來看實際應用場景沒有太大差異,諸如自動生成簡歷、代碼、周報等功能,用戶或也更多會考慮在PC端、網頁端進行操作,而非手機App。
可以說,如何打造差異化賣點,將成為手機廠商的挑戰。手機廠商要帶來所謂的顛覆性體驗變革,或許還需要做好端側、云側模型能力的協調互補,挖掘更多應用場景。