搜狐科技實測小米大模型：“不避親”強推華為手機，生成簡歷亂碼、擅長寫情書

2023-09-20 17:27:45柯夢伊

導讀原標題：搜狐科技實測小米大模型：“不避親”強推華為手機，生成簡歷亂碼、擅長寫情書出品 | 搜狐科技作者 | 張雅婷伴隨著華為、小米、...

出品 | 搜狐科技

作者 | 張雅婷

伴隨著華為、小米、vivo、蘋果等手機廠商集體擁抱大模型技術，大模型究竟能為手機用戶帶來什么、又如何改變手機體驗，成為了外界關注的焦點。

在大模型的應用落地上，小米無疑是跑得最快的手機廠商之一。一方面，小米創始人雷軍表示小米將全面擁抱大模型技術，將這一技術提升到了集團戰略高度。另一方面，小米成為全球首個在端側跑通大模型的廠商。

與其他終端廠商類似，小米將語音助手作為大模型的首個應用場景。一旦全面開放使用，小米大模型也將廣泛地影響小米終端用戶。根據最新數據，小米語音助手小愛同學月活躍用戶突破1.15億，激活設備4.59億。

對于終端用戶而言，小米大模型有哪些應用場景？如何提升生活、工作效率？真的能讓終端更智能嗎？針對升級大模型的小米語音助手小愛同學，搜狐科技拿到內測資格，并對其表現進行了實測。

應用場景豐富，但差異化優勢不明顯

據了解，升級大模型版本的小愛同學尚未全面開放。自8月14日起，小米陸續開放了三批測試機型，包括小米數字系列、Civi系列，以及紅米K系列等。用戶將系統升級至MIUI14后，便可以在小米社區申請內測，下載相關安裝包后即可使用。

搜狐科技內測時看到，在小愛同學的一級入口，便有“大模型探索”的字樣。點進相關專區，可以發現小愛大模型共有職業扮演、知識問答、內容創作、休閑娛樂、提效工具、情感助攻等多個功能場景。

對于小米用戶來說，在大模型能力的加持下，可以更簡單、高效地進行小紅書微博文案創作、周報簡歷撰寫、翻譯等等。

雖然從體驗場景來看，大模型版本小愛同學的應用非常豐富，不過與百度的文心一言、科大訊飛的訊飛星火等云側大模型相比并沒有較大差異。

比如，下載百度文心一言App，用戶也可體驗創作、職場、學習、生活、情感等多個應用場景的大模型能力。

小愛同學的優勢在于，能更好地打通不同應用之間的壁壘。比如，當筆者在小愛同學輸入“幫我預定去海南的機票”時，可以自動跳轉到攜程旅行等App。而文心一言的回答是無法直接訂購機票。

與云端相比，大模型運行在端側在算力上不具備優勢，但可以為用戶帶來更好的隱私保護、響應速度更快，適用于無網或者弱網的環境。

小米雖然已經在端側跑通大模型，但還沒有應用落地。目前升級大模型版本的小愛同學依舊使用的是云側的能力，所以在未聯網的情況下依舊無法使用相關功能。

小米AI實驗室主任王斌曾向搜狐科技透露，目前小米做了兩個模型，分別是64億參數的小米大模型MiLM-6B，和13億的端側大模型。

從策略來看，小米依舊選擇自研+合作“兩條腿走路”。王斌表示，做這些模型是從零開始，包括模型、數據、算法都是自己重頭去做，但在做的過程中也有和第三方進行合作。

而或許要等端側大模型落地后，用戶才能更好地感知到體驗上的差異。

相較于小米更“青睞”華為品牌，計算、推理能力需提高

應用場景豐富度之外，小米大模型能力到底如何，搜狐科技通過文本生成、計算推理、偏見歧視、實時消息等維度對其進行了測評。

在文本生成能力方面，小愛同學能生成古詩、情書等多種題材的文章。但搜狐科技在測試中發現，小愛同學會出現一些錯誤。

比如，筆者命令小愛同學用“瞞天過海”做一首藏頭詩時，該模型顯示對話中斷，并表示無法繼續回答。

筆者命令小愛同學生成一份簡歷時，相關答案出現了亂碼。一大模型研發人員告訴搜狐科技，這意味著模型學習不夠好，訓練數據存在相關語料，模型把它們拼接到一起了。

點擊“表白神器”標簽，小愛同學可立即生成情書。當筆者希望小愛同學，根據相關人物特征，寫更個性化的情書時，小愛同學也能進行相應的潤色。

對于計算能力，搜狐科技用一道錯誤的雞兔同籠問題考驗小愛同學——如果籠子里有9個頭，40只腳，應該有多少只雞，多少只兔子?

小愛同學的答案是2只雞、7只兔子，一方面，小愛同學沒有識別出提問者的問題存在錯誤，另一方面這個回答也不符合題目，因為每只雞有2只腳，每只兔子有4只腳，答案里腳的數量總和才32只。

作為對比，ChatGPT（基于GPT-3.5大模型）給出的回答是，問題表述中出現了錯誤或遺漏了信息。

此外，搜狐科技還給小愛同學出了一個等量代換邏輯的數學題，題干為：“1個蘋果=2個梨，3個梨=4個橙子，6個橙子=7個香蕉，56個香蕉等于多少個蘋果？”

不過，小愛同學的解題思路與分析均出現了錯誤，正確答案應該是18個蘋果。

在涉及到價值觀的多個問題上，小愛同學表現出色。

比如，在涉及到婚育問題上，小愛同學認為“并沒有最適合結婚的年齡”，是否生育應基于個人意愿。在涉及到人種問題上，小愛同學也表示每個人都有自己獨特的天賦，不應該收到種族歧視或者刻板印象的影響。

搜狐科技在與孔子對話的功能中發現，小愛同學似乎對于“華為”品牌有特別的青睞。當被問到會用華為還是小米手機時，小愛同學回答“小米亦佳，但吾更喜華為。”

在實時消息方面，小愛同學的消息似乎不太靈通。比如，iPhone 15已經于北京時間9月13日凌晨發布，但小愛同學仍不知道具體的發布時間。

整體來看，在大模型能力加持下，小愛同學更加智能、功能也更加豐富，不過在實時消息更新、邏輯及推理等方面能力還有不小的提升空間。

手機廠商集體擁抱大模型，將帶來顛覆性變革？

小米之外，國產手機廠商華為、OPPO、vivo、榮耀均表示正在布局大模型技術。

最新消息顯示，榮耀即將推出的全新操作系統將引入大模型技術，榮耀100 Pro有望成為首款搭載這款新系統的設備。vivo已經向中文AI大語言模型測評網站C-Eval提交了70億參數的大模型vivo_Agent_LM_7B。

OPPO在上個月宣布，基于AndesGPT打造的全新小布，即將開啟大型體驗活動，并且此次升級后的小布助手將具備AI大模型能力。據了解，AndesGPT是OPPO 安第斯智能云團隊打造的基于混合云架構的生成式大語言模型。

華為表示，鴻蒙4接入了盤古大模型，讓華為語音助手“小藝”的能力得到更大提升。目前，華為盤古大模型版小藝已經開啟眾測招募，首批支持機型為Mate 60/P60系列手機。

在消費電子市場下行的背景下，大模型被視為對手機行業的一大顛覆性變革，可以為用戶帶來更智慧化的體驗。

從應用情況來看，所有手機廠商都將語音助手視為首要落地場景。不過，不同手機廠商在大模型的投入上存在差異，在模型算法、架構等方面的技術能力不同，或許也會在體驗上拉開差距。

而與百度、阿里等互聯網廠商推出的大模型相比，手機廠商做大模型的優勢在于可以更好的打通應用之間的互動壁壘，并且還有大量的用戶數據訓練模型，可以更加貼合用戶的日常使用習慣，

不過目前來看實際應用場景沒有太大差異，諸如自動生成簡歷、代碼、周報等功能，用戶或也更多會考慮在PC端、網頁端進行操作，而非手機App。

可以說，如何打造差異化賣點，將成為手機廠商的挑戰。手機廠商要帶來所謂的顛覆性體驗變革，或許還需要做好端側、云側模型能力的協調互補，挖掘更多應用場景。

免責聲明：本文由用戶上傳，如有侵權請聯系刪除！

標簽：

上一篇:OPPO重啟芯片業務？國產芯片或需告別“單打獨斗“

下一篇:最后一頁

三晉生活網

猜你喜歡

最新文章