未來物聯網勾勒的美好畫卷正徐徐展開 而成為主驅動力的智能家居正躬逢其盛。而在所有打開智能家居大門的“鑰匙”之中 語音儼然成為最大熱門。據ReportLinker預計 到2024年 全球智能語音市場規模將達到215億美元。
然而 如果將語音等同于智能音箱 那當是謬以千里。智能音箱作為中控設備只是語音的一個入口。從客廳到廚電、衛浴等應用場景的任意家電產品 語音其實可以脫離音箱實現“單機智能” 而語音芯片 正是其賦能者。
打破固有思維 語音≠云
盡管一提到語音方案 業界的慣性思維大都集中在聯網上云的層面 但其實上 應用只有深入到細分市場需求層面 才會激發新的洞察。
探境科技CEO魯勇 曾深入剖析語音在智能家居產品的需求。以大家常見的互聯網電視為例 技術路徑一拆為二 一個是語音識別環節 獲取用戶的指令 另一個是內容獲取環節 執行指令獲取云側的影音。
再深一步剖析我們會發現 其實從智慧客廳到智慧廚房、智慧衛浴等細分場景的各類家電中 需要獲取影音內容的僅有電視和音箱等極少數家電產品。像燈具、開關、空調等絕大多數的產品 或許會在某些高端產品線上附加此類功能 但并非剛需。
可見 智能家居的語音需求可分為兩類 一類是通過語音獲取內容 一類是通過語音控制家電。需要獲取內容的家電品類并不多 其內容獲取環節也與語音技術無關 影音內容的好壞取決于云平臺上片源的質量。
而控制電器的技術路徑 又可分為“遠程控制”及“語音控制”兩種。其中遠程控制通過Wi-Fi或藍牙等無線技術實現app聯網 并進一步控制電器 其技術的關鍵節點在于云端聯網 遠程控制實際上就是控制功能通過聯網來延伸。
可見 在智能家居領域 智能交互的最終目的就是為了控制家電設備 與其強相關的只有“語音控制”這一方向。
“語音控制”本身則可細分成“指令型”與“自然型”(即NLP自然語言處理)兩種。“指令型”可通過離線來實現 也可通過在線來實現。而NLP目前主要是通過云側實現。
“就像大家把云和語音強關聯一樣 其實很多人又把‘云’和‘NLP’兩個問題混到了一塊 認為自然語言識別就得上云。”魯勇認為 未來隨著算法模型越來越小、而芯片功能越來越強大 NLP實現離線識別將指日可待。
可見 語音識別并不等于云。語音識別和云計算是兩個層面的事情 一個是具體的技術 一個是基礎計算設施。語音識別技術的實施途徑分為離線和在線兩種 兩者的區別是將計算放在端側還是云端進行。
事實上 智能家居領域 離線語音方案有其特定的優勢。
離線語音的普世之路
在不遠的未來 萬物互聯將催生上億臺設備 如果所有計算都放在云端的話 不僅成本昂貴 而且效率難以保證。尤其是智能家居這一特殊場景 對實時性、穩定性及隱私性都有極高的要求。出于對云端數據處理能力、網絡延遲及數據安全性的考慮 把算力“下放”到靠近終端的邊緣計算將得到快速的發展。
如果說這是產品設計的考量 那么從生態鏈角度出發 對于廣大的家電廠商而言 上云意味著或將流量入口或大數據開放給第三方的生態鏈公司 或自建私有云入口 既要考慮生態的兼容性 又存在一定的研發門檻 而端側方案則不必考慮諸多顧慮 更可放手一博。
對于C端用戶而言 離線語音帶來的好外也是顯而易見。用戶無需購置和使用智能音箱等這類集中式控制硬件 也無需考慮不同品牌與云平臺的兼容 亦無需要考慮私隱安全的問題。更重要的是 離線方案無需依賴網絡、沒有延遲、識別精準 從而降低了用戶的使用門檻。
魯勇認為 智能家居發展方向應當是“先實現智能 再考慮生態” 本該保證產品易用性的生態 不該成為制約用戶使用的障礙。
離線語音使智能家電產品變得像USB一樣 實現即插即用 沒有任何使用門檻 這將從根本上提升最終的用戶體驗 大大打消終端消費者的使用顧慮。此外 離線語音可面向幾乎所有的家電品類 讓每一臺家電都成為真正的智能化設備 讓智能家居從小眾產品變為普世產品。
正是憑借自身深厚技術底蘊與敏銳市場判斷力 探境科技離線語音識別芯片——音旋風VOI611迅速打開了市場的大門。音旋風VOI611在市場上的競爭優勢極為明顯:支持200條命令詞 擁有高達99%喚醒率與97%識別率 誤喚醒率少于1次/24小時 響應時間小于0.2s 可做到10米遠場識別距離 具有精準的識別效果。
此外 探境科技的語音芯片價格幾乎與普通MCU持平 且沒有任何研發門檻 這無疑將大大加快家電企業智能化的速度。
目前探境科技已覆蓋的智能家居產品包括:智能燈具、智能開關、空調伴侶、語音風扇、空氣凈化器、晾衣架等多個品類 合作廠商包括美的、海爾、新頤、艾美特等知名企業。
同時魯勇強調 端側和云端 并不是非此即彼的單選題 在已有端側語音方案實現單機智能的前提下 是否要聯合Wi-Fi模組 或是增加云端識別 對于廠商而言不過是一道可以自由組合的多選題。
目前業界已意識到在線方案的諸多弊端 “離線+app”、“離線+云識別+app”這樣的離在線方案已見苗頭 魯勇認為隨著語音方案的算法模型越來越小 以及芯片性能逐步提升 端側NLP的技術壁壘已可攻破。未來離線NLP技術成熟之后 更智能、可定制的離線NLP語音方案將是家電廠商的不二之選。
未來“芯”中有數
看準離線語音芯片的錨點 探境已然長線布局 取得初步研發成果。
2020年第四季度 探境科技內部代號為音旋風二代的芯片產品已流片成功。音旋風二代與一代相比 算力更強 可以運行更大的神經網絡模型 同時功耗更低 價格也更低。此外 探境的端側NLP產品也已現雛形。
憑借“存儲優先架構”(SFA架構)解決存儲墻這一獨一無二的硬件架構 輔以打通語音識別全鏈路的算法精進 探境的語音芯片具有體驗好、功耗低、性價比高、實用性等優勢。
魯勇提到 探境不僅可為客戶提供芯片、算法、Turn-Key等多種語音方案 還支持客戶進行二次開發 支持算法移植。在系統軟件層面 對于不同的客戶提供不同層次 包括指令集、SDK開發環境或應用層語音/圖像算法 并可為客戶個性化部署流程。
在魯勇看來 無論任何產品都要尊重人性 人需要陪伴 需要情感交流 這也是探境的終極發展方向 而語音和視覺正是自然界中人類最便捷最符合人性的交互方式 探境科技不會單純的追求某個AI技術指標 而是要做有溫度的芯片方案 以AI技術推動生活。
“下雨時每一滴水會如何進入到山谷 這個路線是肯定無從了解的。但是你一定知道方向——因為有重力 所以必然向下。而類似于必然發生的「重力」 商業趨勢也是必然的 總體趨勢一定能夠預知。”物聯網之父凱文?凱利曾如此總結趨勢的重要性。
在經過市場的錘煉之后 探境未來也將更加“芯”中有數。未來 探境秉持對市場的潛心洞察與剖析 加以硬件、算法的持續創新 也將迎來新的高光時刻。 責任編輯:tzh