伴隨著物聯網時代的到來 語音交互已然成為人與機器“交流”的重要環節。以語音為切入口的布局端成為了許多科技公司的必爭之地。
但語音賽道也有其鮮明的行業特征:首先 語音的交互流程、交互邏輯較之于圖像更為復雜 決定了其產品應用商業落地的復雜性與難度更高 用戶對于產品性能期待值更高;其次 從國內市場看 圖像相對于語音賽道而言 擁有更為確定性的場景應用 作為語音公司而言 要生存 也意味著更加考驗團隊的“市場刨食”能力。
與此同時 由于語音場景碎片化現狀 對于行業玩家 不僅需要在技術方面提前布局 反復打磨 更需具備靈敏的商業嗅覺 提前發現并布局市場機遇。
一個行業越是“紛繁復雜” 越能考驗身處行業中企業的定力和底氣。在語音賽道中 有這樣一家專注語音AI技術的公司——云知聲 其歷經8年的打磨 在語音賽道上探索出自己的生存法則和市場嗅覺。
8年的時間 云知聲也從曾經的默默無聞 逐漸成長為行業領軍企業 不僅在技術且在商業化道路方面 也呈領跑趨勢。而在近期 云知聲正式向上交所提交IPO招股書材料 公司正向“科創板AI語音第一股”發起沖擊。
敢為人先
如何判斷一家AI公司的路走的正確與否呢?云知聲提供了一個很好的研究范本——看一家企業的路對不對 主要是看其在關鍵時刻的那幾步走的對不對 而不是看其大多數時間和其他人做了多少相同的事。
“算力、算法、數據”是構建人工智能核心技術的基礎要素 其中帶領AI產業駛離深水區 實現真正產業落地的關鍵之一就在于算法側供給提升。在這一方向上 云知聲于2012年率先將深度神經網絡(DNN)應用于商業語音識別系統 并在后續的人工智能浪潮中持續進行前沿算法的商業實踐。
基于公司先人一步將DNN引入語音領域 在后續的人工智能浪潮中持續進行前沿算法的商業實踐 例如 后來涌現的卷積神經網絡(CNN)、回歸神經網絡(RNN)、端到端序列建模、生成對抗網絡(GAN)、注意力轉換模型(Transformer)、雙向編碼表征轉換模型(BERT)、知識蒸餾(KD)、自監督學習(SSL)等主流技術方法 云知聲都是業界最早的產業實踐者之一。
而從現在絕大多數企業的選擇來看 DNN已經成為了主流選擇。也就是說 云知聲當時超前的技術預判后來被證實是正確的。
除了率先擁抱DNN外 云知聲的另一個關鍵一步就是2015年啟動自主造芯。
據了解 為了進一步降低智能語音交互方案的功耗、提升其喚醒的靈敏性 進而滿足更多物聯網設備加載語音交互功能的需求 云知聲自2015年起 前瞻性布局人工智能語音芯片 著手開發uDSP處理器和DeepNet IP技術。
在此基礎上 云知聲于2018年率先交付人工智能語音芯片——“雨燕” 后于2019年陸續推出車規級芯片“雪豹”和面向家居領域的第二款升級版芯片“蜂鳥”系列 并啟動具備“圖像+語音”多模態交互功能的芯片“海豚”的研發 持續領跑同業。
需要注意的是 當前越來越多的AI語音公司不約而同地闖入造芯新賽道 從算法出發“軟硬兼施”已然成為一條必走之途 但也顯得語音AI市場變得異常競爭激烈。與之相比 云知聲所推出的芯片又是否具備在這場競爭中“脫穎而出”的品質?
芯片性能優越
以云知聲當前的主力芯片產品之一“蜂鳥”為例 根據灼識咨詢研究結果 其與同期其他市場參與者主力產品相比 “蜂鳥”在語音處理效率和商用成本方面均具有明顯優勢。
具體而言 “蜂鳥”芯片采用先進的DSP+神經網絡+MCU的異構設計 異構設計相較傳統的通用CPU架構 一方面可以大幅度提高芯片的運行效率 另一方面可以減少芯片面積以及功耗。其浮點運算能力和定點運算能力可分別達到16MAC/時鐘周期、32MAC/時鐘周期 均領先于相同面積下同類芯片的性能。
此外 “蜂鳥”芯片內部集成1.5MBSRAM 搭載云知聲自有語音識別算法 可實現遠場5m距離 準確率>98%的遠場語音識別 相比相同競爭對手所需RAW容量減少近一半 這在對成本敏感競爭激烈的語音芯片市場是至關重要的。
同時為了最大限度提高芯片的集成度 “蜂鳥”芯片在芯片內部集成了FLASH 實現了真正意義上的單芯片語音解決方案。
今年上半年 得益于規模化推廣“蜂鳥” 并放棄毛利率較低的產品 云知聲智能語音交互產品直接硬件采購成本占比降至26.17% 毛利率顯著回升。
另外 云知聲還結合自主產權的人工智能加速器IP 設計并開發出了車規級語音AI芯片——“雪豹” 該款芯片與云知聲的人工智能軟件引擎和車聯網人工智能解決方案進行垂直整合 形成完整的云端芯一體解決方案。
目前 車規級芯片“雪豹”已進入吉利汽車的產品穩定性測試以及車規級測試階段 通過后即可在吉利汽車的主流平臺上線。
通過“唯快不破”的造芯發展思路 云知聲很快在語音識別風口中比肩行業頭部公司。
此次科創板IPO中 云知聲擬投入3.17億元用于“面向物聯網邊緣計算的人工智能芯片研發平臺建設”項目。該項目旨在通過人工智能芯片研發 提升物聯網終端的邊緣計算能力 提高應用領域內的芯片設計水平。
獨特的云端芯一體化
云知聲董事長/CTO梁家恩博士曾指出 云知聲很早就搭建了被譽為云知聲版“TensorFlow GKE (Google Kubernetes Engine) ”的 Atlas 機器學習計算平臺。基于該平臺 向上支撐起信號(AEC/SSP/ISP)、語音(ASR/TTS/VPR/CALL)、語言與認知(NLU/NMT/SDS/ICI)、圖像(FID/OD/OCR)等多技術領域的橫向擴展和縱向迭代。
通過將能力封裝在自研 AI 芯片之上 云知聲率先打磨出了獨特的“云端芯”產品中臺 對核心技術進行了模塊化梳理和整合 從而具備面向市場需求的快速產品化能力 支撐公司以豐富的產品組合為眾多知名企業提供服務。
據了解 云知聲的“云-端-芯”產品中臺落地“AI 生活(家居、車載、機器人等)”與“AI 服務(醫療、教育、政務、酒店等)”兩大核心場景 繼而貫通云知聲從 AI 技術到產業應用的生態閉環。
在家電領域 公司智能語音交互方案已被格力等家電龍頭采用;在酒店、商業地產和住宅領域 云知聲與世茂集團達成戰略合作 成立合資公司 面向世茂集團下屬的眾多酒店批量交付智慧物聯解決方案 帶來銷售收入的快速增長。
在醫療領域 云知聲通過與北京協和醫院合作 率先在國內落地醫療病歷轉寫解決方案 并在行業內被快速推廣 目前已在100多家醫院上線使用 超過500多家醫院在測試使用。此外 公司與平安好醫生成立合資公司 試水醫療領域智能硬件產品的開發。
在汽車領域 云知聲還與億咖通成立合資公司 為戴姆勒奔馳等整車廠提供車載語音解決方案 并攜手探索基于自研車規級人工智能語音芯片“雪豹”的車載語音解決方案的應用。
依托“云-端-芯”產品中臺 云知聲已形成了三大系列、數十個產品相輔相成、高度融合的產品矩陣。此外 受益于獨特的產品中臺體系 云知聲的技術能力到產品落地周期被顯著縮短 驗證有效的前沿算法通常可在3-6個月時間內應用于終端產品 確保了公司產品的開發效率和競爭力 增強了云知聲的市場競爭力。
結語
當前 人工智能公司們正迎來企業發展的黃金時代 一方面 自2015年以來 人工智能就成為了市場熱點 相關產業正式被提上國家層面戰略 比如十四五規劃建議稿指出 “要瞄準人工智能、量子信息、集成電路、生命健康、腦科學等前沿領域 實施一批具有前瞻性、戰略性的國家重大科技項目。
按照中央規劃 未來人工智能核心產業、人工智能與傳統產業融合均是戰略發展重點。平安證券預計 到2020年我國人工智能核心產業市場規模將超過1600億元 帶動相關產業市場規模將超過萬億元。
另一方面 科創板采取更靈活的上市機制 有利于一批AI企業加速登陸資本市場。目前云知聲的科創板審核狀態變更為“已問詢” IPO進程正在穩步推進中 公司有望成為科創板AI語音第一股。 責任編輯:tzh