導讀 Arm本周發布了Ethos-U65 AI加速器,用于在邊緣設備和其他設備上運行工作負載。該設計描述為microNPU,其中NPU代表神經處理單元;它應該與Co
Arm本周發布了Ethos-U65 AI加速器,用于在邊緣設備和其他設備上運行工作負載。
該設計描述為microNPU,其中NPU代表神經處理單元;它應該與Cortex-M,Cortex-A和Neoverse系列CPU內核一起使用,它們分別主要針對微控制器,智能手機和筆記本電腦以及服務器。CPU內核將AI數學運算卸載到了microNPU上,并且它們都被封裝在片上系統中。
快速瀏覽其規格[PDF],可以發現Ethos-U65已針對運行卷積神經網絡,遞歸神經網絡和長期短期記憶網絡進行了優化。這些通常用于計算機視覺和自然語言處理應用程序。
因此,該技術可用于諸如實時面部,物體和語音識別之類的事情。Arm將Ethos-U65推向了將AI帶入最新的IT趨勢:網絡邊緣。這意味著我們很可能會看到U65用于智能家居設備和相機,個人數字助理以及管理設備和傳感器的控制器。例如,使用16nm制造節點時,Ethos-U65占用約0.6mm2的管芯空間,支持INT8和INT16精度(這是您進行適度的AI推理所需的全部),并且每秒鐘可實現的最大性能為一萬億次操作第二(在16nm處為1 TOPS)。
它具有55至104KB的內部SRAM,每個時鐘周期可處理256或512個乘加運算。后者對于執行矢量數學至關重要,而矢量數學是當今神經網絡算法的基礎。您可以使用Google的TensorFlow Lite Micro框架訪問Ethos-U65,它可以運行流行的現成模型,例如用于對象識別的Google Inception V3或用于語音識別的Facebook Wav2Letter。