NVIDIA的下一代GeForce游戲卡一直不愿露面。一方面,缺乏足夠的競爭刺激;另一方面,NVIDIA的業務重心早已轉移,不再專注于游戲卡,而是更加關注計算平臺。畢竟有更大的發展空間和更高的利潤。
英偉達今天宣布推出新一代計算平臺“HGX-2”,該平臺擁有多達16張頂級計算卡特斯拉V100,也是首次將AI人工智能和HPC高性能計算集成到統一架構中。
特斯拉V100基于新一代GPU架構“Volta”,采用TSMC 12納米FFN(16納米增強版)工藝制造。它擁有5120個CUDA內核和640個Tensor深度學習內核,面積達815mm2,集成了210億個晶體管。
浮點性能高達半精度30次,單精度15次,雙精度7.5次,張量性能120次。同時搭配16GB HBM2高帶寬內存,4096位寬,頻率1.75GHz,帶寬900GB/s.
英偉達此前的計算平臺HGX-1集成了8個特斯拉V100,共有40,960個CUDA內核、5,120個Tensor內核和256GB視頻內存,通過300GB/s雙線帶寬的NVLink總線連接。浮點性能為單精度125次浮點和雙精度62次浮點,張量性能為1次浮點。
另一方面,全新的HGX-2采用了16特斯拉V100,輕松實現規模和性能翻倍,共有81,920個CUDA內核、10,240個Tensor內核、512GB視頻內存、250次單精度浮點性能和125次雙精度浮點性能,以及2次Tensor性能。
NVIDIA還在系統中部署了12個NVSwitches,用于GPU之間的直接互聯,NVLink總線的雙向帶寬高達2.4 TB/s。
除了高性能之外,HGX-2平臺最大的優勢就是支持各種精度計算,能夠滿足不同的需求。例如,在科學計算和模擬中,FP64和FP32可以用于高精度計算,而在AI訓練和推理中,可以使用FP16浮點和Int8整數精度計算。
聯想、超微、QCT和維文都將在今年晚些時候發布他們的HGX-2系統。
富士康、英業達、廣達和威斯頓正在設計基于HGX-2的系統,該系統將于今年晚些時候推出,可用于云計算數據中心。
原標題:16個特斯拉V100計算卡組件!英偉達打造頂級計算平臺。
編輯:李曉玲。
本文就為大家講解到這里。