首先來看K10,它的物理外觀與GTX 690顯卡沒什么區別,但是NVIDIA公布的幾項參數耐人尋味,單精度浮點能力為4.58TFLOPS,帶寬為320GB/s,作為對比的是GTX 680單精度運算能力3.09TFLOPS,192GB/s帶寬,而GTX 690也有5.62TFLOPS,384GB/s帶寬,上一代Fermi核心浮點運算能力為1.58TFLOPS,帶寬192GB/s。
從參數上看,K10達到了NVIDIA所說的三倍于Fermi家族的單精度浮點能力,但是比GTX 680只提高了50%,帶寬也只高了了67%左右(需要支持ECC糾錯,顯存頻率有所下降),明顯不如GTX 690顯卡。
由于是同樣的架構,Tesla K10很明顯在核心和顯存頻率上做了妥協,由于GK104架構的能效比很高,而HPC領域對功耗、發熱也不甚敏感,不知NVIDIA為何將K10的規格定的比GTX 690還低。
現場的圖片沒有公布K10的顯存容量和TDP信息,但是GeForce GRID頁面出現的K520顯卡規格與K10一致,而顯存容量是8GB,TDP是250W,二者其實都是雙芯GK104顯卡,因此Tesla K10也是8GB顯存,250W TDP。(這個功耗低于GTX 690的300W,或許是規格降低最可能的解釋了)
Tesla K10現在就可以出貨,但是它并不是重點,個人覺得它只是個過渡產品,扮演救火隊員的角色,因為GK104先天孱弱的雙精度運算能力注定了它不可能在HPC市場有多高的成就,NVIDIA之所以推GTX 690上陣是因為GK110架構來的比預期的還要晚。
GK110是NVIDIA針對高性能GPU計算市場開發的架構,之前一直傳聞到今年8月份就會發布,但是NVIDIA給出的日期是今年第四季度,不論是28nm產能還是芯片自身的問題,這大半年的空白期總需要有人先頂上,這就是K10的使命了。
Tesla K20與GK110架構
NVIDIA對K20的描述是“3倍雙精度浮點性能”,并有Hyper-Q、Dynamic Parallelism等多種并行計算技術加持,這些是現有的GK104架構不具備的。 |
|