|
公司基本資料信息
|
NVIDIA®(英偉達™)Tesla™ C2050與C2070計算處理器能夠推動整個行業向并行計算的過渡,為臺式機帶來了小型集群般的性能。Tesla GPU的20系列產品家族基于代號為“Fermi”的下一代CUDA架構,支持技術與企業計算所“必備”的諸多特性,其中包括C++支持、可實現極高精度與可擴展性的ECC存儲器以及7倍于Tesla 10系列GPU的雙精度性能。Tesla™ C2050與C2070 GPU旨在重新定義高性能計算并實現超級計算的平民化。
與最新的四核CPU相比,Tesla C2050與C2070計算處理器以十分之一的成本和二十分之一的功耗即可實現同等超級計算
基于新一代Fermi CUDA架構的GPU |
與基于最新四核CPU的純CPU系統相比,該GPU以十分之一的成本和二十分之一的功耗即可實現同等的集群性能。 |
448個CUDA核心 |
每顆GPU最高可實現515 Gigaflop雙精度峰值性能,從而讓一臺工作站即可實現Teraflop級甚至更高的性能。每顆GPU的單精度峰值性能超過1 Teraflop。 |
ECC存儲器 |
能夠滿足工作站計算精度與可靠性方面的關鍵需求。能夠為存儲器中的數據提供保護功能,從而為應用程序增強數據完整性和可靠性。寄存器文件、L1/L2高速緩存、共享存儲器以及DRAM均受ECC的保護。 |
臺式機上的集群性能 |
與一個小型服務器集群相比,配備多顆GPU的單臺工作站能夠更快地解決大型難題。 |
每顆GPU最多配備6GB GDDR5存儲器 |
更大的數據集能夠保存在直接附屬于GPU的本地存儲器上,從而實現了性能的最大化并減少了數據傳輸的情況。 |
NVIDIA®(英偉達™)并行DataCache™ |
能夠為物理效果解算器、光線追蹤以及稀疏矩陣乘法等諸多算法加速,在這些算法中,數據地址事先都是未知的。每個流式多處理器模塊均包含一個可配置的L1高速緩存,所有處理器核心使用統一的L2高速緩存。 |
NVIDIA®(英偉達™)GigaThread™引擎 |
通過多項技術實現了吞吐量的最大化,其中包括10倍于上一代架構的高速上下文切換、并發內核執行以及改良的線程塊調度。 |
異步傳輸 |
計算核心在PCIe總線上傳輸數據的同時還能夠處理其它數據,因而增強了系統性能。即便是地震處理這類需要大量數據傳輸的應用程序,也能夠通過事先將數據傳輸至本地存儲器的方法來最大限度提升計算效率。 |
CUDA編程環境受到各種編程語言與API的廣泛支持 |
開發人員無論選擇C語言、C++、OpenCL、DirectCompute還是選擇Fortran語言,都能夠實現應用程序的并行機制,進而利用“Fermi”GPU的創新架構。Microsoft Visual Studio開發人員可以使用NVIDIA®(英偉達™)Parallel Nsight工具。 |
高速PCIe Gen 2.0數據傳輸率 |
實現了主系統與Tesla處理器之間帶寬的最大化。讓Tesla系統能夠應用于幾乎所有具備一條開放式PCIe x16插槽且符合PCIe規范的主系統。 |
3規格
尺寸規格 |
9.75英寸PCIe x16規格 |
Tesla GPU的數量 |
1 |
CUDA核心數量 |
448 |
CUDA核心頻率 |
1.15 GHz |
雙精度浮點性能(峰值) |
515 Gflops |
單精度浮點性能(峰值) |
1.03 Tflops |
專用存儲器總容量* Tesla C2050 Tesla C2070 |
3GB GDDR5 6GB GDDR5 |
存儲器頻率 |
1.5 GHz |
存儲器接口 |
384位 |
存儲器帶寬 |
144 GB/秒 |
功耗 Tesla C2050 |
238W熱設計功耗 |
系統接口 |
PCIe x16 Gen2 |
散熱解決方案 |
主動式風扇散熱器 |
顯示器支持 Dual- 顯示器最大分辨率@ 60Hz |
1 2560x1600 |
軟件開發工具 |
CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。 針對Visual Studio的NVIDIA®(英偉達™)Parallel Nsight™ |
*注:在開啟ECC功能的情況下,專用存儲器中的一部分將用于ECC數據,因此用戶可用存儲器容量將減少12.5%。(例如總容量為3 GB的存儲器將僅能為用戶提供2.68 GB的可用容量。)
1. NVIDIA Tesla C2070并非是GTX 590這樣的顯卡, 正確的名稱叫作"運算GPU", 它本身就已經擁有CPU的功能, 所以它搭建的平臺"可以不再"需要INTEL, AMD這樣的傳統CPU作為中央處理器(如圖)
2. 如果和傳統超級圖形工作站(服務器)相比, 他的價格明顯要便宜很多, 如圖, 如果用四個nVIDIA Tesla C2070 組成的平臺(實現了四核心+4GPU+4X6G GDDR5內存+顯存的超級圖形平臺), 只要人民幣10萬左右, 而如果是性能相當的同等級的普通平臺(一個4核心SNB架構的至強CPU, 2個NVIDIA QUADRO 6000專業顯卡組成SLI, 24G 內存), 價格明顯要貴很多.
3. TESLA C2070也可以當作普通的顯卡一樣插在普通電腦的PCI-E 16X插槽上來當普通顯卡用, 但是它作為以專業圖形顯卡為基準的設計, 游戲性能比GTX 590要慢很多, 但是圖形渲染能力(AUTOCAD 3D, 3DS MAX, MAYA這些)比GTX 590快10倍以上