地表最強(qiáng)深度學(xué)習(xí)訓(xùn)練平臺(tái)~UltraLAB GPU硬件選型
目錄
1 深度學(xué)習(xí)訓(xùn)練平臺(tái)與理想計(jì)算架構(gòu)
2 深度神經(jīng)網(wǎng)絡(luò)計(jì)算特點(diǎn)與硬件配置分析
3 UltraLAB GXM圖靈工作站與配置推薦
2018年8月最新深度學(xué)習(xí)基準(zhǔn)配置報(bào)價(jià)下載(直接點(diǎn)擊,GPU更新為RTX2080/2080Ti)
(一)深度學(xué)習(xí)訓(xùn)練平臺(tái)現(xiàn)狀與完美計(jì)算架構(gòu)
深度神經(jīng)網(wǎng)絡(luò)(DNN)計(jì)算數(shù)據(jù)模型繁多,結(jié)構(gòu)復(fù)雜,主流模型含幾十個(gè)隱含層,每層都在上千上萬(wàn)級(jí)的神經(jīng)元,整個(gè)網(wǎng)絡(luò)更多,其計(jì)算量巨大,
市場(chǎng)上用于深度學(xué)習(xí)的訓(xùn)練計(jì)算機(jī)大致情況,
(1)服務(wù)器/工作站(支持2、4、8塊GPU架構(gòu)):普遍存在噪音大,無(wú)法放置于辦公環(huán)境,必須放到專門的機(jī)房,維護(hù)成本高,另外數(shù)據(jù)存儲(chǔ)帶寬、延遲、容量也不盡如意
(2)分布式集群架構(gòu):性能強(qiáng)大,但是開(kāi)發(fā)成本太高,是大多數(shù)科研單位無(wú)法承受
那么問(wèn)題來(lái)了,市場(chǎng)上是否有一個(gè)理想產(chǎn)品,彌補(bǔ)上述缺陷,讓更多單位都能用的起~人工智能AI超級(jí)異構(gòu)計(jì)算機(jī)
UltraLAB GXM圖靈計(jì)算工作站是西安坤隆計(jì)算機(jī)公司2017年上半年推出的、目前市場(chǎng)上一款集GPU超算、海量存儲(chǔ)于一體、基于辦公靜音環(huán)境、應(yīng)用于深度學(xué)習(xí)(機(jī)器學(xué)習(xí)、人工智能)的AI超級(jí)計(jì)算機(jī)系統(tǒng)。
和市面上深度學(xué)習(xí)計(jì)算機(jī)系統(tǒng)相比,顯著優(yōu)勢(shì):
- 完全處于辦公環(huán)境(靜音級(jí))、不在被噪音所困擾
- 配備基于PCIe總線的海量高速并行存儲(chǔ)(最大容量180TB),延遲低,支持最大15個(gè)并行讀,硬盤io性能大幅提升,性能和管理遠(yuǎn)超傳統(tǒng)的DAS/NAS存儲(chǔ)系統(tǒng)
- 配備超級(jí)強(qiáng)大的計(jì)算能力,最大10個(gè)GPU卡,3.82萬(wàn)計(jì)算核,單精度浮點(diǎn)120Tflops
- 不需要專門的機(jī)房,不占過(guò)多空間,維護(hù)成本極低
- 不需要作業(yè)調(diào)度系統(tǒng),管理難度大幅降低
(二)深度神經(jīng)網(wǎng)絡(luò)計(jì)算特點(diǎn)與硬件配置分析
市場(chǎng)上大部分GPU計(jì)算機(jī)(服務(wù)器/工作站),重點(diǎn)都放在GPU卡數(shù)量上,似乎只要配上足夠GPU卡,就可以了,實(shí)際情況是,機(jī)器硬件配置還需要整體均衡,只有這樣這臺(tái)機(jī)器性能才能更好的發(fā)揮
上述圖示,深度神經(jīng)網(wǎng)絡(luò)計(jì)算大致流程,下面通過(guò)深度神經(jīng)網(wǎng)絡(luò)計(jì)算環(huán)節(jié),分析核心硬件配置理想要求
1.數(shù)據(jù)存儲(chǔ)要求
做深度學(xué)習(xí)首先需要一個(gè)好的存儲(chǔ)系統(tǒng),將歷史資料保存起來(lái)
主要任務(wù):歷史數(shù)據(jù)存儲(chǔ),如:文字、圖像、聲音、視頻、數(shù)據(jù)庫(kù)等。。。
性能要求:
a.數(shù)據(jù)容量:提供足夠高的存儲(chǔ)能力,
b.讀寫帶寬:多硬盤并行讀寫架構(gòu)提高數(shù)據(jù)讀寫帶寬
c.接口:高帶寬,同時(shí)延遲低
傳統(tǒng)解決方式:專門的存儲(chǔ)服務(wù)器,借助萬(wàn)兆端口訪問(wèn)
缺點(diǎn):帶寬不高,對(duì)深度學(xué)習(xí)的數(shù)據(jù)讀取過(guò)程時(shí)間長(zhǎng)(延遲大,兩臺(tái)機(jī)器之間數(shù)據(jù)交換),成本高
UltraLAB解決方案:將并行存儲(chǔ)直接通過(guò)PCIe接口,提供最大16個(gè)硬盤的并行讀取,數(shù)據(jù)量大并行讀取要求高,無(wú)論是總線還是硬盤并行帶寬,都得到加大提升,滿足海量數(shù)據(jù)密集io請(qǐng)求和計(jì)算需要
2.CPU要求
主要任務(wù):
(1)數(shù)據(jù)從存儲(chǔ)系統(tǒng)調(diào)入到內(nèi)存的解壓計(jì)算
(2)GPU計(jì)算前的數(shù)據(jù)預(yù)處理
(3)運(yùn)行在代碼中寫入并讀取變量執(zhí)行指令,如函數(shù)調(diào)用啟動(dòng)在GPU上函數(shù)調(diào)用,創(chuàng)建小批量數(shù)據(jù)啟動(dòng)到GPU的數(shù)據(jù)傳輸
(4)GPU多卡并行計(jì)算前,每個(gè)核負(fù)責(zé)一塊卡的所需要的數(shù)據(jù)并行切分處理和控制
(5)求解后數(shù)據(jù)保存前的壓縮計(jì)算
上述每一類操作基本都是單核計(jì)算模式, 如果要加速這些過(guò)程,唯有提升CPU頻率
傳統(tǒng)解決方式:CPU規(guī)格很隨意,核數(shù)和頻率沒(méi)有任何要求
UltraLAB合理推薦:
a.CPU頻率:越高越好
b.CPU三級(jí)緩存:越大越好
c.CPU核數(shù):比GPU卡數(shù)量大(原則:1核對(duì)應(yīng)1卡,核數(shù)要有至少2個(gè)冗余)
3.GPU要求
主要任務(wù):承擔(dān)深度學(xué)習(xí)的數(shù)據(jù)建模計(jì)算、運(yùn)行復(fù)雜算法
傳統(tǒng)架構(gòu):提供1~8塊GPU
UltraLAB合理推薦:
a.數(shù)據(jù)帶寬:PCIe8x 3.0以上
b.數(shù)據(jù)容量:顯存大小也很關(guān)鍵
c.計(jì)算匹配:CPU核-GPU卡 1對(duì)1
d.GPU卡加速:多卡提升并行處理效率
4 內(nèi)存要求
主要任務(wù):存放預(yù)處理的數(shù)據(jù),待GPU讀取處理,中間結(jié)果存放
UltraLAB合理推薦:
a.數(shù)據(jù)帶寬最大化:?jiǎn)蝀eon E5v4 4通道內(nèi)存,雙Xeon E5v4 8通道內(nèi)存,內(nèi)存帶寬最大化
b.內(nèi)存容量合理化:大于GPU總顯存
#p#page_title#e#
(三)UltraLAB GXM圖靈計(jì)算工作站介紹與配置推薦
針對(duì)上述深度學(xué)習(xí)應(yīng)用計(jì)算特點(diǎn),UltraLAB圖靈工作站具有深度學(xué)習(xí)最合理硬件配置架構(gòu),保證整個(gè)機(jī)器是一臺(tái)理想化異構(gòu)超算系統(tǒng),完美強(qiáng)大高效還靜音,目前提供兩種機(jī)型:GX480M和GX610M
3.1 圖靈計(jì)算工作站技術(shù)規(guī)格
機(jī)型 |
硬件配置規(guī)格 |
|||
CPU |
GPU |
內(nèi)存 |
存儲(chǔ) |
|
GX480M |
單CPU架構(gòu),6核4.5GHz,8核4.3GHz,10核43GHz |
最大6塊GPU |
最大256GB |
并行存儲(chǔ), 最大180TB |
GX610M |
雙Xeon架構(gòu), 2*Xeon E5 2637v4(共計(jì)8核3.5GHz) 2*Xeon E5 2643v4(共計(jì)12核3.4GHz) 2*Xeon E5 2667v4(共計(jì)16核3.2GHz) |
最大10塊GPU |
最大1TB |
并行存儲(chǔ), 最大180TB |
技術(shù)規(guī)格一覽表
(1)GX480M技術(shù)規(guī)格一覽表
NO |
主要項(xiàng) |
技術(shù)規(guī)格 |
1 |
CPU |
1顆intel 至尊處理器 推薦型號(hào):6850K OC(6核4.5GHz) 6900K OC(8核4.3GHz) 6950X OC(10核4.3GHz) Xeon E5 2687Wv4(12核3.0GHz) |
2 |
芯片組 |
intel X99+PCH |
3 |
內(nèi)存 |
插槽:8個(gè), 規(guī)格:DDR4 2400 Reg ECC 最大容量:256GB(8根32GB) |
4 |
GPU卡 |
數(shù)量:最大7個(gè) 接口:PCIE 8x 3.0 GPU種類:Nvidia Geforce、Quadro、Tesla Intel Xeon Phi,AMD Firepro 備注:散熱系統(tǒng)必須是主動(dòng)式 |
5 |
系統(tǒng)盤 |
數(shù)量: 2塊 單盤容量:512GB/1TB/2TB/4TB SSD SATA-6Gbps接口, 支持RAID1 |
|
數(shù)據(jù)盤 |
數(shù)量:16塊, 單盤容量:4TB/6TB/8TB/10TB/12TB SATA 企業(yè)級(jí), 最大容量180TB(RAID5),PCIe 4x 2.0接口 |
6 |
光驅(qū) |
DVD刻錄 |
7 |
平臺(tái) |
型號(hào)UltraLAB S2AGDT01PCS 電源 1600w,數(shù)量1個(gè)(四塊GPU卡)或2個(gè)(5個(gè)以上) 機(jī)箱:雙塔式 機(jī)箱尺寸:深度658mm,寬度478mm,高度674mm 輸出口: 2個(gè)千兆以太端口(可選萬(wàn)兆), 4個(gè)USB 3.0口,2個(gè)USB2.0,1個(gè)VGA口 硬盤位:16個(gè)3.5”熱插拔,最大容量180TB PCI擴(kuò)展槽:7個(gè)PCIe 16x |
8 |
鍵盤鼠標(biāo) |
鍵盤:104鍵、有線、USB口, 鼠標(biāo):1000dpi精度、光電、有線、USB口 |
9 |
顯示器 |
23”圖顯(高清,可升降轉(zhuǎn)向,數(shù)量2臺(tái)) |
10 |
整機(jī)優(yōu)化 |
*2.1 自動(dòng)超頻加速優(yōu)化; *2.2 高性能低延遲優(yōu)化; |
11 |
操作系統(tǒng) |
支持Window 7/8/10, Windows 2008/2012/2016 支持Ubuntu 全系列 |
12 |
支持深度學(xué)習(xí)框架 |
Nvidia GPU驅(qū)動(dòng)程序,CUDA , Nvidia Digits, Nvidia cuDNN Caffe,Torch ,TensorFlow,CNTK,Theano, Chainer,DL4J,MXNet |
(2)GX610M技術(shù)規(guī)格一覽表
NO |
主要項(xiàng) |
技術(shù)規(guī)格 |
1 |
CPU |
2顆Xeon E5 2600v4 推薦型號(hào):Xeon E5 2637v4(4核3.5GHz) Xeon E5 2643v4 (6核3.4GHz) Xeon E5 2667v4(8核3.2GHz) Xeon E5 2687Wv4(12核3.0GHz) |
2 |
芯片組 |
intel C612+PCH |
3 |
內(nèi)存 |
插槽:16個(gè), 規(guī)格:DDR4 2400 Reg ECC 最大容量:1TB(16根64GB) |
4 |
GPU卡 |
數(shù)量:最大10個(gè) 接口:PCIE 8x 3.0 GPU種類:Nvidia Geforce、Quadro、Tesla Intel Xeon Phi,AMD Firepro 備注:散熱系統(tǒng)必須是主動(dòng)式 |
5 |
系統(tǒng)盤 |
數(shù)量: 2塊 單盤容量:512GB/1TB/2TB/4TB SSD SATA-6Gbps接口 支持RAID1 |
|
數(shù)據(jù)盤 |
數(shù)量:16塊, 單盤容量4TB/6TB/8TB/10TB/12TB SATA 企業(yè)級(jí), 最大容量180TB(RAID5),PCIe 4x 2.0接口 |
6 |
光驅(qū) |
DVD刻錄 |
7 |
平臺(tái) |
型號(hào)UltraLAB S2AGDT01PCS 電源 1600w,數(shù)量1個(gè)(四塊GPU卡) 或2個(gè)(5個(gè)以上) 機(jī)箱:雙塔式 機(jī)箱尺寸:深度658mm,寬度478mm,高度674mm 輸出口: 2個(gè)千兆以太端口(可選萬(wàn)兆) 4個(gè)USB 3.0口,2個(gè)USB2.0,1個(gè)VGA口 硬盤位:16個(gè)3.5”熱插拔,最大容量180TB PCI擴(kuò)展槽:10個(gè)PCIe 8x 3.0, 1個(gè)PCIe 4x 2.0 |
8 |
鍵盤鼠標(biāo) |
鍵盤:104鍵、有線、USB口, 鼠標(biāo):1000dpi精度、光電、有線、USB口 |
9 |
顯示器 |
23”圖顯(高清,可升降轉(zhuǎn)向,數(shù)量2臺(tái)) |
10 |
整機(jī)優(yōu)化 |
*2.1 自動(dòng)超頻加速優(yōu)化; *2.2 高性能低延遲優(yōu)化; |
11 |
操作系統(tǒng) |
支持Window 7/8/10, Windows 2008/2012/2016 支持Ubuntu 全系列 |
12 |
支持深度學(xué)習(xí)框架 |
Nvidia GPU驅(qū)動(dòng)程序,CUDA ,Nvidia Digits, Nvidia cuDNN,Caffe,Torch ,TensorFlow, CNTK,Theano,Chainer,DL4J,MXNet |
3.2 產(chǎn)品特點(diǎn)
(1)集GPU超算、并行存儲(chǔ)于一體的超級(jí)訓(xùn)練系統(tǒng)
基于辦公環(huán)境,靜音級(jí)
支持最大10塊GPU超算,單精度浮點(diǎn)最大到120Tflops
配備高速并行存儲(chǔ)(16個(gè)盤位),最大180TB容量
支持雙Xeon E5v4高頻處理器,加速密集預(yù)處理、高強(qiáng)度數(shù)據(jù)壓縮等計(jì)算環(huán)節(jié)
擁有CPU+GPU完美的深度學(xué)習(xí)架構(gòu)
(2)預(yù)裝完整開(kāi)發(fā)工具的硬件系統(tǒng),幫助快速啟動(dòng)深度學(xué)習(xí)研究項(xiàng)目
基于GPU工作站系統(tǒng),預(yù)裝深度學(xué)習(xí)所需的軟件:Nvidia 驅(qū)動(dòng)程序,CUDA工具包,cuDNN,開(kāi)源工具TensorFlow,Cafe,Torch,NVIDIA DIGITS等

#p#page_title#e#
3.3深度學(xué)習(xí)工作站硬件配置參考
(1)GX480M機(jī)型配置參考(超值型)
該機(jī)型特點(diǎn):支持最大到6塊GPU卡,CPU的頻率達(dá)到極致,每個(gè)環(huán)節(jié)保證達(dá)到最理想性能,整體配置均衡無(wú)死角,滿足深度學(xué)習(xí)訓(xùn)練硬件配置要求
NO |
CPU |
內(nèi)存 |
GPU/總顯存 |
單精度 |
系統(tǒng)盤 |
并行存儲(chǔ) |
平臺(tái) |
售價(jià) |
1 |
6850K OC (6核4.5GHz) |
32GB |
1塊GTX1080 8GB |
8Tflops |
512GB SSD |
4TB |
雙塔單電 |
46500 |
2 |
6850K OC (6核4.5GHz) |
32GB |
2塊GTX1080 16GB |
16Tflops |
512GB SSD |
2*4TB |
雙塔單電 |
55000 |
3 |
6850K OC (6核4.5GHz) |
64GB |
3塊GTX1080 24GB |
24Tflops |
512GB SSD |
3*4TB |
雙塔單電 |
67500 |
4 |
6900K OC (8核4.3GHz) |
64GB |
4塊GTX1080 32GB |
32Tflops |
1TB SSD |
28TB |
雙塔單電 |
98000 |
5 |
6900K OC (8核4.3GHz) |
96GB |
6塊GTX1080Ti 66GB |
68Tflops |
1TB SSD |
36TB |
雙塔雙電 |
149990 |
備注:含雙23”高清圖顯
(2)GX610M機(jī)型配置參考(高性能型)
該機(jī)型特點(diǎn):支持最大到10塊GPU卡,CPU的頻率和核數(shù)達(dá)到最大均衡,每個(gè)環(huán)節(jié)保證達(dá)到最高性能,整體配置均衡無(wú)死角,滿足深度學(xué)習(xí)訓(xùn)練對(duì)配置的要求
NO |
CPU |
內(nèi)存 |
GPU/總顯存 |
單精度浮點(diǎn) |
系統(tǒng)盤 |
并行存儲(chǔ) |
平臺(tái) |
售價(jià) |
1 |
2*Xeon E5v4 8核3.5GHz |
64GB |
4塊GTX1080 32GB |
33Tflops |
512GB SSD |
28TB |
雙塔單電 |
111000 |
2 |
2*Xeon E5v4 12核3.4GHz |
128GB |
6塊GTX1080Ti 66GB |
68Tflops |
1TB SSD |
36TB |
雙塔單電 |
182000 |
3 |
2*Xeon E5v4 12核3.4GHz |
192GB |
8塊GTX1080Ti 88GB |
91Tflops |
1TB SSD |
44TB |
雙塔雙電 |
215000 |
4 |
2*Xeon E5v4 16核3.2GHz |
256GB |
9塊GTX1080Ti 99GB |
102Tflops |
1TB SSD |
60TB |
雙塔雙電 |
248000 |
5 |
2*Xeon E5v4 16核3.2GHz |
512GB |
9塊GTX1080Ti 99GB |
102Tflops |
1TB SSD |
120TB |
雙塔雙電 |
310000 |
6 |
2*Xeon E5v4 16核3.2GHz |
512GB |
9塊 Quadro P5000 144GB |
79.74Tflops |
2TB SSD |
120TB |
雙塔雙電 |
415000 |
7 |
2*Xeon E5v4 24核3.0GHz |
512GB |
9塊 Quadro P6000 216GB |
107.8Tflops |
2TB SSD |
150TB |
雙塔雙電 |
735000 |
備注:含雙23”高清圖顯
關(guān)于GPU計(jì)算卡主要型號(hào)參考
No |
型號(hào) |
顯存 |
流處理器SP |
顯存帶寬 (GBs) |
浮點(diǎn)計(jì)算指標(biāo) TFLOPs (單精度) |
功耗 |
備注 |
1 |
Quadro P6000 |
24GB |
3840 |
432 |
11.98 |
250w |
顯存和性能最大 |
2 |
Quadro P5000 |
16GB |
2560 |
288 |
8.86 |
180w |
顯存更大 |
3 |
TITAN X |
12GB |
3584 |
480 |
10.97 |
250w |
|
4 |
GTX1080Ti |
11GB |
3584 |
484 |
11.33 |
250w |
性價(jià)比高 |
5 |
GTX1080 |
8GB |
2560 |
320 |
8.22 |
180w |
超值 |
6 |
GTX1070 |
8GB |
1920 |
256 |
5.78 |
150w |
超值 |
UltraLAB GXM在深度學(xué)習(xí)模型訓(xùn)練領(lǐng)域
除了熱門的語(yǔ)音識(shí)別、圖像識(shí)別、自然語(yǔ)言處理(機(jī)器翻譯)外,更多應(yīng)用
制造業(yè) |
生產(chǎn)管理,事故預(yù)防,技術(shù)更新,不合格產(chǎn)品預(yù)判 |
醫(yī)療與護(hù)理 |
影像診斷,用藥管理 |
零售,飲食,食品 |
自動(dòng)記賬,庫(kù)存控制,店面防盜預(yù)防,內(nèi)部檢測(cè),污染檢測(cè),可疑人物檢測(cè) |
安全監(jiān)控 |
電梯監(jiān)控,設(shè)備監(jiān)控,店面監(jiān)控 |
建筑與房地產(chǎn) |
工程管理,事故預(yù)防,房地產(chǎn)信息查詢,設(shè)施監(jiān)控 |
農(nóng)業(yè)與海洋 |
澆水附加肥料,除草和培育作物管理和病蟲(chóng)害防治,野生動(dòng)物損害控制,水質(zhì)監(jiān)測(cè)管理,飼養(yǎng)和運(yùn)輸調(diào)整,航運(yùn) |
倉(cāng)儲(chǔ)與物流 |
庫(kù)存管理,事故預(yù)防,轉(zhuǎn)運(yùn)和設(shè)備維護(hù),異常監(jiān)測(cè) |
廣告與營(yíng)銷 |
客戶響應(yīng)分析,客戶行為分析 |
總結(jié)
UltraLAB GXM是一款靜音級(jí)超級(jí)異構(gòu)計(jì)算能力的深度學(xué)習(xí)訓(xùn)練計(jì)算機(jī),比市面上的機(jī)器,更安靜,性能更強(qiáng)大,適合科研、研究部門在安靜的辦公環(huán)境下運(yùn)行。
此外,該機(jī)型用途極廣,擴(kuò)展能力強(qiáng), 調(diào)整配置后,可為電磁仿真計(jì)算(CST)、量子化學(xué)/分子動(dòng)力學(xué)計(jì)算(VASP、AMBER等)、超大屏拼接(8X9=72路視頻拼接合成)、視頻剪輯合成、指紋識(shí)別等應(yīng)用,提供強(qiáng)悍的計(jì)算、圖形生成能力
方案咨詢
西安坤隆計(jì)算機(jī)科技有限公司
國(guó)內(nèi)知名高端定制圖形工作站廠家
業(yè)務(wù)電話:400-705-6800
微信