欢迎光临
我们一直在努力

显卡 工作站(深度学习工作站配置要求GPU上的投资回报比基本呈线性变化)

在进入细节之前,让我做几个结论:

1.目前只有 GPU可以完全支持深度学习,请购买更新的显卡(及以上)

2、GPU的投资回报率基本呈线性变化,可以根据需要配置不同的GPU。

3、需要一个可靠的电源来维持工作站的长期稳定运行,所以电源的选择要稳定。

4.在现有预算下,GPU>CPU=RAM>=SSD

5、云服务使用简单,但长期使用非常昂贵,所以我们必须有自己的硬件设施。

1、需求分析

(1)为什么要专门为深度学习配置工作站(服务器)?

1、深度学习需要大量的并行计算资源,动辄计算需要数天甚至数周,而显卡(GPU)正好适合这种工作,提供上百倍的加速,强大的 GPU 可以在几个小时内完成 本来 CPU 需要几个月才能完成任务,所以深度学习甚至机器学习领域已经全面转向 GPU 架构,使用 GPU 来完成训练任务。

2. 如今,即使是使用 GPU 的深度学习任务也可以持续数天甚至数月(取决于数据规模和深度学习网络模型),需要单独的设备来确保训练任务能够长时间稳定运行 7×24 小时时间。

3、独立的深度学习工作站(服务器)可以方便实验室计算资源的共享。多个用户可以在个人电脑上编写程序,远程访问深度学习服务器排队使用计算资源,降低了购买设备的成本,避免了本地电脑配置复杂的软件环境。

(2) 深度学习工作站配置要求

深度学习任务对计算机性能要求较高,各硬件主要完成以下操作:

深度学习计算过程

上图展示了深度神经网络计算的一般过程。以下是通过深度神经网络计算环节对核心硬件配置的理想需求分析:

硬件性能要求

中央处理器:

因为显卡主要用于cuda计算,所以对CPU的要求不是很高。频率越高,线程越多越好。通常,CPU 内核的最小数量大于显卡的数量。约束之一:cpu的最大PCI-E通道数。每块显卡占用16个pcie通道达到最大性能,单个cpu最多支持40个pcie服务器配置单,即即使有4个pcie x16接口也最多只能达到2个x16加一个x8,插显卡无法发挥其全部性能。不过主板芯片组其实可以扩展一些pcie通道。(x99主板可扩展2.0,z170可扩展3.0)

显卡:

深度学习需要高性能显卡来执行复杂的单精度运算。通常,神经网络需要大量的显存和内存资源。因此,运行大规模深度卷积网络和执行计算机视觉任务需要超过 8GB 的​​显存。一般选择以上配置。您应该购买具有更多内存的图形卡。2080、2070、1070、1060、Titan X、Titan V几个指标对比如下:

( -point 每秒每浮点运算) 单精度

也就是计算性能,决定了计算速度,首选,Titan V,但是最强悍的Titan V的价格是它的三倍

单精度算力

VRAM(显存):显存的大小决定了我们的网络模型能否执行。大规模卷积神经网络将使用超过 8G 的显存。因此,购买一块显存大的显卡,可以保证大部分卷积神经网络模型都能顺利运行实现。

显存大小

其中拥有11G显存,可用于更大的网络机型,性能比较强。价格在5000元左右。

它是最新的显卡,同样有11G内存,但是速度是1.5倍,价格在9000元左右。

Titan V拥有12G显存,可以说是能够执行大部分网络,而且速度是最快的。因为是商用的,它的价格也很感人,25000元左右一个。

这三个模型更适合深度学习图像处理任务,可以完成大部分网络,并且可以根据预算自由选择。8G显存和6G显存的1080和1060也是性价比不错的选择,但考虑到显存的限制,尽量买11G以上显存的显卡。

母板:

前面提到了cpu提供的pcie通道数的限制。如果要使用多块显卡,则需要在主板上提供额外的 pcie 通道。一般只有服务器级的主板才会提供x99、x299等主板的扩展pcie通道,但是使用这个主板必须要配这个接口的服务器级CPU(至强系列、i7 7900x以上、i9系列、等等),如果你不需要超过三个显卡,你可以使用cpu提供的pcie。

记忆:

深度学习需要大量数据,中间计算过程也会临时存储大量数据,一般需要2到3倍显存的内存,32G或64G甚至更高。内存频率越高越好。

最低推荐32G DDR4内存(16G*2)2000元左右,预算可以升级到64G(4000元左右)。

硬盘:

深度学习需要大量的数据和快速的访问速度。一般采用较大的固态盘作为系统盘和训练数据存储盘,HDD机械硬盘作为存储盘。

建议使用512G以上的nVME固态硬盘(800元)和几TB(2TB约300元)的硬盘作为存储空间

电源、机箱:其实还是要买一个比较稳定的电源,因为保证长期稳定运行会有“无穷无尽”。一般使用大品牌的金牌或铂金认证电源。只能使用一张700w的显卡,每增加一张显卡会增加400w。4*titan V大概用了1600w的电源。

监视器:监视器是生产力,两个或三个就可以了。这是我的工作环境,两台显示器,一台查看运行状态,一台查看调试文档。

6.jpg

2.配置推荐

说完基本需求,我们就进入正题,推荐几个不同价位的配置模板,分别是

0. 深度学习入门配置 i5 8400+GTX 1060/1070/ +16G RAM +256G SSD 7000元左右,这个配置基本可以尝试大部分机型,如今网络机型越来越大,难免遇到不足记忆。然而,学习是一个循序渐进的过程。当您的知识达到要求更高规格的设备时,您自然会知道需要什么配置。

1、深度学习个人高级配置i7 8700K+GTX+32G RAM+512G SSD,约15000元。有了这样的配置,大部分深度学习项目基本不会遇到问题。如果有更深层次的需求,当你达到高层次的集群时,你应该知道需要什么配置。我的建议不起作用。. .

2. 深度学习的完美个人配置,i7 9700K+GTX or GTX TItan V1+64G RAM +2T SSD。3万元左右,如果使用双(2万元)元,可以在保持较高性价比的同时拥有单台电脑最快的速度。使用GTX TITAN V将达到目前单显卡的峰值计算能力,并且可以完成少量的显存。使用 11G 以上的机型。

3.深度学习实验室共享服务器,运行724小时还是V 其实前两种配置也可以作为共享服务器,但是计算资源太少,预算足够购买高性能多显卡深度学习服务器,24*运行7小时后,其他用户可以在自己的笔记本电脑和台式机上编写和初步调试卷积神经网络。本地验证无误后,即可上传到服务器进行训练任务。这样可以大大节省设备费用,最大限度地利用计算资源,避免每个用户都需要配置复杂的软件环境。

4、深度学习实验室共享服务器最大单机配置。基本上是单台服务器所能提供的最高配置。如果想要更高的配置,可以模仿大型商业研究所在此基础上搭建服务器集群。(相当于买了很多这个配置,用高速以太网互联,一个10GE的交换机可能要几万)

0.深度学习个人入口配置

i5 8400+GTX 1060/1070/ +16G RAM +256G SSD 7000元左右。这种配置基本可以尝试大部分机型。如今网络模型越来越大,越来越深,难免会遇到显存不足的情况。然而,学习是一个循序渐进的过程。当您的知识达到要求更高规格的设备时,您自然会知道需要什么配置。

图像.png

1.深度学习个人高级配置

i7 9700K+GTX 或 GTX TItan V1+64G RAM+2T SSD。如果使用双(20000)元,可以在保持高性价比的同时拥有单台电脑最快的速度。使用GTX TITAN V将达到目前单显卡算力的巅峰,可以完成少数使用11G以上显存的机型。.

图像.png

在此基础上,可以将显卡换成12G显存的泰坦V(性能1.5倍,价格翻倍到9000元左右),达到单卡性能的巅峰。

2.深度学习个人完美配置

i7 9700K+GTX 或 GTX TItan V1+64G RAM+2T SSD。3万元左右,如果使用双(2万元)元,可以在保持较高性价比的同时拥有单台电脑最快的速度。使用GTX TITAN V将达到目前单显卡的峰值计算能力,并且可以完成少量的显存。使用 11G 以上的机型。

图像.png

半价换显卡

图像.png

3. 深度学习实验室共享服务器

724小时运行还是V 其实前两种配置也可以作为共享服务器,但是计算资源太小,预算足够购买一台高性能多显卡深度学习服务器,24小时运行* 7小时,其他用户可以在笔记本电脑和台式机上编写并初步调试卷积神经网络,本地验证无误后上传到服务器进行训练任务。这样可以大大节省设备费用,最大限度地利用计算资源,避免每个用户都需要配置复杂的软件环境。

image.png 换个显卡可以省点,主板也可以换个四路显卡sli 5000元左右。

图像.png

4、深度学习实验室共享服务器最大单机配置

基本上是单台服务器所能提供的最高配置。如果想要更高的配置,可以模仿大型商业研究所在此基础上搭建服务器集群。

图像.png

4. 展示

当然,显示器越多越好,2-3 差不多,虽然大部分任务可能都是在笔记本电脑上完成的。

5.最后是机箱

既然是科研设备,机箱肯定是有衬里的。一般深度学习服务器除了机柜式外,都使用海盗船的这个机箱。

各个服务商销售的深度学习主机大同小异。购买特斯拉P系列商用计算卡,注意不要上当。虽然是商用卡,但比同等性能的gtx和rtx系列贵几倍。

这是经销商的建议。

一般供应商给出的配置几乎是可靠的,即在某些部位会使用特殊的通道产品。部分商家给出的配置,性价比不是很高。比如无脑泰坦V推荐的配置,25000,60%的性能可以买5个。需要的配置是经过仔细计算的。哦,全是泪水

赞(0) 打赏
未经允许不得转载:艾飞特资源网 » 显卡 工作站(深度学习工作站配置要求GPU上的投资回报比基本呈线性变化)
分享到

登录

找回密码

注册