问题描述

我打算购买新的专用计算机,用于运行COMSOLMultiPhysics®。betvicror伟德2021欧洲杯你推荐什么硬件?

解决方案

由于广泛的不同问题类型,软件和硬件开发的快速速度,以及各种不同的硬件在显着不同的价格点,对所有使用情况没有单betvicror伟德2021欧洲杯一的电脑选择。

记忆

单一的最重要因素是您有足够的物理内存(RAM)来解决您想要使用的最大模型,并且已正确安装RAM。如果您没有足够的RAM,那么无论所有其他硬件选择如何,都会有重大放缓。

预测RAM要求是通过解决类似但包含您想要在最大型号中解决的相同物理的较小模型来完成的。监视所使用的内存和自由度,这些内存在求解器日志中报告。将曲线拟合到该形式A X(DOF)^ N的数据,其中A和N是拟合系数,DOF是自由度的数量,并用它来预测您的更大模型的内存要求。指数n通常在1和2之间。使用使用迭代求解器的多档预处理时,n将更接近1,并且当使用直接求解器时,它将更接近2.因子,a取决于稀疏性问题。例如,对于热辐射问题,在非竞争程度下耦合的自由度,将远高于导电传热问题,其中仅存在自由度之间的局部耦合。

请注意,在不同的型号类型之间,内存使用率与自由度相比,可以非常不同,因此您可能需要对您希望解决的每种类型的模型重复此过程。您将需要一个至少具有此数量的RAM的计算机。也意识到,没有实际需要的RAM没有任何优点。确保使用您选择的CPU支持的最快可能的内存速度。

性能也强烈依赖于如何安装内存。所有计算机通过多声道内存总线访问已安装的内存。如果未正确填充内存库,则存储器速度将被送为下降。例如,考虑具有四个存储体的四个存储器通道单CPU计算机(每个存储器通道1个),并且这些库中的每一个具有总共16个开放式槽,总共16个打开的DIMM插槽,如下面的示意图所示。

计算机的原理图

通常,如果在任何银行使用超过两个时隙,那么内存速度会降低,但如果使用每个库以上的插槽,则在某些系统上会有速度。您的硬件供应商应提供此信息。因此,例如,如果要在上述系统中安装16GB的RAM,则安装四个4GB或8个2GB DIMM,并确保使用所有内存库。安装四个4GB DIMM离开最多的空间,以安装更多RAM,并获得多个内存通道的最佳优势。不要以这样的方式安装DIMM,即一些内存通道将未被使用;这将导致显着放缓,因为一些内存频道未使用。您需要添加更多RAM以利用所有内存通道。这总结在下面的示意图中。

推荐的内存布局

影响整体软件速度的其他因素

性能,CPU类型,CPU基础频率,缓存,CPU数,CPU数量,每个CPU数量以及硬件成本之间存在复杂的关系。COMSbetvicror伟德2021欧洲杯OL CodeBase由几种不同类别的算法组成,这些算法具有不同的缩放属性。因此,一些硬件因素比其他硬件因素更大,而这些因素的相对优点是问题类型和问题依赖性。因此很难做出特定的硬件建议。以下是一般性建议。

CPU类型

不同的CPU架构提供不同的功能,价格明显不同。

高端CPU,如英特尔®Xeon®Gold和铂金,或AMD®EPYC®,处理器具有CPU-to-CPU互连,每个计算机启用多个CPU,并允许CPU相互通信以访问非常大记忆量。这些处理器具有最高的内存带宽;能够在RAM内存和处理器之间来快速移动大量数据。在运行COMSOL时,这是它们的主要优势。betvicror伟德2021欧洲杯高端CPU应用于双CPU,甚至四CPU或八CPU配置。如果您需要解决非常大量的内存,或者计划连续运行许多仿真,这是有动力的。解决单一型号时,随着CPU数量的越来越多的性能,性能将改善,但相对性能的改进取决于模型大小。较大的模型将在多CPU系统上看到更快的加速。如果您正在考虑购买四个或八种CPU系统,请联系Comsol技术支持。betvicror伟德2021欧洲杯

Mid-range CPUs, such as the Intel® Xeon® W, or AMD® Ryzen™ Threadripper™, processors, do not have CPU-to-CPU interconnects and are thus an appropriate choice for a single-CPU computer.它们确实具有可比较的时钟速度和核心计数作为高端系统。它们是一个有吸引力的全部选择。

入门级CPU(如英特尔®Xeon®E处理器)有两个内存通道,没有CPU-to-CPU互连,也无法解决多个内存。它们具有最低的内存带宽,但可以具有高时钟速度。它们并不像运行多个模拟的选择,但通常可以很快解决单一模型。

上面列出的CPU是推向专业工程界的现代处理器。还有处理器,主要销售到共享许多相同功能的消费市场,并且可以具有相当的性能,通常用于降低成本。

时钟频率

更高的时钟频率通常会导致所有区域的软件更快地表现。如果所有其他硬件规范都是相同的,两台计算机之间的相对性能将直接依赖于时钟频率。

高速缓存存储器

缓存内存直接构建到处理器中。高速缓存更好。所有其他因素相同,更高的缓存机将显示出更好的性能。

核心数量

处理器中的核心越多,可以立即执行更平行的线程,这被称为多线程。betvicror伟德2021欧洲杯COMSOL将自动利用所有可用的核心,但是有一个计算成本。使用太多的核心并行甚至可能导致放缓,但通常仅适用于相对较小的模型。某些型号甚至是以单线性能主导的。通常,六个或八核系统是一个良好的全部选择,但更多的核心比这更好,特别是在并行运行多个模型时,或者使用Pardiso Direct求解器时。


一般性建议

参数扫描

如果您计划解决许多几何变体,不同网格,不同的材料集或每个唯一模型中的其他参数,那么您将使用参数扫描功能。例如,扫描部分维度的10个变化以及扫描超过10种不同的材料和10个不同的模型参数将需要解决类似的模型1000次,以及在单个计算机上运行此作为单个作业时的解决时间(在最坏的情况下)只是恰好1000倍。

通过使用任何许可证类型或群集计算机在单个计算机上并行地运行作业,可以减少扫描大量参数的解决时间浮动网络许可证

要在单台计算机上并行解决,请使用批量扫描功能。仅在单个计算机上并行运行参数扫描,只有建议所有型号在内存同时安装在内存中。例如,如果模型的一个实例需要3GB的RAM来解决,那么它可以在16GB RAM计算机上运行四个同时作业有意义。对于具有小的内存要求的模型,您可能会看到随着有核心的同时作业运行的改进。使用批处理扫描时的相对加速是模型和硬件依赖性。

要在群集中并行解决参数扫描,请使用集群扫描功能。您可以立即运行的并行作业数量(最多有群集中的可用节点的数量。)您可以在自己的群集上运行或使用第三方群集运行。betvicror伟德2021欧洲杯COMSOL保持一份列表技术合作伙伴谁为群集计算提供了按需计算资源。群集的每个节点只需要满足运行唯一模型所描述的要求。有关群集硬件的进一步指导,请参阅知识库1116。

也可以看看知识库1250:运行参数扫描,批量扫描和群集从命令行扫描。

始终考虑是否可以通过使用避免大扫描优化模块。

OS.

在5.4版之前的COMSOL betvicror伟德2021欧洲杯Multiphysics版本中,Linux和MacOS操作系统可以在具有许多核心的某些处理器上倾斜窗口。

硬盘驱动器

与硬盘相比,固态驱动器提供更好的系统性能。更快的驱动器总是更好,但如果系统正在使用您正在解决的模型上的交换空间(虚拟内存)的驱动器,最好更好地升级RAM,而不是投资更快的驱动器。

图形

我们推荐现代AMD或基于NVIDIA的专用显卡。可以找到测试的显卡列表系统要求页面。显卡中的内存越大,可以可视化更复杂的模型。请注意,仅仅因为模型需要大量的RAM内存来解决并不一定意味着它需要大量的视频卡显示,反之亦然。

GPUS.

目前不支持图形处理单元上的通用计算。

也可以看看

选择Compute Cluster的硬件,解决方案1116.
betvicror伟德2021欧洲杯COMSOL和多线程,解决方案1096.