开yun体育app官网网页登录入口 CAE实证Vol.14:超大内存机器,让你的HFSS电磁仿真解放天性

发布于:25-08-12 播放次数:

HFSS大内存单机仿真_HFSS集群计算优化_hfss原理

HFSS即高频率结构模拟器,是首个面向市场的三维电磁分析工具,该软件由Ansoft公司于1990年完成首个版本的推出。

二零零八年,Ansys企业并购了Ansoft公司,并持续对HFSS等电子及电磁仿真项目进行研制kaiyun全站网页版登录,旨在应对工业构造中机械学科同电气学科不断交织的挑战。

HFSS如今已是天线、射频RF或微波器件、高速互连线路、滤波装置、连接端口、集成电路封装、电路板布局工程师不可或缺的软件。全球各地的技术人员借助Ansys HFSS软件,对通信系统、高级驾驶辅助系统(ADAS)、航天器及物联网(IoT)产品中的高频高速电子部件进行设计。

HFSS集群计算优化_HFSS大内存单机仿真_hfss原理

HFSS是一款基于麦克斯韦理论的数值仿真计算软件,要掌握它的特性,需要借助计算机技术,才能有效提高仿真效率,我们今天简单探讨一下。

01

扩展性低

大内存单机是首选

在蓝箭航天实例里讲过,各类CAE软件,对基础资源的匹配需求并不相同。

对于求解计算:

这种算法方式,跟直接计算方法对比,结果更准确些。不过它的通用性不太好,特别是在好些台机器上同时使用时,速度提升并不明显,比较适合在拥有众多处理器和大容量存储空间的设备上执行,通常对存储空间和读写速度的依赖性较强。

这种算法是公开的,其准确度不如隐藏的算法,不过它的分布式处理能力更强,特别是在多台设备上运行时,能够实现较好的线性加速效果,因此它很适合进行多台计算机的联合运算,对硬件设备没有特殊限制,通常对存储空间和读写速度的依赖程度不高。

各类CAE应用场景的可拓展性大致如次图所示,自上至下逐步增强:

HFSS大内存单机仿真_hfss原理_HFSS集群计算优化

HFSS是计算电磁学领域的一个突出范例,它被放置在表格的最顶端,这表明它的扩展能力有限,因此更适合配置强大且具备高输入输出的单机系统,其性能表现越强越理想。

这是由于两方面原因造成的:

1. 网络通信开销大

2. 内存要求高

在Fluent和LS-DYNA的实践过程中,我们曾指出过通信成本的问题,当计算节点的数量不断增长时,这两个软件会出现显著的节点间数据传输负担,从而引发信息传递的延迟现象。

HFSS同样如此,对网络性能要求很高。当CPU核心数目不断上升,带宽方面的优势会超过核心利用率。换言之,增加机器配置不如提升网络传输速率。

内存使用情况,与算法设计、结果准确度密切相关,很大程度上是权衡了功能实现与成本投入的结果。

HFSS对内存占用非常庞大。根据我们观察到的有限情况,不同任务实际运行时CPU核心数量与内存比例在1:5到1:23之间,差别非常悬殊。单个任务往往需要几百GB的内存,配备这样大内存的计算机在整个行业内都十分罕见。

hfss原理_HFSS大内存单机仿真_HFSS集群计算优化

鉴于前述两种应用情境,网络传输必须高效,内存容量须充足,因此配备大内存的单台计算机是最佳解决方案。

我们全新推出的FCC-E专有D区配置水平如下:

hfss原理_HFSS大内存单机仿真_HFSS集群计算优化

四大特点:

1. 专供超大内存裸金属机器;

2. 全新三/四代机器,性价比极高;

3. 三个月起租,短期/长期租赁皆可;

4. 可动态拓展至通用C区。

内存容量极为可观的服务器,单台可配置高达四千吉字节存储空间,核心数量最多可达一百九十二个,能够充分应对HFSS软件的运算要求。

单机多核心,带宽不是问题。

内存足够大,无需工程师向精度与算法做妥协。

而且,资源足够,价格感人,还不用长期持有。

详情戳:专有D区震撼上市,高性价比的稀缺大机型谁不爱?

02

要是没有大单机或者一台不够呢?

那就搞集群!

先前,倘若公司不购置价格高昂的巨型设备,工程师们就需对复杂且庞大的设计进行“分解重组”,把几何构造划分成好几个部分,等后期再整合各项成果,因为忽略了对所有电磁相互作用的考量,这种做法极易产生偏差。

或者,工程师直接简化模型降低精度,以减少计算量。

当前,情形有所变化,HFSS在HPC高性能计算领域投入了大量精力。

通过不断对算法进行深化和完善,我们研发了专门适配多核计算设备的数值计算工具和优化方案,以此提升整体性能表现

方法二:借助HFSS同调度系统的结合,能够把众多设备汇集成群体,用以处理复杂规模课题,不再受限于单个设备的性能参数,只要网络传输能力达标即可。

这两种技术,工程师借助HFSS可以求解规模更宏大、结构更繁复的模型,同时不会牺牲精确度。

我们擅长的是方法二。

对研发工程师来说,使用集群有两大好处:

一、提高了单人使用上限

我们通过整合分散的岛屿式独立系统,构建出一个整体的计算能力集合,这实质上形成了一个共享的运算环境。从某种角度理解,这种集合体可以当作一台巨型机器来运用,集合中的每一台独立设备通常被称为一个单元,这些单元通过协同工作来处理用户的请求。

用户将一个集群当作一台大型计算机来运用时,单个用户的资源限制不再是一台机器的界限,而是变成了整个资源库的约束。

因此开yun体育app官网网页登录入口,HFSS对资源的需求极高,现在不再依赖单台设备,而是通过这个资源集合来统一提供支持。

HFSS大内存单机仿真_hfss原理_HFSS集群计算优化

用户能够将HFSS任务分配到多个计算节点去处理,还可以在集群里区分不同的仿真流程队列,并且配置不同的资源队列,从而让多个CAE设计工作同时开展。

简单来说,一个任务能够分配给多台机器处理云开·全站体育app登录,多个任务可以并行执行,面对复杂任务也不必担忧单台机器的处理能力瓶颈。

二、提高了团队协作水平

独立操作时彼此互不配合,缺少统筹规划,由此产生的联络障碍和资源浪费,实际上相当可观。

不同工作可能会产生资源冲突,造成相互影响。例如,若两个HFSS工作同时在一台设备上执行,有可能触发内存警报。

而集群模式下:

我们按照各个业务部门职责划分,在集群中分配各自独立的区域,既能让不同部门的研发人员共享同一个集群资源,维持各自的使用方式,又能确保彼此不受影响。

例如浙桂半导体进行研发时设置有四个专门团队,其中元组的Sentaurus系统是资源需求极高的,常常该系统的任务一旦启动,其他团队就无法使用剩余资源。采用集群架构的独立区域配置能够有效处理这类情况,详情请参考文章:【实例】浙桂半导体如何让年轻力量成为主导,在竞争中领先一步

HFSS集群计算优化_HFSS大内存单机仿真_hfss原理

此外,在构建了整体一致的操作准则之后,我们倡导项目资料与成员信息的集中处理及访问权限管理,各个业务单元能够依据成员的授权级别,互通使用运算能力、存储空间及各类软件工具,从而全面提升团队的协作成效与作业效能。

对于公司或团队的管理人员以及IT技术人员而言,集群的价值更为显著,这一点不仅研发人员能够体会到,而且他们从中获得的益处也更为丰富。

此处无需赘述,可参见:从“各自为战”到“并肩作战”,团队怎样成为项目推进、技术实施与决策者的理想协作方?

03

绝配!

自适应网格剖分&Auto-Scale

一半时间画网格,一半时间等仿真结果。

这恐怕是很多CAE工程师的日常。

HFSS运用自适应网络剖分方法,先自动生成几何结构与边界条件网格,再依据电场梯度实施自适应网格细化与剖分,经过多次迭代,便能得到符合精度标准的结果,此技术能减少求解所需的网格数量,显著降低电磁场仿真的复杂程度。

HFSS大内存单机仿真_HFSS集群计算优化_hfss原理

HFSS的自动网格划分流程:首先创建基础网格,接着逐步加密并细化,反复进行,直至达到稳定状态。

整个过程完全自动化,无需人为干预。

这对众多电磁场模拟专家而言,是个极为有利的消息,通过削减任务量,也简化了软件的操作复杂度,使得研究人员能将全部精力投入到怎样获取理想的模拟成效上。

接下来,让我们换一个视角来看这个问题。

HFSS能够将全部自适应网格剖分环节分解为多个步骤,并借助调度器逐一执行,我们的调度器Fsched所含的Auto-Scale特性,与此流程极为契合。

最佳效果是分为三步:

第一步:初始网格生成,核数与内存需求很低;

第二步:网格自适应剖分,适度的核数与大量内存需求;

第三步:频率扫描,核数与内存需求高。

HFSS集群计算优化_HFSS大内存单机仿真_hfss原理

三个阶段需要的资源量差别很大。

同时,由于这一过程是自动的,很难提前预估内存需求。

用户要注意,预留的空隙过大,或许会形成资产闲置,空隙过窄,作业或许会遭遇挫折。

我们的Auto-Scale功能能依据HFSS任务各个阶段的具体需要,灵活调配云端资源,以少量资源来启动网格构建,再以较多资源执行频率检测这一环节,等作业结束后便会自动释放。

根据任务需要,为每个环节配置恰当的资源,确保与工作要求高度契合,有助于提高工作完成度,同时避免资源闲置。

其他使用情境请点:Auto-Scale这根神奇工具怎样显著增强Virtuoso模拟速度?

04

GPU

一个可能的选择

自ANSYS HFSS 17.2版本起,该软件正式提供了对图形处理器加速功能的直接支持。

一般来说,GPU可以加速可视化和后处理过程,提高工作效率。

决定是否借助GPU来提升求解器效率,关键在于算法本身是否适配这种加速方式。

最新发布的ANSYS 2024 R1使用说明中提到,运用图形处理器提升性能主要涉及三个方面:

1. 频域求解器

2. 时域求解器

3. SBR+求解器

HFSS大内存单机仿真_HFSS集群计算优化_hfss原理

使用GPU加速必须申请HPC License, ANSYS Electronics HPC高性能选项模块能够同时运用CPU加速和GPU加速, 一个HPC Pack可以激活一块GPU加速卡或者八个CPU核心。

通过分析设备费用和计算能力,业内多数人觉得运用图形处理器执行HFSS不太划算。

实证小结

网络传输和内存消耗都非常大,通常情况下,若要运用HFSS执行三维电磁计算,应优先选择配置高内存的单台计算机。

在内存容量有限或单台计算机无法满足需求时,借助将HFSS同调度系统相结合的方式,让多台设备协同工作构建成群体,可以用来处理规模庞大的课题,从而使用户能够分析出尺寸更宏大且构造更为错综的方案。

自适应网格剖分方法借助fastone研发平台的Auto-Scale特性,能够提高工作完成率,同时降低资源消耗。

本次CAE实证系列Vol.14就到这里了。

下一期,我们聊Abaqus。

fastone研发平台在众多CAE应用中的具体运作情况,请通过下列应用项目名称进行查阅。

技艺精湛,思维敏捷,精通仿真软件,擅长数值模拟技术。

速石科技工业仿真行业白皮书,可以戳下方查看:

仿真宇宙 │ 评测篇(上)│ 评测篇(下)