最近因为科研需要用到离散元仿真计算,使用的软件为ANSYS RockyDEM,特对常见的平价显卡进行速度测试,结果如下图所示:

结论如下:
1、离散元仿真的等效算力:FP32+2xFP64;
2、计算速度受到算力与显存带宽的共同影响,专业计算卡的等效算力可能低于游戏卡,但其高内存带宽弥补了这一点;
3、双精度算力可以加速多面体颗粒,这也导致P100在球柱形颗粒(sphero-cylinder)的计算中得到了比4060Ti更好的表现,但是加速效果也没有官方文件中说的那么好,4060Ti也不是直接就用不了的程度;
4、显存大小:一般的算例根本就用不到多少显存大小,数百万数千万颗粒的仿真计算也不会用这种显卡计算。但是V100肯定比TitanV计算速度快,因为多了4个显存带宽也增加了33%
1080Ti、2080Ti以及所有的旧架构没有双精度的计算卡都不用再考虑用于离散元计算,2080Ti算这个显然都不如P100,不测都知道;
30系显卡在相同性能的情况下和P100一样费电,也基本不用考虑了;
官方推荐TitanV,但是我不推荐TitanV。因为TitanV在拥有高速显存但是砍掉了显存ECC,存在计数错误的问题,报错蓝屏事小,算例算不对事大;
P100是个好东西,除了有点费电之外;
有条件就买4090、5090等,买不了吃亏买不了上当;


结论如下:
1、离散元仿真的等效算力:FP32+2xFP64;
2、计算速度受到算力与显存带宽的共同影响,专业计算卡的等效算力可能低于游戏卡,但其高内存带宽弥补了这一点;
3、双精度算力可以加速多面体颗粒,这也导致P100在球柱形颗粒(sphero-cylinder)的计算中得到了比4060Ti更好的表现,但是加速效果也没有官方文件中说的那么好,4060Ti也不是直接就用不了的程度;
4、显存大小:一般的算例根本就用不到多少显存大小,数百万数千万颗粒的仿真计算也不会用这种显卡计算。但是V100肯定比TitanV计算速度快,因为多了4个显存带宽也增加了33%
1080Ti、2080Ti以及所有的旧架构没有双精度的计算卡都不用再考虑用于离散元计算,2080Ti算这个显然都不如P100,不测都知道;
30系显卡在相同性能的情况下和P100一样费电,也基本不用考虑了;
官方推荐TitanV,但是我不推荐TitanV。因为TitanV在拥有高速显存但是砍掉了显存ECC,存在计数错误的问题,报错蓝屏事小,算例算不对事大;
P100是个好东西,除了有点费电之外;
有条件就买4090、5090等,买不了吃亏买不了上当;