2张3080TI不能使用同一CPU下的PCIE [怀疑主板老化\延长线异常]
本帖最后由 baibaipangpang 于 2021-8-28 16:47 编辑2张3080TI不能使用同一CPU下的PCIE
超微X11SPL-F 单路服务器主板 C621芯片 LGA3647针脚 ATX版型下:
2显卡安装在同一CPU下的2条PCIE上,13456包,一个400万PPD运行,一个100万PPD,不知道怎么回事;
2显卡一张安装CPU下的1条PCIE(PCIE 3.0 8X)上,一张安装在C621芯片下的1条PCIE(PCIE 3.0 4X)上,13456包,13456包,CPU下PCIE的显卡413万PPD,C621芯片PCIE的显卡396万PPD,运行效率基本一致,但明显受PCIE通道略微影响,减少PPD大约5%;
ASUS P6T ,安装2张3080TI无法进入系统。
是主板的问题吗?还是3080TI的问题?
--------------
一步一步逐步排查,目前高度怀疑是延长线问题
PCIE3.0 X16转X16的延长线60CM长度,使用正常;
PCIE3.0 X8转X16延长线30CM,再转PCIE3.0 X16转X16的延长线40CM长度,使用异常;
--------------------2021.08.28
这周换了延长线,运行良好,在超微X11SPL-F 上问题已经解决了
与主板和CPU无关,猜测是3080TI不支持SLI导致(按理FAH与SLI无关) 金鹏 发表于 2021-8-15 21:47
与主板和CPU无关,猜测是3080TI不支持SLI导致(按理FAH与SLI无关)
论坛上很多人都一机双卡或多卡啊
2020年GPU8卡机装机,陆续更新中 - Folding@home 模拟蛋白质折叠 - 中国分布式计算论坛 - Powered by Discuz! (equn.com)
2020年GPU4卡机装机,陆续更新中(20201123),新楼在47层 - Folding@Home 模拟蛋白质折叠 - 中国分布式计算论坛 - Powered by Discuz! (equn.com)
单机 20M ppd 达成 - Folding@Home 模拟蛋白质折叠 - 中国分布式计算论坛 - Powered by Discuz! (equn.com)
难道是哪的设置问题?
baibaipangpang 发表于 2021-8-15 23:16
论坛上很多人都一机双卡或多卡啊
2020年GPU8卡机装机,陆续更新中 - Folding@home 模拟蛋白质折叠 - 中国 ...
以前的N卡都支持SLI的,三系开始只有3090支持,猜测FAH那是驱动限制 ASUS P6T ,安装2张3080TI无法进入系统是怎么个提示?
zflowers 发表于 2021-8-16 14:54
ASUS P6T ,安装2张3080TI无法进入系统是怎么个提示?
新安装系统:无提示,过BIOS后,系统安装读取U盘(IOS)后,直接黑屏卡死;
原有系统增加第二块显卡:进系统异常缓慢,进系统后CPU100%,后降至50~80%,鼠标等操作异常缓慢,实际无法操作。
金鹏 发表于 2021-8-16 09:05
以前的N卡都支持SLI的,三系开始只有3090支持,猜测FAH那是驱动限制
找机会我实验下,看看3090是否有这个问题
金鹏 发表于 2021-8-15 21:47
与主板和CPU无关,猜测是3080TI不支持SLI导致(按理FAH与SLI无关)
FAH我记得官方说过不支持SLI?
HEDT/服务器的CPU直连都独立信道,理论上不会互相影响。
我副机现在是Z97上PCIe拆分x8+x8的2080Ti+1080,这种跨代混搭都是正常分数,问题跟SLI应该不沾边。
楼主跑的时候GPU-Z看占用率是不是正常的?如果达不到正常水平(90%+),试试手动指定cuda-index。默认的-1自动分配有时候是会出错的。
安装两张显卡不能进系统,两个槽有没有单独测试过?这么久的主板,有可能供电线路承受不了大负载。 本帖最后由 baibaipangpang 于 2021-8-17 12:43 编辑
thomasbbq 发表于 2021-8-17 11:54
FAH我记得官方说过不支持SLI?
HEDT/服务器的CPU直连都独立信道,理论上不会互相影响。
我副机现在是Z97 ...
“如果达不到正常水平(90%+),试试手动指定cuda-index。默认的-1自动分配有时候是会出错的。”
PCIE 3.0 4X GPU-Z占用率在74%~78%之间,偶尔80%
PCIE3.0 8X GPU-Z占用率在83%~93%之间
都插在1个CPU下的直连PCIE通道的时候,GPU-Z占用率在50%~80%
如何手动指定cuda-index?
用优麒麟20.04 nvidia-smi 显示GPU使用率95%,但是没有风扇调节和超频降频选项(有一张卡需要超频、一张卡需要降频)
“安装两张显卡不能进系统,两个槽有没有单独测试过?这么久的主板,有可能供电线路承受不了大负载。”
单独插测试都没问题,
在寻找新主板(带IPMI),根据这次经验拟找 PCIE 4.0 16X的,但是担心一机4卡,散热跟不上,用暴力风扇隔着门都能听见,用水冷贵而且进不去机房。
目前一机2卡已经用3个猫头鹰2000转+2个猫头鹰1500转的吹了,声音正好,温度也刚刚在忍受范围内。
thomasbbq 发表于 2021-8-17 11:54
FAH我记得官方说过不支持SLI?
HEDT/服务器的CPU直连都独立信道,理论上不会互相影响。
我副机现在是Z97 ...
FAH与SLI无关,且以前混插跑FAH都无问题,三系和以前唯一不同就是老黄禁止了3080TI/3080/3070/3060 的SLI,所以猜测和此有关 有段时间混跑过1070+1660ti,没有任何问题,一块当视频输出一块纯计算卡 baibaipangpang 发表于 2021-8-17 12:38
“如果达不到正常水平(90%+),试试手动指定cuda-index。默认的-1自动分配有时候是会出错的。”
PCIE 3. ...
GUI的Config——slots标签页——选择你要改的slot ID——edit——往下拉就有opencl-index和cuda-index
不过你现在用PCIe 3.0 x4看上去是被带宽限制了?看任务管理器fahcore是否有占满一个线程的占用率(CPU时间是不是每秒都在增加),占用率不足就是带宽限制了。
thomasbbq 发表于 2021-8-17 22:00
GUI的Config——slots标签页——选择你要改的slot ID——edit——往下拉就有opencl-index和cuda-index
...
我的界面里面没有opencl-index和cuda-index选项
“CPU时间是不是每秒都在增加”是什么意思,能确认的是单个进程占用率约为10%,肯定比一个CPU线程占满高了。PCIE 3.0 8X和PCIE 3.0 4X的显卡FAH进程都是10%,都超过一个CPU线程了。我的CPU是5218关闭了超线程。
以前给别人装X99或者X299加多卡是,BIOS里有个Above 4G要打开,然后所有卡能跑16X 本帖最后由 baibaipangpang 于 2021-8-20 17:32 编辑
tw1975@163.com 发表于 2021-8-18 14:30
以前给别人装X99或者X299加多卡是,BIOS里有个Above 4G要打开,然后所有卡能跑16X ...
Above 4G打开了
稍后测试下windows server 2019系统
看是不是系统问题
0820:换WINSERVER系统了,问题依旧
明显有个显卡跑不满
页:
[1]
2