找回密码
 新注册用户
搜索
查看: 5138|回复: 16

[求助] 2张3080TI不能使用同一CPU下的PCIE [怀疑主板老化\延长线异常]

[复制链接]
发表于 2021-8-15 00:12:47 | 显示全部楼层 |阅读模式
本帖最后由 baibaipangpang 于 2021-8-28 16:47 编辑

2张3080TI不能使用同一CPU下的PCIE
超微X11SPL-F 单路服务器主板 C621芯片 LGA3647针脚 ATX版型下:
2显卡安装在同一CPU下的2条PCIE上,13456包,一个400万PPD运行,一个100万PPD,不知道怎么回事;
2显卡一张安装CPU下的1条PCIE(PCIE 3.0 8X)上,一张安装在C621芯片下的1条PCIE(PCIE 3.0 4X)上,13456包,13456包,CPU下PCIE的显卡413万PPD,C621芯片PCIE的显卡396万PPD,运行效率基本一致,但明显受PCIE通道略微影响,减少PPD大约5%;


ASUS P6T ,安装2张3080TI无法进入系统。


是主板的问题吗?还是3080TI的问题?


--------------



一步一步逐步排查,目前高度怀疑是延长线问题

PCIE3.0 X16转X16的延长线60CM长度,使用正常;
PCIE3.0 X8转X16延长线30CM,再转PCIE3.0 X16转X16的延长线40CM长度,使用异常;
--------------------2021.08.28

这周换了延长线,运行良好,在超微X11SPL-F 上问题已经解决了


回复

使用道具 举报

发表于 2021-8-15 21:47:44 | 显示全部楼层
与主板和CPU无关,猜测是3080TI不支持SLI导致(按理FAH与SLI无关)
回复

使用道具 举报

 楼主| 发表于 2021-8-15 23:16:33 | 显示全部楼层
回复

使用道具 举报

发表于 2021-8-16 09:05:37 | 显示全部楼层
baibaipangpang 发表于 2021-8-15 23:16
论坛上很多人都一机双卡或多卡啊

2020年GPU8卡机装机,陆续更新中 - Folding@home 模拟蛋白质折叠 - 中国 ...

以前的N卡都支持SLI的,三系开始只有3090支持,猜测FAH那是驱动限制
回复

使用道具 举报

发表于 2021-8-16 14:54:14 | 显示全部楼层
ASUS P6T ,安装2张3080TI无法进入系统  是怎么个提示?
回复

使用道具 举报

 楼主| 发表于 2021-8-17 04:25:54 | 显示全部楼层
zflowers 发表于 2021-8-16 14:54
ASUS P6T ,安装2张3080TI无法进入系统  是怎么个提示?

新安装系统:无提示,过BIOS后,系统安装读取U盘(IOS)后,直接黑屏卡死;

原有系统增加第二块显卡:进系统异常缓慢,进系统后CPU100%,后降至50~80%,鼠标等操作异常缓慢,实际无法操作。

回复

使用道具 举报

 楼主| 发表于 2021-8-17 04:27:28 | 显示全部楼层
金鹏 发表于 2021-8-16 09:05
以前的N卡都支持SLI的,三系开始只有3090支持,猜测FAH那是驱动限制

找机会我实验下,看看3090是否有这个问题

回复

使用道具 举报

发表于 2021-8-17 11:54:51 来自手机 | 显示全部楼层
金鹏 发表于 2021-8-15 21:47
与主板和CPU无关,猜测是3080TI不支持SLI导致(按理FAH与SLI无关)

FAH我记得官方说过不支持SLI?
HEDT/服务器的CPU直连都独立信道,理论上不会互相影响。
我副机现在是Z97上PCIe拆分x8+x8的2080Ti+1080,这种跨代混搭都是正常分数,问题跟SLI应该不沾边。

楼主跑的时候GPU-Z看占用率是不是正常的?如果达不到正常水平(90%+),试试手动指定cuda-index。默认的-1自动分配有时候是会出错的。

安装两张显卡不能进系统,两个槽有没有单独测试过?这么久的主板,有可能供电线路承受不了大负载。
回复

使用道具 举报

 楼主| 发表于 2021-8-17 12:38:42 | 显示全部楼层
本帖最后由 baibaipangpang 于 2021-8-17 12:43 编辑
thomasbbq 发表于 2021-8-17 11:54
FAH我记得官方说过不支持SLI?
HEDT/服务器的CPU直连都独立信道,理论上不会互相影响。
我副机现在是Z97 ...

“如果达不到正常水平(90%+),试试手动指定cuda-index。默认的-1自动分配有时候是会出错的。”

PCIE 3.0 4X    GPU-Z占用率在74%~78%之间,偶尔80%

PCIE3.0 8X    GPU-Z占用率在83%~93%之间

都插在1个CPU下的直连PCIE通道的时候,GPU-Z占用率在50%~80%

如何手动指定cuda-index?
用优麒麟20.04 nvidia-smi 显示GPU使用率95%,但是没有风扇调节和超频降频选项(有一张卡需要超频、一张卡需要降频)



“安装两张显卡不能进系统,两个槽有没有单独测试过?这么久的主板,有可能供电线路承受不了大负载。”

单独插测试都没问题,

在寻找新主板(带IPMI),根据这次经验拟找 PCIE 4.0 16X的,但是担心一机4卡,散热跟不上,用暴力风扇隔着门都能听见,用水冷贵而且进不去机房。

目前一机2卡已经用3个猫头鹰2000转+2个猫头鹰1500转的吹了,声音正好,温度也刚刚在忍受范围内。

回复

使用道具 举报

发表于 2021-8-17 13:54:12 | 显示全部楼层
thomasbbq 发表于 2021-8-17 11:54
FAH我记得官方说过不支持SLI?
HEDT/服务器的CPU直连都独立信道,理论上不会互相影响。
我副机现在是Z97 ...

FAH与SLI无关,且以前混插跑FAH都无问题,三系和以前唯一不同就是老黄禁止了3080TI/3080/3070/3060 的SLI,所以猜测和此有关
回复

使用道具 举报

发表于 2021-8-17 19:24:45 | 显示全部楼层
有段时间混跑过1070+1660ti,没有任何问题,一块当视频输出一块纯计算卡
回复

使用道具 举报

发表于 2021-8-17 22:00:29 | 显示全部楼层
baibaipangpang 发表于 2021-8-17 12:38
“如果达不到正常水平(90%+),试试手动指定cuda-index。默认的-1自动分配有时候是会出错的。”

PCIE 3. ...

GUI的Config——slots标签页——选择你要改的slot ID——edit——往下拉就有opencl-index和cuda-index

不过你现在用PCIe 3.0 x4看上去是被带宽限制了?看任务管理器fahcore是否有占满一个线程的占用率(CPU时间是不是每秒都在增加),占用率不足就是带宽限制了。

回复

使用道具 举报

 楼主| 发表于 2021-8-18 13:09:19 | 显示全部楼层
thomasbbq 发表于 2021-8-17 22:00
GUI的Config——slots标签页——选择你要改的slot ID——edit——往下拉就有opencl-index和cuda-index

...

sunlogin_20210818130333.gif
sunlogin_20210818130115.gif
我的界面里面没有opencl-index和cuda-index选项


“CPU时间是不是每秒都在增加”是什么意思,能确认的是单个进程占用率约为10%,肯定比一个CPU线程占满高了。PCIE 3.0 8X和PCIE 3.0 4X的显卡FAH进程都是10%,都超过一个CPU线程了。我的CPU是5218  关闭了超线程。





回复

使用道具 举报

发表于 2021-8-18 14:30:15 | 显示全部楼层
以前给别人装X99或者X299加多卡是,BIOS里有个Above 4G要打开,然后所有卡能跑16X
回复

使用道具 举报

 楼主| 发表于 2021-8-19 15:01:27 | 显示全部楼层
本帖最后由 baibaipangpang 于 2021-8-20 17:32 编辑
tw1975@163.com 发表于 2021-8-18 14:30
以前给别人装X99或者X299加多卡是,BIOS里有个Above 4G要打开,然后所有卡能跑16X ...

Above 4G  打开了


稍后测试下windows server 2019系统

看是不是系统问题






0820:  换WINSERVER系统了,问题依旧


明显有个显卡跑不满
1.gif
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-3-29 20:47

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表