找回密码
 新注册用户
搜索
查看: 10253|回复: 19

关于Fah客户端显卡识别混乱的问题

[复制链接]
发表于 2016-2-10 11:03:51 | 显示全部楼层 |阅读模式
本人配置如下。原来980ti和780并存时没有任何问题,由于桌面太卡就装了个710,但是重启后发现780识别到了710上面。请问能不能指定gpu运算而不要自动识别,或者有没有修复自动识别问题的方法。

G{%84E32U}1HED7`K_@I8%B.jpg

另:二奶机上试了下centos7,发现免安装版不能控制暂停,就又换了官网rpm版。
回复

使用道具 举报

发表于 2016-2-10 11:38:45 | 显示全部楼层
准备工作:在V7显示PPD的status界面看清GT710对应的ID编号是00/01/02中哪个
然后第一步点击V7界面里confgure按钮>slots>选择上面GT710对应0/1/2,删掉(表删错),然后退出V7重开



如果上述步骤里V7显示只有980TI和780,计算时仍旧指向GT710就需要手动调整index了,
具体如GT710主卡酱油,则980TI和780依次index对应为1和2
下图仅供参考

捕获.PNG


回复

使用道具 举报

发表于 2016-2-10 11:47:26 | 显示全部楼层
我在编写ppd自动上传程序,需要解决这个问题。 目前已经有思路,需要楼主配合一下:

1、请把log.txt文件发给我
2、请把work文件夹发给我
3、请运行nvidia-smi,把结果发给我(nvidia-smi工具说明 http://www.equn.com/forum/thread-41746-1-1.html
回复

使用道具 举报

发表于 2016-2-10 11:49:19 | 显示全部楼层
log.txt文件和work文件夹默认在c:\ProgramData\FAHClient,当然你在安装fah客户端时可以指定其他位置
回复

使用道具 举报

 楼主| 发表于 2016-2-10 11:51:58 | 显示全部楼层
金鹏 发表于 2016-2-10 11:38
准备工作:在V7显示PPD的status界面看清GT710对应的ID编号是00/01/02中哪个
然后第一步点击V7界面里confgure ...

如改为2就会显示无gpu,因为gt710是2月才上市的显卡,我估计gpu.txt里没有添加该卡信息。又由于和780都是开普勒架构,识别乱了。
不知道如何能手动添加该卡信息,或者反馈bug上去。
回复

使用道具 举报

 楼主| 发表于 2016-2-10 12:00:41 | 显示全部楼层
wpf999 发表于 2016-2-10 11:47
我在编写ppd自动上传程序,需要解决这个问题。 目前已经有思路,需要楼主配合一下:

1、请把log.txt文件发 ...

正在上传中,不止是否可接收google drive,美国百度云太慢了
回复

使用道具 举报

发表于 2016-2-10 12:07:50 | 显示全部楼层
misaka10086 发表于 2016-2-10 12:00
正在上传中,不止是否可接收google drive,美国百度云太慢了

发到我们的qq群文件里如何
回复

使用道具 举报

 楼主| 发表于 2016-2-10 12:08:45 | 显示全部楼层
wpf999 发表于 2016-2-10 11:49
log.txt文件和work文件夹默认在c:\ProgramData\FAHClient,当然你在安装fah客户端时可以指定其他位置 ...

链接:http://pan.baidu.com/s/1gek9IKz 密码:nv1c
我已证实是因为GPU.txt里没有710的Device id,所以导致识别出现问题
[GeForce GTS 450]
0x10de:0x1246:2:2:GF108

上述的就是id,不止如何获取,获取了后可以手动添加进去
回复

使用道具 举报

发表于 2016-2-10 12:15:49 | 显示全部楼层
misaka10086 发表于 2016-2-10 12:08
链接:http://pan.baidu.com/s/1gek9IKz 密码:nv1c
我已证实是因为GPU.txt里没有710的Device id,所以导 ...

感谢你的协助,有了样本,这个bug就能分析清楚了,然后反馈给fah官方。

710的 device id 可以用GPU-z看到,这个截图中以970为例
1.gif
回复

使用道具 举报

 楼主| 发表于 2016-2-10 12:30:15 | 显示全部楼层
wpf999 发表于 2016-2-10 12:15
感谢你的协助,有了样本,这个bug就能分析清楚了,然后反馈给fah官方。

710的 device id 可以用GPU-z看 ...

然而我发现后面那个id并不是gpu-z里显示的那个。。。
只能等反馈上去让他们添加了
顺便求问群号?
回复

使用道具 举报

发表于 2016-2-10 12:33:12 | 显示全部楼层
misaka10086 发表于 2016-2-10 12:08
链接:http://pan.baidu.com/s/1gek9IKz 密码:nv1c
我已证实是因为GPU.txt里没有710的Device id,所以导 ...

不知为何, 我这的GPUs.txt中有GT 710   GPUs.txt (77.96 KB, 下载次数: 3231)
回复

使用道具 举报

发表于 2016-2-10 12:34:08 | 显示全部楼层
misaka10086 发表于 2016-2-10 12:30
然而我发现后面那个id并不是gpu-z里显示的那个。。。
只能等反馈上去让他们添加了
顺便求问群号?

欢迎您加入3213讨论Q群,群号 84902213
回复

使用道具 举报

 楼主| 发表于 2016-2-10 12:36:25 | 显示全部楼层
wpf999 发表于 2016-2-10 12:33
不知为何, 我这的GPUs.txt中有GT 710

又搜索了下,发现的确有。。。于是这问题又无解了
到底是哪里出了问题
可这问题的表现确实像是GPUs里没有的样子
回复

使用道具 举报

发表于 2016-2-10 12:58:10 | 显示全部楼层
misaka10086 发表于 2016-2-10 12:36
又搜索了下,发现的确有。。。于是这问题又无解了
到底是哪里出了问题
可这问题的表现确实像是GPUs ...

根据你提交的log文件,这个bug问题已经查清。原因是fah主控程序与计算core程序的GPU枚举ID不一致造成的!  fah主控程序与core程序的作者不是同一个人,可能在技术细节上没有完全衔接。


fah主控程序FAHClient.exe枚举的GPU如下(log.txt),gpu 0为980Ti,gpu 1 为780

搜狗截图20160210124542.png


这里的gpu ID将作为参数传给core程序 ,注意参数中的 -gpu 1 -gpu-vendor nvidia
  1. 03:47:06:WU01:FS00:Running FahCore: "C:\Program Files (x86)\FAHClient/FAHCoreWrapper.exe" C:/Users/Misaka10086/AppData/Roaming/FAHClient/cores/web.stanford.edu/~pande/Win32/AMD64/NVIDIA/Fermi/Core_21.fah/FahCore_21.exe -dir 01 -suffix 01 -version 704 -lifeline 8448 -checkpoint 8 -gpu 1 -gpu-vendor nvidia
  2. 03:47:06:WU01:FS00:Started FahCore on PID 10560
  3. 03:47:06:WU01:FS00:Core PID:10572
复制代码
而core程序,这里为FahCore_21.exe ,对GPU的枚举如下( work/01/01.log.txt)
搜狗截图20160210125235.png
710在枚举顺序中 id=1


于是错乱发生了,在NV的opencl平台选择了gpu 1,这个就是710啊!!
搜狗截图20160210125514.png

结论:主控程序的gpu 1是780,而core程序的gpu 1是710,两边各搞各的编号体系,自然会出乱子!



回复

使用道具 举报

发表于 2016-2-10 13:08:17 | 显示全部楼层
尝试解决办法:

搜狗截图20160210130646.png
在这里把980Ti的opencl-index设为0,  而780的opencl-index设为2,希望能解决问题
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-4-29 05:08

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表