找回密码
 新注册用户
搜索
查看: 4510|回复: 4

[求助] linux平台上的boinc的奇怪问题

[复制链接]
发表于 2012-9-4 12:09:49 | 显示全部楼层 |阅读模式
本帖最后由 jpegreader 于 2012-9-4 15:18 编辑

系统是ubuntu64bit,安装是直接用apt-get install boinc安装的。
一开始我只是想跑WCG,就点dash里面boinc的图标,开boinc manager,很简单地就开跑了。
后来想跑gpugrid了,装nvidia官驱失败,改用bumblebee,具体情况见这里
受限于bumblebee调用N卡驱动的方式是在终端中用optirun XXX这样的方式,原来直接点图标的方式是不行了,于是optirun boincmgr,启动后还是找不到GPU,只好optirun boinc再optirun boincmgr这样才找得到GPU。
但奇怪的事情出现了,这时候启动的boincmgr里面见不到一点项目,就跟新安装的一样,原来的WCG都没了。而如果用点图标的方式启动的话,又见得到那些WCG的任务了,好像我的电脑上存在了两个boinc。
我也暂时不管这事了,能跑gpugrid就好。
但后来重启电脑后要用从终端启动的方式运行boinc,出现了错误。用boincmgr就见不到原来添加的gpugrid,什么项目都没有。用boinccmd就报错Authorization failure: -155,而终端里的boinc没多久就出现类似04-Sep-2012 15:16:43 [---] GUI RPC bind to port 31416 failed: 98
gstate.init() failed
Error Code: -180这样的信息,自动退出了。
我只能上网找信息,找到这么个说法:
OK, I think having found something.

I had previously in a former session installed Boinc 5.4.11 from Ubuntu repositories.
It seems, even after removing the application (according to Adepte), that it was still working, and launched at start with a new Ubuntu session.
I found that by console when typing "ps aux" I found that :

boinc 5227 0.0 0.9 52416 9332 ? Ss 20:44 0:00 /usr/bin/boinc_client -redirectio -dir /var/lib/b
boinc 5239 0.0 0.1 20468 1440 ? SNl 20:44 0:00 riesel_wrapper_5.36_x86_64_pc_linux_gnu
boinc 5240 0.0 0.1 20472 1440 ? SNl 20:44 0:00 riesel_wrapper_5.36_x86_64_pc_linux_gnu

I could kill it only under root, because belonging to "boinc" user.

After that, I relaunched my Boinc 5.10.7 without anymore problem ;-)

于是我依样画葫芦,在top里把user是boinc的一个进程毙了,然后再开boinc和boinccmd,一切正常,gpugrid又回来了。

我最关心的问题是两个,一个是通过不同方式启动boinc出现两种boinc是怎么回事?另一个是把那个进程毙了就能正常运行boinc是怎么回事?是某种冲突吗?
回复

使用道具 举报

发表于 2012-9-6 22:58:20 | 显示全部楼层
我也是用ubuntu的,不过是32位+pae的,我装的boinc是直接在软件中心搜索安装的,N卡的驱动也是系统提示安装成功的,跑Einstein和milkyway的GPU任务很久了,从没出现过问题啊。你那个搞得太复杂了……
回复

使用道具 举报

 楼主| 发表于 2012-9-7 08:36:50 | 显示全部楼层
回复 2# vincentdark


    啊,我也是被逼的啊,N卡官方驱动对于笔记本支持太差,只能用bumblebee的解决方案,结果就导致如此了。
我观察到我第一次运行optirun boinc之后,boinc就在我的home目录下面建了一大堆配置文件之类的东西,见下图:

同时我还观察到系统启动后自动启动的boinc的user是boinc,而我用optirun boinc命令启动后的boinc的user是ban(我的用户名)。
这样就能想到一种导致问题的可能性,就是optirun boinc运行后的boinc用户组只能属于ban,而非boinc,所以不得不“自立门户”。而“一山不容二虎”,想要运行基于optirun boinc的boinc就必须先把自启动的boinc kill掉。
话说我这想法真是太幼稚了,完全胡乱猜测……
回复

使用道具 举报

发表于 2012-9-7 09:54:25 | 显示全部楼层
回复 3# jpegreader


    我觉得你说的对,就是用户权限的问题。系统启动时不要自动启动boinc应该就好了吧。或者改改启动脚本?
回复

使用道具 举报

发表于 2013-1-30 14:49:26 | 显示全部楼层
我现在也在研究双显卡的问题……

windows下启动manager后就会自动连接或启动客户端,所以一般人看起来就会把客户端和manager当成一样的东西。

linux下manager只负责连接客户端并显示信息,和客户端是分开的。发行版软件源里的boinc都是配置好启动脚本的,开机自动以独立用户boinc身份运行,工作目录在 /var/lib/boinc。启动manager时只是连接上这个客户端而已。

自己运行boinc命令启动的是客户端,不指定参数的话,就会把执行时的目录当作工作目录,所以就创建了那么一大堆文件。

没法同时开两个的原因是,boinc会绑定一个固定的端口,供manager或其他监视程序连接,一个端口只能一个boinc占。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2025-5-7 08:11

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表