中国分布式计算论坛

 找回密码
 新注册用户
搜索
查看: 3992|回复: 12

收到cicikml的捐赠后的实验贴 [GTS450 on Ubuntu]

[复制链接]
发表于 2013-12-21 02:22:22 | 显示全部楼层 |阅读模式
本帖最后由 dengi 于 2013-12-21 02:21 编辑

上回书说到,有幸获得@cicikml 兄弟捐赠的GTS450,拿出来秀以后,@cuda 兄弟委托写个linux平台的文档。教程算不上,实验文档而已。

先说说环境:
Hardware: Intel Q6600 + P35 + 主角GTS450
OS: Ubuntu 12.04.3 x64

实验一、默认环境运行FAH

一、安装OS
没啥可说的。

二、确认系统默认驱动
dengyi@fah04:~$ lspci
.....
01:00.0 VGA compatible controller: NVIDIA Corporation GF106 [GeForce GTS 450] (rev a1)
01:00.1 Audio device: NVIDIA Corporation GF106 High Definition Audio Controller (rev a1)
.....

dengyi@fah04:~$ lsmod
Module                  Size  Used by
snd_hda_codec_hdmi     37463  4
nouveau               958580  1
snd_hda_intel          44339  0
coretemp               13596  0
snd_hda_codec         141761  2 snd_hda_codec_hdmi,snd_hda_intel
ttm                    84051  1 nouveau
kvm_intel             137899  0
drm_kms_helper         49597  1 nouveau
snd_hwdep              13668  1 snd_hda_codec
drm                   287564  3 nouveau,ttm,drm_kms_helper
kvm                   455932  1 kvm_intel
snd_pcm               102477  3 snd_hda_codec_hdmi,snd_hda_intel,snd_hda_codec
snd_timer              29989  1 snd_pcm
snd                    69533  6 snd_hda_codec_hdmi,snd_hda_intel,snd_hda_codec,snd_hwdep,snd_pcm,snd_timer
i2c_algo_bit           13564  1 nouveau
gpio_ich               13526  0
soundcore              12680  1 snd
mxm_wmi                13021  1 nouveau
snd_page_alloc         18798  2 snd_hda_intel,snd_pcm
video                  19652  1 nouveau
wmi                    19256  2 nouveau,mxm_wmi
lpc_ich                17144  0
microcode              23017  0
serio_raw              13215  0
mac_hid                13253  0
asus_atk0110           18078  0
lp                     17799  0
parport                46562  1 lp
pata_acpi              13038  0
atl1                   45128  0
pata_marvell           12894  0
ahci                   25879  0
libahci                31606  1 ahci

看来nouveau驱动正常加载。

三、 安装FAHClient
参照 http://www.equn.com/forum/thread-38965-1-1.html

四、运行FAH Client,从远程FAHControl上查看状态

CPU计算是正常的,GPU是有的,CUDA驱动是没有的,GPU计算是不能的。
在Solt里添加GPU,一堆报错什么的。

15:36:51:WU01:FS01:Valid core signature
15:36:51:WU01:FS01:Unpacked 8.16MiB to cores/www.stanford.edu/~pande/Linux/AMD64/NVIDIA/Fermi/beta/Core_17.fah/FahCore_17
15:36:51:WU01:FS01:Starting
15:36:51:WU01:FS01:Running FahCore: /usr/bin/FAHCoreWrapper /var/lib/fahclient/cores/www.stanford.edu/~pande/Linux/AMD64/NVIDIA/Fermi/beta/Core_17.fah/FahCore_17 -dir 01 -suffix 01 -version 703 -lifeline 1538 -checkpoint 15 -gpu 0 -gpu-vendor nvidia
15:36:51:WU01:FS01:Started FahCore on PID 1576
15:36:51:WU01:FS01:Core PID:1580
15:36:51:WU01:FS01:FahCore 0x17 started
15:36:51:WARNING:WU01:FS01:FahCore returned: UNKNOWN_ENUM (127 = 0x7f)
15:36:52:WU01:FS01:Starting
15:36:52:WU01:FS01:Running FahCore: /usr/bin/FAHCoreWrapper /var/lib/fahclient/cores/www.stanford.edu/~pande/Linux/AMD64/NVIDIA/Fermi/beta/Core_17.fah/FahCore_17 -dir 01 -suffix 01 -version 703 -lifeline 1538 -checkpoint 15 -gpu 0 -gpu-vendor nvidia


no GPU

no GPU

评分

参与人数 2基本分 +120 收起 理由
cicikml + 100 很给力!感谢兄弟帮助更多人。.
金鹏 + 20 赞一个!

查看全部评分

 楼主| 发表于 2013-12-21 02:23:02 | 显示全部楼层
本帖最后由 dengi 于 2013-12-21 02:45 编辑

实验二、安装Nvidia驱动

没有CUDA是不行的,继续。

一、下载适合的驱动
http://www.geforce.com/drivers
我的是NVIDIA-Linux-x86_64-331.20.run
scp到ubuntu上。

二、安装必要的软件包
sudo apt-get install binutils gcc make

三、安装驱动
sudo sh ./NVIDIA-Linux-x86_64-331.20.run

先是一个License说明,必须同意吧…… [fah04-2.png]

然后提示“Nouveau存在,自己想办法弄掉”,也只能说好…… [fah04-3.png]

然后提示“我可以帮你把Nouveau弄走,试试吧!”,照旧说好…… [fah04-4.png]

然后提示“我帮了,你重启下试试吧!”,好像挺有希望的…… [fah04-5.png]

然后提示“安装失败!看日志自己想办法!”,TNND……  [fah04-6.png]

于是重启计算机。重启完成后,查看驱动加载情况
dengyi@fah04:~$ lsmod
Module                  Size  Used by
vesafb                 13876  1
snd_hda_codec_hdmi     37463  4
snd_hda_intel          44339  0
snd_hda_codec         141761  2 snd_hda_codec_hdmi,snd_hda_intel
coretemp               13596  0
snd_hwdep              13668  1 snd_hda_codec
kvm_intel             137899  0
snd_pcm               102477  3 snd_hda_codec_hdmi,snd_hda_intel,snd_hda_codec
kvm                   455932  1 kvm_intel
snd_timer              29989  1 snd_pcm
snd                    69533  6 snd_hda_codec_hdmi,snd_hda_intel,snd_hda_codec,snd_hwdep,snd_pcm,snd_timer
gpio_ich               13526  0
soundcore              12680  1 snd
snd_page_alloc         18798  2 snd_hda_intel,snd_pcm
lpc_ich                17144  0
serio_raw              13215  0
mac_hid                13253  0
microcode              23017  0
asus_atk0110           18078  0
lp                     17799  0
parport                46562  1 lp
pata_acpi              13038  0
pata_marvell           12894  0
ahci                   25879  0
libahci                31606  1 ahci
atl1                   45128  0

Nouveau没了。再次运行NVIDIA-Linux-x86_64-331.20.run ,一切都美好了。

License说明过后,开始安装了。
看图说话。
[fah04-7.png] [fah04-8.png] [fah04-9.png] [fah04-10.png] [fah04-11.png] [fah04-12.png]
完成了![fah04-13.png]
再次重启,查看驱动状态。
dengyi@fah04:~$ lsmod
Module                  Size  Used by
nvidia              10619226  12
drm                   287564  1 nvidia
vesafb                 13876  1
snd_hda_codec_hdmi     37463  4
snd_hda_intel          44339  0
snd_hda_codec         141761  2 snd_hda_codec_hdmi,snd_hda_intel
coretemp               13596  0
snd_hwdep              13668  1 snd_hda_codec
kvm_intel             137899  0
snd_pcm               102477  3 snd_hda_codec_hdmi,snd_hda_intel,snd_hda_codec
kvm                   455932  1 kvm_intel
snd_timer              29989  1 snd_pcm
snd                    69533  6 snd_hda_codec_hdmi,snd_hda_intel,snd_hda_codec,snd_hwdep,snd_pcm,snd_timer
gpio_ich               13526  0
soundcore              12680  1 snd
snd_page_alloc         18798  2 snd_hda_intel,snd_pcm
lpc_ich                17144  0
serio_raw              13215  0
mac_hid                13253  0
microcode              23017  0
asus_atk0110           18078  0
lp                     17799  0
parport                46562  1 lp
pata_acpi              13038  0
pata_marvell           12894  0
ahci                   25879  0
libahci                31606  1 ahci
atl1                   45128  0

nvidia驱动被加载。运行FAHClient看状态。
[fah04-14.png]

CUDA 2.1
CUDA Driver 6000

GPU运算正常,PPD 12000~13000,8900包, 0x17。
好像已经完成了。



fah04-2.png
fah04-3.png
fah04-4.png
fah04-5.png
fah04-6.png
fah04-7.png
fah04-8.png
fah04-9.png
fah04-10.png
fah04-11.png
fah04-12.png
fah04-13.png
fah04-14.png

评分

参与人数 1基本分 +100 收起 理由
wpf999 + 100 辛苦了!

查看全部评分

 楼主| 发表于 2013-12-21 02:23:35 | 显示全部楼层
本帖最后由 dengi 于 2013-12-21 02:57 编辑

实验三、安装Nvidia CUDA驱动

听说,还有一种高级的CUDA驱动,没研究,大致刚才那个是for games的,CUDA驱动是运算、开发的,试试看。

一、下载CUDA驱动
https://developer.nvidia.com/cuda-downloads
我的是cuda-repo-ubuntu1204_5.5-0_amd64.deb,很小的一个文件,当然也可以下那个.run去编译。

二、安装
sudo dpkg -i cuda-repo-ubuntu1204_5.5-0_amd64.deb
sudo apt-get update
sudo apt-get install cuda

然后就是漫长的下载安装过程……
完成后重启。

三、查看状态
dengyi@fah04:~$ lsmod
Module                  Size  Used by
nvidia               9430169  28
snd_hda_codec_hdmi     37463  4
snd_hda_intel          44339  0
snd_hda_codec         141761  2 snd_hda_codec_hdmi,snd_hda_intel
coretemp               13596  0
snd_hwdep              13668  1 snd_hda_codec
kvm_intel             137899  0
snd_pcm               102477  3 snd_hda_codec_hdmi,snd_hda_intel,snd_hda_codec
kvm                   455932  1 kvm_intel
snd_timer              29989  1 snd_pcm
snd                    69533  6 snd_hda_codec_hdmi,snd_hda_intel,snd_hda_codec,snd_hwdep,snd_pcm,snd_timer
soundcore              12680  1 snd
snd_page_alloc         18798  2 snd_hda_intel,snd_pcm
gpio_ich               13526  0
drm                   287564  1 nvidia
serio_raw              13215  0
lpc_ich                17144  0
microcode              23017  0
mac_hid                13253  0
asus_atk0110           18078  0
lp                     17799  0
parport                46562  1 lp
pata_acpi              13038  0
atl1                   45128  0
pata_marvell           12894  0
ahci                   25879  0
libahci                31606  1 ahci

夜深了,想睡觉。
看看Control上的状态。[fah04-15.png]
CUDA Driver 变更为5050,版本号下降?

PPD没啥变化。感觉之前的driver里也包含CUDA driver,这个里面主要是SDK、Toolkit什么的,不知有什么区别,高手讲解下吧。





fah04-15.png
发表于 2013-12-21 09:20:58 | 显示全部楼层
dengi 发表于 2013-12-21 02:23
实验三、安装Nvidia CUDA驱动

听说,还有一种高级的CUDA驱动,没研究,大致刚才那个是for games的,CUDA驱 ...

感谢兄弟的教程

已加入置顶资料帖
发表于 2013-12-21 10:46:46 | 显示全部楼层
不做开发不需要安装CUDA SDK,这个里面包括CUDA头文件、lib文件和编译工具nvcc等。

跑fah只安装显卡驱动就行了,CUDA运行库包含在显卡驱动里。
发表于 2013-12-21 11:28:28 | 显示全部楼层
很不错,看来ubuntu上装v7会比较顺利。
我的机器用的是一个自己定制的精简版Linux系统,装nv驱动、跑一般的cuda/opencl程序没有问题,但是跑v7显卡包就遇到一大堆系统库兼容性问题,最后是在精简版系统中用chroot又模拟了一个完整版Linux系统才解决问题。
发表于 2013-12-21 13:18:35 | 显示全部楼层
cuda 发表于 2013-12-21 11:28
很不错,看来ubuntu上装v7会比较顺利。
我的机器用的是一个自己定制的精简版Linux系统,装nv驱动、跑一般的 ...

v7客户端主程序是用python编写的
发表于 2013-12-21 14:19:42 | 显示全部楼层
wpf999 发表于 2013-12-21 13:18
v7客户端主程序是用python编写的

跑CPU包是正常的,只有GPU包出现报错,应该不是python的问题。
用strace跟踪可以发现一些具体问题,不过v7的core程序经过了层层包装,出错代码也很笼统,调试起来比较麻烦。

发表于 2013-12-21 14:45:43 | 显示全部楼层
cuda 发表于 2013-12-21 14:19
跑CPU包是正常的,只有GPU包出现报错,应该不是python的问题。
用strace跟踪可以发现一些具体问题,不过v ...

是新版core17还是老版,老版本的core17依赖glib库
发表于 2013-12-21 15:38:29 | 显示全部楼层
不知道450跑opencl包卡不卡。。。
550ti开始已经接受不太卡了

自己是苦逼GTS250卡爆
发表于 2013-12-21 15:38:46 | 显示全部楼层
wpf999 发表于 2013-12-21 13:18
v7客户端主程序是用python编写的

刚才查看了一下,用python写的应该只是FAHControl。而Linux命令行下跑FAH只要FAHClient和FAHCoreWrapper就已足够,并不需要用到FAHControl,因此可以排除这个问题。

发表于 2013-12-21 15:49:20 | 显示全部楼层
本帖最后由 cuda 于 2013-12-21 15:52 编辑
wpf999 发表于 2013-12-21 14:45
是新版core17还是老版,老版本的core17依赖glib库


你指的是FahCore_17文件?是最新版,但是同样存在许多的库依赖问题。
当然,我测试用的是个精简Linux系统不具有普遍性,不过我估计在其他一些Linux发行版中可能也会或多或少遇到问题。
其实用静态链接等方法完全可以把库依赖性问题降到最低限度,所以感觉v7显卡客户端兼容性方面做得不大好。希望下个版本能够改进吧。
发表于 2013-12-21 23:46:46 | 显示全部楼层
这片GTS450发挥了更大作用,哈哈。
您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

小黑屋|手机版|Archiver|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2019-11-21 23:11

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表