找回密码
 新注册用户
搜索
查看: 7943|回复: 11

[原创] Ubuntu 18.04/CentOS/RHEL无头英伟达GPU从零设置

[复制链接]
发表于 2020-4-14 08:42:41 | 显示全部楼层 |阅读模式
本帖最后由 Baiqing_Lyu 于 2020-4-14 23:53 编辑



此教程默认你已经对Linux有一个基本的认识和理解,如果你想要更高的PPD,使用Linux来跑包可以带来更高的分数。这个教程针对的是无头Linux服务器设置,不过只要系统版本一样有没有桌面都没有关系。所有的命令会从终端完成。如果哪个资源被墙了可以告诉我,我可以将需要的软件上传到IPFS。


Ubuntu (18.04) 安装步骤

  • 下载英伟达Ubuntu来源包

  1. curl -O http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
复制代码
  • 安装来源包

  1. sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
复制代码
  • 加入英伟达GPG钥匙:

  1. sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
复制代码
  • 更新来源和安装CUDA:

  1. sudo apt update && sudo apt install cuda -y
复制代码
  • CUDA已经安装,现在需要OpenCL来提供libOpenCL.so

  1. sudo apt install ocl-icd-opencl-dev
复制代码
  • 开始安装F@H无头客户端,首先下载客户端软件包:

  1. wget https://download.foldingathome.org/releases/public/release/fahclient/debian-stable-64bit/v7.5/latest.deb
复制代码
  • 安装:

  1. sudo dpkg -i latest.deb
复制代码

安装的时候会有一个弹窗问你要用户名和密码,可以暂时不填,最后一个问你是否开启服务的时候必须选Yes,否则软件不会正常安装。
安装完成,可以跳到调试步骤



CentOS 7/8 RHEL 7/8

  • 更新系统Kernel

  1. sudo yum clean all
  2. sudo yum install -y kernel | grep -q 'already installed' || sudo reboot
复制代码
系统可能会重启。
  • 安装其它需求:

  1. sudo yum install -y kernel-devel-$(uname -r) kernel-headers-$(uname -r)
复制代码

  • 安装CUDA来源包:
    (根据系统版本来安装)

CentOS/RHEL 8
  1. sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-repo-rhel8-10.1.243-1.x86_64.rpm
复制代码
CentOS/RHEL 7
  1. sudo yum install http://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-repo-rhel7-10.0.130-1.x86_64.rpm
复制代码


  • 安装epel-release来源,此来源含有需要的DKMS部件:


CentOS 7/8 and RHEL 7:
  1. sudo yum install epel-release
复制代码

RHEL 8:
  1. sudo yum install https://dl.fedoraproject.org/pub/epel/epel-release-latest-8.noarch.rpm
复制代码


  • 清楚缓存:

  1. sudo yum clean all
复制代码

  • 安装CUDA:

  1. sudo yum install cuda
复制代码


  • 安装OpenCL:

  1. sudo yum install opencl-headers
复制代码

  • 现在所有需求已经安装,可以开始安装F@H无头客户端,下载并安装客户端软件包:

  1. sudo yum install https://download.foldingathome.org/releases/public/release/fahclient/centos-6.7-64bit/v7.5/latest.rpm
复制代码

安装完成,可以跳到调试步骤



调试步骤

  • 停止客户端来调制设置。

  1. sudo /etc/init.d/FAHClient stop
复制代码
  • 确认英伟达驱动正确安装:
  1. nvidia-smi
复制代码
如果弹出没有此命令重启系统。

设置文件在/etc/fahclient/config.xml

附件有一个设置例子,可以根据需求修改。(一些系统可能不支持中文,在保存前记得将中文移除)
如果选择要用远程控制,需要将端口36330打开。

  • 设置调制完成,可以开始客户端。

  1. sudo /etc/init.d/FAHClient start
复制代码

  • 查看是否运行:
  1. sudo /etc/init.d/FAHClient status
复制代码
  • 查看进度
  1. sudo /etc/init.d/FAHClient log
复制代码


目前英伟达OpenCL的算法极其差劲,导致一个GPU就会需要一个CPU核心来提供数据。如果你想要在CPU上跑包以这个算法来考虑需要用几个核心:


CPU跑包核心数量= CPU核心总数量 - GPU数量
使用所有CPU+GPU会导致GPU不被充分的利用。

config.xml

468 Bytes, 下载次数: 13525

设置文件

评分

参与人数 7基本分 +167 收起 理由
yimu35 + 14 辛苦了!
flybike007. + 14 辛苦了!
mikutiger + 3 辛苦了!
Lynt + 12 赞一个!
wpf999 + 100 很给力!
金鹏 + 20 很给力!
lothlorien + 4 很给力!

查看全部评分

回复

使用道具 举报

发表于 2020-4-14 19:55:42 | 显示全部楼层
centos 6不可以跑fah,几年前我就测试过。  fah core会报错, 原因是glibc版本较低,是2.12

所以我用centos 7,这个可以跑
回复

使用道具 举报

发表于 2020-4-14 19:58:03 | 显示全部楼层
不需要安装CUDA,只需要安装显卡驱动就跑fah了。
回复

使用道具 举报

 楼主| 发表于 2020-4-14 23:54:38 | 显示全部楼层
wpf999 发表于 2020-4-14 19:58
不需要安装CUDA,只需要安装显卡驱动就跑fah了。

的确不需要安装完整的CUDA工具组,但是从零开始我认为这是最直接和简单的安装步骤。也可以为了未来有其它需要CUDA的软件打底

CentOS 6, RHEL 6步骤已移除,谢谢提醒!
回复

使用道具 举报

发表于 2020-4-14 23:55:38 | 显示全部楼层
Baiqing_Lyu 发表于 2020-4-14 23:54
的确不需要安装完整的CUDA工具组,但是从零开始我认为这是最直接和简单的安装步骤。也可以为了未来有其它 ...

如果是ubuntu桌面版的话该怎么弄?可否出个教程呢?包括超频,监控等。
回复

使用道具 举报

发表于 2020-4-15 00:01:02 | 显示全部楼层
Baiqing_Lyu 发表于 2020-4-14 23:54
的确不需要安装完整的CUDA工具组,但是从零开始我认为这是最直接和简单的安装步骤。也可以为了未来有其它 ...

CUDA SDK只有当需要在平台上需要make代码时才安装,这个安装包很大。 不是CUDA开发者没必要安装。
回复

使用道具 举报

发表于 2020-4-15 00:48:51 | 显示全部楼层
wpf999 发表于 2020-4-15 00:01
CUDA SDK只有当需要在平台上需要make代码时才安装,这个安装包很大。 不是CUDA开发者没必要安装。
...

debian系系统的某些程序在编译的时候好像没把cuda编译进去,导致需要cuda计算的时候用户要安装一遍cuda。比如blender。

当然跑fah和boinc不需要再额外安装cuda了。
回复

使用道具 举报

发表于 2020-4-15 00:50:59 | 显示全部楼层
另外,nvidia显卡驱动的安装,在ubuntu下建议还是直接用软件源里的版本,不要用无头版。红帽系不太清楚。无头的安装方法好像各方面都不太推荐。

回复

使用道具 举报

发表于 2020-4-15 08:40:30 | 显示全部楼层
ubuntu里面怎么升级Teamviewer?现在提示版本太老不能连接
回复

使用道具 举报

 楼主| 发表于 2020-4-15 09:42:27 | 显示全部楼层
freestman 发表于 2020-4-15 08:40
ubuntu里面怎么升级Teamviewer?现在提示版本太老不能连接

连接的话需要FAHControl,不是TeamViewer。第一行是IP,第二行是密码

control.PNG

回复

使用道具 举报

发表于 2020-4-15 12:17:04 | 显示全部楼层
freestman 发表于 2020-4-15 08:40
ubuntu里面怎么升级Teamviewer?现在提示版本太老不能连接

貌似只能重装,参考这个https://community.teamviewer.com/t5/Linux/how-to-upgrade-from-version-12-to-version-13-on-ubuntu/td-p/24926 ,最新的版本15,要求Ubuntu 16.04以上,下载页面:https://www.teamviewer.com/en/download/linux/?_ga=2.193676267.734524210.1586914244-156437699.1586914244,我在Ubuntu 14.10上无法安装最新版,尝试无头版可以安装,但是连线一直不能显示桌面,暂时无解。
回复

使用道具 举报

发表于 2020-4-16 09:26:00 | 显示全部楼层
Keyco 发表于 2020-4-14 23:55
如果是ubuntu桌面版的话该怎么弄?可否出个教程呢?包括超频,监控等。

ubuntu桌面网上教程挺多的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-3-29 05:03

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表