gongyz 发表于 2016-2-14 19:30:18

einstein项目显卡选择讨论

因为引力波的发现这个项目多了很多新人

这个帖子来抛砖引玉先把我个人用过的显卡说一下 楼下请帮忙补充

首先说一下这么项目的特点那就是小核心利用率高大核心的理论性能增长和实际表现脱钩

举个例子 都是CUDA55的beta包在跑4线程的情况下GTX760大约每天得分10万780ti大约是17万

从规格来看760是1152个流处理器780ti是2880两倍都不止不过除了负载高低的区别也可能和rop数量上780ti只比760多50%有关

估计都有影响

另外我发现这项目对显存带宽也比较敏感如果用DDR3显存表现就会非常差劲 比如我的单通道APU核显和64bit D3的240亮机卡 以及D3版650M 跑起来都非常慢

所以独显选择上 虽然低端卡性价比更高 但别选D3卡

麦克斯韦的问题

同样条件下 750ti每天只有6万左右和760差距明显虽然我没有960但估计960也不如760我有过970 和780ti差距非常大只比760快10%的样子

性价比来说 这项目麦克斯韦不如开普勒当然麦克斯韦一贯的省电低温的优势还是很明显的

显存占用上1G显存的极限大概是同时跑三个包四个包就应该不够了所以建议2GD5或以上

A卡的话 我的270要明天才到 就先不说了 谁也来说说自己的

另外这项目的显卡项目CPU占用虽然不高 但如果CPU性能低下也会明显的降低效率

gongyz 发表于 2016-2-14 19:32:48

@vardrag 是这个项目上显卡方面最有发言权的了at一下请你说说

vardrag 发表于 2016-2-15 15:59:54

本帖最后由 vardrag 于 2016-2-15 16:09 编辑

gongyz 发表于 2016-2-14 19:32
@vardrag 是这个项目上显卡方面最有发言权的了at一下请你说说
我以前在某个贴里总结过,跟你说的差不多。
跑了一年感觉E@H对GPU的挖掘比F@H差远了。
1、大核心的效率偏低。
最典型的是fiji,4096个流处理器在不出错的情况下输出比280X只高3成。大核心效率最高的差不多是280X,2048个流处理器的输出比5个r7-350(384*5=1920个流处理器)稍微强一点。titanX,780ti,980ti,290X/390X等等输出都偏低,还不如760X2。
2、新架构的PPD没有明显优势。
970(1356MHz)/770(1211MHz)、980ti(1354MHz)/780ti(1006MHz)输出都差不多;A卡方面GCN1.1之后只能单线程运行导致新不如旧,比如390X还不如280X,fury比280X也好不了多少。
3、PPD对频率“不敏感”(超频得不到好处,但是降频对PPD的影响却比较明显),这是造成新架构没有优势的一个重要原因。
1.2G的780TI,PPD比1G的高不了多少。麦克斯韦比开普勒的一个明显的优势就是可以获得很高的频率,但是现在高频也没用。
4、N卡的程序相对比较成熟,对CPU的依赖比较低,PPD对CPU的主频也不是很敏感;A卡很占CPU,主频越高越好,尤其是大核心,4.5G的I5带3张280X跑12个线程已经比较吃力了。但是无论哪种卡,想发挥最大的效能最好是CPU专用。
5、旧程序(比如windows的CUDA32)对PCI-E带宽也有要求,PPD从3.0X16换成2.0X16就有明显变化;新程序如CUDA55对PCI-E带宽不敏感
6、显存的问题没有注意


老卡虽然性价比高,但是购买渠道和保修都是问题,而且功耗和散热需要考虑
新卡性价比不高,但是购买容易,效能高,散热压力小,省电,对家居和办公环境的影响也小

vardrag 发表于 2016-2-15 16:23:03

显存容量根本不是问题,一般的核心两个线程就可以占用90%以上,3个线程跑不满的GPU绝不可能只配1G显存,所以这个问题不用考虑。

vardrag 发表于 2016-2-15 16:29:24

大核心3-4个线程,中小核心1-2个线程就足够了。线程太多对PPD没什么帮助,徒增负担,而且算太慢还有超时的风险。

金鹏 发表于 2016-2-15 16:42:00

据说引力波发现和验证和Einstein@Home木有半毛线关系

jylfyzyz 发表于 2016-2-15 17:06:57

而且这项目的GPU程序是用来寻找脉冲星的,找引力波的全部是CPU程序,即使有人进来不久也会退掉吧

nekoko 发表于 2016-2-15 17:14:35

金鹏 发表于 2016-2-15 16:42
据说引力波发现和验证和Einstein@Home木有半毛线关系

有关系,脉冲双星也是引力波的来源,Einstein@home 的GPU程序主要就是找双星……对观测也是有贡献哒~
另外,LIGO这次只是首次观测到引力波,Einstein@home 的目标是寻找连续的引力波,貌似LIGO的测试程序已经公布在计算程序里啦,应该马上就会有数据可以跑了


说起优化,其实也是挺难的,SETI因为公布了源码所以有人给做优化,官方的优化其实也不怎么样的……
E@H 计算的内容应该和SETI类似,基本就是FFT滤波吧,从杂乱信号中提取周期性信号,所以估计效率低的原因和优化的原理应该类似,什么时候E@H 有源码放出来就好了~

Rojer 发表于 2016-2-15 17:17:34

Einstein@Home 寻找的是持续波信号,这次发现的黑洞合并信号只有1/4秒,这种类型的信号并没有交给Einstein@Home来处理。但Einstein@Home也是有发现的,去年年底确认志愿者们发现了了四个年轻的伽玛射线脉冲星。

vardrag 发表于 2016-2-15 18:52:06

jylfyzyz 发表于 2016-2-15 17:06
而且这项目的GPU程序是用来寻找脉冲星的,找引力波的全部是CPU程序,即使有人进来不久也会退掉吧 ...

好像有过引力波的CPU任务

vardrag 发表于 2016-2-15 18:54:07

金鹏 发表于 2016-2-15 16:42
据说引力波发现和验证和Einstein@Home木有半毛线关系

优化倒是有,一年内更新了大概3次程序,PPD提高还是挺明显的

金鹏 发表于 2016-2-15 18:56:40

vardrag 发表于 2016-2-15 18:54
优化倒是有,一年内更新了大概3次程序,PPD提高还是挺明显的

我是说针对新架构的GPU的优化,特别是涉及到的新算法也有优化?

vardrag 发表于 2016-2-15 18:57:14

金鹏 发表于 2016-2-15 18:56
我是说针对新架构的GPU的优化,特别是涉及到的新算法也有优化?

那个应该是没有

金鹏 发表于 2016-2-15 18:59:25

nekoko 发表于 2016-2-15 17:14
有关系,脉冲双星也是引力波的来源,Einstein@home 的GPU程序主要就是找双星……对观测也是有贡献哒~
另 ...

以此为契机在全世界掀起引力波热潮感觉FAH那边淘汰下来的显卡来跑E@H刚刚好

yimu35 发表于 2016-2-15 19:10:09

Titan X oc @1400mhz也才22万ppd。这个项目确实新老卡差距不大。
页: [1] 2 3
查看完整版本: einstein项目显卡选择讨论

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~