中国分布式计算论坛

 找回密码
 新注册用户
搜索
12
返回列表 发新帖
楼主: gongyz

[讨论] 荣耀9X的发布会官宣了中科院高能所的新项目CEPC@home

[复制链接]
发表于 2019-8-15 18:08:22 | 显示全部楼层
我上面那个回复里faner的点评很显然是不了解科研的情况。

首先,并不是算得多就能抓住好的成果。科研不是靠堆砌计算的,或者说靠堆砌计算做出来的科研基本上很快就会变成废纸。为什么呢?因为如果科学家需要计算一个很大的东西,那么首先想到的其实不是怎么搞计算资源,而是先想办法找到合适的方式把计算的难度降下来,无论是寻找合适的算法,还是近似算法,或者理论推算。在所有他们知道的优化办法都用尽之后,才是计算资源的问题。这是因为计算资源要钱,而科学家最缺的其实就是钱,否则CEPC也不会有那么大争议。如果盲目堆砌计算的话,别人如果第二年找到了一个特别好的算法,能把难度降下来十倍的话,那就相当于之前的计算白做了。当然也有例外,就是如果问题本身就很难无法优化的话(NPC问题或者涉及大量数据),那么就只能堆计算资源了。

然后,即使是海量计算,也还要看问题的特性。志愿计算适用的问题范围很窄,数据量不能大,单个任务计算量不能太大,而且问题分割不能过于影响效率。因为有这些限制,所以许多科学问题都不能用志愿计算,只能在数据中心里计算,尤其是那些需要处理海量数据(TB级别)的。这就是为什么我们经常看到生物和数学方面的项目,因为这些计算的内容很多是针对一个实例或者一个蛋白质,相对来说容易划分,而且计算量也不大。另一种适合志愿计算的就是大规模信号处理,就是SETI@home和Einstein@home之类的,他们有大量的巡天数据,需要找到里边的信号,这样的话只要把数据按照时间切一切,就能同时保证数据量和计算量不超过限制。还有一种适合志愿计算的就是随机模拟,这种计算的话可以每台机器上跑一套,计算之间没有耦合,结果交上来取一个最优或者平均就好。之前的LHC@home和AQUA@home就是这样。

当然,因为我之前做过的那个研究,现在可以做的数学问题多了一点,但是目前似乎还没有人跟进。

也就是说,尤其不适合志愿计算的有两种:要么问题没办法分割得足够细而且互不相干,要么需要的数据量实在太大。问题在于,对撞机和粒子物理学大部分的计算其实都是后者。这就是为什么LHC这么大的一个项目,实际上用到志愿计算的就是LHC@home,也就是模拟一下对撞机,看看怎么摆那些器件会比较好。之后所有对撞数据都是内部网格消化的,因为数据分发的成本太大。

CEPC@home如果搞的话,大概也跟LHC@home一样,让大家做做模拟就算了。最核心的数据处理肯定也不适合志愿计算,他们必定会有配套的超级计算机,毕竟这是我国强项。

点评

给力哟!: 5.0 精辟!: 5.0
给力哟!: 5 精辟!: 5
哪怕是当个没名分的外围,我也认了。为国家尽力,不在于大小。  发表于 2019-9-10 22:50

评分

参与人数 2基本分 +11 收起 理由
xx318088 + 1 很给力!
0xCAFEBABE + 10 感谢大佬科普!

查看全部评分

发表于 2019-8-16 09:55:28 | 显示全部楼层
精英主义 不可持续 举步维艰

点评

搞科研就像医生,如果随便读过两本书就上手给你开个“巴豆不可轻用”所以开两斤,你倒是敢?  发表于 2019-8-17 14:51
发表于 2019-9-10 22:45:11 | 显示全部楼层
0xCAFEBABE 发表于 2019-7-24 10:04
从CAS半死不活的样子,就不看好中科院的项目。

同意。我加入几年了,特么一个包没收到

点评

精辟!: 5.0
精辟!: 5
哈哈哈,我比你强点,还接到过一点包。。  发表于 2019-9-11 09:59
发表于 4 天前 | 显示全部楼层
最近忙着码字写本子……但愿明年能如愿给我(们)批一个新集群用……
2000个核心起,想想就真香~~
您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

小黑屋|手机版|Archiver|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2019-10-18 22:24

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表