找回密码
 新注册用户
搜索
查看: 4918|回复: 9

[分享] 关于在国内推广分布式计算的一个想法

[复制链接]
发表于 2010-4-17 02:45:28 | 显示全部楼层 |阅读模式
本帖最后由 panzerkiller 于 2010-4-17 02:47 编辑

老生长谈了

无意中从equn.com链到mdbbs.org,进去逛了一圈,发现一个问题:论坛挺热闹,说明国内做分子动力学的研究人员,对计算量的需求很大;遗憾的是,没看到一篇贴子涉及分布式计算。与此同时,equn上大把的热心人在算FAH(斯坦福大学潘德研究小组的分布式计算项目,目前世界最大的项目)。于是,一个想法产生了:肥水不流外人田,给自己人算!
首先,对几个问题做一些简单分析
国内的研究人员为什么不用分布式计算?
a. 不知道分布式计算之存在
b. 知道,也了解运作方式,但因为某些原因不愿意采用
 b1: 担心安全性,自己辛辛苦苦开发的课题,一行行写好的程序,万一被别人拿去发了paper,自己只有傻眼的份。
 b2: 担心计算资源不稳定,因为程序的运行和调试需要大量的精力和时间,志愿计算这种可能连7x24都没办法保证的方式,怎么让人放心?万一到期拿不出结果耽误事情,找谁?
 b3: 家用机器太低端,不屑一用

以上这几点是我能想得出的原因,下面就来说说我的想法,为什么分布式计算可以用。

首先,安全问题不必太担心,以我的研究经历,你自己的数据,出了实验室,基本上没人能看懂;即使能够费尽周折反向了你的课题,也还要考虑一下费这么大劲偷别人课题值不值得;其实相对于自己课题被网络上某人偷去,你的第一作者被师兄/老板拿去的机会更大。

其次,来说说分布式计算的优点。
以我的理解,模拟计算,除了在乎计算速度,对结果的稳定性也有一定要求,通常都需要不少于两次的验算。所以评估一个模型的计算耗时应该把验算时间加进去。这时候,分布式计算的优势就显示出来了,简单算一笔小帐:
假设有一个程序,需要验算3次,
一台双CPU至强运行一次耗时24小时;
一台单CPUi7运行一次耗时48小时;
方案一
单独用一台双CPU至强,完成整套运算耗时24x3=72小时;
方案二
用双 CPU至强运算的同时,交给N台i7验算,这样,理想情况下,48小时后,将得到N+1个结果,N>2的话就算超额完成任务。
方案二的另一大优势是其天然的相对稳定性:即使在最不理想的情况下,如遇机器罢工,停电等人力不可抗拒之因素,方案一只能顺延耗时,方案二却能占概率的便宜,按时完成:毕竟全国停电的几率不是很大。

最后,方案二还有个非常诱人的优势:省钱. 这个对一些经费不充足的组还是有意义的,现在研究生的工资也要从老板经费里扣了

啰唆了这么多,相信各位跟我一样,一定在考虑同一个问题:怎么运作?我有一个大概的构思,在这里提出来,希望大家拍砖的同时,能够集思广益, 完善这个想法。

第一阶段,依托论坛,手动发包。(这里把需要计算资源的研究人员简称为雇主,志愿提供计算能力的叫短工)
雇主发贴招聘,说明计算需求--->短工报名,展示机器配置,可运行情况-->雇主统计,邮件发包,或者干脆上论坛附件,随便下载-->。。。-->短工提交结果-->雇主发工资(伪币,评分,任意一种可满足虚荣心的方式)

第二阶段,在吸引足够多的眼球,雇主短工达到一定规模,反映良好的情况下,开始考虑搭建自动发包的服务器,可以直接用BOINC的,我就不多说了。

第三阶段, 有偿计算,这个太远了,暂不考虑。

这个构思中,第一阶段是其核心,就象电子商务一样,本质还是商业,网页啊,平台啊只是实现的手段。推广分布式计算,人气是第一位的,眼下在国内推广,上游研究人员的认同比我们下游志愿者的人数更重要。

以上这些,纯数闭门造车,希望大家指正
回复

使用道具 举报

发表于 2010-4-17 09:15:03 | 显示全部楼层
天朝的领导们都不愿意冒风险。。。
回复

使用道具 举报

 楼主| 发表于 2010-4-17 09:19:02 | 显示全部楼层
所以啊,跟领导谈,没戏;直接联系学生吧
天朝的领导们都不愿意冒风险。。。
bugfix 发表于 2010-4-17 09:15
回复

使用道具 举报

发表于 2010-4-17 09:48:11 | 显示全部楼层
想法挺好。不过有几个顾虑:

1. 斯坦福的名气在那里。公正性、公益性、透明度有保证。随便某个研究生蹦出来说要算XXX。谁知道你到底在算啥呢?谁来担保你不是在算导弹弹道或者股市涨跌呢?当然如果真是股市涨跌我也有兴趣算。弹道就算了。
2. FAH的公益性目标容易得到大家认同。毕竟要付出电脑、时间、精力、电费,大家还是有点私心的,虽然几十年之后得帕金森症还有点远。但大家也愿意帮忙。你准备让大家算点啥呢?
回复

使用道具 举报

 楼主| 发表于 2010-4-17 09:57:32 | 显示全部楼层
弹道之类的就不必担心了,我想算,人家还不信任咱呢;我的提议还有针对性的:就是MDBBS.COM上的分子动力学研究,跟FAH用相同或相似的内核。初衷就是能够慢慢建立起信任和互动。
想法挺好。不过有几个顾虑:

1. 斯坦福的名气在那里。公正性、公益性、透明度有保证。随便某个研究生蹦出 ...
shouldbe 发表于 2010-4-17 09:48
回复

使用道具 举报

发表于 2010-4-17 10:18:49 | 显示全部楼层
任重道远。FAH也不是一年就起来的。时间成熟的时候相信会有人出头做的。
回复

使用道具 举报

发表于 2010-4-17 19:49:47 | 显示全部楼层
目前国内环境,暂不抱任何希望
回复

使用道具 举报

发表于 2010-4-17 20:47:16 | 显示全部楼层
我觉得中国不适合分布式运算= =
回复

使用道具 举报

发表于 2010-4-17 21:31:11 | 显示全部楼层
想法好

个人看法同楼上,换个字词顺序:分布式计算不适合中国
回复

使用道具 举报

发表于 2010-4-17 21:44:15 | 显示全部楼层
他们都不急,我们急什么
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-15 00:51

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表