|
楼主 |
发表于 2007-7-30 15:47:32
|
显示全部楼层
http://climateapps2.oucs.ox.ac.uk/cpdnboinc/quick_faq.php
Climateprediction.net FAQ
compiled by Thyme Lawn & Chris Randles
正式开始前会问到的问题?
运行这个程序安全吗? - 详见 BOINC FAQ: 安全
完成一个模型的计算任务要用多长时间?
这取决于你的计算机速度有多快,你运行程序进行计算的时间有多少,计算中的这个模型大小也是一个影响因素。传统项目实验在 1.4 GHz的机器上不停计算的话大约需要4周时间才能完成。800MHz的G4苹果电脑约要3个月,而2.8 GHz的P4电脑或是Mac G5也要花3个星期。我们建议如果你的电脑能一周只能能开几个小时的话,最好不要参加本项目。本项目程序可以在显示器关闭的时候保持运行。
硫循环实验模型加入项目并投入计算的时间为2005年8月26日,单个任务的用时约为原来的2.8倍。
瞬态耦合模型原计划的持续时间比较短,每个模型的运算时间约是传统模型的6.6倍(比硫循环实验模型要长2.3倍)。以前的实验研究模型多是以模型响应极端预测的情况为目标,不过瞬态耦合模型是第一个准备将结果投入实际应用的项目,这也能让不少人对其产生兴趣。
为什么每个任务都这么大?
每个任务有多大?
和SETI@Home的任务相比,本项目的任务——气候模型可以说是非常大的。用Pentium 4进行计算的话,一个传统项目的任务会花费大约3周, 一个硫循环实验的任务则需要8周,瞬态耦合模型的任务更是需要20周才能完成。
不能把任务划分的小一些吗?
SETI@Home是按望远镜的探测时间段来划分每个任务。Climateprediction.net (CPDN) 的任务 则是气候模型,按各项目的不同可能要进行45至200年间的气候模拟。如果对一个气候模型进行时间上的划分,这将是非常低效的,因为后一个时间段的计算模拟必须得等待前一个时间段的计算结果才能开始。因此将任务按时间段划分成小块并不实际而且这样还会导致大量数据文件的传输(大约要100MB以上)。而且当你加入这个项目后,能看到一个完整的气候演化过程岂不好过只看到其中一个阶段?
对气候模型按时间段进行划分并不可取,这主要是因为相邻计算单元间产生的大量通信行为(每一次计算步进都要通信3次,而整个模型的计算中计算完成,通信次数将超过750000次)。而单独设置一网络驱动器进行连接也不实用。
任务这么大,那我不是会很长时间都得不到分数?
现在可以在每个任务计算到上传点时获得分数,在传统项目的任务中设有72个上传点, 硫循环实验中有120个,瞬态耦合模型则有超过2000个上传点。也就是说,使用一台高配置的电脑计算硫循环实验的任务,你最多只需要等待12个小时就可以遇到上传点,计算情况则每周更新一次。
同时,你也不需要等待对计算结果的验证。
So 计算多长时间能够遇到一个上传点, 气候模型、时间段、上传点和计算步进分别是指什么?
climateprediction.net(CPDN)项目中的任务就是一个完整的气候模型,完全独立。项目需对大量不同的模型进行计算,模型之间只有微小的差异。每个模型都划分为若干个时间段、上传点和计算步进。
一个计算步进等于模型中的半个小时(并非真实情况下的时间),每10,802个计算步进后会设有一个上传点(报告计算结果),在每一个时间段中都有24 个上传点。模型中设定一年为12个月,每月30天(并不是365天,所以会出现2月30日),计算一下就可以知道一个时间段有15年零1天(非真实时间)。
传统项目实验中的每个气候模型都是由3个时间段组成,硫循环实验则为5个时间段。
下面以一个单CPU的普通P4为例进行粗略的计算:
传统项目
• 计算步进=2.2秒
• 上传点=6.6小时
• 时间段=6.6天
• 气候模型=19.8天
硫循环实验
• 计算步进=3.7秒
• 上传点=11.2小时
• 时间段=11.2天
• 气候模型=56天
另见Climateprediction.net任务大小设置表
可见,使用一台较快速的电脑计算传统项目或是硫循环实验,每天会计算到2至4个上传点(报告计算结果),完成一个完整的模型计算会划分20天或者是56天。当然,计算机需要全速运行才可以。
瞬态耦合模型与前二者略有不同,其设置有更多上传点(模型时间是每月一次),这是由于计算结果信息较多的缘故。而且并未设置时间段,而是以事后预报 和 事前预测两部分组成。
• 时间步进=2.7秒(改48步进/日为72步进/日)
• 上传点/(模型时间一个月)=98分钟
• 模型时间一年=19.5小时
• 事后预报/事前预测=65天
• 整个气候模型=130天
在你在第一个上传点完成上传后,只有在第一次数据更新后,才可以看到所获得的分数。然后,在每一次数据更新后,此间所进行的一次或多次的上传,都可以获得分数。现在状态更新的频率为一天一次。
更多关于任务设置大小的信息可以查看 Climateprediction.net任务大小设置表。
这种设置的作用是什么?
climateprediction.net (CPDN)的任务包非常大,但完成每个任务包可以得到更多的分数,并且通过设置上传点的方法,就可以经常获得分数。
让人担忧的是计算中的错误会导致很多任务的丢失。怎样才能妥善解决这个问题呢?提议任务包做小一些的意见因为不切实际而被否定。更好些的方法是进行经常的备份,这样在碰到计算错误的时候就不会损失太多。如果你想对任务进行备份,请见如何备份BOINC 。
费时更久的硫循环实验在每一阶段完成后都将结果上传,可以解决部分问题。如果在最后的第五阶段出现了错误,早已经得到的前四个阶段的结果可以降低整个模型计算结果丢失的可能性。
瞬态耦合模型改进了以上的方法,在计算到上传点的时候,以及模型中每模拟运行到10年的时候,程序都会对气候数据和信息进行上传。
计算过程中是否需要一直在线?
当然不用一直在线。只要安装好程序并完成注册,就可以离线运行程序了。
当计算机计算到上传点时,程序会自动尝试“上传”少量数据(如果此时网络连接可用),便于项目跟踪模型的计算情况。如果不能进行网络连接,上传点的信息就会先储存起来,待下次成功连接网络后再上传。上传点处的数据并不是必须要上传的,但在整个模型的计算完成后会有约6M的数据需要经网络上传(modem需要一个小时左右,宽带/ADSL则只要几分钟)。在BOINC中会显示上传的详细信息。上传数据将分为5个压缩"zip"文件,并可以分步上传(比如在上传过程中可以暂停/恢复以及退出/重启,而且在初始上传中断后,也不必下载全部的文件)。
那可能吗,不需要和其它计算机进行通信吗?
不需要。用户个人的计算机是独立进行气候模型的模拟计算的。这也是任务包如此巨大的原因——通信过程也会很频繁。即使有一台专门用于网络通信的设备,这么做也是不太实际的。
能随意暂停计算吗?
climateprediction.net的气候模型不应当干扰计算机的正常使用。不过通过BOINC Manager的文件菜单可以暂停所有的项目。另外要暂停某一个项目,还可以在项目选项卡中实现。第三种方法是在任务选项卡中点击暂停按钮。要注意的是只暂停了一个任务包的话,有可能会让另一个任务包开始运行(如果已经下载到本地)。
除以上方法外,用户还可以在Climateprediction.net 的官方网站上进行参数设置,包括仅在某设定时间内运行BOINC或者只在计算机闲置若干时间后运行,等等。BOINC可以在平台所支持的各项目间进行“任务切换”,指定各项目的CPU使用比例,从而避免某个项目在完成一个任务包之前独占CPU的情况发生。同时还可以设置项目在被挤出运行队列的时候是驻留内存(这样不会损失先前的计算结果)还是退出。
应该怎样卸载程序?
如果想在BOINC下终止climateprediction.net (CPDN),简单的点击一下项目选项卡中的“退出”即可。在Windows下点击项目选项卡后,再选择“退出”即可。Linux 以及OSX下,需要打开一个终端,找到BOINC的安装目录后,输入
./boinc* -detach http://climateprediction.net.
这样就可以删除所有climateprediction.net (CPDN)的文件,但不影响其它的BOINC项目。如果要卸载BOINC,可以在Windows控制面板中的添加/删除程序选择卸载。Mac和Linux环境下只需要删除BOINC文件夹或可执行文件。我们非常感谢您能把余下的时间和精力投入到我们这样的项目中来。不过,如果您已经下载了一个任务包,我们希望您能将这个任务包计算完毕,而不是只为了看看屏保。我们这样做也是基于项目的科学性要求,因为从现在的情况来看,任务包如果不计算完毕,一是无法由他人继续计算,二是无法对所得结果进行评价。
设置及其它问题
设置部分参见 Climateprediction. net的安装设置
代理服务器
如果需要使用代理进行网络连接,在Windows版的BOINC客户端上,找到“设置代理”选项,把代理的地址填入即可。Linux/Mac版的BOINC客户端,需要设置HTTP_PROXY的代理服务器环境变量。其它设置(如用户名/密码)见
BOINC Linux/Mac Client page.
防火墙设置
注意在防火墙设置中要允许BOINC的程序访问及使用网络(Windows中是boincmgr.exe和boinc.exe;Mac/Linux中是boinc_*)。客户端要使用80端口进行通信(这是浏览器使用的默认HTTP端口)。和浏览器一样,与BOINC服务器进行通信要依靠的客户端程序,不会使用其它端口。
If y务必使BOINC能够拥有80端口的全部权限。已知若设置防火墙限制BOINC访问指定服务器后,Climateprediction.net的气候模型会因防火墙阻挡访问镜像服务器而出现错误。
代理服务器及身份验证
Win32:点击“设置”,在“代理服务器”中填入配置信息。
Mac/Linux:BOINC客户端的命令行版有很多环境变量以及命令行参数。
详细内容可阅读下面的文章:"BOINC Daemon - Command Line Interface - Command-Line Options".
有关项目
climateprediction.net研究的是什么?
项目在不同阶段的实验设计的具体内容,参见Strategy Page。有两个子项目是属于整个大项目中的“第一阶段”。首先就是传统项目或称作HADSM3,该项目分为三个时间段,采用完整的大气模型和简化的海洋模型。另一个是硫循环实验,其中包括对一些化合物中的含硫情况进行建模。该项目有五个时间段,更复杂的运算使得计算步进的间隔增加,总的计算用时约为传统项目的2.8倍。
瞬态耦合模型包含了“第二阶段”的事后预报和“第三阶段”的事前预测。这也是首次考虑到了模型的实际应用。
iClimateprediction.net的气候模型中有各种项目模型的相关信息。
climateprediction.net项目所包含的科学知识请点击这里.。
如何运行Climateprediction.net的程序
程序可以计算多少个气候模型?
要多少有多少。程序计算一个气候模型并完成后,会返回少量的数据信息,然后就开始计算另一个气候模型,如此循环,直到你切换到另一个项目或是将BOINC卸载。
磁盘空间
每一个Climateprediction.net的气候模型将随着计算慢慢扩容到750MB(硫循环实验的话会达到2.7GB)。
在每一个时间段的末尾,都会产生一些输出文件。这些文件在进行格式转换的时候会频繁访问硬盘,计算机因此会显得比较慢,这个过程大约有5分钟。如果这样会引起操作不便,请关闭此操作或是选择暂停,待计算机处于闲置时间时再重新开始。
气候模型计算结束后,科学家所关心的一些关键数据会被打包成总大小约7M的5个文件进行上传。硫循环实验在每一个时间段结束时都会上传回一个文件——第一个为9MB,其余的为2.6MB。数据文件会被压缩成zip格式,完整的传统项目约占330MB的磁盘空间,硫循环实验则需1GB。
瞬态耦合模型每计算10年进行一次上传,磁盘空间只占用660MB,不再使用的文件会被自动删除。
如何使用参数设置来限制磁盘的使用,可以参阅磁盘使用设置。
如果无法下载,请阅读解决磁盘空间不足引起的无法下载问题。
将BOINC设置为以服务器模式运行
打开一个DOS窗口,将当前目录改为BOINC的安装目录,运行boinc_cli.exe –install将BOINC安装为服务器模式。在服务设置中打开BOINC这一项,再查看工具栏的中的日志消息,确认BOINC已经被安装到本地系统帐户。转到BOINC目录,保证本地系统帐户具有全部权限。退出BOINC,将各开始文件夹中的相关文件全部删除。如果没有这一步,下次运行时,GUI图形界面仍会同CLI命令行模式服务一起启动。而GUI启动时就会出现-144错误(共享内存文件无法创建,文件已存在),这样运行模型计算都将是无效的。可以重新打开BOINC服务(或是从服务设置中和使net命令启动)。
关闭系统时的步骤
如果是在Windows系统中运行BOINC软件,注意在关闭系统时要先退出BOINC程序。BOINC程序无法控制Windows的关闭,因此在退出BOINC客户端时state.xml会发生冲突,导致唤醒系统时启动失败。命令行版由于将BOINC安装为系统服务会更为安全,但在退出Windows时要先运行以下命令:
net stop boinc
BOINC客户端已经比以往版本更加可靠,但在关机退出前停止BOINC客户端的运行仍然是比较安全的办法。
命令行版本
BOINC的命令行版优化了环境变量,以命令行模式运行。相关内容可见下面的文章“BOINC Daemon - Command Line Interface - Command-Line Options”。
计算完毕上报结果
计算完毕表示核心程序将在下一次联络项目调度服务器时上报结果。你只需让其自动运行即可。
需要从CP classic升级到BOINC吗?
请见Should I upgrade to BOINC from CP classic?
图形兼容性
图形界面需要显卡支持OpenGL。测试显卡的OpenGL性能可以下载此软件:OpenGL extensions viewer。运行此程序,不过要保证显卡能够完全兼容。
使用中会遇到的一些问题
如果因为磁盘空间不够而下载不到任务,该如何解决?
•每一个传统项目的任务包需要750MB的磁盘空间。对HT技术的处理器来说,两个逻辑处理器一共需要1.5GB。硫循环实验直至完成计算前需要2.7GB空间,这样HT超线程处理器便需5.4GB空间。
如果空间紧缺,但同时也完成了一些任务包,参见如何保存和删除CPDN的结果数据。
•进入BOINC界面左侧的“您的帐号”,在项目官网查看磁盘使用设置,选择'View or edit' General Preferences。查看其它三项参数设置(最多使用(MB),保留至少/最多使用(%总磁盘空间)),以符合每个任务至少750MB的空间使用要求(硫循环实验为2.7GB)。
•若其它三项参数设置能够满足每个任务至少750MB的空间使用要求(硫循环实验为2.7GB),这即是你个人的资源分配设置。此设置不仅能控制各任务所分得的运行时间,同时也可以分配BOINC各任务所能够使用的磁盘空间。如果设置的资源使用比例较低,可能会影响你参与到Climateprediction.net (CPDN)中来(因为本项目相比其它BOINC 平台上的项目需要更多的磁盘空间)。一个可能的解决办法是针对Climateprediction.net (CPDN)将资源分配设置暂时调高,待任务下载完成再恢复到原样。
•如果需要更改设置,在完成参数设置后保存即可。在客户端下一次连接服务器的时候完成参数设置上的更新。不过要更快的更改此设置的话,请在BOINC客户端上点击“更新”以获取最新的参数设置。退出BOINC再重启即可,这样新设置就生效,下载也可以正常进行了。
为什么我的电脑上还存有330MB/1GB的数据?
每一个任务包都会留下330MB的数据,而硫循环实验约有1GB。
虽然只有一小部分的数据(有7MB或是20MB)会上传,但剩余部分依旧是有用的数据。当然最有用的信息都是经过了选择的。
根据各人的需求,对项目所剩数据的处理也有所不同。
兴趣爱好 有用户将数据保留在磁盘上,可以用CPView 或者一些高级可视化软件查看程序的气候模型模拟情况。
存档 有用户保存下这些数据,可以防止任务丢失后重新计算。以后的10年中,存档的作用可能时时会显现出来。这些数据在接下来的2年里可能会经常用到,随后被调取的频率将逐渐减小。把这些数据保存在CD或是DVD上是一种好方法。但如果联系不到本人,项目小组就无法取得这些数据。不过,即使这些盘片在10年之内丢失了,这种保存数据的方法也在一定程度上减小了气候模型重新计算的可能性。
删除 有用户选择删除这些数据,因为他们没有那么多闲置的存储空间。任务完成后剩余的数据是可以随意删除的。如果过后项目小组又需要这些信息的话,原任务就会重新发放给用户再计算一次。有人认为对任务的重新计算应该尽量避免,但寻找一位用户重新计算某个任务后再删除剩余数据,要比找一位还保存着相关任务数据的用户要简便的多。
项目要求一些用户上传某特定任务的数据,但如果需要上传的数据太多,这就有点不合理了。不过我觉得现在的任务完成后上传的数据并不算多。
数据能否删除或保存的依据 如果任务在第一个时间段内出现了计算错误,要保存相关数据就没有什么必要了。如果任务运行的时间比较长了,此时出现计算错误,研究人员希望能从中找到出错的原因。数据是删除还是保存取决于你认为这些数据是否还有用。
数据上传:这是早期版本的程序上传数据的功能。我不清楚这是否也包括BOINC版本的程序在内。如果BOINC版本的使用者将任务的所有数据都上传的话,Climateprediction.net并没有专人或是准备相应的存储空间来应付这些。
请见如何保存和删除CPDN的结果数据。
[ 本帖最后由 第三类接触 于 2007-9-13 14:50 编辑 ] |
评分
-
查看全部评分
|