找回密码
 新注册用户
搜索
查看: 3463|回复: 2

谁给我解释一下`````什么是SETI还有BOINC ??偶真的不懂``

[复制链接]
发表于 2005-1-26 13:35:29 | 显示全部楼层 |阅读模式
我只是一个`````在设计单位里混混的电脑维护人员```哪位老大教教我啊
回复

使用道具 举报

发表于 2005-1-27 23:57:00 | 显示全部楼层
目前存在的绝大多数SETI程序,包括在加洲伯克利大学(UC Berkeley)大楼里大型计算机上运行 的程序,都在实时的对从天文望远镜收集来的数据进行分析。这些计算机都没有对这些微弱的 信号进行深入的分析,也没有试图搜索更多种类的信号(关于信号的类型,将在后面讨论)。之所以没有这样做的原因是用来进行分析的计算机的处理能力是有限的。要想从大量的极其微弱的信号中发现什么的话,必须需要极其大量的计算机的处理能力,因此需要一台完全难以实 现的超级计算机来完成这个工作。SETI计划根本不可能也没有能力建造或者购买这样的计算 机,因此他们采取了另一种平衡的方法。那就是用比较小的计算机而花更多的时间来完成这个 工作,而不是用超级计算机和比较短的时间内完成这个工作。但是新的问题是,这样就会有许许多多的堆积如山的数据等待处理。那么,他们是否可以利用大量的这种小型计算机同时处理 不同的数据呢?SETI计划能在那里找到成千上万的计算机,并且能过不断的处理从阿雷西博 (Arecibo)射电望远镜收集的数据呢?
伯克利(UC Berkeley)的SETI计划的成员注意到已经有成千上万的计算机是可以利用的。这 些计算机中有很多通常都是什么也不做,只是在运行屏幕保护,白白的浪费电。因此,SETI@home也就产生了。SETI@home希望你能够允许我们在你不使用计算机的时候借用它来 帮助我们“……寻找新的生命形式,寻找新的文明”。我们将利用运行在你的计算机上的屏幕保护程序来完成这个工作,它能够通过互联网从我们的服务器上获得一个数据包,分析它并将 结果返回给我们。当你需要用你的计算机工作的时候,屏幕保护程序会立即退出,只有在你完成工作而不使用计算机的时候才开始继续进行分析的工作。
这是一项既有趣而又十分困难的任务。因为这里有太多的的数据要分析,几乎是不可能完成。好在这些要被分析的数据可以很容易的被分解成很多小的数据包,这些小的数据包可以同时被处理,因为它们之间是相互独立的。而且,目前只有很有限的天空能够被阿雷西博(Arecibo)射电望远镜扫描到。在未来的两年里,能过被望远镜扫描的天空将被扫描三次。我们认为对于 这个计划已经是足够了。到那个时候,我们将完成对天空的三次扫描后,我们将会有新的望远镜,新的试验和SETI计划的新的进展。我们希望,那个时候你还能够参加到我们的计划中来。
在位于波多黎各的阿雷西博(Arecibo)射电望远镜上,所有收集到的数据会被记录在高密度的 磁带上,每天都会有一个35G的DLT磁带存储着这些数据。由于阿雷西博(Arecibo)射电望 远镜和互联网没有足够的带宽,因此这些磁带不得不通过传统的邮递系统送到伯克利 (Berkeley)来。这些数据会被分解成大约0.25M大小的数据块(我们称之为“工作单元 (work unit)”)。这些工作单元会从SETI@home的服务器,经过互联网发送到世界各地的 人们那里进行分析。
-资料补充:数据是怎样被分解的


SETI@home会收集2.5M带宽内的数据,其中心频点在1420MHz。对于法送给你进行分析而 言,这依然是一个比较宽的带宽,所以我们将这个带宽分成了256份,即每份的带宽是10kHz (其实应该是9766Hz,但是我们为了计算方便而简化了这个数字)。数据分解的工作使用一种 叫“splitter”的软件完成的,这样10kHz的带宽就比较好使用了。要记录10kHz带宽的信号, 我们需要记录数据量约为每秒20000比特(20kbps)。(这叫做尼奎斯特(Nyquist)频率)我 们会发给你大约107秒这样的10kHz(20kbps)带宽的数据。100秒乘以20000比特等于 2000000比特,也就是说大约0.25M字节的数据,其中每字节是8比特。我们称这0.25M的数 据包为“工作单元(work unit)”。我们还要发送一些关于工作单元的附加的信息,所以工作 单元的大约是340k字节。
SETI@home只有在传送数据的时候才会通过互联网与你相连,也就是说只有在屏幕保护程序 完成对工作单元的分析后,需要发送结果或者获取新的工作单元的时候。我们只有在得到你的 许可和控制下才会让你的计算机与我们的服务器建立连接,你也可以通过一些选项来设置屏幕 保护程序在完成当前的工作单元后自动发送结果并获取新的工作单元。一般情况下,使用普通的调制解调器时,数据的传输不会超过5分钟,而且一旦数据的传输完毕,我们就会断开与你 的连接。

我们会利用在伯克利的数据库来对每一个工作单元进行跟踪。当工作单元被返回后,工作单元将被送回数据库并且做上“已完成”的标记。服务器会将一个新的工作单元发送给你进行分析 同时在数据库中为这个工作单元做上“进行中”的标记。为了保证数据被处理的正确性,我们会重复送出同一个工作单元,因为即使是正常工作的计算机也会偶尔出错。如果你无法完成当前的工作单元, 或者因为某种原因造成计算机死机而丢失分析结果的话,不用担心,数据是不会丢失的。
那么,你所做的一切对我们有哪些帮助呢?你要在工作单元里面寻找什么呢?简单的说,我们想 知道地球以外的生命是否发送了信息给我们。我们想知道,“他们”是否用他们认为最有效的 方式发送信息给我们,并能够让我们很容易的发现这些信息。目前已知的是,在多个频率上发 送信息不是最有效的,因为这样需要很多能量。如果能够把发送信息的能量集中在比较窄的频 率范围内(即窄带),那么这些信号会比较容易从背景噪声中分离出来。这一点非常重要,因 为我们认为“他们”离我们非常遥远,因此“他们”的信号在到达我们这里的时候已经非常微 弱了。所以,我们不会搜索宽带信号(即在很多频率上的信号),我们只在一些特定的频率上 搜索。SETI@home的屏幕保护程序就像收音机的调频器一样可以调节不同的频道,然后观察 在该频道上的信号强度。如果信号强度有变化,就会引起我们的注意。一个可以帮助我们区分本地的信号(即来自地球或其卫星的信号)的原因是,这些信号或多或 少都是连续的,而且它们基本上是恒定强度的信号。另一方面,阿雷西博(Arecibo)射电望远镜是固定在地面上的,因此随着地球的自转,它并不是在跟做某一特定的星体。正是由于这样, 天空对于射电望远镜来说是“漂移”的。通常,任何目标在“漂移”过射电望远镜的碟形天线 的焦点中线(或者说目标束)时大约要12秒的时间,所以我们希望能有一个“他们”的信号能够在这12秒的时间里发生由强变弱的变化,以便能让我们发现它。因为我们想要搜索这12秒 钟的“高斯(gaussian)”信号,所以我们发送给你大约100秒的数据。我们也需要在不同工作 单元内的数据有一定的交迭,我们不想因为数据包的分解而丢失一些重要的数据。

点击这里可以看到关于RFI(无线频率接口 Radio Frequency Interference)的更多信息

让我们来看一些实例。如果你安装了Real player的话,你也可以听一听根据这些信号模拟出来 的声音(但是注意这些信号是无线电信号而不是声音信号)。点击下面的图象就可以听到声音。


这张图片所显示的X轴是表示时间的流向,Y轴表示的是频率,或者说是不同频率信号的强 度。这里所看到的是宽频信号,也就是说很多不同频率的信号混在一起。要注意的是,图中信 号有微弱(暗的)开始,然后逐渐增强(明亮),在横轴中间大约6秒的位置达到最大值。这 也正是我们希望看到的地外生命的信号在“漂移”过射电望远镜时的情形。但是我们并不在宽 频信号内搜索,这可能是星体或者其他天体所产生的信号。因此,宽频信号是不合适的。

 

这张图片正是我们想要看到的。在这里我们可以看到是在一个比较窄的频带内的信号,信号在 这个12秒的频带内也是有强有弱的。我们尚不知道多窄的频带才是合适的,所以我们会搜索多 个这样的频带。

 
  
如果“他们”试图在“他们”的信号中加入一些有意义的信息,那么信号几乎可以肯定是脉冲 信号,就像这张图片显示的这样。

由于行星的自转,“他们”的信号发生器和我们的射电望远镜都是在沿着各自行星的中心轴做 圆形运动。这种运动的结果是在观察的过程中我们会发现有些频率变化了,也正是因为这种相对运 动,我们可以称这种现象为“多普勒漂移(doppler shifting)”或者信号的频率漂移。这有可能 会造成在这12秒钟某些频率信号的增加或消失,这就是所谓的“啁啾信号(Chirped Signal)”。我们也会检测这种信号。

  
当然我们也会搜索含有脉冲信号的多普勒漂移(啁啾)信号。


-资料补充:关于数据分析的更多信息
SETI@home的软件可以搜索比SERENDIP IV所能搜索的信号弱10倍的信号,因为它采用了 一种增强运算算法,称为“相干积分(coherent integration)”。目前还没有任何一台计算机 (包括SERENDIP程序)有足够的处理能力来独立实现这种方法。你的计算机对数据进行快速 傅立叶变换处理,在各种频率,带宽和啁啾速率中搜索较强的信号。你从我们这里获得的每一 个工作单元都会进行如下的步骤。
我们先来看一看最需要运算处理能力的部分。首先要做的工作是消除数据中的啁啾频率,也就 是说要消除多普勒效应的影响。最好的方法是,在-10Hz/秒到+10Hz/秒的频率内,步长为 0.002Hz/秒,进行约20000次的操作。在每一个啁啾频率上,对107秒的数据消除啁啾之后, 再将数据分成8块,每块13.375秒的数据块。每个13.375秒的数据块用0.07Hz的滤波器搜索,试图发现一些有意义的峰值信号(这意味着对每个啁啾频率上的每个数据块要进行约 131072次测试)。这样的话,有非常非常多的数据要处理。在这第一步的处理中,你的计算机 要进行约2000亿次的运算。而我们要做一些10Hz/秒到50Hz/秒之间的数据处理。
工作还没有完呢!因为我们还要搜索其他的频带。下一步,我们将滤波器的带宽加倍到 0.15Hz,同时因为滤波器的带宽加宽了,我们只需要检测四分之一的速率就可以了。在我们完 成上面的处理之后,我们只完成了四分之一的工作,或者说完成500亿次的运算。是不是太简 单了?
在下一步,我们再将滤波器的带宽加倍(从0.15到0.3Hz),同时将啁啾频率再减少四分之 一。这一步(包括这以后的后续步骤)的处理工作只是前一步的1/4。那么这里有125亿次运算 发生。就这样,对于那107秒的数据的连续14次的带宽加倍(0.07,0.15,0.3,0.6,1.2, 2.5,5,10,20,40,75,150,300,600和1200Hz)会产生总共2750亿次的运算。所以说, 我们主要对窄带的数据进行分析(大约70%的工作量)。
最后,那些在某些频率,带宽和啁啾组合下的比较强的信号实际上是从地球上产生的信号。只 有在12秒内产生并消失的信号(12秒钟正好是射电望远镜经过天空中某一点的时间)才有可 能被认为是地外生命的信号。同时,这样的超过某一门限的峰值信号会被记录下来。  

上述的工作是用来搜索那些持续的地外生命的信号的,那些信号是连续的,或者可以理解称为 强脉冲。那么如果我们的外星朋友发送的是一系列的有间隔的有规律的脉冲信号呢?那么我们 必须也要搜索那些有规律变化的信号。SETI@home使用了两种方法来搜索脉冲信号。一种是 用于搜索较强脉冲的三相脉冲法,另一种是可以用来搜索较平均但是较弱的脉冲信号。三相脉冲法其实很简单。在整个频谱上每个频段上,计算机将搜索那些超过特定门限的脉冲。 这个特定的门限要设定在一个合理的范围内才可以得到一定量的可能有意义的脉冲信号,否则 的话,会搜索到大量噪声脉冲,使我们进行很多无意义的运算。对于超越门限的每一对脉冲信 号,SETI@Home程序会搜索在这对脉冲信号中间的脉冲信号。如果找到了,屏幕保护程序会 自动纪录结果并将结果送回伯克利。屏幕保护程序会自动进行这样工作,所以它不会重复的处 理所有的脉冲信号。但是要记住,它必须对每一个10kHz的取样的频率段进行这样的操作。

第二种脉冲检测方法稍微有点复杂,这是SETI@home计划为这个目的特别开发的,称为“快速折叠算法(fast folding algorithm)”。同样,我们对每个10kHz的频率段进行处理。这种算 法可以检测数据包内大量的重复脉冲,这些脉冲可能很微弱,很容易被淹没在背景噪声中。我 们首先从数据包种选择一段频率进行分析,然后搜索脉冲的强度和周期之间的关系。屏幕保护 程序会将数据包分割成相同大小的块,然后将这些块相加。这样,如果块的大小正好与脉冲的周期(或多个周期)相同的话,那么脉冲信号就会因为叠加而增强,就会从背景噪声中显现出 来。最困难的是,我们必须能够将数据包分割成正确的大小。由于我们根本不知道脉冲的频率 是多少,所以我们不得不尝试不同的周期频率。同样,这种算法不会重复尝试那些已经完成的 工作,如果发现了重复的周期脉冲信号,程序会纪录它并将它发送会伯克利。你们的计算机需 要多长时间才能完成这些工作呢?平均的说,家庭计算机需要大约10到50个小时才能完成一个工作单元,而且假设你的计算机没有做其他的工作。

根据射电望远镜在纪录工作单元时的移动方式不同,你的计算机将要完成大约2.4万亿到3.8万亿次数学运算(专业术语应该是浮点运算),才能完成一个工作单元。
现在,你应该知道我们为什么需要你的帮助了
在我们讨论“会发生什么”之前,我们应该让你知道更多的关于“如果”的问题。其实,对于 你所分析的数据和结果,许多是无线电信号,而且很多都是从地球上产生的,认识到这一点时 非常重要的。电视机,雷达等都是微波发送器,卫星等天体也都是这样的无线电信号发生器。 同时有一些“测试信号”会被有意的加入到系统里面,SETI@Home计划可以利用这样的信号 来证明系统的软件和硬件都工作正常。阿雷西博(Arecibo)射电望远镜会收集所有的信号,然 后分发给你的屏幕保护程序进行处理。射电望远镜并不在意所收集到的信号的类型,就如同你 的耳朵并不会选择听到什么样的声音一样。你的屏幕保护程序会仔细检查所受到的数据包,搜 索那些比背景噪声“大”的信号和那些在12秒内产生并消失的信号(还记得吗?12秒钟正好 是射电望远镜扫过天空中某一点的时间)。

所有有价值的信号都会被送回伯克利,SETI@home计划会作进一步的分析。SETI@home维护 着一个庞大的关于已知的无线射频接口(RFI)的数据库,而且这个数据库在不断的更新。所以你的屏幕保护程序所检测的99.9999%的信号都会被认为已知的无限射频接口而被放弃掉,测 试信号也会被消除掉。

那些剩下的未知的信号会根据天空中同一位置的观测数据进行进一步的分析。由于 SETI@home计划不能控制射电望远镜,所以这个工作可能需要6个月的时间(也就是望远镜 转到同一位置所需要的时间)。如果,信号被认为有意义,SETI@home计划将会申请使用射电望远镜对这些数据所对应的天空进行专门的观察。

如果某个信号被重复观察了两次以上,而且确认不是已知的射频信号或者测试信号, SEIT@home计划会请另一个组织的人检查这个信号。他们将会使用不同的望远镜,接收机, 计算机等设备,希望这样能够消除由我们的设备和计算机程序所产生的错误。和其他组织一 起,SETI@home可以完成干涉测量法(干涉测量法需要由在两个具有相当距离的观测点共同 完成),这样就可以证明该信号是从其他星体发送来的。

如果得到的进一步的确认,SETI@home将会用国际天文联合会IAU(International astronomical Union)提供的电报格式发表一个声明。这是将重要的天文发现通知其他天文学团体的标准做 法。这样的电报包含了所有便于其他天文学团体研究和确认这个信号的所有信息,如频率,带 宽,位置等。使用屏幕保护程序发现这个信号的人将会和SETI@home计划的成员一样成为这个信号的共同发现人。但在这时,我们仍然无法确认这个信号是从其他智慧生命发送来的还是一个新的天文现象。

关于新的发现的所有信息都会公之于众,也许是通过网络或者其他方式。任何一个国家或个人 都不允许占用所观察信号的频带。由于目标信号各能出现在任何位置,所以全球范围内的无线 电观测是十分必要的,因此国家之间的共同努力是十分必要的。因此,所有的信息都应该是公 开的。

点击下面的连接可以看到官方的“关于搜索地外智慧的活动的原则的声明”。

基于这些原则,对SETI@home的参加者来说,不应该在发现了地外智慧的信号以后十分兴奋 的打电话给媒体,并发表自己的声明。这样作对整个计划是有害的。重要的是,我们应该保持 自己的头脑冷静,而让我们的计算机运转。我们都希望,我们能过成为接收到那些地外文明 “打电话回家”的信号的人。
............................................................................................................................................................

"伯克利开发架构网络计算 (BOINC)是一个项目的软件平台, 像distributed.net和 SETI@home一样, 把数百万志愿计算机作为一台并行巨型计算机。"平台的源代码是完全公开的, 我们鼓励那些对C++感兴趣的程序员帮助开发平台代码。BOINC的相关信息已被翻译为以下语种(您可以通过项目网站的链接访问到): 汉语, 爱沙尼亚语, 丹麦语,法语, 德语, 俄语, 西班牙语。

目前BOINC支持Windows, Linux,UNIX, 和Mac OSX平台。使用BOINC的项目客户端允许使用不同的CPU平台(平台无关性)。目前计划使用BOINC的项目有:BOINC Beta 测试,SETI@home,Folding@Home, climateprediction.net, 一个即将开始的由马里兰大学的复杂生物分析学和计算生物学中心主办的通过分析DNA 序列数据来研究导致结核病、麻疯病的分子变异和特殊细菌的项目。

3.19 Windows版的BOINC平台于2004年6月22日发布。3.18 Linux X86版于2004年6月19日发布。3.18 Mac OSX版于2004年6月19日发布。3.18 Solaris版于2004年6月19日发布。一个平台无关结构版, 允许您在任一个平台上运行BOINC于2004年2月1日发布。

平台参与者: 通过在项目站点注册帐户参加BOINC项目, 然后下载、运行BOINC客户端。它自动将设置自身参加那个项目。详见参加BOINC项目的更多相关信息。
回复

使用道具 举报

发表于 2005-1-29 14:00:27 | 显示全部楼层
这么多啊,简单来说,BOINC是平台,就像WINDOWS一样,SETI@HOME就是项目,就像你听音乐用的播放器,或是图像处理软件如PHOTOSHOP,或是看电影用的REALONE等运行在上面的程序。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-16 05:02

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表