1.堆积如山的数据
目前存在的绝大多数SETI程序,包括在加洲伯克利大学(UC Berkeley)大楼里大型计算机上运行的程序,都在实时的对从天文望远镜收集来的数据进行分析。这些计算机都没有对这些微弱的 信号进行深入的分析,也没有试图搜索更多种类的信号(关于信号的类型,将在后面讨论)。之所以没有这样做的原因是用来进行分析的计算机的处理能力是有限的。要想从大量的极其微弱的信号中发现什么的话,必须需要极其大量的计算机的处理能力,因此需要一台完全难以实现的超级计算机来完成这个工作。SETI计划根本不可能也没有能力建造或者购买这样的计算机,因此他们采取了另一种平衡的方法。那就是用比较小的计算机而花更多的时间来完成这个工作,而不是用超级计算机和比较短的时间内完成这个工作。但是新的问题是,这样就会有许许多多的堆积如山的数据等待处理。那么,他们是否可以利用大量的这种小型计算机同时处理不同的数据呢?SETI计划能在那里找到成千上万的计算机,并且能过不断的处理从阿雷西博(Arecibo)射电望远镜收集的数据呢?
伯克利(UC Berkeley)的SETI计划的成员注意到已经有成千上万的计算机是可以利用的。这些计算机中有很多通常都是什么也不做,只是在运行屏幕保护,白白的浪费电。因此,SETI@home也就产生了。SETI@home希望你能够允许我们在你不使用计算机的时候借用它来帮助我们“……寻找新的生命形式,寻找新的文明”。我们将利用运行在你的计算机上的屏幕保护程序来完成这个工作,它能够通过互联网从我们的服务器上获得一个数据包,分析它并将结果返回给我们。当你需要用你的计算机工作的时候,屏幕保护程序会立即退出,只有在你完成工作而不使用计算机的时候才开始继续进行分析的工作。
这是一项既有趣而又十分困难的任务。因为这里有太多的的数据要分析,几乎是不可能完成。好在这些要被分析的数据可以很容易的被分解成很多小的数据包,这些小的数据包可以同时被处理,因为它们之间是相互独立的。而且,目前只有很有限的天空能够被阿雷西博(Arecibo)射电望远镜扫描到。在未来的两年里, 能过被望远镜扫描的天空将被扫描三次。我们认为对于这个计划已经是足够了。到那个时候,我们将完成对天空的三次扫描后,我们将会有新的望远镜,新的试验和SETI计划的新的进展。我们希望,那个时候你还能 够参加到我们的计划中来。
2.数据包的分解
在位于波多黎各的阿雷西博(Arecibo)射电望远镜上,所有收集到的数据会被记录在高密度的磁带上,每天都会有一个35G的DLT磁带存储着这些数据。由于阿雷西博(Arecibo)射电望远镜和互联网没有足够的带宽,因此这些磁带不得不通过传统的邮递系统送到伯克利 (Berkeley)来。这些数据会被分解成大约0.25M大小的数据块(我们称之为“工作单元 (work unit)”)。这些工作单元会从SETI@home的服务器,经过互联网发送到世界各地的人们那里进行分析。
资料补充:数据是怎样被分解的?
SETI@home会收集2.5M带宽内的数据,其中心频点在1420MHz。对于法送给你进行分析而言,这依然是一个比较宽的带宽,所以我们将这个带宽分成了256份,即每份的带宽是10kHz(其实应该是9766Hz,但是我们为了计算方便而简化了这个数字)。数据分解的工作使用一种叫“splitter”的软件完成的,这样10kHz的带宽就比较好使用了。要记录10kHz带宽的信号,我们需要记录数据量约为每秒20000比特(20kbps)。(这叫做尼奎斯特(Nyquist)频率)我们会发给你大约107秒这样的10kHz(20kbps)带宽的数据。100秒乘以20000比特等于2000000比特,也就是说大约0.25M字节的数据,其中每字节是8比特。我们称这0.25M的数据包为“工作单元(work unit)”。我们还要发送一些关于工作单元的附加的信息,所以工作 单元的大约是340k字节。
3.发送出的数据
SETI@home只有在传送数据的时候才会通过互联网与你相连,也就是说只有在屏幕保护程序完成对工作单元的分析后,需要发送结果或者获取新的工作单元的时候。我们只有在得到你的许可和控制下才会让你的计算机与我们的服务器建立连接,你也可以通过一些选项来设置屏幕 保护程序在完成当前的工作单元后自动发送结果并获取新的工作单元。一般情况下,使用普通的调制解调器时,数据的传输不会超过5分钟,而且一旦数据的传输完毕,我们就会断开与你的连接。
我们会利用在伯克利的数据库来对每一个工作单元进行跟踪。当工作单元被返回后,工作单元将被送回数据库并且做上“已完成”的标记。服务器会将一个新的工作单元发送给你进行分析 同时在数据库中为这个工作单元做上“进行中”的标记。为了保证数据被处理的正确性,我们会重复送出同一个工作单元,因为即使是正常工作的计算机也会偶尔出错。如果你无法完成当前的工作单元,或者因为某种原因造成计算机死机而丢失分析结果的话,不用担心,数据是不会丢失的。
4. SETI@home在寻找什么?
那么,你所做的一切对我们有哪些帮助呢?你要在工作单元里面寻找什么呢?简单的说,我们想知道地球以外的生命是否发送了信息给我们。我们想知道,“他们”是否用他们认为最有效的方式发送信息给我们,并能够让我们很容易的发现这些信息。目前已知的是,在多个频率上发送信息不是最有效的,因为这样需要很多能量。如果能够把发送信息的能量集中在比较窄的频率范围内(即窄带),那么这些信号会比较容易从背景噪声中分离出来。这一点非常重要,因为我们认为“他们”离我们非常遥远,因此“他们”的信号在到达我们这里的时候已经非常微弱了。所以,我们不会搜索宽带信号(即在很多频率上的信号),我们只在一些特定的频率上搜索。SETI@home的屏幕保护程序就像收音机的调频器一样可以调节不同的频道,然后观察在该频道上的信号强度。如果信号强度有变化,就会引起我们的注意。一个可以帮助我们区分本地的信号(即来自地球或其卫星的信号)的原因是,这些信号或多或少都是连续的,而且它们基本上是恒定强度的信号。另一方面,阿雷西博(Arecibo)射电望远镜是固定在地面上的,因此随着地球的自转,它并不是在跟做某一特定的星体。正是由于这样,天空对于射电望远镜来说是“漂移”的。通常,任何目标在“漂移”过射电望远镜的碟形天线的焦点中线(或者说目标束)时大约要12秒的时间,所以我们希望能有一个“他们”的信号能够在这12秒的时间里发生由强变弱的变化,以便能让我们发现它。因为我们想要搜索这12秒钟的“高斯(gaussian)”信号,所以我们发送给你大约100秒的数据。我们也需要在不同工作单元内的数据有一定的交迭,我们不想因为数据包的分解而丢失一些重要的数据。
点击
这里可以看到关于RFI(无线频率接口 Radio Frequency Interference)的更多信息,或者浏览
第5楼帖子
让我们来看一些实例。如果你安装了Real player的话,你也可以听一听根据这些信号模拟出来的声音(但是注意这些信号是无线电信号而不是声音信号)。点击下面的图象就可以听到声音。

这张图片所显示的X轴是表示时间的流向,Y轴表示的是频率,或者说是不同频率信号的强度。这里所看到的是宽频信号,也就是说很多不同频率的信号混在一起。要注意的是,图中信号有微弱(暗的)开始,然后逐渐增强(明亮),在横轴中间大约6秒的位置达到最大值。这 也正是我们希望看到的地外生命的信号在“漂移”过射电望远镜时的情形。但是我们并不在宽频信号内搜索,这可能是星体或者其他天体所产生的信号。因此,宽频信号是不合适的。

这张图片正是我们想要看到的。在这里我们可以看到是在一个比较窄的频带内的信号,信号在这个12秒的频带内也是有强有弱的。我们尚不知道多窄的频带才是合适的,所以我们会搜索多个这样的频带。

如果“他们”试图在“他们”的信号中加入一些有意义的信息,那么信号几乎可以肯定是脉冲信号,就像这张图片显示的这样。

由于行星的自转,“他们”的信号发生器和我们的射电望远镜都是在沿着各自行星的中心轴做圆形运动。这种运动的结果是在观察的过程中我们会发现有些频率变化了,也正是因为这种相对运动,我们可以称这种现象为“多普勒漂移(doppler shifting)”或者信号的频率漂移。这有可能会造成在这12秒钟某些频率信号的增加或消失,这就是所谓的“啁啾信号(Chirped Signal)”。我们也会检测这种信号。

当然我们也会搜索含有脉冲信号的多普勒漂移(啁啾)信号。
资料补充:关于数据分析的更多信息
SETI@home的软件可以搜索比SERENDIP IV所能搜索的信号弱10倍的信号,因为它采用了一种增强运算算法,称为“相干积分(coherent integration)”。目前还没有任何一台计算机 (包括SERENDIP程序)有足够的处理能力来独立实现这种方法。你的计算机对数据进行快速傅立叶变换处理,在各种频率,带宽和啁啾速率中搜索较强的信号。你从我们这里获得的每一个工作单元都会进行如下的步骤。
我们先来看一看最需要运算处理能力的部分。首先要做的工作是消除数据中的啁啾频率,也就是说要消除多普勒效应的影响。最好的方法是,在-10Hz/秒到+10Hz/秒的频率内,步长为 0.002Hz/秒,进行约20000次的操作。在每一个啁啾频率上,对107秒的数据消除啁啾之后,再将数据分成8块,每块13.375秒的数据块。每个13.375秒的数据块用0.07Hz的滤波器搜索,试图发现一些有意义的峰值信号(这意味着对每个啁啾频率上的每个数据块要进行约131072次测试)。这样的话,有非常非常多的数据要处理。在这第一步的处理中,你的计算机要进行约2000亿次的运算。而我们要做一些10Hz/秒到50Hz/秒之间的数据处理。
工作还没有完呢!因为我们还要搜索其他的频带。下一步,我们将滤波器的带宽加倍到 0.15Hz,同时因为滤波器的带宽加宽了,我们只需要检测四分之一的速率就可以了。在我们完成上面的处理之后,我们只完成了四分之一的工作,或者说完成500亿次的运算。是不是太简单了?
在下一步,我们再将滤波器的带宽加倍(从0.15到0.3Hz),同时将啁啾频率再减少四分之 一。这一步(包括这以后的后续步骤)的处理工作只是前一步的1/4。那么这里有125亿次运算发生。就这样,对于那107秒的数据的连续14次的带宽加倍(0.07,0.15,0.3,0.6,1.2, 2.5,5,10,20,40,75,150,300,600和1200Hz)会产生总共2750亿次的运算。所以说,我们主要对窄带的数据进行分析(大约70%的工作量)。
最后,那些在某些频率,带宽和啁啾组合下的比较强的信号实际上是从地球上产生的信号。只有在12秒内产生并消失的信号(12秒钟正好是射电望远镜经过天空中某一点的时间)才有可能被认为是地外生命的信号。同时,这样的超过某一门限的峰值信号会被记录下来。
5.搜索脉冲信号
上述的工作是用来搜索那些持续的地外生命的信号的,那些信号是连续的,或者可以理解称为强脉冲。那么如果我们的外星朋友发送的是一系列的有间隔的有规律的脉冲信号呢?那么我们必须也要搜索那些有规律变化的信号。SETI@home使用了两种方法来搜索脉冲信号。一种是 用于搜索较强脉冲的三相脉冲法,另一种是可以用来搜索较平均但是较弱的脉冲信号。三相脉冲法其实很简单。在整个频谱上每个频段上,计算机将搜索那些超过特定门限的脉冲。 这个特定的门限要设定在一个合理的范围内才可以得到一定量的可能有意义的脉冲信号,否则的话,会搜索到大量噪声脉冲,使我们进行很多无意义的运算。对于超越门限的每一对脉冲信号,SETI@Home程序会搜索在这对脉冲信号中间的脉冲信号。如果找到了,屏幕保护程序会自动纪录结果并将结果送回伯克利。屏幕保护程序会自动进行这样工作,所以它不会重复的处理所有的脉冲信号。但是要记住,它必须对每一个10kHz的取样的频率段进行这样的操作。
第二种脉冲检测方法稍微有点复杂,这是SETI@home计划为这个目的特别开发的,称为“快速折叠算法(fast folding algorithm)”。同样,我们对每个10kHz的频率段进行处理。这种算 法可以检测数据包内大量的重复脉冲,这些脉冲可能很微弱,很容易被淹没在背景噪声中。我们首先从数据包种选择一段频率进行分析,然后搜索脉冲的强度和周期之间的关系。屏幕保护程序会将数据包分割成相同大小的块,然后将这些块相加。这样,如果块的大小正好与脉冲的周期(或多个周期)相同的话,那么脉冲信号就会因为叠加而增强,就会从背景噪声中显现出来。最困难的是,我们必须能够将数据包分割成正确的大小。由于我们根本不知道脉冲的频率是多少,所以我们不得不尝试不同的周期频率。同样,这种算法不会重复尝试那些已经完成的工作,如果发现了重复的周期脉冲信号,程序会纪录它并将它发送会伯克利。你们的计算机需要多长时间才能完成这些工作呢?平均的说,家庭计算机需要大约10到50个小时才能完成一个工作单元,而且假设你的计算机没有做其他的工作。
根据射电望远镜在纪录工作单元时的移动方式不同,你的计算机将要完成大约2.4万亿到3.8万亿次数学运算(专业术语应该是浮点运算),才能完成一个工作单元。
现在,你应该知道我们为什么需要你的帮助了。
6. 如果我的计算机发现了外星人
在我们讨论“会发生什么”之前,我们应该让你知道更多的关于“如果”的问题。其实,对于你所分析的数据和结果,许多是无线电信号,而且很多都是从地球上产生的,认识到这一点时非常重要的。电视机,雷达等都是微波发送器,卫星等天体也都是这样的无线电信号发生器。 同时有一些“测试信号”会被有意的加入到系统里面,SETI@Home计划可以利用这样的信号来证明系统的软件和硬件都工作正常。阿雷西博(Arecibo)射电望远镜会收集所有的信号,然后分发给你的屏幕保护程序进行处理。射电望远镜并不在意所收集到的信号的类型,就如同你的耳朵并不会选择听到什么样的声音一样。你的屏幕保护程序会仔细检查所受到的数据包,搜索那些比背景噪声“大”的信号和那些在12秒内产生并消失的信号(还记得吗?12秒钟正好是射电望远镜扫过天空中某一点的时间)。
所有有价值的信号都会被送回伯克利,SETI@home计划会作进一步的分析。SETI@home维护着一个庞大的关于已知的无线射频接口(RFI)的数据库,而且这个数据库在不断的更新。所以你的屏幕保护程序所检测的99.9999%的信号都会被认为已知的无限射频接口而被放弃掉,测试信号也会被消除掉。
那些剩下的未知的信号会根据天空中同一位置的观测数据进行进一步的分析。由于 SETI@home计划不能控制射电望远镜,所以这个工作可能需要6个月的时间(也就是望远镜转到同一位置所需要的时间)。如果,信号被认为有意义,SETI@home计划将会申请使用射电望远镜对这些数据所对应的天空进行专门的观察。
如果某个信号被重复观察了两次以上,而且确认不是已知的射频信号或者测试信号,SEIT@home计划会请另一个组织的人检查这个信号。他们将会使用不同的望远镜,接收机,计算机等设备,希望这样能够消除由我们的设备和计算机程序所产生的错误。和其他组织一起,SETI@home可以完成干涉测量法(干涉测量法需要由在两个具有相当距离的观测点共同 完成),这样就可以证明该信号是从其他星体发送来的。
如果得到的进一步的确认,SETI@home将会用国际天文联合会IAU(International astronomical Union)提供的电报格式发表一个声明。这是将重要的天文发现通知其他天文学团体的标准做法。这样的电报包含了所有便于其他天文学团体研究和确认这个信号的所有信息,如频率,带宽,位置等。使用屏幕保护程序发现这个信号的人将会和SETI@home计划的成员一样成为这个信号的共同发现人。但在这时,我们仍然无法确认这个信号是从其他智慧生命发送来的还是一个新的天文现象。
关于新的发现的所有信息都会公之于众,也许是通过网络或者其他方式。任何一个国家或个人都不允许占用所观察信号的频带。由于目标信号各能出现在任何位置,所以全球范围内的无线电观测是十分必要的,因此国家之间的共同努力是十分必要的。因此,所有的信息都应该是公开的。
点击下面的连接可以看到官方的“关于搜索地外智慧的活动的原则的声明”。
基于这些原则,对SETI@home的参加者来说,不应该在发现了地外智慧的信号以后十分兴奋的打电话给媒体,并发表自己的声明。这样作对整个计划是有害的。重要的是,我们应该保持 自己的头脑冷静,而让我们的计算机运转。我们都希望,我们能过成为接收到那些地外文明 “打电话回家”的信号的人。
[
本帖最后由 BiscuiT 于 2007-7-25 14:09 编辑 ]