SETI@home:屏幕保护

来自中国分布式计算总站
Ledled讨论 | 贡献2013年12月3日 (二) 23:09的版本 数据信息: 更换图片地址
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索
传统客户端(SETI@home Classic)屏幕保护图形
改用BOINC计算平台的屏幕保护图形

SETI@home屏幕保护

在操作系统下启用了屏幕保护程序,当机器在超过设定时间无任何操作后,屏幕保护程序随即启动。右边视图分别是SETI@home Classic传统客户端的屏幕保护图形(该项目已终止),和改用BOINC计算平台的现时运行中的SETI@home的屏幕保护程序。

总述

SETI@home是一个复杂的科学分析软件。它对您从伯克利SETI项目下载的数据进行了大量的数学运算。您从屏保中看到的仅仅是对您的电脑所正在进行的运算的一个扫视。SETI@home屏保显示可分为四个主要的部分。

  • 用户信息
    • 该部分给出了参与Seti的计算者的账户名、所在团队、用户的Seti积分。
  • 数据信息
    • 该部分给出了当前程序正在计算的数据的空域信息、数据的记录时间、数据所来源于的望远镜、数据所正在分析的无线电频谱。同时,您可以从WU的名称来看出信息的记录时间。
    • 如:03mr07aa.15285.15205.3.4.49 的开头,03mr07表示的是,记录时间为:07年mr(3月)03日~
  • 数据分析
    • 该部分给出了Seti是如何工作的,以及数据分析区所显示的图形和文字的含义。
  • 频率-时间-能量 图
    • 该部分内容将会告诉您,Seti下方快速变动的图形是在干什么?

Sah scr1.jpg



数据信息

本部分包含了当前正在处理的数据块的信息。对于我们来说,精准和详尽的掌握这些数据非常重要。因为这样能使我们将其记录在我们的数据库内。倘若发现了一个信号,该信息将帮助我们到那片空域去再次检查无线电频谱的相关部分,以便于对我们的结果进行核对。

我正在观察哪里?

本部分的第一行显示了数据被获取的空中方位。这也是望远镜所指向的位置,或者更准确的说,那个时刻正好处于望远镜前方的空域。在地球上,您需要两个坐标,纬度和经度,来对地球上的某点进行定位。同样地,在天空中您也需要两个坐标来找到“天球”上的某一目标。在天空中这两个坐标被称为“赤经(right ascension)”和“赤纬(declination)”。纬度(Latitude)和赤纬(declination)使用完全相同的方法进行测量,以零度赤道(在赤纬中称为天赤道)作为起始,并以向北90度作为北极,-90度作为南极。赤经(Right ascension)和经度(longitude)有一些不同。经度以穿越英格兰格林威治的格林威治子午线作为起始,向东向西进行测量。您可以向东或向西 180度,直到您到达了地球背面的国际日期变更线。而赤经仅以一个方向进行测量,向东测量,并且以“时、分、秒”而非“度”来进行测量。总计有24个小时,每个小时被分为60分钟,每分钟被分为60秒。这样可以把天空的旋转与地球的旋转很好的联系起来。您能够通过查看第一行的RA(赤经)和Dec(赤纬)来得知您的数据在天空中被记录的位置,并可在天图(star chart)上查到该坐标。

请注意Arecibo望远镜仅能观察到大约1/3的天空。该望远镜的位置是固定的,并且仅能在移动接受天线的情况下指向一个有限的范围。SETI@home搜索被限制在北纬0度至35度之间。

该望远镜的射电束大约是1/10度那么宽,还有,重现在您的数据段中的107秒的数据汇集,大约相当于望远镜射电束回转了0.6度的空域。因而您的数据占据了天空(天图)中一个高为1/10度、宽为6/10度的空域。

我正在观察的时间?

数据信息区域的第二行显示了数据的记录时间。请注意这里给出的时间是GMT(格林威治标准时间)。这是处于零度经线的英格兰皇家格林威治天文台的时间。所有的天文学家都使用这一标准,以便消除世界上不同时区所带来的混乱。您将收到以第二行所显示的时间为中心的107秒的时间段内所记录的数据。

我正在使用的望远镜?

下一行为您指出了数据源,称为Arecibo Radio Observatory(射电天文台)。除去某些自然灾害毁坏了该望远镜的情况的话,这里显示的天文台不大可能会改变。

我正在分析的频率?

最后一行为您指出的是您正在分析的数据的基础频率。SETI@home探寻一个 2.5 MHz宽的无线电频谱波段。SETI@home项目把这一宽波段分为更方便管理的信息块,大约每个有 10 kHz (事实上是 9765 Hz)。这意味着为SETI@home记录的每107秒数据实际上生成了256个数据块!基础频率的数字将告诉您在这 2.5 MHz 的波段中,您的这一个 10 kHz 的波段的位置在哪里。


综合了所有这些行,您就知道了在空域的地点、时间、监听的频段以及数据的来源。这样您也得知了能够唯一确定数据块的所有信息。

在天空中的哪里?

Sah scr skymap.png

即使阿雷西博射电望远镜的碟形天线被固定地直指向天顶,它仍能在有限的范围内进行定向。这是通过沿着弓形轨道移动接受天线来完成的。这使望远镜能够“看到”南纬2度和北纬38度之间的天空。我们在图上以浅灰色来标注了这一区域。试试看您能否找出您的任务包所记录的空域。请您注意,天空是非常广阔的区域!您可能需要向右侧卷动以便于观看到整个宇宙!

带有天线的弓形经度轨道被安装在一个环形轨道上。通过结合了这两种运动的天线,望远镜能够对目标进行长达3小时的追踪。事实上尽管如此,SETI@home对追踪目标并不感兴趣,而是宁愿让它们在天线保持静止的时候从望远镜上“飘过”。

数据分析

这里是产生所有运算的地方。尽管其他两个文本区域在数据处理过程中保持不变,但是这个部分是随着您电脑的工作而动态变化的。该部分屏幕包括了在对任务进行分心的任意时刻下,有关您电脑正在进行的工作的大量的相关信息。对该区域的关注将有助于您了解SETI@home正在对那些数据进行怎样的处理。

屏保程序正在做什么?

第一行将告诉您程序正在做的事情。它可能显示多种情况中的一种。我们将在下方列出并解释它们。(注:我在这里仅挑选出几个比较常见的,而且该版本英文原文主要是针对Classic版本进行描述的)

Doing Baseline Smoothing 进行基线滤波

当您从伯克利的服务期收到一个新的WU的时候,将会有各种各样的信号混杂在其中。我们仅仅对寻找那些窄带信号有兴趣。这些窄带信号被我们认为是有可能是某个外星文明用来通讯的。另一方面,宽带信号更像是由自然界的天体所产生的。为了拒绝这些宽带噪音,我们的屏保程序对数据进行了一种“平均”,来消除宽带噪音,并将其他所有窄带信号降低(或提高)到一个共有的“基线(baseline)”水平。还有,在这107秒中,信号有时会缓慢的变强和/或变弱 (louder and/or softer)。基线滤波将它们全部调校至一个相同的水平。这是您收到WU之后对数据所作的第一件事,并且通常这只做一次。某些客户端(比如Mac客户端)并不把滤波后的数据存储在RAM中,所以每当屏保启动时都需重新计算这一过程。一个进度条将显示在右侧,以便告诉您究竟电脑把这一过程进行了多少。

Computing Fast Fourier Transform 计算快速傅里叶变换

这里是所有需要做的工作。提供给您的来自望远镜的数据是随时间变化的信号 -就像随着您的声音变化而引起与麦克风相连的示波器的线条上下波动一般。在该情况下,时间沿着水平的X轴变化而信号强度(气压)沿着垂直的Y轴变化。原始的射电望远镜信号对我们没有多大的用处。我们想要看到的是在信号中是否存在恒定的(和强的)“声调(tones)”。我们更希望看到一幅图,其中频率随着水平的X轴变化,能量随着垂直的Y轴变化。某一单一频率图像中的任何尖突都可能是一个强信号(loud signal)。

为了将一组时域的数据转换为一组频域的数据,我们应用了一个相关的复杂的数学运算,称为“快速傅里叶变换”或FFT。欲知更多关于FFT的信息,请参考有关数字信号处理(DSP)的书籍。

该处理过程的结果将被生成在屏保里本区域下方的画面中。您可能会注意到有关FFT的一些有趣的事情。在一个WU的起始阶段,我们进行了15次不同的 FFT,每种变换对数据有着不同的精确度。我们开始寻找小至 .07 Hz 宽的细节内容。当您做这类分析时需要有所权衡。如果您希望得到非常精确的频率,您将不得不花费更多的时间来观测这些数据。您将注意到,在0.075 Hz 频率分解(frequency resolution)中,我们必须以13.42秒为长度来处理数据块。为了完成分析我们的107秒的样本,我们需要做8次FFT。当我们减少频率分解到 0.14 Hz我们将仅仅需要处理长度为6.7秒的样本数据。我们现在有较少的频率分解,但我们有较多的时间分解(time resolution)。我们需要花费双倍的数目(16次FFT)来覆盖我们的107秒的数据!我们在分析过程中进行15种不同的频率分解(0.075, 0.15,0.3,0.6,1.2,2.5,5,10,20,40,75,150,300,600 和 1200 Hz)。随着每次的频率分解的减半,我们需要进行双倍数量的FFT,才能够覆盖整个107秒数据。这一捣弄数据的数量真是令人头晕!

再次的,显示在右侧的进度条将让您知道电脑进行的每组FFT的进度。您也同样能够在下面的区域看到FFT的集聚的图形。

Chirping Data 啁啾数据

一个外星人的星球相对于我们的地球保持静止是完全不可能的。您应记得人类正在随着一个绕着太阳旋转的自转着的星球疾驰,而太阳本身也在绕着我们的银河系中心转动。我们可假设我们的地球之外的朋友也有着同样的处境。

这里有一个有趣的结果,就是所有这些运动都将有信号从移动的源发出和/或在移动的星球上接收(all this motion will have on a signal emitted from a moving source and/or received on a moving planet.)。这就是多普勒效应。您无疑是对此非常熟悉的,就像您听到一辆汽车一边鸣笛一边从您身边驶过一般。声音的频率,或定调,会随着卡车的经过而不断变化。您可以出门去亲身体会一下。站在路边并倾听一个朋友鸣着笛从您身边驶过。您也可从一辆固定着的鸣笛的汽车旁飞奔而过,同样您也会听到音调的变化。这就是非常重要的相对速度。

虽然我们的遥远的朋友并未对我们鸣笛,但他们正对我们发送电磁波。他们的信号将会因我们两个系统共同的运动而失真,就像汽车的笛声失真一般。为了解开这个,SETI@home的屏保将通过尝试大量可能的多普勒加速度来多次分析这些数据。事实上,屏保程序首先得到原始数据,然后通过算术方法地“撤销 (undo)”一个特定的多普勒加速度或“chirp(唧唧叫的)”。然后将这些“逆-加速(de-accelerated)”的结果数据送至FFT(快速傅里叶变换)程序。这被称为“De-chirping”这些数据。SETI@home试图从介于 -50 Hz/sec 至 +50 Hz/sec 的多个点来进行这项工作。在最佳的0.075 Hz的频率分解,我们测试了5049种不同的chirp rates,在 -10 Hz/sec 和 +10 Hz/sec之间!

Searching For Gaussians 搜索高斯信号

正如在FFT部分简要解释的那样,当频率分解比较粗糙的时候,时间分解将比较精细。当时间分解足够高的时候,我们可以观察数据,来看信号是否会在它们经过望远镜视野的12秒内变强和变弱。这是一个极好的测试,可以告诉我们某个信号是否“就在那里”而不是某个来自地球的简单的干扰源。一个地面信号将不会在我们所感兴趣的12秒时间段内变强再变弱。这一曲线拟合将检验信号是否再12秒内由弱变强再由强变弱。该测试仅被应用于大于或等于0.59 Hz的频率分解。

由于我们正在搜索这样的12秒“高斯信号”,所以您的107秒的数据中与前后的块都各有15秒钟的数据交叠。这样我们就能保证不会因为把一个重要信号从中间切开而错过这一重要信号。

Searching For Pulses / Triplets 搜索脉冲 / 三重线

在SETI@home客户端中的一个新特性是查找无线电信号中的重复脉冲。我们的外星邻居可能不会发送一个完美的平声来让我们侦测。它们可能发送一系列窄间隔或宽间隔的脉冲集。这将是更加经济有效的传送方式,如果他们正在有意这么做的话(而且如果他们是无意的,谁能知道他们发送的是什么!)对于所有的大于或等于 .59Hz 的频率分解,屏保程序都将对重复的或三个一组的脉冲进行搜索。


Doppler Drift Rate 多普勒漂移速率

数据分析面板的第二行包括了当前的“多普勒漂移速率”。对数据的最初的测试假定了 0 Hz/秒的漂移速率。这些未被加速的信号更像是来自陆基的无线电频率干扰(radio frequency interference (RFI))的发射源。在 -10 Hz/sec 和 +10 Hz/sec 的漂移速率之间尝试所有的15种频率分解,并且在各次FFT之间以 0.002 Hz/sec 来递增多普勒漂移速率。在 +-10 和 +-50 之间我们采用 0.296 Hz/sec 的增量。

Frequency Resolution 频率分解

第二行同时也显示了我们当前的计算中正在使用的频率分解(带宽)。您将注意到大多数时间中,我们将以 0.075 Hz 的频率分解来计算FFT。每隔4次FFT,我们将做一次 0.14 Hz 的频率分解。每隔16次FFT,我们将做一次 0.29 Hz 的频率分解。每隔64次FFT... 好了,你知道我的意思。请别忘记我们有15种不同的频率分解(0.075,0.15,0.3,0.6,1.2,2.5,5,10,20,40,75, 150,300,600 和 1200 Hz)。如果多普勒漂移速率高于 10 Hz/sec 或低于 -10 Hz/sec,我们就不再讨论那最佳的两种频率分解(0.075 Hz 和 0.15 Hz)。

Analysis Results 分析结果

数据分析面板的下一个部分显示了到当前为止,所发现的关于最佳高斯信号、脉冲、三重线的中间结果。面板的该部分在这三种结果中间轮流切换,但仅在发现了一个有用的重要结果时。举个例子,如果没有重要的三重线,您将不会看到有三重线被显示。

Best Gaussian 最佳高斯信号

如果一个信号强于平均噪声,而且以“高斯信号”的方式由弱变强再由强变弱,就像目标经过望远镜的电波束一般,那么我们会非常感兴趣的。

标记着“power”的数字表示了该信号与上述计算的基线能量的相关度有多强。标记着“fit”的数字是对一个上升和下降的信号与理想的高斯信号(钟状曲线(bell curve))外形的匹配度的测量。“fit”的数字越低,则表明匹配度越佳。(这事实上是一个X方匹配(chi-square fit),也就是体现该数据与理想高斯信号的差距有多大。)即使您发现了一个强的峰值和一个低的匹配数,也请不要通知媒体或向世界宣布您已经发现了外星人。任何强信号在成为“官方认可”之前,都必须通过多种方法进行核实以便排除无线电频率干扰源(RFI)(翻译在这里)的影响。由于优势噪声可能随机地模拟成高斯信号,所以我们已经设置了一个极限来避免被那些微不足道的无用结果所淹没。如果那些信号强于平均噪声水平的3.2倍,并有一个小于10的匹配指数,它们将被回馈给我们设在伯克利的服务器。

处于能量和匹配指数下方的图标显示了曲线的匹配分析,以及该WU运算以来所发现的最佳高斯信号。注意:如果在观察过程中,望远镜对空域的回转过慢或过快,那么将不会有此类图形被显示。

Sah scr gaussian.gif

红色线条表示了当前的真实数据 - 给定频率下的能量随时间的变化。这一视图也是您屏保下方所显示的大图表自后向前的切片。每当高斯匹配变换到一个新的频率,这里图像的样子都会随之改变。白色的线条表示了与该数据最佳匹配的高斯信号,也正是您的客户端实际上正在计算的东西!

在每个数据点我们都尝试一个新的匹配。您可通过快速变化的白线来观察到这一点。若不是分析过程发生的如此之快,您将会看到,在我们尝试最佳匹配的过程中,高斯信号(白线上的隆起)从图像的左侧一直移动到右侧。

Best Pulse 最佳脉冲

为了寻找一系列重复的弱脉冲,SETI@home的屏保程序应用了一项称为“快速折叠算法(fast folding algorithm)”的特别的测试。如果程序发现了一组重复的脉冲,它将统计描述所发现的情况并显示出来。

Sah scr pulse.gif

标记着“power”的数字表示了该信号与上述计算的基线能量的相关度有多强。标记着“period”的数字是对脉冲间隔的秒数长短的测量。由于RFI和随机噪声都有可能模拟为一个脉冲信号,我们在这里也同样设置了一个极限值。该极限值被动态的计算出来,依赖于周期(period)和该数据被折叠 (fold 展开?)的次数。(对于讨厌数学的人,这涉及到转换一个“不完全γ函数(incomplete gamma function)”。) 脉冲的计分值(score value)指脉冲振幅对极限值的比率。当您的屏保向伯克利回馈结果的时候,将会把计分值大于1的脉冲一并上报。

在能量、周期和计分值下方的图表显示了脉冲的分析,以及该WU运算以来所发现的最佳脉冲。注意:如果没有发现重要的脉冲,那么将不会有此类图形被显示。

如上面的高斯信号一般,红线表示了当前的真实数据 - 给定频率下的能量随时间的变化。与高斯信号不同,该图表大概不会覆盖整个107秒数据,但一定会覆盖脉冲的两倍周期(图标上方“period”值的两倍)。您能够在噪声中看到2个明显的尖突。图的左右两侧是一样的。显示两个周期将使您更简单的看到这些脉冲。

欲知更多的SETI@home数据分析的技术性描述,请查阅这里的SETI@home天空观测论文(Sky Survey paper)

Best Triplet 最佳三重线

SETI@home客户端还要对脉冲再做一项测试。该测试用于寻找三联的等间距脉冲。为了进行这项测试,屏保程序将检查每一对儿高于某一极限能量的脉冲。然后客户端在这两个脉冲的中间来寻找第三个脉冲。如果发现了这样的脉冲,他们将被记录并传回到伯克利。

Sah scr triplet.gif

如果发现了一组三重线,将有一条线被显示,来表示这组脉冲的能量(与噪声基线相关)(power),以及用秒表示的脉冲相隔的时间(period)。

在power和period数据下方的图表显示的是该WU运算以来所发现的最佳的三重线。三重线将会用短的黄线来轻轻的标记。注意:如果没有发现重要的脉冲,那么将不会有此类图形被显示。

频率-时间-能量 图

您可在这里观察正在计算中的快速傅里叶变换的图形。频率沿着水平的X轴变化,能量沿着垂直的Y轴变化,时间沿着自内向外的Z轴变化。这里你可能会注意不同频率分解中的FFT的不同。在0.075 Hz的分解下,您将注意到我们仅需进行8次FFT来完成整个107秒的数据。这与需要进行16次FFT的0.14 Hz 的分解是不同的。每当我们把频率分解减半(加倍带宽),我们就会得到两倍的时间分解(我们将做双倍的FFT)。在最终的1200 Hz 的分解中,我们将得到0.008192秒的时间分解,这也意味着我们将需要为这一幅图完成总计为 131,072 次的FFT!这样能够允许侦测足够短的脉冲,但无法完成足够精确的频率测量,而且发现连续信号的敏感度也被降低了。

您在该图形中所看到的各种颜色完全没有任何意义。它们只是为了看起来更加美观。我们希望您能够喜欢,就像我们喜欢这些颜色一样。

一个意义重大的地外信号可能不会在这个图中被看见,因为它可能被周围的自然界噪音完全掩盖。因此,如果您看到了什么,请不要过分兴奋,因为它可能仅仅是地面上的某个很强的源,或者是经过头顶的人造卫星。平均来说,我们将观察天空中的相同部分每3到6个月,因此到那时我们将重新检查那些相同的强信号。

这里是有关于RFI(Radio Frequency Interference)的更多细节。

外部链接

About The SETI@home Screensaver