因特网形成的因特网格(World Wide Grid),是一个由全球范围内相互协作的个人计算机组成的网络,用户可以像用电一样,方便地使用这个网络所提供的计算能力和服务。
目前,大约有450万人每天都在搜索地球之外的智能生物。也许很多人会错解他们所做的工作,难道他们是每天夜里带着数码摄像机爬上小山,期待着UFO的出现吗?当然不是!这些人都是普通的办公室职员、家庭妇女、大学生或者中学生,他们所做的事情与网络上的其他用户没有什么两样,所不同的是,他们在下载网络资源的同时,将电脑中剩余的、可自由支配的计算能力提供给了加利福尼亚州的一个名叫SETI@home(即Search for Extraterrestrial Intelligence at home的英文缩写,意为在家中搜索地球之外的智能生物)的研究项目,以便搜索地球之外的智能生物。
SETI@home项目从1999年5月开始启动,虽然至今天文学家也没有通过网络找到地球之外的智能生物,但他们却发明了这种新的工作方式。SETI@home项目已经开始着手“分布式计算”(Distributed Computing)的研究了,即在网络上在线分配和捆绑计算。下一步的目标是“联网计算”,即根据点对点原理,对可以使用的应用程序、计算能力和数据进行分工,并且根据需要对可以检索到的内容进行处理,这种方法被称之为“网格计算”。这个概念来源于英文的网络、网格和电网这几个概念,就如同一个电网,用户使用这些资源就像用电一样简单,只要插上插座即可。
来自宇宙的数据流:对于“哈勃”这样的大型望远镜所产生的海量数据,如果没有网格计算,那么天文学家将对此束手无策。
不只是全球范围内的研究人员以及搜索地球之外的智能生物的天文学家有这种需求,其他领域的科学家、产品开发人员和经常奔波于路途中的商人或者是超级影迷都有着类似的要求。比尔·盖茨在1981年所说的“640KB内存已经足够,可以满足任何应用程序的需求”的时代早已经一去不复返了。目前,完整的解决方案应该是提供全球范围内计算机的联网——一个全球范围的网格。
通往大型计算之路
网格研究专家们指出网格技术的发展前景是把因特网作为惟一的一个超级计算机,未来的因特网不只是像现在这样随时提供信息,而且还可以根据需要完成任意一项任务,即能够按时完成任意一项计算任务。弗劳恩霍夫(Fraunhofer)研究中心的网格项目负责人弗兰茨-约瑟夫·普弗劳恩特(Franz-Josef Pfreundt)非常兴奋地解释说:“我的台式电脑不仅仅是一个用来传输软件、计算能力和服务的工具,还是网格中的一个人机界面。”
SETI@home项目已经证明,这样一个“发电厂”在理论上是可行的。它是一个更复杂的环绕地球的网络。传统的方法是通过一台计算机与服务器进行数据交换来搜索地球之外的智能生物,而网格计算是将所有参与其中的计算机联接起来,共同运行。因此绝对有必要建立一个可以提供资源并可以进行分配与搜索的完善组织、一个防止网络失灵和滥用的保护措施,以及一个开放的、可扩展的、能满足每一个用户需要的组织结构。这样就需要制定一个全球范围的因特网协议和标准。
欧洲粒子物理研究所的个人计算机平台:在日内瓦的这个粒子物理研究所中用到的这些计算机或许在将来会改变整个世界。
这样一个网格的核心是一台专用超级计算机,由它来充当顶级管理员的角色。这台超级计算机根据不同的任务找到合适的计算机,并分配给它相应的任务,将数据和必需的软件传送过去。这时,客户端程序会像屏保程序一样出现或者在后台秘密地工作,以最低的工作优先级运行,以防影响本地程序的正常运行。我们可以把这些参与计算任务的计算机想像成可以自动找到的“名片”,它能够向超级计算机提供本地的工作状况、存储能力和传输速度等信息。如果没有网格参与计算,那么相比之下,计算效率只有20%到30%。Sun公司的网格计算负责人沃尔夫冈·根茨什(Wolfgang Gentzsch)先生说:“如果采用网格技术,工作的效率可以提高70%到80%。”
网格技术已经开始应用于企业和研究机构的局域网中。美国的Celera基因公司在他们的研究领域做出了伟大的贡献:破译了第一个人类基因组,其中的关键就是他们以网格技术的计算平台为基础。2002年底之前一直在Celera公司工作的克努特·赖讷特(Knut Reinert)教授回忆说:“在高峰期,计算平台可以提供120个处理器,它的工作能力是普通计算机的120倍,这在我们对2700万基因片段进行相互比较时起到了非常重要的作用。”
安全性要求最高
像摩托罗拉、索尼、宝马或者福特等这些跨国公司都采用了Sun公司提供的企业内部局域网的网格技术。除了考虑计算能力之外,这些企业首先想到的是安全性和保密性问题,特别是当新项目刚刚开始策划的时候。比如在碰撞实验中汽车的仿真结构,以及一辆汽车跟随另一辆汽车一起撞到墙面时,材料的变形如何减少到最小;又如商业企业在IBM公司所提供的“电子商务随需应变(e-Business on demond)”的网格系统中找到符合他们需求的解决方案。这些商业机密如何保证不泄漏出去?在网格市场上的第三大生产商HP正在研究企业跨地区的安全性解决方案。
除了商业间谍之外,大多数企业和研究者还担心他们的网格在向因特网上自由扩展时会受到黑客的攻击。慕尼黑大学的天体物理学家、电视节目“Alpha Centauri”(BR-Alpha)的主持人哈拉尔德·莱施(Harald Lesch)说:“我的学生非常热衷于联网计算,幸运的是,我们只在局域网中使用。”显而易见,对于这些需要处理“哈勃”望远镜产生的海量数据流的人们而言,这种计算方式是必须的。然而他们对只能在局域网内部使用表示遗憾。莱施进一步解释了为什么放弃扩展到外部因特网,他说:“我们最近受到来自保加利亚黑客的攻击,由此可见,在局域网之外数据更容易受到侵犯。”
因此,从局域网网格跨跃到因特网网格的最后技术障碍是安全问题,目前还没有得到彻底地解决(见左下的采访)。例如,一个黑客在网络节点上会在什么时候、对什么内容进行攻击?他们将采取何种方式攻击安全系统?此外,不同厂商的应用程序与单个网格节点的标准尚未统一。从2000年年底开始,来自科学和工业界的5000多名专家聚集到“全球网格论坛”(Global Grid Forum,GGF),讨论如何把握全球网格的进一步发展。弗洛里安·申克(Florian Schintke)认为,网格技术还需要再等上一段时间才能广泛应用。GGF成员、来自柏林的“康拉德-楚泽-信息技术中心”(Konrad-Zuse-Zentrum)的计算机专家亚历山大·赖讷费尔德(Alexander Reinefeld)教授明确指出:“要实现建立在更广阔范围的网格计算以及更吸引人的价格,还需要多年的研究和开发工作。”
未来大有可为
网格技术的前景是非常诱人的。目前全球包括笔记本电脑和服务器在内的计算机超过10亿台,由此不难看出,网格计算将可以形成一台巨大的超级计算机。无论何时何地,各类科研项目都能利用人们计算机上的剩余计算能力。毕竟从现在的情况来看,如果想完成这些研究项目,大型计算机过于昂贵或者还不够用。
如果能够实现“网格经济”,那么刚刚诞生的网格计算的前景将不可估量。作为推动者的网格提供商可以根据计算资源和数据资源的需求进行调整,来满足不同用户在质量、时间上的要求,并且花费是可以支付得起的。弗劳恩霍夫研究中心的弗兰茨-约瑟夫·普弗劳恩特描绘了未来实现全球“网格经济”的繁荣景象:“计算能力、软件和服务都已经具备了,最后我们只需要像用电一样支付费用,而不用知道它究竟是从哪里来的。”
全球的网格项目
建立在网格技术基础之上的全球联网计算,目前只是应用在大学和研究实验室中。除左图中所列举的重要项目以外,还有:
加拿大生物信息技术资源(CBR):在加拿大由15所研究机构以及其他很多大学和专科医院组成的生物信息技术的联盟(www.cbr.nrc.ca)。
横跨欧洲的网格(CrossGrid):在波兰的克劳考(Kraukau),由11个欧洲国家的21个成员建立的一个欧洲范围内的网格(www.crossgrid.org)。
数据网格(DataGrid)和洲际大型资料交换网格(DataTag):在欧洲粒子物理研究所中,有很多的网格项目。这些项目建立并发展着欧洲、亚洲和美洲的国际网格平台(www.cern.ch)。
弗劳恩霍夫资源网格(FhRG):在德国弗劳恩霍夫研究所的网格为那些需要大量计算的应用程序与专用软件工作的企业提供支持。(www.fhrg.fhg.de)。
国际网格联盟(iGrid):在美国的芝加哥,50个研究实验室的计算机组成了一个网格。他们的目标是要提供更好的网格技术以及网格应用程序。(www.isoc.org/inet99/proceedings/4a/4a_2.htm)。
国际临床生物统计学协会(ISCB):在全球有超过1600个成员在生物信息和分子生物学方面利用计算机资源进行相关的研究。他们的中心设在加利福尼亚的圣地亚哥(www.iscb.org)。
粒子物理资料网格(PPDG):12所美国研究实验室和大学在开发用于高能和原子物理实验的服务(www.ppdg.net)。
从过去到现在最流行的超级计算机
1964年
克雷(Cray)的CDC 6600:非西摩·克雷(Seymour Cray)设计出了第一台高性能计算机。这是一台名副其实的超级计算机。作为第一台超级计算机,它每秒钟可以运行300万次浮点运算,并可以在两台计算中并行完成指令。
1976年
克雷-1:克雷-1同样是由非西摩·克雷开发的,它具有每秒钟运行13300万次的工作能力,主内存是8MB。它在接下来的几年里在世界上都承担着重要的大型任务。
1985年
克雷-2:克雷-1的继任者,与前一代产品相比运行速度超越了GHz的限制(每秒钟运行19亿次,256 MB的主内存),并且已经可以与其他的克雷-2进行联网。
1994年
美国宇航局的Beowulf项目:美国宇航局把16台商用电脑连接成一个集群,它每秒钟可以运行7000万次,价格为40000英镑。
1997年
IBM的深蓝:这个庞然大物由256个并行处理器组成。凭借每秒钟运行10亿次的计算能力,它击败了国际象棋世界冠军加里·卡斯帕罗夫。
2002年
NEC的地球模拟器:目前最好的超级计算机来自于日本研究实验室中的项目。它的工作能力是每秒钟运行41万亿次,主内存为10TB。
在这里,您可以自由地利用每个计算机的计算能力
对于工业界来说,这个特别的研究项目不是要成为速度最快的获胜者,而是要利用因特网免费地获得帮助。
搜索地球之外的智能生物:在加利福尼亚的伯克利SETI@home研究项目中,您可以从研究小组那里获得经过位于波多黎各的305米长的射电望远镜过滤后的来自宇宙的信号(
http://setiathome.ssl.berkeley.edu)。
抗击艾滋病毒(AIDS):科学家们通过他们的努力试图找到更多HIV病毒的结构(www.fightaidsathome.org)。
对抗生物恐怖主义行为和癌症:美国的企业和美国国防部呼吁,与他们联手共同研究一种抗炭疽病病原体的疫苗和抗天花或者癌症的药物(www.grid.org)。
用Google进行研究:这个搜索引擎支持像Folding@home这样的科学项目,该项目在搜索的基础上利用蛋白质的3D结构来仿制新的药物(
http://toolbar.google.com/dc/offerdc.html)。
更好的搜索引擎:您可以从Grub这个新的搜索引擎中获得帮助,它会搜遍整个网络找到并分析您所需要的东西(www.grub.org)。
代码破解:它的吸引力在于您可以完全公开地进行密码破解并且还可以赢得奖金。获胜者可以获得1000英镑的奖励(www.distributed.net)。
人物采访
在网格计算中,最致命的薄弱环节在什么地方?
英格瓦德森:在每一个环节中都可能会出现问题,我觉得从根本上来说,为其他人提供准备好的数据以及设置第三方所使用的基础结构都是充满风险的。可以把网格计算与其他所有的计算机网络同样看待,都是把信息技术全盘托出。这种情况下,需要关注三个关键问题:机密性、可靠性和易获取性。
在媒体中,我们可以经常看到在因特网上有关黑客攻击的消息。对网格计算来说,这意味着什么?
英格瓦德森:在最近一段时间里,拒绝服务(DoS ,Denial of Service)的攻击非常流行。这个程序会用打包的数据持续攻击一台计算机或者服务器,直到被攻击的目标计算机崩溃。该黑客程序就是利用了程序和操作系统的漏洞和弱点,或者是协议执行程序的漏洞。在目前的网格计算系统中自然也存在着这个问题。而且越难确定这些安全隐患,系统越容易出现问题。对于网格计算来说,要明确的是:它需要最高的安全等级!因为在网格中要完全支持所有可以持续提供资源的IT基础结构以及关键的商业功能。
如何确保每一个网格的参与者不滥用网格?以及网格不会因此瘫痪?
英格瓦德森:在很大范围内富有成效地使用网格计算不只是一项技术挑战,还必须在所有的参与者中制定强有力的协议或者约束机制,并在其中详细地规定:谁、怎么样、在什么地方以及什么时候使用或者用网格来做什么,以此把网格瘫痪的危险尽量降到最低。另外,人们在发现网格出现问题时,有责任向服务器报告情况。
因特网变成全球网格,成为一个超级计算机,是乌托邦还是不久就会成为现实?
英格瓦德森:我认为,现在的机会是很好的。在网格市场上,三大巨头IBM、HP、Sun为开发这项技术投入了数十亿的巨额资金。网格计算已经显现出它的优势,它可以降低费用并为IT行业的管理人员提供更好地控制他们的基础架构的机会。当然,在网格中存在的安全问题,是要谨慎应对。因为黑客也会紧跟这个大趋势,勿庸置疑,他们知道在未来的网格计算中会产生新的漏洞。