找回密码
 新注册用户
搜索
楼主: 碧城仙

[已完成翻译] 开始翻译 WCG 官方网站,research 部分

[复制链接]
发表于 2007-4-23 11:50:07 | 显示全部楼层
http://www.worldcommunitygrid.org/projects_showcase/hcmd/viewHcmdAbout.do

项目相关情况         


由基因探究发病机理

1986年,,由最常见的Duchenne肌营养不良症中发现并确认了第一个抗肌营养不良蛋白基因。从这一刻起,拜基因研究所赐,此后有超过200个致病基因被发现。但其功能以及和对应蛋白质的相互作用,大部分还不了解。随着我们所掌握的信息不断的增多,这些基因也将揭示出神经肌肉疾病的复杂发病机理。
某一个组织器官的所有细胞都以DNA形式包含着同样的遗传信息,并组成基因组。而基因(现已发现超过20,000个人类基因)表达的蛋白质(大约能表达超过45,000个,平均每一个基因可以表达1.6个蛋白质)构成了器官细胞的特定功能,例如肌肉。蛋白质可分为酶、信号分子等类,还有一些是称作受体和另一些具有高亲和性和特异性称作配体进行结合(如同锁和钥的关系),此外的是结构蛋白。蛋白质的空间结构(3D结构)将决定它们之间的相互作用以及功能。
肌肉功能要靠无数的蛋白质来实现。它们位于肌肉细胞的不同位置以及运动神经棘突——刺激肌肉功能——或者位于神经与肌肉连接处附近,并发生作用。
大多数神经肌肉疾病都要归结为基因变异(特定基因发生突变导致相关蛋白质突变),这将使蛋白质彻底失效或者部分丧失功能,更严重的会无法形成蛋白质。依蛋白质和所处位置不同,因此所发生的神经肌肉疾病也会不同。
神经肌肉疾病阻碍蛋白质保持肌肉和神经正常功能的原因,一直是研究人员想要了解的,因而需要对蛋白质在每种疾病发病机理中的作用进行更深入细致的研究。
了解蛋白质的功能及相互作用也将有助于研究人员设计治疗方案。而如果关键的知识缺失,科学家就无法针对多数神经肌肉疾病制定新的治疗方法。
World Community Grid与Decrypthon分子对接项目

Decrypthon分子对接项目将利用World Community Grid对“蛋白质数据库”(www.rcsb.org/pdb)中以千计的蛋白质三维结构进行研究,发掘存在于蛋白质间的相互关系。所研究的内容涉及导致神经肌肉障碍的变异蛋白质。
此项研究将就功能蛋白的交互作用建立新的信息库。拓展后的研究还将包括DNA配基(如一些药物)与蛋白质结合位点的交互作用。这或许是自设计小分子影响特定分子和配对分子间结合的工作变得可行后,医学上的一项非常重要的研究。但要想弄明白相同小分子为何能对其它已存在的相互作用产生或直接或间接的作用,还是困难的多。
该项目中提出的研究方法将进化信息(进化过程对蛋白质功能发展的影响)和分子建模(计算两互作用蛋白质分子间相对位置的)引入,以验证潜在的交互作用。
分子建模指通过理论方法结合计算技术对分子行为进行建模和模拟。 这些方法和技术将用于研究生物系统的组织构造,例如蛋白质折叠或是蛋白质-配体结合中的分子识别,涵盖了从很小的化学物系到极大的生物分子和物质集合(蛋白质复合物)很广的范围。
蛋白质-配体对接作为一种分子建模技术,将对某一配体(某蛋白质、DNA或者药物等)相对的蛋白质的位置及取向(即3D结构)进行预测。对接技术以纯物理理论为基础,即使是未知功能的(或相对研究较少的)蛋白质也可以拿来进行分子对接。而仅有的要求就是其3D结构能被实验确定或者能以某种理论方法进行估计。
分子对接方法一般从一已知蛋白质数据库开始寻找成对具有亲和性的蛋白质。亲和性由称作计分函数的功能来估算。最后,将根据目标蛋白质返回一个结合性最佳的蛋白质列表。其相配程度由几何和化学两方面共同表达。几何方面表示三维构型的表面互补性如何,就好像手套和手的关系。而化学方面则表示两分子的原子间相互作用情况(例如相互作用的强弱如何)。
像蛋白质这样的复杂结构(最小的蛋白质也是由上百个原子组成),要测定正确蛋白质间的相配程度,大量的计算必不可少。不采用World Community Grid的话,计算的耗时会让人无法接受。因为对于首批选定的168个蛋白质来说,估计在2GHz的电脑上花费的计算时间将达14,000年。
要克服这个计算方面的困难,方法之一就是将改良信息用于推算潜在的结合位点和最有可能发生交互作用的表面定位分子对接。基于蛋白质改良的初步分析极大的减少了计算时间,而World Community Grid 的加入使得分析范围更加扩大。没有World Community Grid,一切计算都是时间杀手。
志愿者们将空闲的计算时间贡献出来给World Community Grid用于寻找最佳的配对蛋白质,对于AFM, CNRS, INSERM 以及其它研究者的工作不仅起到了促进作用,而且在科学研究工具的发展方面所做出的贡献将为罕见疾病的新治疗手段提供更多的信息。

评分

参与人数 1维基拼图 +40 收起 理由
霊烏路 空 + 40

查看全部评分

回复

使用道具 举报

发表于 2007-4-23 11:51:57 | 显示全部楼层
http://www.worldcommunitygrid.org/projects_showcase/hcmd/viewHcmdPart.do
(本部分原文陈述不清)

研究合作者         

本分子对接项目由巴黎第六大学的Dr. Alessandra Carbone所领导,并与网格计算领域(来自法国国家科学研究中心CNRS的Jean-Marie Chesnaux)和分子建模领域(来自CNRS的Richard Lavery)以及肌病遗传分析领域的团队(来自INSERM的法国公共卫生研究所Pascale Guicheney)通力合作。

计算生物学部分:由Dr. Alessandra Carbone 团队的分析基因组学小组, INSERM U511实验室的分析基因组学小组,以及巴黎第六大学医学系共同参与;

网格计算部分:由Jean-Marie Chesneaux 团队,巴黎第六大学信息实验室(LIP6),CNRS UMR 7606实验室,巴黎第六大学共同参与;

肌病部分:由Pascale Guicheney 团队,INSERM U582实验室,巴黎居里医院肌病研究所共同参与;

分子建模部分:由Richard Lavery 团队的理论生物化学实验室,CNRS UPR9080实验室,巴黎生物物化研究所共同参与。

评分

参与人数 1维基拼图 +10 收起 理由
霊烏路 空 + 10

查看全部评分

回复

使用道具 举报

发表于 2007-4-23 11:52:51 | 显示全部楼层
http://www.worldcommunitygrid.org/projects_showcase/hcmd/viewHcmdFaq.do?shortName=hcmd

帮助治疗肌营养不良         


什么是Decrypthon项目?
Decrypthon项目(www.decrypthon.fr)是由AFM (法国肌营养不良协会French Muscular Dystrophy Association), CNRS (法国国家科学研究中心French National Center for Scientific Research)和IBM在2004年5月共同发起的。此次合作建立的网格计算平台涵盖了技术、经济和人力资源各方面,其参与者也包括了RENATER (法国国家通信研究网络/法国国家研究与教育网络)、大学和来自因特网的个人。最后一专用语RENATER常见与后者搭配,但按字面翻译应为前者
该项目的目标是要为研究小组提供高性能的网格运算以及技术设备,特别是在面对神经肌肉障碍这样的课题背景下,要使项目的研究进展加快。同时作为IBM和CNRS的参与团队还担负着项目验证、移植和网格化的技术支持,而AFM则为项目提供经济支持。
蛋白质的功能是什么?
蛋白质是生物学研究的基础:
•        蛋白质是细胞生物化学反应中起催化作用的生命元素(例如酶)。
•        蛋白质是骨骼、肌肉、血管等部分的主要组成部分。
正因为蛋白质在生物学当中的基础作用,科学家们对人类基因组进行了排序,这可称作蛋白质的“蓝图”。其中包含了确定氨基酸序列的DNA密码,例如组成蛋白质的氨基酸就是如此情况。

现代生物学研究所面临的一大挑战就是如何才能搞清蛋白质在细胞中所起的作用以及原理。
什么是蛋白质结构?
蛋白质是由氨基酸作为基本组成的长链大分子。实际在生命体中的蛋白质不再是如同氨基酸长链一般的结构,取而代之的是更紧凑的特定折叠结构(空间结构),蛋白质的特性也就此确定了下来。
关于氨基酸序列的知识并不能帮助科学家了解更多蛋白质的功能和原理。蛋白质的功能需要按特别的方式——“折叠”,才能实现,这就需要蛋白质聚集到一起,而这种自发性的聚集过程便称作“折叠”过程。蛋白质的“折叠”过程作为几乎整个生物学的关键且基本的一部分,至今仍没有一个清楚的认识。
理论上蛋白质的折叠形式非常多,但其中只有一种形式能在人体内找到。人体细胞进化出的新机制可以使蛋白质折叠并具备特定功能。
而当蛋白质的折叠过程出现问题时(如发生“错误折叠”),将导致严重后果,包括很多人们熟知的如老年痴呆症、亨廷顿舞蹈病、帕金森氏症和很多癌症综合症等等。
从这样的复杂结构当中所获得的信息,不论是在验证重要功能蛋白质组合时,还是在测定天然或设计位点突变对蛋白质组合以及药物交互性的影响时,都起着非常重要的作用。
什么是分子建模?
分子建模指通过理论方法结合计算技术对分子行为进行建模和模拟。这些方法和技术将用于研究生物系统的组织构造,例如蛋白质折叠或是蛋白质-配体结合中的分子识别,涵盖了从很小的化学物系到极大的生物分子和物质集合(蛋白质复合物)很广的范围。
分子建模的一般特征是在原子尺度上的分子系统描述,最小的信息单元可以到单个原子级别(或者是小原子集团)。
相邻原子(最小单元)间的相互作用可以描述为弹性相互作用(化学键)。一个复杂的数学模型要考虑到总的势能(分子间力),并对原子间的相互作用进行描述。
对于像蛋白质这样的复杂结构(最小的蛋白质也包括上百个原子),构建三维模型需要计算机的支持。
什么是蛋白质-配体对接?
至今所了解到的大多数蛋白质中,其生物学相关信息仍不是完全清楚。即使是一个已经研究得很透彻的生物学过程,其中参与的某个蛋白质也会和某个不相关的蛋白质发生作用。
而且,很多此前的“假想”蛋白质也在人类基因组序列计划中被发现。对于这些新发现,除了它们的氨基酸序列,其它一无所知。
对每一个蛋白质,科学家都要找到以下所有问题的答案:蛋白质的结合是不是在活体内才能进行?如果答案肯定,那么其三维空间结构是什么样子的?蛋白质-配体的相互作用的强弱又如何呢?
蛋白质-配体对接是一项 蛋白质-配体对接作为一种分子建模技术,将对某一配体(某蛋白质、DNA或者药物等)相对的蛋白质的位置及取向(即三维结构)进行预测。
对接技术以纯物理理论为基础,即使是未知功能的(或相对研究较少的)蛋白质也可以拿来进行分子对接。而仅有的要求就是其3D结构能被实验确定或者能以某种理论方法进行估计。

分子对接技术可以应用在很多方面上,最显著的就是用在药物选择过程中使用的备选化学品数据库虚拟筛选技术。
Decrypthon分子对接项目 vs. FightAIDS@Home
2005年11月起,FightAIDS@Home (FAAH)在World Community Grid投入运行。这个项目一直致力于用计算方法使药物设计过程变得更有效率,用更廉价的药物预防艾滋病毒,进而阻止艾滋病的发作。
Decrypthon项目和FAAH项目的相似之处在于二者都使用计算机程序来模拟两化合物或分子的对接并评估结合情况。在HIV病毒复制过程中需要一种称作HIV蛋白酶的物质,FAAH就是要在与其结合的众多化合物中进行寻找。如果发现某一化合物对HIV蛋白酶的依附性特别强,它就可以使抑制HIV蛋白酶在病毒复制中的作用。
Decrypthon项目同样也是与分子对接有关,但范围则是所有和神经肌肉疾病相关的蛋白质、基因(DNA)和可能的药物(配体)。研究会有助于更好的理解这些蛋白质在一般生理过程和疾病中的特定作用。
为什么本项目只开放了Windows版本?
现在我们还只是处在项目的第一阶段,本阶段的工作还只是一小部分,但却是对准备项目的第二阶段非常重要。第二阶段的任务非常重,按计划将于2007年开始。因为前一阶段的任务非常少,可以很快结束,因而不必在BOINC的三个平台(Windows, Linux, and Mac)上运行。现阶段只在Windows的UD平台上进行,第二阶段将同时在UD和BOINC上开展。

评分

参与人数 1维基拼图 +50 收起 理由
霊烏路 空 + 50

查看全部评分

回复

使用道具 举报

发表于 2007-4-23 11:53:47 | 显示全部楼层
http://www.worldcommunitygrid.org/projects_showcase/hcmd/viewHcmdAgentFaq.do

界面左下角圈中的两个名字(例如1ATN_r_u和1HE1_r_u)是什么意思?
这是两个对接蛋白质分子的pdb(蛋白质数据库)编号。这类蛋白质通过了对接蛋白质基准测试,已知这些蛋白质参与了至少一种蛋白质复合物的构成并不重复的涵盖了大多数的蛋白质结构和功能。你可以用蛋白质编号的前4个字母作为访问链接的结尾来获得更多相关信息。
举例如下:
http://www.rcsb.org/pdb/explore/explore.do?structureId=1ATN
http://www.rcsb.org/pdb/explore/explore.do?structureId=1HE1
这两个蛋白质在图形窗口中的圆形区域中表示了出来,并用颜色进行区分。
下面是有关蛋白质基准测试的参考文献,里面有详细介绍。
J.Mintseris, K, Wiehe, B. Pierce, R. Anderson, R. Chen, J. Janin and Z.Weng, Protein-protein docking benchmark 2.0: An update, Proteins 20, 214 (2005)
http://www3.interscience.wiley.com/cgi-bin/abstract/110548133/ABSTRACT
图形界面左上角的 Erelec和Etmin是什么意思?
对接过程的目的是要找到使两蛋白质形成蛋白质复合物的最佳方法(还要看两个蛋白质能否发生交互作用,“现实世界”中两者能否走到一起,比如在某个生物系统中)。蛋白质间的交互作用可以用相互作用能Etmin表示(以kcal/mol为单位)。 Erelec则是相互作用能中的静电部分,大小取决于蛋白质上的总电荷。Etmin的负值绝对值越大,蛋白质间的相互作用就越强。
下面的参考文献会给出关于计算两蛋白质间相互作用能的更多细节。
M. Zacharias, Protein-protein docking with a reduced protein model accounting for side-chain flexibility, Protein Science 12,1271 (2003) http://protsci.highwire.org/cgi/content/abstract/12/6/1271
current progress是什么意思?
电脑的计算能力将用来确定相互作用能最小化的最可能结构。”current progress”就是表示程序对对接位置的扫描进度。

[ 本帖最后由 第三类接触 于 2007-5-16 14:04 编辑 ]

评分

参与人数 1维基拼图 +20 收起 理由
霊烏路 空 + 20

查看全部评分

回复

使用道具 举报

发表于 2007-4-23 11:54:56 | 显示全部楼层
http://www.worldcommunitygrid.org/projects_showcase/fgc/viewFgcMain.do

基因组对比项目概述         


项目状态和成果:   项目信息会由负责科学家发布在以下网页Genome Comparison website. 最新项目报告请前往Genome Comparison status report查看。 对项目的评论和疑问可以到Genome Comparison Forum发帖。

增加数据库中的蛋白质功能注释
过去几年,科学家对不同组织的基因序列进行了对比以发现其中的不同。基因序列的不同可能也会使功能趋向一致。于是,科学家将未知功能的某器官基因序列和已知功能的另一器官基因序列进行对比,将可能得到重要的线索。

所谓的挑战就是在科学家发现新的信息后,将其输入包含基因序列信息的某一数据库。这样过了几年,具有海量二次信息的蛋白质数据库(结构、功能、蛋白质相似性和大量的对照数据)就可以建立起来以供使用。一旦信息输入以后就基本上不会再进行更正或者升级。因此蛋白质功能的预测注释通常是不完善的,或者由以前不正确的序列注释的推测导致错误,再或者是非正规的命名法所致。此外,很多蛋白质组分中的结构和/或功能域(由分子组成的的更高级功能、结构单元),是比较容易在自动注释过程中被忽略的。

本项目的第一步是要对所有蛋白质序列的预测成对的进行对比,以获得蛋白质相似性的目录,并和标准化的GO(Gene Ontology) (www.geneontology.org/)一起将作为注解人员的参考资料,同时也会为生物学家提供宝贵的数据库支持。 在本项目中使用到的序列相似性对比程序在文献中被称SSEARCH(W.R. Pearson [1991] Genomics 11:635-650),采用精确Smith-Waterman算法(T. F. Smith and M. S. Waterman [1981] J. Mol. Biol. 147:195-197)并且是可以免费获得的。程序在蛋白质序列中计算寻找最佳局部相似性结果。这样科学家们就能在对其它有机体基因进行排序时将相关信息输入数据库进行对比,得到其它新的信息。

处理过后,精确的蛋白质序列注释,对数据不一致性的纠正以及对假设蛋白质的未知功能的的描述,这些都将变为可能。而且,不仅多域蛋白质及其功能单元可以确认,甚至一些远缘关系也能发现。项目将有助于生物学数据质量的提高,相应的也促进了进对生物学数据、生物系统、宿主-寄生菌及环境交互作用的理解。

评分

参与人数 1维基拼图 +20 收起 理由
霊烏路 空 + 20

查看全部评分

回复

使用道具 举报

发表于 2007-4-23 11:56:10 | 显示全部楼层
http://www.worldcommunitygrid.org/projects_showcase/fgc/viewFgcAbout.do

关于项目         


基因组对比项目:新手释疑
基因、基因组、基因组数据

An organism一个器官的基因组包含了其全部的遗传信息。基因组的遗传单位是基因。基因是生理发展、新陈代谢以及(在某种程度上)有机体行为的原因。在细胞生化反应中起作用的蛋白质是由绝大多数基因控制的,而另一部分基因则决定着RNA分子的形成。还有一些虽然不会对形成分子起作用,但从结构和调控角度看仍然是非常重要的。
计算机分析并推测对基因决定蛋白质的编码区域位置(细菌中有几百个至上千个蛋白质,人体中则有约30,000个蛋白质及其变体)。不过,对于这些已知的蛋白质(结构蛋白、蛋白酶、转运蛋白以及信号功能蛋白等)所决定的细胞功能,还大多是假设性质的。大多数可能的功能都由计算机对数据库中的蛋白质基因序列进行对比分析后被归纳起来。但即便如此,仍然只有一小部分的蛋白质功能在实验室中得以确认。.
从90年代起,国际上为找到完整的基因遗传编码都在努力研究着,范围涵盖了400多种有机体(www.genomesonline.org),其中有细菌、酵母、原生动物、无脊椎动物、脊椎动物,还包括人类和植物。现在有超过1,500种基因的研究工作处在进行状态,代表着了医药、经济、环境、产业利益等领域或者是重要的研究模型等。新确定的部分基因组序列将很快投入应用,同时也加入到几千种有机体的资料库中,尽管还不完整。
蛋白质的编码基因和蛋白质注释
NCBI的参考序列计划(RefSeq)(2006年9月发布,版本号19),是一个基因序列的资料库(www.ncbi.nlm.nih.gov/RefSeq),记录了从3774种有机体,还有病毒中获得的超过280万个蛋白质的编码基因。在应用了生物信息学的工具并进行数据库对比后,验证过的蛋白质编码基因和相关的蛋白质及其功能注释(原始序列数据库中的预测生物学功能和结构特征)都会进行排序。这些结构和功能注释多年来在数据库的发展中相互参照着建立了起来。这个阶段人们为建立一个仔细勘定过的蛋白质引用集也付出了不少心血。不仅要求一个关于基因、蛋白质和细胞功能的命名引用集(称作Gene Ontology – GO [www.geneontology.org]),还需要一个标准化注释规则,可是至今仍没有完成。
此外,这样过了几年,具有海量二次信息的蛋白质数据库(结构、功能、蛋白质相似性和大量的对照数据)就可以建立起来以供使用。一旦信息输入以后就基本上不会再进行更正或者升级。因此蛋白质功能的预测注释通常是不完善的,或者由以前不正确的序列注释的推测导致错误,再或者是非正规的命名法所致。此外,很多蛋白质组分中的结构和/或功能域(由分子组成的的更高级功能、结构单元),是比较容易在自动注释过程中被忽略的。
基因组对比项目:提升数据库中的蛋白质功能注释
本项目的第一步是要对所有蛋白质序列的预测成对的进行对比,以获得蛋白质相似性的目录,并和标准化的GO(Gene Ontology) (www.geneontology.org/)一起将作为注解人员的参考资料,同时也会为生物学家提供宝贵的数据库支持。 在本项目中使用到的序列相似性对比程序在文献中被称SSEARCH(W.R. Pearson [1991] Genomics 11:635-650),采用精确Smith-Waterman算法(T. F. Smith and M. S. Waterman [1981] J. Mol. Biol. 147:195-197)并且是可以免费获得的。程序在蛋白质序列中计算寻找最佳局部相似性结果。

处理过后,精确的蛋白质序列注释,对数据不一致性的纠正以及对假设蛋白质的未知功能的的描述,这些都将变为可能。而且,不仅多域蛋白质及其功能单元可以确认,甚至一些远缘关系也能发现。
细胞内的生物系统非常复杂,细胞的整个蛋白质含量、蛋白质相互作用、生化途径还有其规则,我们对这些的了解仍然是非常有限。因此,以已知有机体的对应蛋白质为基础,建立能够在染色体组水平反映其基本基因序列联系的数据库,将对促进这些方面的认识发挥重要作用。
加之,数据库也能对关于生物多样性的实验研究提供帮助。基因组对比分析后得到的结论,可以用在新有机体环境样品以及零散分析的遗传学和生物化学研究等很多方面。而且,在认识基因组结构和有机体生化及结构组织时,依靠基因组对比分析所得到的蛋白质(以及微生物)进化关系的叙述分析,将会事半功倍。大规模的初期研究,例如生命树的描述,生物多样性的编录都能从项目数据库中获益。
新药物,新疫苗,还有新的诊断方法
针对基因组进行的科学研究和(生物)技术进步加快了新药物、新疫苗和新诊断方法的问世。比较基因组学、生化途径和细胞进程的知识在这个领域里的地位是独一无二的。另外一方面,在理解微生物、多细胞生物和病原体与环境(和/或宿主)之间的影响时,功能研究和蛋白质相互作用研究便成为了关键,也为传染性疾病、寄生虫病、慢性疾病和变性疾病的控制策略寻找到了一条新的道路。
World Community Grid与基因组的功能注释
对严格配对的基因组序列进行对比是一项计算密集型工作,而现在要进行这样一项工作——对所有基因组序列确定的预测蛋白质进行全面对比,如果没有来自World Community Grid的巨型网格支持,几乎是不可完成的任务。最后得到的信息矩阵所组成的数据库在新基因组序列被发现时可以不断增加,同时也向整个科学界的基础研究提供了最基本的资料。

评分

参与人数 1维基拼图 +30 收起 理由
霊烏路 空 + 30

查看全部评分

回复

使用道具 举报

发表于 2007-5-9 11:21:41 | 显示全部楼层
http://www.worldcommunitygrid.org/projects_showcase/fgc/viewFgcFaq.do?shortName=fgc
建议与官方联系确认部分专有名词的中文翻译
基因组对比项目         

•  基因组对比项目是什么东东?
•  项目的蛋白质序列对比是出于什么目的?
•  对比过程是如何进行的?
•  项目有可能会取得什么样的成果?
•  我该如何加入项目?
•  项目软件是如何运行的?
•  项目客户端显示的那些圆圈和字符表示什么意思?



基因组对比项目是什么东东?
基因组对比项目是由Fiocruz基金会生化及分子生物学部的Bioinformatics Team发起的,准备将闲置的计算资源利用分布式计算组织起来,用于全基因组序列编码的所有蛋白质序列相似水平的比对计算。这其中不仅包括人类基因,还有一些医学、商业和工业,或者是在研究方面有重要意义的有机体,总数有几百种。计算完成后得到的相似性目录将会和标准化Gene Ontology一起作为注解人员的参考资料,并为生物学家提供具有非凡价值的数据资源。


项目的蛋白质序列对比是出于什么目的?
只有一小部分由全基因组序列编码的预测protein content在实验室分析过程中确认了其生物学功能和表现。原始蛋白质序列数据,在与来自全世界不同数据库中的蛋白质或蛋白质编码基因信息进行对比后,注释工作——对前者所包含的生物学功能和结构特征进行预测,已经基本完成。但是,注释通常是不完整的,比如采用非正规的命名方式,以及因采用过往的错误序列注释而导致的问题。因此,all against all 控制对比数据库会是一个非常有意义的参照。


对比过程是如何进行的?
生物序列(DNA,RNA以及蛋白质)大多以双序列比对方法进行比较。这种方法将两个序列并排放在一起以便能寻找到更多的相同位置。所选序列可以是整体(整个的生物序列),也可以是局部(选取序列的一部分),这要看研究的背景和目的是什么。在本项目中使用到的序列相似性对比程序在文献中被称SSEARCH(W.R. Pearson [1991] Genomics 11:635-650),采用精确Smith-Waterman算法(T. F. Smith and M. S. Waterman [1981] J. Mol. Biol. 147:195-197)并且是可以免费获得的,程序在蛋白质序列中计算并寻找最佳局部相似性结果。(算法是一种有系统的步骤,用于进行特定运算或者解决一确定类问题)


项目有可能会取得什么样的成果?
•        对许多研究项目来说,本项目最后得到的all against all 控制对比数据库在功能方面、生化途径、进化方面,以及在修正早先和最近才获取的基因组序列注释方面都是具有很高价值的参考资料。
•        准确的注释,涉及假想蛋白质未知功能的工作,还有对蛋白质间演化关系的描述,这些都会在了解基因组组成、演化和细胞功能上起到主要的作用。
•        项目在理解宿主-寄生菌的关系以及研制新型药物和疫苗的方法这些方面所做的贡献,对整个科学领域也将起着无比重要的作用。
•        生物多样性和新有机体的研究也会从可靠的对比数据中获益匪浅。
•        未来新序列的公布将会建立在不断发展的交叉引用数据库上。


我该如何加入项目?
你只需要下载并安装World Community Grid 提供的免费软件 。安装一完成,计算机就可以自动开始工作,而你仍然可以继续正常使用它。


项目软件是如何运行的?
软件会自动下载小块的数据(即预测的蛋白质序列)然后开始序列对比,精确计算其中的相似性水平。计算完成后,信息结果将由World Community Grid 发送给Fiocruz,并在那里由生化及分子生物学部的Bioinformatics Team进行分析。采用Smith-Waterman算法进行的大规模对比分析属于“计算密集型”,需要很大的计算能力,这也是World Community Grid 需要你(和你的朋友)加入项目的原因。


项目客户端显示的那些圆圈和字符表示什么意思?
本项目客户端界面显示了对比过程中的各个部分,以及配对进行对比后获得的一些综合结果。
左边的小圆圈表示来自两个或者一个基因组的两个不同基因。每一个圆圈中都有一个唯一的号码,这是用来标识源数据库中的基因编码预测蛋白质序列。
右侧的大圆圈显示的是相应的蛋白质序列及其描述,还有相似性得分和该序列对的计算值。
蛋白质序列是由一串有序的字母表示(就如同其在各自基因中编码的一样)。每一个字母都表示该蛋白质中的一个不同氨基酸(如M代表蛋氨酸,S代表丝氨酸,等等)。
多数蛋白质序列都是假定的,也就是说,它们的存在只是由计算得出,但其各自的细胞或组织表达还没有在实验中得到证实。

评分

参与人数 1维基拼图 +30 收起 理由
霊烏路 空 + 30

查看全部评分

回复

使用道具 举报

发表于 2007-5-13 00:49:55 | 显示全部楼层
http://www.worldcommunitygrid.org/projects_showcase/viewHpf2Research.do

人类蛋白质组折叠研究——第二阶段         


项目运行情况及现有成果:  项目相关信息将会由项目研究科学家公布在Human Proteome Folding – Phase 2 website上。最新的项目情况报告请到Human Proteome Folding – Phase 2 status report查询。项目评论以及提问请在论坛Human Proteome Folding – Phase 2 Forum发帖。

人类蛋白质组折叠研究——第二阶段(HPF2) 将延续上一阶段所剩余的部分。本阶段的两个主要目标是:1)获得特定人类蛋白质和病原体蛋白质的更高分辨率结构;2)在Rosetta软件结构预测的发展基础上,对蛋白质结构的预测进行更进一步的研究。因此,项目会同时开展两个重要方向的研究,一是生物学方向,一是生物物理学方向。

该项目始于系统生物学研究所(ISB)*,现在由纽约大学(NYU)生物和计算科学系接管。项目将采用Rosetta的软件对前一阶段获得的蛋白质结构进行更细致的原子级别描述. 前一阶段的目标就是要了解蛋白质的功能,而第二阶段则是要使某一选定的蛋白质子集的预测精度得以提高。高精度在不少应用中都是重要一环,这些应用就包括,对接过程的药靶和蛋白质设计等中的虚拟影像,但并不只有这些。第二阶段的研究,将在World Community Grid平台上计算一些研究得比较透彻的蛋白质(如酵母菌蛋白质),进一步了解蛋白质结构,不断发展最新的蛋白质结构预测。这将有助于Rosetta开发小组改进软件以及提高预测结果的可靠性。

HPF2主要以人体分泌的蛋白质为研究对象(存在于血液和细胞间隙中) 。这类存在于细胞之间的信号蛋白质通常是诊断时的关键标志,通常会被作为药物使用(合成后用于缺乏此类蛋白质的病人)。最好的例子就是胰岛素和人生长激素。对人体分泌蛋白质的功能研究将发现在血液及其它间隙液中的蛋白质未知功能。

项目还把一些关键分泌致病蛋白质纳入研究范围。尽管还处在早期的设计阶段,HPF2也开始关注由疟原虫传播的疟疾。研究者希望对疟疾分泌蛋白质进行高精度的预测结构,然后作为生物信息学的基础数据。对研究疟疾寄生物和人体宿主之间复杂关系的科学家们来说,这些数据能帮他们大忙。由于没有什么直截了当的解决办法,又不巧生物学正好是这地球上最难懂的几个学科之一,所以研究人员相信在WCG平台上推出该项目,将有利于宿主-寄生菌相互关系的研究或者多少了解一些组成。研究人员准备把成果提供给科学界,一同观察、使用和精炼,最终可以为干预过程打下基础。

最后,通过NYU和ISB的努力,将可以提供可预测的,起预防作用的个人用药品(如果预测——所研究的分泌蛋白质是这些未来药物的关键部分——没有错)。现在要确认哪个蛋白质才是所要的标识物(这是一类可以用于显示一些癌症症状的物质,会在血液、间隙液,或者是组织中大量产生)还太早。不过,可以确定的是,有很多都会成为分泌蛋白质。在第一阶段,World Community Grid的计算能力显得非常重要,这可以让结果能更早送到研究生物学和生物化学的科学家手里。
要了解更多信息,点击这里.

*译注:系统生物学创始人Leroy Hood等创立的世界第一个系统生物学研究所

评分

参与人数 1维基拼图 +25 收起 理由
霊烏路 空 + 25

查看全部评分

回复

使用道具 举报

发表于 2007-5-13 00:57:02 | 显示全部楼层
考完了,可以投入相当的时间回来翻译了~
回复

使用道具 举报

发表于 2007-5-16 13:57:19 | 显示全部楼层
http://www.worldcommunitygrid.org/projects_showcase/viewHpf2About.do


项目简介         

人类蛋白质组折叠研究: 新手释疑
蛋白质是生命所必需的。人体的任何一部分都是由蛋白质组成,退一步讲,都多少含有蛋白质。

蛋白质是什么?
蛋白质是由多个氨基酸小分子组成的长链大分子。组成蛋白质的氨基酸只有20种,一般数百个氨基酸才能构成一个单个蛋白质分子。

由于结构复杂,蛋白质一般不能维持长链结构。当氨基酸组成长链以后,会更紧密的缠在一起,其特定功能会由其特定形态体现出来。

蛋白质的折叠行为是因为不同的氨基酸以特定的规则相结合。想像一下,氨基酸就是20个不同颜色的小珠子。这些小珠子具有一种特别的粘性,即特定的颜色组合才能结合在一起。 因此,氨基酸长链就能以特定方式进行适当的折叠,这样就形成了人体所需的蛋白质。人体细胞具有的一种重要机制不仅能使蛋白质的折叠能够准确完成,而且这种机制还可以解决蛋白质折叠不当问题。
蛋白质和人类基因是怎么发生关系的?
人类全部基因的集合称作“人类基因组”。统计后得知人类基因组包括了超过30,000个基因。每一个基因都是一段DNA长链,它们可以决定这30,000个蛋白质中某一个氨基酸链的构成方式。近年来,科学家已经可以为每一个人类基因绘制序列图谱,也就是说全部的人类蛋白质的氨基酸排列顺序都已经确认。因此,人类基因组和人类蛋白质组,也就是全部的人类蛋白质是直接相关的。

蛋白质隐含的秘密
虽然人们已经从人类蛋白质组中获取了不少信息,但大部分蛋白质的功能却仍然是个迷。基因不能明确说明蛋白质到底是怎么折叠成最终形态的,更关键的是无法得知蛋白质的作用,也不能搞清它和其它蛋白质的联系。

蛋白质就像拼图一样。比如说,肌肉蛋白相互连接组成了肌肉纤维。这样的特定连接方式就是源自其形态以及其它与形态相关的因素。.

体内细胞的每一个活动都摆脱不了蛋白质形态的控制,这样就可以(不会)让蛋白质之间发生连锁反应。例如,病毒蛋白或是细菌的独特结构会破坏细胞膜进而感染细胞本身。
人类蛋白质组折叠研究
对蛋白质形态的理解将帮助研究人员研究蛋白质是如何实现其特定功能的,同时也可以了解在发病时蛋白质功能受阻导致无法维持细胞健康的原因。

人类蛋白质组折叠研究将集合起来的数百万计算机投入网格中,以助科学家一臂之力。我们所要做的就是以网格为载体,让研究成果较以前能更快的获得。在更深刻的理解了蛋白质结构后,科学家们就可以研究疾病的发病机理,并最终寻找到相应的治疗手段。

在WCG客户端运行的时候,其计算内容就是对一个氨基酸链进行不同方式的折叠,评价特定的折叠规则即氨基酸配对规则控制下的折叠效果。尝试过上百万种折叠方式后,就可以按实际人体中的方式对蛋白质进行折叠,每个蛋白质在找到最合适的形态后都会留给给科学家进行下一步研究。

[ 本帖最后由 第三类接触 于 2007-5-16 14:00 编辑 ]

评分

参与人数 1维基拼图 +28 收起 理由
霊烏路 空 + 28

查看全部评分

回复

使用道具 举报

发表于 2007-5-17 14:32:30 | 显示全部楼层
http://www.worldcommunitygrid.or ... ase/viewHpf2Part.do
纽约大学:
Richard Bonneau博士:Bonneau博士是人类蛋白质组折叠研究的技术带头人。他主要在ab initio型蛋白质结构预测、蛋白质折叠、调控网络预测上有着专门研究,他现阶段主要集中精力将结构预测与结构信息用于调控网络与物理网络的功能注释和模型预测。Bonneau博士致力于发展一种通用方法,通过基于化学交联的距离约束集,解决蛋白质结构和蛋白质复合的问题。Bonneau博士在纽约大学致力于研究系统生物学的数据集成与分析算法——基于系统生物学数据的以设计用于预测全局调控网络的算法。

华盛顿大学:
David Baker博士:Rosetta最初是由一个研究团队在David Baker的实验室里的发展起来的,这个团队拥有许多科学家(这些科学家现在在几个研究机构里)。David Baker博士实验室当前的研究目标主要是发展分子内和分子间交互作用的改进模型,并通过这一模型预测和设计大分子结构以及大分子间的交互作用。他们的预测与设计软件在生物学上具有巨大价值,而且也能提供非常严格和真实的测试,以促进模型的改进和增加对基本原理的理解。

Lars Malmstroem:Lars Malmstroem已经在ISB/UW系统的底层设计了基础设施用于处理海量的具有高内耦合性的数据集(通过这一研究计划产生的数据集);他将全力参与此计划,并开发出准确的数据集成方案,并将最完善的预测结果发送给生物学家。

[ 本帖最后由 Surge 于 2007-5-17 18:34 编辑 ]

评分

参与人数 1维基拼图 +12 收起 理由
霊烏路 空 + 12

查看全部评分

回复

使用道具 举报

发表于 2007-5-18 19:57:21 | 显示全部楼层
为你们呐喊加油~
回复

使用道具 举报

发表于 2007-5-19 15:42:49 | 显示全部楼层
翻译了以后,越来越感觉美国科技的先进,什么时候,中国才能出现这样的分布式计算项目?
回复

使用道具 举报

发表于 2007-5-19 16:18:46 | 显示全部楼层
ls的mm,research的前面部分一直是我在做着,你这突然插进来,可能会让我做无用功的……
如果你有这个热情,就从Completed Research翻起,我们岔开做,parallel work,ok?
回复

使用道具 举报

发表于 2007-5-19 16:30:59 | 显示全部楼层
我就试着翻译一小段,哈哈。
好吧,我有空了翻译Completed Research。OK
parallel work.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-3-29 05:59

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表