Rosetta@home:常见科学问答

来自中国分布式计算总站
跳转至: 导航搜索

什么是 Rosetta ?

Rosettta 是一个蛋白质结构预测及设计软件。

什么是蛋白质?

蛋白质是由氨基酸组成的聚合物,由基因进行编码。

什么是氨基酸?

氨基酸是组成蛋白质的化学根。总共有 20 多种有特定基因的氨基酸。这 20 多种氨基酸依据属性不同可分成不同的类别:酸性或是碱性,亲水或是亲油。

蛋白质有什么用途?

生物体中细胞的基本功能都是由蛋白质完成的。它们通过DNA对基因进行复制和保持,它们帮助细胞生长和分裂,并防止细胞生长过多,它们赋予细胞特定的身份 (比如肝脏、神经元、胰腺等等),它们也帮助细胞间的交换。当蛋白质发生变异或者被毒素感染,就会引发诸如癌症或阿尔茨海默氏痴呆等疾病。细菌或病毒的蛋白质会攻击并杀死细胞。总之,蛋白质可以做任何事情 :)

蛋白质如何完成所有这些各不相同的功能?

每种蛋白质都会折叠成独一无二的三维形状或结构。这个结构决定了蛋白质的功能。比如用来打破葡萄糖以便细胞可以从中吸取能量的蛋白质将会呈现一个能识别并附着在葡萄糖上面(就像锁和钥匙)的形状。它将具有能够和葡萄糖相互作用并打破它以释放能量的氨基酸。

为什么蛋白质会折叠成独一无二的结构?

很早人们就已经认识到自然界中绝大多数的蛋白质都是热力学最小的。通俗的说,蛋白质的形状是所有它能呈现的形状中最稳定的。想像一个漏斗里面的球,它总是会滚回漏斗的底部,因为那是最稳定的状态。

是什么作用力决定了蛋白质的独一无二的(最稳定的)自然结构?

蛋白质中氨基酸的序列就决定了它的自然状态。由于氨基酸各不相同的化学属性,有些氨基酸会因为互相吸引(比如电荷相反的氨基酸)会连接在一起;还有些氨基酸因为不亲水(因为它们是油性的),它们就会驱使蛋白质形成一个紧凑的形状,以至于不让水碰到藏在蛋白质核心中的氨基酸。

为什么很难决定蛋白质的自然结构?

即使是很小的蛋白质也包含100多个氨基酸。它所可能形成的构造的数目也将是一个天文数字,因为其中的自由度相当之多。要计算每一个可能状态的能量(以便我们可以找出哪一个是最稳定的)也是一个很难处理的。这个问题的复杂度与蛋白质的大小呈指数对应关系。而一些人类的蛋白质更是巨大(由上千个氨基酸组成)。

那么 Rosetta 是怎么试图解决这个问题的?

Rosetta 的理论基础,一是不同类型氨基酸间相互作用的物理及化学属性,二是对于每段氨基酸分支来说怎样的局部构造是可以接受的。如此就可以限制搜寻的范围,并评估各种可能构造的能量。只要对足够多的构造进行采样,Rosetta 就能找到蛋白质的能量最低、最稳定的自然结构。

为什么 Rosetta 的结构预测需要通过分布式计算来完成?

在许多蛋白质的自然结构已知的情况下,我们注意到Rosetta的能量函数能够证明自然状态比其它任何采样状态都要更为稳定。我们也注意到在随机构造时从来没有采样到过自然状态。因此如果能够提供给这个问题更多的计算资源,我们就能进行更多的采样并尝试不同的搜寻策略以找到最有效的方法。

Rosetta@home 会对医学研究有帮助吗?

请看我们网站上的相关疾病的研究部分以了解 Rosetta 是如何应用于医学问题的。