預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的快速方法

時(shí)間：2022-12-17 13:26:46 生物科學(xué)畢業(yè)論文我要投稿

相關(guān)推薦

　　蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法是首先預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu)類(lèi)型，下面是小編搜集整理的預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的快速方法的內(nèi)容，歡迎閱讀參考。

　　預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的快速方法篇1

　　1、研究背景及意義

　　蛋白質(zhì)二級(jí)結(jié)構(gòu)的預(yù)測(cè)是生物、數(shù)學(xué)與計(jì)算機(jī)交叉領(lǐng)域的課題，進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè)對(duì)于理解蛋白質(zhì)結(jié)構(gòu)與功能的關(guān)系，以及分子設(shè)計(jì)、生物制藥等領(lǐng)域都有重要的現(xiàn)實(shí)。隨著人類(lèi)基因組計(jì)劃的順利實(shí)施，已知氨基酸序列的蛋白質(zhì)數(shù)量成級(jí)數(shù)增長(zhǎng)，目前試驗(yàn)手段主要依靠X射線晶體衍射與核磁共振方法測(cè)定蛋白質(zhì)二級(jí)結(jié)構(gòu)，但測(cè)定周期較長(zhǎng)，導(dǎo)致已測(cè)定二級(jí)結(jié)構(gòu)的蛋白質(zhì)數(shù)量與已知氨基酸序列的蛋白質(zhì)數(shù)量差距越來(lái)越大，要求有一種快速簡(jiǎn)潔而適用性強(qiáng)的預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的方法。而蛋白質(zhì)的氨基酸排列順序決定了它的空間結(jié)構(gòu)，空間結(jié)構(gòu)體現(xiàn)了蛋白質(zhì)的生理功能，那么就可以從已知序列和結(jié)構(gòu)的蛋白質(zhì)出發(fā)，挖掘出其中的關(guān)系，就可以預(yù)測(cè)出其他已知序列的蛋白質(zhì)的二級(jí)結(jié)構(gòu)。如果準(zhǔn)確率達(dá)到要求則對(duì)于了解生命現(xiàn)象的本質(zhì)，解釋疾病的發(fā)生機(jī)制，診斷、治療疾病、設(shè)計(jì)新藥、通過(guò)不同生物蛋白質(zhì)結(jié)構(gòu)研究生物進(jìn)化、利用其他生物為人類(lèi)服務(wù)等都有著非常重要的.意義。綜上，蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)對(duì)于蛋白質(zhì)的研究與應(yīng)用領(lǐng)域具有很好的推動(dòng)作用。

　　2、預(yù)測(cè)方法

　　二級(jí)結(jié)構(gòu)預(yù)測(cè)一直都是學(xué)者喜歡研究的問(wèn)題，研究時(shí)間長(zhǎng)，目前預(yù)測(cè)二級(jí)結(jié)構(gòu)預(yù)測(cè)的方法已經(jīng)有很多，但是在準(zhǔn)確率上都達(dá)不到所希望的要求，因此無(wú)數(shù)的人依然為此努力著。

　　(1)經(jīng)驗(yàn)參數(shù)法。

　　經(jīng)驗(yàn)參數(shù)法是一種基于單個(gè)氨基酸殘基統(tǒng)計(jì)的經(jīng)驗(yàn)預(yù)測(cè)方法。通過(guò)統(tǒng)計(jì)分析，獲得的每個(gè)殘基出現(xiàn)于特定二級(jí)結(jié)構(gòu)構(gòu)象的傾向性因子，進(jìn)而利用這些傾向性因子預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu)。1970年由PeterY.Chou和GeraldD.Fasman提出Chou-Fasman方法是預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的經(jīng)驗(yàn)方法。這種方法基于每個(gè)氨基酸在α螺旋的相對(duì)頻率，測(cè)試表，和通過(guò)X射線晶體學(xué)已知的蛋白質(zhì)結(jié)構(gòu)。從這些頻率、概率參數(shù)，可知道每個(gè)氨基酸在各個(gè)二級(jí)結(jié)構(gòu)類(lèi)型的外觀，而這些參數(shù)是用來(lái)預(yù)測(cè)某一氨基酸序列將形成一個(gè)螺旋，一個(gè)測(cè)試鏈，或一個(gè)又一個(gè)蛋白質(zhì)的概率的。該方法在確定正確的二級(jí)結(jié)構(gòu)準(zhǔn)確性約50-60%，這明顯比現(xiàn)代機(jī)器學(xué)習(xí)技術(shù)的準(zhǔn)確性要低。

　　(2)GOR方法。

　　GOR方法是一種基于信息論和貝葉斯統(tǒng)計(jì)學(xué)的方法，是統(tǒng)計(jì)算法中理論基礎(chǔ)最好的。GOR將蛋白質(zhì)序列當(dāng)作一連串的信息值來(lái)處理，基本原理是將蛋白質(zhì)的一級(jí)結(jié)構(gòu)和二級(jí)結(jié)構(gòu)看成一個(gè)轉(zhuǎn)化過(guò)程的兩個(gè)相互聯(lián)系的信息；GOR方法不僅考慮被預(yù)測(cè)位置本身氨基酸殘基種類(lèi)的影響，而且考慮相鄰殘基種類(lèi)對(duì)該位置構(gòu)象的影響。為了避免大量的實(shí)驗(yàn)數(shù)據(jù)，GOR將信息函數(shù)分為多項(xiàng)式和的形式。

　　(3)Lim方法-立體化學(xué)方法。

　　氨基酸的理化性質(zhì)對(duì)二級(jí)結(jié)構(gòu)影響較大，在進(jìn)行結(jié)構(gòu)預(yù)測(cè)時(shí)考慮氨基酸殘基的物理化學(xué)性質(zhì)。立體化學(xué)是從三維空間揭示分子的結(jié)構(gòu)和性能。手性分子是立體化學(xué)中極其重要的部分之一。同分異構(gòu)在有機(jī)化學(xué)中是極為普遍的現(xiàn)象。立體異構(gòu)是指分子中的原子或基團(tuán)在空間的排列不同步產(chǎn)生的異構(gòu)現(xiàn)象。利用不同氨基酸家族的性質(zhì)差異來(lái)進(jìn)行二級(jí)預(yù)測(cè)。

　　(4)同源分析法。

　　同源分析法是將待預(yù)測(cè)的片段與數(shù)據(jù)庫(kù)中已知二級(jí)結(jié)構(gòu)的片段進(jìn)行相似性比較，利用打分矩陣計(jì)算出相似性得分，根據(jù)相似性得分以及數(shù)據(jù)庫(kù)中的構(gòu)象態(tài)，構(gòu)建出待預(yù)測(cè)片段的二級(jí)結(jié)構(gòu)。該方法對(duì)數(shù)據(jù)庫(kù)中同源序列的存在非常敏感，若數(shù)據(jù)庫(kù)中有相似性大于30%的序列，則預(yù)測(cè)準(zhǔn)確率可大大上升。

　　(5)BP神經(jīng)網(wǎng)絡(luò)算法。

　　在生物信息學(xué)研究中，應(yīng)用得最多的神經(jīng)網(wǎng)絡(luò)模型是多層前饋網(wǎng)絡(luò)模型，這種模型使用最廣泛的算法是BP算法，即反向傳播算法。它屬于有導(dǎo)師學(xué)習(xí)的算法。這種模型也叫BP神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)通過(guò)對(duì)已有氨基酸編碼建立序列到結(jié)構(gòu)，結(jié)構(gòu)到結(jié)構(gòu)的兩層網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)，預(yù)測(cè)的準(zhǔn)確性上有極大的提高。

　　3、方法分析

　　蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法是首先預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu)類(lèi)型，然后再預(yù)測(cè)二級(jí)結(jié)構(gòu)。通過(guò)對(duì)各個(gè)方法的比較可以得到：

　　(1)與傳統(tǒng)經(jīng)典方法相比，利用特征信息提取方法可涵蓋序列統(tǒng)計(jì)特征、氨基酸物理化學(xué)特征、氨基酸片段位置分布三方面的信息，此方法可以較為全面地反映出蛋白質(zhì)序列中有代表性的特征信息。

　　(2)通過(guò)采用有效的特征挑選算法以及分類(lèi)算法，既有效減少了信息的冗余，又提高了結(jié)構(gòu)類(lèi)預(yù)測(cè)模型的準(zhǔn)確率。

　　綜上，本研究從信息學(xué)角度出發(fā)，系統(tǒng)地解決蛋白質(zhì)信息提取、多特征信息組合及結(jié)構(gòu)類(lèi)預(yù)測(cè)等信息處理問(wèn)題，有助于蛋白質(zhì)的結(jié)構(gòu)及功能研究，同時(shí)也對(duì)蛋白質(zhì)序列分析、機(jī)器學(xué)習(xí)領(lǐng)域的發(fā)展有很大的幫助。

　　(3)目前普遍使用的，考慮多條序列的方法，運(yùn)用長(zhǎng)程信息和蛋白質(zhì)序列的進(jìn)化信息，準(zhǔn)確度有了比較大的提高。

　　4、結(jié)語(yǔ)

　　由上述的各種方法可以看出有很多方面的因素會(huì)影響蛋白質(zhì)二級(jí)結(jié)構(gòu)的預(yù)測(cè)，如目前已知的蛋白質(zhì)太少，大部分處于未知階段。

　　針對(duì)目前的蛋白質(zhì)數(shù)據(jù)庫(kù)資源的貧乏性特點(diǎn)，如何選擇適當(dāng)?shù)念A(yù)測(cè)方法和評(píng)估準(zhǔn)則將決定蛋白質(zhì)預(yù)測(cè)的準(zhǔn)確率的高低。因此在選擇時(shí)應(yīng)該多種方法綜合利用，不僅包括各種預(yù)測(cè)方法的綜合，而且也包括結(jié)構(gòu)實(shí)驗(yàn)結(jié)果、序列對(duì)比結(jié)果、蛋白質(zhì)結(jié)構(gòu)分類(lèi)預(yù)測(cè)結(jié)果等信息的綜合。多個(gè)程序同時(shí)預(yù)測(cè)，綜合評(píng)判得到一致結(jié)果；序列比對(duì)與二級(jí)結(jié)構(gòu)預(yù)測(cè)；雙重預(yù)測(cè)。對(duì)模型進(jìn)行反復(fù)優(yōu)化，以提高預(yù)測(cè)的準(zhǔn)確率和實(shí)際價(jià)值。

　　參考文獻(xiàn)：

　　[1]閆平凡,張長(zhǎng)水.人工神經(jīng)網(wǎng)絡(luò)語(yǔ)模擬退火計(jì)算[M].北京:清華大學(xué)出版社,2000.

　　[2]沈世鎰,神經(jīng)網(wǎng)絡(luò)系統(tǒng)理論及其應(yīng)用[M].科學(xué)出版社,2000.

　　[3]唐媛李,春花,蛋白質(zhì)二級(jí)結(jié)構(gòu)的研究進(jìn)展[J].現(xiàn)代生物醫(yī)學(xué)進(jìn)展,2013.

　　[4]楊存榮,孫之榮,模式識(shí)別方法預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的研究[N].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),第32卷,第1期,1992.

　　[5]王勇獻(xiàn),蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的模型與方法研究[D].工學(xué)博士學(xué)位論文.

　　預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的快速方法篇2

　　摘要：

　　基于空間約束的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法是一種以已知結(jié)構(gòu)為模板預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的方法。其中，它提取了模板結(jié)構(gòu)中的同源約束，結(jié)合力場(chǎng)中的立體化學(xué)約束，作為優(yōu)化初始結(jié)構(gòu)的條件，從而對(duì)初始結(jié)構(gòu)進(jìn)行調(diào)整，最終得到模型。本文主要綜述了基于空間約束的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法的原理，所涉及的空間約束，以及應(yīng)用與軟件。

　　關(guān)鍵詞：

　　蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)；空間約束；同源模建

　　近些年來(lái)，基因組計(jì)劃為我們提供了大量的蛋白質(zhì)序列。我們只有理解了新蛋白質(zhì)的功能，基因組計(jì)劃才能真正實(shí)現(xiàn)它的意義。為了描述，理解和操控蛋白質(zhì)的功能，就必須首先確定蛋白質(zhì)的結(jié)構(gòu)。然而，實(shí)驗(yàn)方法測(cè)定蛋白質(zhì)結(jié)構(gòu)代價(jià)很高且費(fèi)時(shí)費(fèi)力。由于實(shí)驗(yàn)方法確定蛋白質(zhì)結(jié)構(gòu)存在缺陷和不足，蛋白質(zhì)結(jié)構(gòu)確定的速度跟不上序列測(cè)定的速度，且差距在不斷擴(kuò)大。因此，完全依靠實(shí)驗(yàn)方法確定蛋白質(zhì)結(jié)構(gòu)已經(jīng)不能滿足現(xiàn)實(shí)的需求[1]。上世紀(jì)70年代，人們發(fā)現(xiàn)蛋白質(zhì)三級(jí)結(jié)構(gòu)是由其一級(jí)序列決定的，這也就意味著可以從蛋白質(zhì)序列中獲取蛋白質(zhì)三級(jí)結(jié)構(gòu)的信息。這一發(fā)現(xiàn)為計(jì)算機(jī)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)提供了理論依據(jù)。經(jīng)過(guò)了40余年的發(fā)展，計(jì)算機(jī)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的技術(shù)日趨成熟。其中，同源模建方法是一種以已知結(jié)構(gòu)的蛋白質(zhì)為模板預(yù)測(cè)目標(biāo)蛋白質(zhì)結(jié)構(gòu)的方法。因?yàn)橐患?jí)序列的相似性越高，兩個(gè)蛋白質(zhì)的三級(jí)結(jié)構(gòu)的相似性也越高。

　　同源模建方法是從模板序列和目標(biāo)序列的比對(duì)開(kāi)始的。合適的模板是同源模建得到好模型的基礎(chǔ)。同源模建方法一般分為四個(gè)步驟：序列比對(duì)，模建結(jié)構(gòu)，結(jié)構(gòu)優(yōu)化和結(jié)構(gòu)評(píng)估[2]。

　　不同的同源模建方法的區(qū)別主要體現(xiàn)在第二步模建目標(biāo)模型上。最傳統(tǒng)的也是使用最廣泛的模建方法是剛體裝配法。此方法使用從已知結(jié)構(gòu)中獲得的剛體結(jié)構(gòu)信息組裝模型。基于這類(lèi)同源模建方法的程序有COMPOSER。另一類(lèi)方法就是片段匹配法。片段匹配法，又稱坐標(biāo)重建法，是基于發(fā)現(xiàn)大部分的蛋白質(zhì)結(jié)構(gòu)片段都是聚類(lèi)到大約100個(gè)結(jié)構(gòu)分組中。搜索并確定其余原子坐標(biāo)的方法一般是搜索所有已知結(jié)構(gòu)或者是基于能量函數(shù)的構(gòu)象搜索。第三類(lèi)同源模建方法是基于空間約束的同源模建方法。由于這種基于約束的模建方法可以使用關(guān)于目標(biāo)序列的各種不同的信息，所以它是所有同源模建方法中最有前途的[3]。

　　1.基于空間約束的同源模建方法

　　基于空間約束的同源模建方法通過(guò)目標(biāo)序列與模板序列的比對(duì)結(jié)果，得到目標(biāo)序列結(jié)構(gòu)上的許多約束或者限制。這些約束通常是通過(guò)假設(shè)目標(biāo)序列和模板序列上的相對(duì)應(yīng)的距離和角度是相似的得到的�？臻g約束除了這些同源約束還包括：立體化學(xué)約束。然后使用空間約束來(lái)優(yōu)化模型的初始結(jié)構(gòu)，使模型結(jié)構(gòu)對(duì)這些空間約束的違背最小，從而得到最終的模型結(jié)構(gòu)。模型的初始結(jié)構(gòu)可以通過(guò)距離幾何法或真實(shí)空間優(yōu)化法來(lái)實(shí)現(xiàn)。然后空間約束和力場(chǎng)數(shù)據(jù)項(xiàng)都被整合到一個(gè)客觀函數(shù)中去。最后，在笛卡爾坐標(biāo)系中當(dāng)客觀函數(shù)的函數(shù)值最小時(shí)，得到模型的最終結(jié)構(gòu)�；诳臻g約束的同源模建方法的優(yōu)勢(shì)之一是不同來(lái)源的約束和限制都很容易被添加到同源約束中去。同樣，基于空間約束的同源模建方法的進(jìn)一步的發(fā)展也是因?yàn)楦鞣N約束的加入，使得這種方法更加完善。當(dāng)然，好的優(yōu)化算法的選擇也是改善這種方法的途徑[4]。

　　1.1距離約束和距離幾何法最早的基于約束的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法使用的約束一般都是距離約束，這些距離約束數(shù)據(jù)都是來(lái)自實(shí)驗(yàn)檢測(cè)結(jié)果。PerJ Kraulis等人[5]提出了一種使用核磁共振數(shù)據(jù)確定蛋白質(zhì)結(jié)構(gòu)的方法，其中使用了蛋白質(zhì)原子間的距離數(shù)據(jù)。Hiroshi Wako等人[6]應(yīng)用距離約束法預(yù)測(cè)了牛胰蛋白酶抑制劑的三級(jí)結(jié)構(gòu)。其中，他們考慮了氨基酸殘基的親疏水性，并且設(shè)定了螺旋與延伸結(jié)構(gòu)和片層結(jié)構(gòu)中的平均距離，合并了特定的半胱氨酸殘基之間的二硫鍵的位置信息和五個(gè)特殊的殘基對(duì)之間的確切距離信息。他們定義了一個(gè)客觀函數(shù)，通過(guò)使用這一系列的距離約束數(shù)據(jù)，使客觀函數(shù)最小化，從而確定目標(biāo)蛋白質(zhì)的.最終結(jié)構(gòu)。其中使用的距離約束數(shù)據(jù)都是通過(guò)對(duì)14個(gè)已知結(jié)構(gòu)的蛋白質(zhì)的距離數(shù)據(jù)的統(tǒng)計(jì)分析總結(jié)得到的。

　　距離約束數(shù)據(jù)方便使用分子內(nèi)部坐標(biāo)表示，分子內(nèi)部坐標(biāo)僅僅體現(xiàn)保守結(jié)構(gòu)特征的相對(duì)位置，而忽略分子的位置和方向。其他模建研究表明使用距離坐標(biāo)系統(tǒng)處理分子內(nèi)部結(jié)構(gòu)約束問(wèn)題非常有用。因?yàn)闅W幾里得變換群中的每一個(gè)幾何特征不變量都可以用距離來(lái)表示，所以距離坐標(biāo)系統(tǒng)可以替代笛卡爾坐標(biāo)。笛卡爾坐標(biāo)可以通過(guò)程序重新恢復(fù)。Havel TF等人[7]結(jié)合使用核磁共振數(shù)據(jù)和距離幾何法確定了胰蛋白酶抑制劑的結(jié)構(gòu)，并證明了使用該方法計(jì)算蛋白質(zhì)的完整結(jié)構(gòu)是可行的。使用距離幾何法解決同源模建問(wèn)題，就是一個(gè)確定具有同源性的蛋白質(zhì)中結(jié)構(gòu)相似的原子的分子內(nèi)距離的過(guò)程。Andras Aszodi等人[8]設(shè)計(jì)了一種基于距離幾何法的同源模建方法，這種方法能在相對(duì)較短的時(shí)間內(nèi)得到大量的低分辨率的片段，它是通過(guò)一系列的嵌入折疊整個(gè)簡(jiǎn)化的模型，也就是把結(jié)構(gòu)投射到逐漸減小的維度的歐幾里德空間中去。

　　1.2空間約束和真實(shí)空間優(yōu)化法基于空間約束的同源模建方法逐漸被人們認(rèn)可，越來(lái)越多的其他類(lèi)型的約束信息被添加到方法中來(lái)。這也使得這種方法越來(lái)越完善。Andrej Sali等人[9]開(kāi)發(fā)了一種整合了多種空間約束的同源模建方法，其中包含的空間約束有Cα原子之間的距離約束，NO原子之間的距離約束，立體化學(xué)約束，主鏈二面角約束以及側(cè)鏈二面角約束。這種方法的基本步驟是，首先，根據(jù)模板序列與目標(biāo)序列的比對(duì)結(jié)果，從模板結(jié)構(gòu)中提取相對(duì)應(yīng)的同源約束，這些約束的展現(xiàn)形式都是概率密度函數(shù)，也就是每一個(gè)同源約束就產(chǎn)生一個(gè)概率密度函數(shù)；然后通過(guò)多目標(biāo)函數(shù)法和共軛梯度算法來(lái)對(duì)得到的概率密度函數(shù)進(jìn)行優(yōu)化，得到最優(yōu)解，即模型結(jié)構(gòu)信息。

　　Cα原子之間的距離約束，也就是約束目標(biāo)蛋白質(zhì)中兩個(gè)不同氨基酸殘基的Cα原子之間的距離的概率密度函數(shù)。這個(gè)概率密度函數(shù)也就是一個(gè)高斯分布，其中高斯分布的平均值是模板結(jié)構(gòu)中對(duì)應(yīng)殘基的Cα原子之間的距離，標(biāo)準(zhǔn)差是通過(guò)已知結(jié)構(gòu)中Cα原子之間的距離；兩個(gè)比對(duì)序列的部分同源性；已知結(jié)構(gòu)中這段距離兩端的殘基的部分溶劑親和性；距離兩端的殘基離空位的平均距離四個(gè)參數(shù)根據(jù)相應(yīng)的計(jì)算公式得到的。立體化學(xué)約束是根據(jù)標(biāo)準(zhǔn)力場(chǎng)數(shù)據(jù)對(duì)目標(biāo)蛋白質(zhì)中的原子位置的約束。其中涉及了原子距離，角度，二面角，所以立體化學(xué)約束函數(shù)也有很多種，比如高斯函數(shù)，余弦函數(shù)等等。構(gòu)建這些約束函數(shù)所需要的參數(shù)也是來(lái)源于力場(chǎng)數(shù)據(jù)。蛋白質(zhì)中主鏈骨架原子之間的鍵形成的二面角稱為主鏈二面角。根據(jù)組成二面角的原子類(lèi)別的不同，可以將主鏈二面角分為三類(lèi)。其中，由于二面角位置的特殊性，第三類(lèi)主鏈二面角的變化比較單一。正是這樣，前兩類(lèi)二面角的變化就成了討論主鏈二面角的關(guān)鍵。根據(jù)前兩類(lèi)主鏈二面角的變化，主鏈構(gòu)象分為A，B，P，G，L和E六個(gè)類(lèi)別。并且，每個(gè)主鏈二面角構(gòu)象類(lèi)別中的二面角分布都是一個(gè)高斯分布，這樣每一個(gè)分布都可以用一個(gè)概率密度函數(shù)表示出來(lái)。在考慮目標(biāo)序列中固定部位的主鏈構(gòu)象的約束時(shí)，就使用六個(gè)類(lèi)別的概率密度函數(shù)的一個(gè)加權(quán)和來(lái)表示。其中，每一個(gè)類(lèi)別高斯函數(shù)的平均值，標(biāo)準(zhǔn)差和權(quán)重都是通過(guò)統(tǒng)計(jì)分析得到的。Andrej Sali等人[10]使用了一個(gè)含有1000個(gè)蛋白質(zhì)的數(shù)據(jù)集，統(tǒng)計(jì)分析了不同殘基類(lèi)型情況下的主鏈二面角的類(lèi)別分布，得到了每一個(gè)主鏈構(gòu)象類(lèi)別的高斯函數(shù)的平均值，標(biāo)準(zhǔn)差和權(quán)重三個(gè)參數(shù)的數(shù)據(jù)。

　　1.3其他約束同源模建方法得到的模型的可靠性很大程度上依賴于目標(biāo)序列與模板序列的序列一致性。蛋白質(zhì)超家族成員之間存在的結(jié)構(gòu)差異不僅體現(xiàn)在空位區(qū)域上而且還體現(xiàn)在二級(jí)結(jié)構(gòu)位置的移位。這就造成了同源模建方法的一個(gè)內(nèi)在局限性。Saikat Chakrabarti等人[11]添加遠(yuǎn)距離模板中的保守片段作為額外的空間約束，在一定程度上改善了基于空間約束的同源模建方法的這一問(wèn)題。他們使用主流的結(jié)構(gòu)化片段的數(shù)據(jù)庫(kù)SMoS，這個(gè)數(shù)據(jù)庫(kù)整個(gè)了許多高保守結(jié)構(gòu)的殘基片段。他們利用了數(shù)據(jù)庫(kù)中的殘基片段的結(jié)構(gòu)信息，將這些結(jié)構(gòu)信息作為額外約束信息添加到同源模建方法中去。BooJALA V B Reddy等人[12]將二級(jí)結(jié)構(gòu)信息和氨基酸長(zhǎng)距離接觸圖添加到基于空間約束的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的方法中，改善了含有高比例螺旋或折疊結(jié)構(gòu)的蛋白質(zhì)的預(yù)測(cè)精度。

　　2.軟件與應(yīng)用

　　MODELLER是一款同源模建軟件[13]。其中，使用的原理就是基于空間約束的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)。簡(jiǎn)而言之，軟件的輸入項(xiàng)是模板序列與目標(biāo)序列的比對(duì)結(jié)果，模板序列的結(jié)構(gòu)文件和腳本文件。然后，MODELLER就能自動(dòng)計(jì)算出目標(biāo)序列中所有非氫原子的坐標(biāo)。MODELLER軟件中涉及到的空間約束包括：同源約束，立體化學(xué)約束，統(tǒng)計(jì)約束和其他額外添加的約束。軟件沒(méi)有界面交互系統(tǒng)，只能通過(guò)腳本進(jìn)行使用。

　　MODWEB是一種自動(dòng)同源模建的網(wǎng)上服務(wù)器[14]。它接收一條以上的FASTA序列，然后在PDB數(shù)據(jù)庫(kù)中搜索最可行的模板，并計(jì)算出提交的目標(biāo)序列的模型。MODWEB使用的原理與MODELLER類(lèi)似，只是在兩個(gè)步驟進(jìn)行了改進(jìn)。它使用的模板搜索方法是序列結(jié)構(gòu)比對(duì)，搜索使用的模板也不止一個(gè)。對(duì)于單個(gè)提交序列，MODWEB是通過(guò)郵件的形式返回結(jié)果。如果提交的序列不止一條或者包含結(jié)構(gòu)時(shí)，返回的結(jié)果將被作為一個(gè)單獨(dú)的數(shù)據(jù)集添加到蛋白質(zhì)模型的相關(guān)數(shù)據(jù)集中。

　　3.展望

　　隨著越來(lái)越多的蛋白質(zhì)序列的三級(jí)結(jié)構(gòu)被測(cè)定，同源模建的使用范圍也不斷擴(kuò)大。其中，基于空間約束的同源模建方法是在所有同源模建方法中表現(xiàn)最好的方法。目前，對(duì)基于空間約束的同源模建方法的研究也越來(lái)越深入。許多額外的實(shí)驗(yàn)數(shù)據(jù)約束被添加到方法中來(lái)，比如，核磁共振數(shù)據(jù)，交聯(lián)試驗(yàn)數(shù)據(jù)，熒光光譜實(shí)驗(yàn)數(shù)據(jù)，微電子圖像重建實(shí)驗(yàn)數(shù)據(jù)和定點(diǎn)突變實(shí)驗(yàn)數(shù)據(jù)。實(shí)驗(yàn)數(shù)據(jù)約束的添加使基于空間約束的同源模建方法的預(yù)測(cè)結(jié)果更加的合理。

　　總之，基于空間約束的同源模建方法具有能添加多種來(lái)源的數(shù)據(jù)約束的特點(diǎn)，是同源模建方法中與實(shí)驗(yàn)數(shù)據(jù)聯(lián)系最深的方法，也意味著是最有潛力的方法。

　　參考文獻(xiàn)：

　　[1] Yang Z, Jeffrey S. The protein structure prediction problem could be solved using the current PDB library[J].Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(4):1029-1034.

　　[2] Bino, John, Andrej, Sali. Comparative protein structure modeling by iterative alignment, model building and model assessment[J].Nucleic Acids Research, 2003, 31(14):3982-3992.

　　[3] Martí-Renom M A, Stuart A C, Fiser A, et al. Comparative protein structure modeling of genes and genomes[J].Annual Review of Biophysics & Biomolecular Structure, 2000, 29(29):27-30.

　　[4] Sánchez R, 07ali A. Comparative protein structure modeling as an optimization problem[J]. Journal of Molecular Structure Theochem, 1997:489-496.

　　[5] Krauli P J, Jones T A. Determination of three-dimensional protein structures from nuclear magnetic resonance data using fragments of known structures[J]. Proteins Structure Function & Bioinformatics, 1987, 2(3):188-201.

　　[6] Wako H, Scheraga H A. Distance-constraint approach to protein folding. I. Statistical analysis of protein conformations in terms of distances between residues[J]. Journal of Protein Chemistry, 1982, 1(1):5-45.

　　[7] Havel T F, Wüthrich K. An evaluation of the combined use of nuclear magnetic resonance and distance geometry for the determination of protein conformations in solution[J]. Journal of Molecular Biology, 1985, 182(2):281-294.

　　[8] András Aszódi, Robin EJ Munro, William R Taylor. Distance geometry based comparative modelling[J]. Fold Des, 1997, 2(3):S3-S6.

　　[9] Andrej Sali, Blundell T L. Comparative protein modelling by satisfaction of spatial restraints[J]. Journal of Molecular Biology, 1993, 234(3):779-815.

　　[10] ?Ali, Andrej, Overington J P. Derivation of rules for comparative protein modeling from a database of protein structure alignments[J]. Protein Science A Publication of the Protein Society, 1994, 3(9):1582-1596.

　　[11] Chakrabarti S, John J, Sowdhamini R. Improvement of comparative modeling by the application of conserved motifs amongst distantly related proteins as additional restraints[J]. Journal of Molecular Modeling, 2004, 10(1):69-75.

　　[12] Reddy B V B, Kaznessis Y N. Use of secondary structural information and C α -C α distance restraints to model protein structures with MODELLER[J]. Journal of Biosciences, 2007, 32(1 Supplement):929-936.

　　[13] Eswar N, Eramian D, Webb B, et al. Protein Structure Modeling with MODELLER[M].Structural ProteomicsHumana Press, 2008:145-159.

　　[14] Eswar N. Tools for comparative protein structure modeling and analysis[J]. Nucleic Acids Research, 2003, 31(13):3375-3380.

【預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的快速方法】相關(guān)文章：

課題開(kāi)題報(bào)告基本結(jié)構(gòu)及寫(xiě)作方法05-25

蛋白質(zhì)的理化性質(zhì)08-15

自制快速干手器05-11

網(wǎng)購(gòu)快速發(fā)展的隱憂05-14

學(xué)位論文的結(jié)構(gòu)要件04-26

結(jié)構(gòu)方面的毛病05-08

淺談德國(guó)的教育結(jié)構(gòu)06-19

公路粉噴樁復(fù)合地基沉降預(yù)測(cè)淺論05-11

論文的結(jié)構(gòu)和排版格式07-25

預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的快速方法

預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的快速方法 篇1

預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的快速方法 篇2

　　預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的快速方法篇1

　　預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的快速方法篇2