複製鏈接
請複製以下鏈接發送給好友

多重序列比對

鎖定
多重序列比對(Multiple sequence alignment;MSA)是對三個以上的生物學序列(biological sequence),如蛋白質序列、DNA序列或RNA序列所作的序列比對。一般來説,是輸入一組假定擁有演化關係的序列。
中文名
多重序列比對
外文名
Multiple sequence alignment
簡    介
蛋白質序列、DNA序列
提    要
個別的氨基酸或核苷酸

多重序列比對簡介

圖1.計算機程序ClustalW。 圖1.計算機程序ClustalW。
從MSA的結果可推導出序列的同源性,而種系發生關係也可引導出這些序列共同的演化始祖。如圖1所示,視覺化敍述可描繪出各種突變事件,例如:點突變的單格變化、刪除突變與插入突變等等。MSA常用來研究序列的保守性(conservation),或是蛋白質結構域的三級結構與二級結構,甚至是個別的氨基酸或核苷酸。 [1] 

多重序列比對支序分類學

支序分類學(英語:Cladistics)又稱親緣分支分類學,是一種生物分類哲學,其指只依據演化樹分支的順序,而不參考形態上的相似性來排列物種。此一學派的主要貢獻者一般認為是德國昆蟲學家威利·漢寧根,他稱此為種系發生系統學
分支研究的最終結果是由被稱之為“分支圖”的樹狀關係圖來描繪出其假定的關係。現代的系統學研究會收集各方面的資料,包括DNA序列生化數據和形態學上的數據等。
在一個“分支圖”中,所有的生物體都如同一片樹葉,且每個內節點理想上都是二元(有兩條分歧)的,在此一分歧點兩端的分類羣即稱為“旁系分類羣”或“旁系羣”。每一枝幹,不論其包含了上萬種類別或只有一種類別,都被稱做是一個分支。一個自然的類羣應該會有包含在任一分支裏的所有生物體,這個分支會有着屬於此一分支的唯一祖先(一個不會是此一分支外的其他生命體的祖先)。每一分支都會有一些只共同出現在分支內每一個成員上,而不會出現在其他生命體上的特徵。這些特徵稱之為衍徵。例如,堅硬的前鞘翅)是鞘翅目的衍徵,而幼葉卷疊式-由捲曲的幼芽舒展成葉子則是蕨類植物的衍徵。

多重序列比對支序分類方法

分支分類分析必須收集信息,並區分什麼是“一般特徵”什麼是“特殊性狀”。在以前,研究者必須區分哪些特殊性狀是共同祖先以前具有的(祖徵),哪些是共同祖先單獨具有的特徵(共源性狀),要和分支以外的種羣比較,只有共源性狀才能用來確定一個分支。
要確定一個分支,必須有足夠大量的共源性狀,才能説明這種特徵不是由於共同的祖徵,不是由於趨同進化造成的同形相似(因為生活在同一環境,而不是因為有同一祖先造成的相似特徵)。例如類和昆蟲有生活在相似的環境中都具有的翅膀(共同的特徵),但卻是沿着不同的進化路線發展的,如果將它們放到一個分支內就是錯誤的。
共源特徵確定後,要依照簡約化的原理確定之間的關係(也是一種奧卡姆剃刀原理),另外也主要也依照分子進化理論,選取最接近的分支。
現代不太容易出現由於研究者自身造成的偏差,因為一般分析都使用計算機軟件,有各種複雜的軟件可以用來分析和計算分支。
現代DNA系列的測定已經比較容易,種系發生學得到分子數據的支持。計算機系統可以處理大量的數據,能精確篩選出真正的共源特徵數據。更為有效的方法是利用染色體中的反轉座子記號。最理想的是將形態學分子生物學、以及行為生態等種系發生學的信息結合起來,沒有一種方法是完全完美的。所有的方法都有自己的誤差,在形態學中經常發生趨同進化的錯誤,但在分子生物學中卻經常有和外在特徵衝突的現象,分子數據雖然比利用化石數據更精確,但也充滿誤差。各種方法的比較和結合,才能得到更好的結果。
親緣分支理論並不能取代所有的進化理論,只是對現有的知識進行一些修正。這種理論也可以使用到生物學以外的領域,已經應用到歷史語言學中確定語言的族屬分類,和古代文獻考訂中確定文獻派生情況等。

多重序列比對支序分類法分類

自從1960年代以來,生物界出現傾向用親緣分支分類法的“分支主義”,他們主張取消所有非分支的分類系統。但其他分類學家認為雖然種系發生學要應用親緣分支的技術,但分類仍然有使用傳統的類的必要,兩種分類法都應該存在,因為不僅存在單源種系,也有同源種系。
單源種系可以應用分支,全體種系都是從一個祖先派生出來的。同源種系雖然意義相同,但其中一部分種羣有獨立的進化道路,產生很大的區別。例如鳥類爬行類具有同一祖先,但進化道路相當不同。脊椎動物無脊椎動物也是從共同祖先演化來的,但不能分到同一類中。
此外還有多源種系,例如以前分到一類“厚皮類”中的動物犀牛並不是來源於同一祖先,而是各自由不同的薄皮祖先進化來的。演化分類學者認為多源在分類學中是錯誤的,如同將趨同演化的動物或同形的動物分到一類中一樣。
分支學者認為同源種系和多源種系是一樣錯誤的,單系羣是依據共源性狀,可以將各種羣進行客觀地分類。而同源和多源是依據外觀特徵,容易造成主觀的錯誤。但其他學者認為分支法將種羣分類從“低級”向“高級”分類,容易導致目的論,目的論是在演化研究中應該避免的。
分支學者認為傳統的分類方法人為地將物種分成不同的層次,不能真正代表物種演化的實際情況,因此應該放棄林奈的分類法,全部使用簡單的親緣分支層次。
而其他有不同意見的學者認為所有的分類方法都是人為的,都有主觀因素在內,所有物種都是在持續不斷地演化,任何分類劃分都是人為製造前半部單一起源,後半部同源發展,在樹形結構的早期就應用同源分類是必要的。例如發展成為靈長類的早期脊椎動物不能放到任何單源分支中。他們還認為同源分類提供了生物形態、生態即生命演化歷史中重要變化的信息。也就是説傳統分類和分支分類都很有價值,但在不同方面是為不同目的而起作用。 [2] 

多重序列比對系統發生學

系統發生學希臘語φυλογένεση希臘語φύλο,現代希臘語:fílo- 種系,性別和γεννήση,現代希臘語:jénnissi- 新生,誕生。英語:Phylogenetics,又稱系統發育學,簡稱為譜系學)是指在地球歷史發展過程中生物種系的發生和發展。
這個概念不單止用於動物種系的發生與發展,還會用在系統學各個層面的分類單元上面。它也會被用到某一特徵的在生物發育過程中的進化這一方面。
系統發生學的研究是通過以下的手段實現的:
通過這些數據,人們就可以為生物建立一棵系統發生學樹(演化樹),其中描述了各個物種之間可能有的親緣關係。
系統發生學研究的最大困難是,系統發生學的進化過程是不能被直接通過觀察和實驗被證實的。所以各個方面的證據都要被綜合起來分析。由於對這些證據的側重不同,會經常造成有多個不同的演化樹版本,例如原口類動物的幾個究竟是歸到蜕皮動物(來自遺傳學方面的證據)還是觸手動物(形態學方面的證據)。
特徵分為同源同功兩種。
  • 同源,例如同源器官或是同源的行為方式,會顯示出相同的軀體基本構造,因為環境的不同而進化成不同的外形或功能。同源器官的外形和功能可以相差很大。一個很好的例子就是脊椎動物的前肢。它們可以成為足,翅膀(鳥、翼龍、蝙蝠),鰭(魚、企鵝、魚龍、),手(人類、和一些恐龍),挖掘工具(田鼠、裸濱鼠、袋鼴)。但其骨骼構造卻是相似的。這些相似性只能用系統發生學的理論去解釋。
同源特徵證實了物種間的親緣關係,是重構進化樹的有力手段。同源現象在生物學中可以進一步分為直系同源(直系同源是指在不同物種中的某一基因來自同一祖先)和旁系同源(種系間的基因複製) 。 [3-4] 

多重序列比對參見

參考資料
  • 1.    Duret, L.; S. Abdeddaim. Multiple alignment for structural functional or phylogenetic analyses of homologous sequences. (編) D. Higgins and W. Taylor. Bioinformatics sequence structure and databanks. Oxford: Oxford University Press. 2000.
  • 2.    See, for example, pp. 45, 78 and 555 of Joel Cracraft and Michael J. Donaghue, eds. (2004). Assembling the Tree of Life. Oxford, England: Oxford University Press.
  • 3.    Ehrlich, Paul; Richard Holm; Dennis Parnell (1963) The Process of Evolution. New York: McGraw–Hill, p. 66: "Its shortcomings have been almost universally pointed out by modern authors, but the idea still has a prominent place in biological mythology. The resemblance of early vertebrate embryos is readily explained without resort to mysterious forces compelling each individual to reclimb its phylogenetic tree."
  • 4.    Thompson, J. D.; F. Plewniak and O. Poch. A comprehensive comparison of multiple sequence alignment programs. Nucleic Acids Research. 1999, 27 (13): 12682––2690.