-
遺傳密碼
(一組規則)
鎖定
它決定肽鏈上每一個氨基酸和各氨基酸的合成順序,以及蛋白質合成的起始、延伸和終止。
- 中文名
- 遺傳密碼
- 外文名
- genetic codon
遺傳密碼簡介
遺傳密碼是活細胞用於將DNA或mRNA序列中編碼的遺傳物質信息翻譯為蛋白質的一整套規則
[1]
[2]
。mRNA的翻譯是通過核糖體完成的,核糖體利用轉運RNA(tRNA)分子一次讀取mRNA的三個核苷酸,並將其編碼的氨基酸按照信使RNA(mRNA)指定的順序連接完成蛋白質多肽鏈的合成。由於脱氧核糖核酸(DNA)雙鏈中一般只有一條單鏈(稱為模版鏈)被轉錄為信使核糖核酸(mRNA),而另一條單鏈(稱為編碼鏈)則不被轉錄,所以即使對於以雙鏈 DNA作為遺傳物質的生物來講,密碼也用核糖核酸(RNA)中的核苷酸順序而不用DNA中的脱氧核苷酸順序表示。
遺傳密碼決定蛋白質中氨基酸順序的核苷酸順序 ,由3個連續的核苷酸組成的密碼子所構成 。遺傳密碼在所有生物體中高度相似,幾乎所有的生物都使用同樣的遺傳密碼,可以在一個包含64個條目的密碼子表中表達
[1]
。即使是非細胞結構的病毒,它們也是使用標準遺傳密碼。但是也有少數生物使用一些稍微不同的遺傳密碼
[2]
。
遺傳密碼由兩套相對獨立的系統——RNA和DNA構成,是為了實現對細胞內成百上千同時發生的生化反應進行有序的信息管控,因為在生命構建與運行過程之中,mRNA的使命完成之後,馬上就被銷燬掉,而DNA所記錄的遺傳信息則是要永久保存的,是種族延續的根本。遺傳密碼是與原始生命的生化系統協同演化而來的,遺傳密碼的誕生是生命誕生的重要標誌
[3]
。
遺傳密碼基本特點
遺傳密碼方向性
遺傳密碼連續性
遺傳密碼簡併性
遺傳密碼擺動性
mRNA上的密碼子與轉運RNA(tRNA)J上的反密碼子配對辨認時,大多數情況遵守鹼基互補配對原則,但也可出現不嚴格配對,尤其是密碼子的第三位鹼基與反密碼子的第一位鹼基配對時常出現不嚴格鹼基互補,這種現象稱為擺動配對。
遺傳密碼通用性
遺傳密碼破解過程
遺傳密碼歷史
遺傳密碼的發現是20世紀50年代的一項奇妙想象和嚴密論證的偉大結晶。mRNA由四種含有不同鹼基腺嘌呤(簡稱A)、尿嘧啶(簡稱U)、胞嘧啶(簡稱C)、鳥嘌呤(簡稱G)的核苷酸組成。最初科學家猜想,一個鹼基決定一種氨基酸,那就只能決定四種氨基酸,顯然不夠決定生物體內的二十種氨基酸。那麼二個鹼基結合在一起,決定一個氨基酸,就可決定十六種氨基酸,顯然還是不夠。如果三個鹼基組合在一起決定一個氨基酸,則有六十四種組合方式(4 *4*4=64)。前蘇聯科學家喬治伽莫夫(George Gamow)最早指出需要以三個核酸一組才能為20個氨基酸編碼
[4]
。克里克的實驗首次證明密碼子由三個DNA鹼基組成。1961年,美國國家衞生院的海因裏希 馬太(Heinrich Matthaei)與馬歇爾 沃倫尼倫伯格(Marshall Warren Nirenberg)在無細胞系統(Cell-free system)環境下,把一條只由尿嘧啶(U)組成的RNA轉釋成一條只有苯丙氨酸(Phe)的多肽,由此破解了首個密碼子(UUU -> Phe)。隨後科拉納(Har Gobind Khorana)破解了其它密碼子,接着霍利(Robett W.Holley)發現了負責轉錄過程的tRNA。1968年,科拉納、霍利和尼倫伯格分享了諾貝爾生理學或醫學獎。
遺傳密碼閲讀方式
破譯遺傳密碼,必須瞭解閲讀密碼的方式。遺傳密碼的閲讀,可能有兩種方式:一種是重疊閲讀,一種是非重疊閲讀。例如mRNA上的鹼基排列是AUGCUACCG。若非重疊閲讀為AUG、CUA、CCG、;若重疊閲讀為AUG、UGC、GCU、CUA、UAC、ACC、CCG。兩種不同的閲讀方式,會產生不同的氨基酸排列。克里克等用T噬菌體為實驗材料時發現,在編碼區增加或刪除一個鹼基,便無法產生正常功能的蛋白質;增加或刪除兩個鹼基,也無法產生正常功能的蛋白質。但是當增加或刪除三個鹼基時,卻合成了具有正常功能的蛋白質。他們的實驗證明了遺傳密碼中三個鹼基編碼一個氨基酸,閲讀密碼的方式是從一個固定的起點開始,以非重疊的方式進行,編碼之間沒有分隔符。
遺傳密碼破譯方法
尼倫伯格等發現由三個核苷酸構成的微mRNA能促進相應的氨基酸-tRNA和核糖體結合。但微mRNA不能合成多肽,因此不一定可靠。科蘭納(Khorana,Har Gobind)用已知組成的兩個、三個或四個一組的核苷酸順序人工合成mRNA,在細胞外的轉譯系統中加入放射性標記的氨基酸,然後分析合成的多肽中氨基酸的組成。
後來,尼倫伯格等用多種不同的人工mRNA進行實驗,觀察所得多肽鏈上的氨基酸的類別,再用統計方法推算出人工mRNA中三聯體密碼出現的頻率,分析與合成蛋白中各種氨基酸的頻率之間的相關性,以此方法也能找出20種氨基酸的全部遺傳密碼。最後,科學家們還用了由3個核苷酸組成的各種多核苷鏈來檢查相應的氨基酸,進一步證實了全部密碼子。
遺傳密碼密碼子表
第 一 位 鹼 基 | 第 二 位 鹼 基 | 第 三 位 鹼 基 | |||
- | U | C | A | G | - |
U | UUU (Phe/F)苯丙氨酸 UUC (Phe/F)苯丙氨酸 UUA (Leu/L)亮氨酸 UUG (Leu/L)亮氨酸 | UCU (Ser/S)絲氨酸 UCC (Ser/S)絲氨酸 UCA (Ser/S)絲氨酸 UCG (Ser/S)絲氨酸 | UAU (Tyr/Y)酪氨酸 UAC (Tyr/Y)酪氨酸 UAA (終止) UAG (終止) | UGU (Cys/C)半胱氨酸 UGC (Cys/C)半胱氨酸 UGA (終止) UGG (Trp/W)色氨酸 | U C A G |
C | CUU (Leu/L)亮氨酸 CUC (Leu/L)亮氨酸 CUA (Leu/L)亮氨酸 CUG (Leu/L)亮氨酸 | CCU (Pro/P)脯氨酸 CCC (Pro/P)脯氨酸 CCA (Pro/P)脯氨酸 CCG (Pro/P)脯氨酸 | CAU (His/H)組氨酸 CAC (His/H)組氨酸 CAA (Gln/Q)谷氨醯胺 CAG (Gln/Q)谷氨醯胺 | CGU (Arg/R)精氨酸 CGC (Arg/R)精氨酸 CGA (Arg/R)精氨酸 CGG (Arg/R)精氨酸 | U C A G |
A | AUU (Ile/I)異亮氨酸 AUC (Ile/I)異亮氨酸 AUA (Ile/I)異亮氨酸 AUG (Met/M)甲硫氨酸(起始) | ACU (Thr/T)蘇氨酸 ACC (Thr/T)蘇氨酸 ACA (Thr/T)蘇氨酸 ACG (Thr/T)蘇氨酸 | AAU (Asn/N)天冬醯胺 AAC (Asn/N)天冬醯胺 AAA (Lys/K)賴氨酸 AAG (Lys/K)賴氨酸 | AGU (Ser/S)絲氨酸 AGC (Ser/S)絲氨酸 AGA (Arg/R)精氨酸 AGG (Arg/R)精氨酸 | U C A G |
G | GUU (Val/V)纈氨酸 GUC (Val/V)纈氨酸 GUA (Val/V)纈氨酸 GUG (Val/V)纈氨酸 | GCU (Ala/A)丙氨酸 GCC (Ala/A)丙氨酸 GCA (Ala/A)丙氨酸 GCG (Ala/A)丙氨酸 | GAU (Asp/D)天冬氨酸 GAC (Asp/D)天冬氨酸 GAA (Glu/E)穀氨酸 GAG (Glu/E)穀氨酸 | GGU (Gly/G)甘氨酸 GGC (Gly/G)甘氨酸 GGA (Gly/G)甘氨酸 GGG (Gly/G)甘氨酸 | U C A G |
注:(起始)標準起始編碼,同時為甲硫氨酸編碼。mRNA中第一個AUG就是蛋白質翻譯的起始部位。
遺傳密碼逆密碼
Ala | A | GCU,GCC,GCA,GCG | Leu | L | UUA,UUG,CUU,CUC,CUA,CUG |
Arg | R | CGU,CGC,CGA,CGG,AGA,AGG | Lys | K | AAA,AAG |
Asn | N | AAU,AAC | Met | M | AUG |
Asp | D | GAU,GAC | Phe | F | UUU,UUC |
Cys | C | UGU,UGC | Pro | P | CCU,CCC,CCA,CCG |
Gln | Q | CAA,CAG | Ser | S | UCU,UCC,UCA,UCG,AGU,AGC |
Glu | E | GAA,GAG | Thr | T | ACU,ACC,ACA,ACG |
Gly | G | GGU,GGC,GGA,GGG | Trp | W | UGG |
His | H | CAU,CAC | Tyr | Y | UAU,UAC |
Ile | I | AUU,AUC,AUA | Val | V | GUU,GUC,GUA,GUG |
起始 | AUG | 終止 | UAG,UGA,UAA | - |
遺傳密碼其他信息
遺傳密碼閲讀框
閲讀框由翻譯起始位點的初始核苷酸三聯碼決定,它為一系列連續的非重疊密碼子設置閲讀框架,稱為“開放閲讀框”(ORF)。例如,一段序列GGGAAACCC,如果由第一個位置開始讀,包括3個密碼子GGG,AAA和CCC。如果從第二位開始讀,包括GGA和AAC(忽略不完整的密碼子)。如果從第三位開始讀,則為GAA和ACC。故此每段序列都可以分為三個閲讀框,每個都能產生不同的氨基酸序列(在上例中,相應為Gly-Lys-Pro,Gly-Asp,和Glu-Thr)。而因為DNA的雙螺旋結構,每段DNA實際上有六個閲讀框。實際的框架是由起始密碼子確定,通常是mRNA序列上第一個出現的AUG。破壞閲讀框架的變異(例如,插入或刪除1個或2個核苷酸)稱為閲讀框變異,通常會嚴重影響到蛋白質的功能,故此並不常見,因為他們通常不能在演化中存活下來。在真核生物中,外顯子中的ORF經常被內含子打斷。
遺傳密碼起始和終止密碼子
蛋白質的翻譯從初始化密碼子(起始密碼子)開始。單獨的起始密碼子不足以啓動翻譯過程,需要適當的初始化序列和起始因子才能使mRNA和核糖體結合,如大腸桿菌中的Shine-Dalgarno序列和起始因子。最常見的起始密碼子是AUG,其同時編碼的氨基酸在細菌為甲酰甲硫氨酸,在真核生物為甲硫氨酸,但在個別情況其它一些密碼子也具有起始的功能。其他備選起始密碼子還包括“GUG”或“UUG”,分別編碼纈氨酸或亮氨酸,但作為起始密碼子,它們被翻譯為甲硫氨酸或甲酰甲硫氨酸
[5]
。
終止密碼子也稱為“終止”或“無意義”密碼子。在經典遺傳學中,終止密碼子各有名稱:UAG為琥珀(amber),UGA為蛋白石(opal),UAA為赭石(ochre)。這些名稱是由最初發現這些終止密碼子的發明者命名的。因為沒有同源tRNA具有這些終止密碼子互補的反密碼子,使得釋放因子有機會與核糖體結合,促進新合成的多肽從核糖體分離從而結束翻譯程序。另外,在哺乳動物的線粒體中,AGA和AGG也充當終止密碼子。
遺傳密碼簡併性
遺傳密碼的簡併性指的是遺傳密碼的冗餘性。這個詞由Bernfield和Nirenberg給出。遺傳密碼具有冗餘但沒有歧義
[6]
。
大部分密碼子具有簡併性,即兩個或者多個密碼子編碼同一氨基酸。簡併的密碼子通常只有第三位鹼基不同,例如,GAA和GAG都編碼谷氨醯胺。如果不管密碼子的第三位為哪種核苷酸,都編碼同一種氨基酸,則稱之為四重簡併;如果第三位有四種可能的核苷酸之中的兩種,而且編碼同一種氨基酸,則稱之為二重簡併,一般第三位上兩種等價的核苷酸同為嘌呤(A/G)或者嘧啶(C/T)。只有兩種氨基酸僅由一個密碼子編碼,一個是甲硫氨酸,由AUG編碼,同時也是起始密碼子;另一個是色氨酸,由UGG編碼。
遺傳密碼的簡併性可使基因更加耐受點突變。例如,四重簡併密碼子可以容忍密碼子第三位的任何變異;二重簡併密碼子使三分之一可能的第三位的變異不影響蛋白質序列。
遺傳密碼非標準的遺傳密碼
雖然遺傳密碼在不同生命之間有很強的一致性,但亦存在非標準的遺傳密碼。在有“細胞能量工廠”之稱的線粒體中,便有和標準遺傳密碼數個相異的之處,甚至不同生物的線粒體有不同的遺傳密碼。支原體會把UGA轉譯為色氨酸。纖毛蟲則把UAG(有時候還有UAA)轉譯為谷氨醯胺(一些綠藻也有同樣現象),或把UGA轉譯為半胱氨酸。一些酵母會把GUG轉譯為絲氨酸。在一些罕見情況,一些蛋白質會有AUG以外的起始密碼子。 真菌、原生生物和人以及其它動物的粒線體中的遺傳密碼與標準遺傳密碼的差異,主要變化如下:
密碼子 | 通常的作用 | 例外的作用 | 所屬的生物 |
UGA | 中止編碼 | 色氨酸編碼 | 人、牛、酵母線粒體,支原體(Mycoplasma)基因組,如Capricolum |
UGA | 中止編碼 | 半胱氨酸編碼 | 一些纖毛蟲(ciliate)細胞核基因組,如遊纖蟲屬(Euplotes) |
AGR | 精氨酸編碼 | 中止編碼 | 大部分動物線粒體,脊椎動物線粒體 |
AGA | 精氨酸編碼 | 絲氨酸編碼 | 果蠅線粒體 |
AUA | 異亮氨酸編碼 | 蛋氨酸編碼 | 一些動物和酵母線粒體 |
UAA | 中止編碼 | 谷氨醯胺編碼 | 草履蟲、一些纖毛蟲(ciliate)細胞核基因組,如嗜熱四膜蟲(ThermophAilus tetrahymena) |
UAG | 中止編碼 | 穀氨酸編碼 | 草履蟲核細胞核基因組 |
GUG | 纈氨酸編碼 | 絲氨酸編碼 | 假絲酵母核基因組 |
AAA | 賴氨酸編碼 | 天冬氨酸編碼 | 一些動物的線粒體,果蠅線粒體 |
CUG | 亮氨酸編碼 | 中止編碼 | 圓柱念珠菌(Candida cylindracea)細胞核基因組 |
CUN | 亮氨酸編碼 | 蘇氨酸編碼 | 酵母線粒體 |
隨着對基因組序列加深瞭解,科學家可能還會發現其它非標準的轉譯方式,以及其它未知氨基酸在生物中的應用。
遺傳密碼密碼子使用偏好性
密碼子的頻率,也稱為密碼子使用偏差性,可以因物種而異,對控制翻譯具有功能意義。
- 參考資料
-
- 1. Shu, J.J .A new integrated symmetrical table for genetic codes:BioSystems,2017:151, 21–26
- 2. Turanov, A.A., Lobanov, A.V., Fomenko, D.E., Morrison, H.G., Sogin, M.L., Klobutcher, LA., Hatfield, D.L., Gladyshev, V.N .Genetic code supports targeted insertion of two amino acids by one codon:Science,2009:323 (5911),259–261
- 3. ATP-Hypothesis: A New Conceptual Framework for the Origins of Genetic Codes .Preprints.2020-04-02[引用日期2020-04-02]
- 4. Mason, P.H.Degeneracy at multiple levels of complexity:Biological Theory: Integrating Development, Evolution and Cognition,2010:5(3), 277-288
- 5. Touriol, C., Bornes, S., Bonnal, S., Audigier, S., Prats, H., Prats, A.C., Vagner, S.Generation of protein isoform diversity by alternative initiation of translation at non-AUG codons:Biology of the Cell / Under the Auspices of the European Cell Biology Organization,2003:95 (3–4), 169–178
- 6. Watson, J.D..Molecular Biology of the Gene:Pearson/Benjamin Cummings. ,2008