Một bảng mã codon có thể được sử dụng để dịch mã di truyền thành một chuỗi amino acid.[1][2] Mã di truyền tiêu chuẩn thường được biểu diễn dưới dạng bảng mã codon RNA vì khi ribosome tổng hợp protein trong tế bào, chính RNA thông tin (mRNA) có vai trò làm khuôn tổng hợp protein.[2][3] Trình tự DNA trong bộ gen quyết định chuỗi mRNA.[4] Trong ngữ cảnh này, mã di truyền tiêu chuẩn được gọi là 'bảng dịch mã 1' bên cạnh các bảng mã khác,[3] đồng thời có thể được biểu diễn dưới dạng bảng mã codon DNA. Ở các bảng ấy, mã codon DNA nằm trên mạch DNA có nghĩa và được sắp xếp theo chiều 5'-3'. Những bảng có mã codon khác được sử dụng tùy thuộc vào nguồn gốc của mã di truyền, ví dụ như từ hydrogenosome, nhân tế bào, lạp thể hoặc ty thể.[5]
Trong mã di truyền và các bảng dưới đây có tổng cộng 64 codon khác nhau, chủ yếu mã hóa một amino acid cụ thể.[6] Ba codon gồm UAG, UGA và UAA (còn được gọi là codon kết thúc),[note 1] không mã hóa cho amino acid nào, thay vào đó báo hiệu giải phóng chuỗi polypeptide mới được tổng hợp từ ribosome. Ở mã di truyền chuẩn, codon AUG có thể đóng vai trò là codon mở đầu và bắt đầu dịch mã cùng các thành phần khác như yếu tố khởi đầu (initiation factor).[3][9][10] Ở những trường hợp hiếm gặp, codon mở đầu ở mã tiêu chuẩn có thể gồm cả GUG hoặc UUG - những codon này thường lần lượt dịch mã cho valin và leucin, song khi làm codon mở đầu, chúng được dịch mã thành methionin (ở sinh vật nhân thực) hoặc formylmethionin (ở sinh vật nhân sơ).[3][10]
Bảng/vòng tròn cổ điển của mã di truyền chuẩn được sắp xếp tùy ý dựa trên vị trí codon thứ nhất. Sau khi quan sát từ nghiên cứu, nhà khoa học Milton H. Saier chỉ ra rằng việc tái tổ chức vòng tròn dựa trên vị trí codon số hai (và sắp xếp lại thứ tự từ UCAG sang UCGA), giúp sắp xếp các codon hiệu quả hơn dựa theo tính kỵ nước của các amino acid mà chúng mã hóa.[12][13] Nghiên cứu cho thấy các ribosome nguyên thủy 'đọc' vị trí codon thứ hai cẩn thận nhất nhằm kiểm soát mô hình kỵ nước trong các chuỗi protein.
Bảng đầu tiên (hay bảng chuẩn) có thể được sử dụng để dịch các bộ ba nucleotide thành amino acid tương ứng hoặc làm tín hiệu thích hợp nếu nó là codon mở đầu hoặc codon kết thúc. Bảng thứ hai (được gọi đúng là bảng nghịch đảo) có chức năng ngược lại: nó có thể được dùng để suy luận ra bộ ba mã di truyền nếu biết trước amino acid. Vì nhiều codon khác nhau có thể mã hóa chung cho một amino acid, nên ký hiệu acid nucleic của IUPAC được cung cấp ở một số trường hợp.
Đặc tính hóa sinh của amino acid | Thể vô cực (np) | Phân cực (p) | Thể base (b) | Thể acid (a) | Kết thúc dịch mã: codon kết thúc * | Khởi đầu dịch mã: codon mở đầu tiềm năng ⇒ |
Base thứ nhất |
Base thứ hai | Base thứ ba | |||||||
---|---|---|---|---|---|---|---|---|---|
U | C | A | G | ||||||
U | UUU | (Phe/F) Phenylalanin (np) | UCU | (Ser/S) Serin (p) | UAU | (Tyr/Y) Tyrosin (p) | UGU | (Cys/C) Cystein (p) | U |
UUC | UCC | UAC | UGC | C | |||||
UUA | (Leu/L) Leucin (np) | UCA | UAA | Kết thúc (Ochre) *[note 2] | UGA | Kết thúc (Opal) *[note 2] | A | ||
UUG ⇒ | UCG | UAG | Kết thúc (Amber) *[note 2] | UGG | (Trp/W) Tryptophan (np) | G | |||
C | CUU | CCU | (Pro/P) Prolin (np) | CAU | (His/H) Histidin (b) | CGU | (Arg/R) Arginin (b) | U | |
CUC | CCC | CAC | CGC | C | |||||
CUA | CCA | CAA | (Gln/Q) Glutamin (p) | CGA | A | ||||
CUG | CCG | CAG | CGG | G | |||||
A | AUU | (Ile/I) Isoleucin (np) | ACU | (Thr/T) Threonin (p) | AAU | (Asn/N) Asparagin (p) | AGU | (Ser/S) Serin (p) | U |
AUC | ACC | AAC | AGC | C | |||||
AUA | ACA | AAA | (Lys/K) Lysin (b) | AGA | (Arg/R) Arginin (b) | A | |||
AUG ⇒ | (Met/M) Methionin (np) | ACG | AAG | AGG | G | ||||
G | GUU | (Val/V) Valin (np) | GCU | (Ala/A) Alanin (np) | GAU | (Asp/D) Acid aspartic (a) | GGU | (Gly/G) Glycin (np) | U |
GUC | GCC | GAC | GGC | C | |||||
GUA | GCA | GAA | (Glu/E) Acid glutamic (a) | GGA | A | ||||
GUG ⇒ | GCG | GAG | GGG | G |
Như được trình bày trong bảng trên, bảng số 1 của Trung tâm Thông tin Công nghệ sinh học Quốc gia Hoa Kỳ (NCBI) bao gồm các codon mở đầu ít phổ biến hơn là GUG và UUG.[3]
Amino acid | Codon RNA | Đã nén | Amino acid | Codon RNA | Đã nén | |
---|---|---|---|---|---|---|
Ala, A | GCU, GCC, GCA, GCG | GCN | Ile, I | AUU, AUC, AUA | AUH | |
Arg, R | CGU, CGC, CGA, CGG; AGA, AGG | CGN, AGR; hoặc CGY, MGR |
Leu, L | CUU, CUC, CUA, CUG; UUA, UUG | CUN, UUR; hoặc CUY, YUR | |
Asn, N | AAU, AAC | AAY | Lys, K | AAA, AAG | AAR | |
Asp, D | GAU, GAC | GAY | Met, M | AUG | ||
Asn hoặc Asp, B | AAU, AAC; GAU, GAC | RAY | Phe, F | UUU, UUC | UUY | |
Cys, C | UGU, UGC | UGY | Pro, P | CCU, CCC, CCA, CCG | CCN | |
Gln, Q | CAA, CAG | CAR | Ser, S | UCU, UCC, UCA, UCG; AGU, AGC | UCN, AGY | |
Glu, E | GAA, GAG | GAR | Thr, T | ACU, ACC, ACA, ACG | ACN | |
Gln hoặc Glu, Z | CAA, CAG; GAA, GAG | SAR | Trp, W | UGG | ||
Gly, G | GGU, GGC, GGA, GGG | GGN | Tyr, Y | UAU, UAC | UAY | |
His, H | CAU, CAC | CAY | Val, V | GUU, GUC, GUA, GUG | GUN | |
MỞ ĐẦU | AUG, CUG, UUG | HUG | KẾT THÚC | UAA, UGA, UAG | URA, UAG; hoặc UGA, UAR |
Đặc tính hóa sinh của amino acid | Thể vô cực (np) | Phân cực (p) | Thể base (b) | Thể acid (a) | Kết thúc dịch mã: codon kết thúc * | Khởi đầu dịch mã: codon mở đầu tiềm năng ⇒ |
Base thứ nhất |
Base thứ hai | Base thứ ba | |||||||
---|---|---|---|---|---|---|---|---|---|
T | C | A | G | ||||||
T | TTT | (Phe/F) Phenylalanin (np) | TCT | (Ser/S) Serin (p) | TAT | (Tyr/Y) Tyrosin (p) | TGT | (Cys/C) Cystein (p) | T |
TTC | TCC | TAC | TGC | C | |||||
TTA | (Leu/L) Leucin (np) | TCA | TAA | Kết thúc (Ochre) *[note 2] | TGA | Kết thúc (Opal) *[note 2] | A | ||
TTG ⇒ | TCG | TAG | Kết thúc (Amber) *[note 2] | TGG | (Trp/W) Tryptophan (np) | G | |||
C | CTT | CCT | (Pro/P) Prolin (np) | CAT | (His/H) Histidin (b) | CGT | (Arg/R) Arginin (b) | T | |
CTC | CCC | CAC | CGC | C | |||||
CTA | CCA | CAA | (Gln/Q) Glutamin (p) | CGA | A | ||||
CTG | CCG | CAG | CGG | G | |||||
A | ATT | (Ile/I) Isoleucin (np) | ACT | (Thr/T) Threonin (p) | AAT | (Asn/N) Asparagin (p) | AGT | (Ser/S) Serin (p) | T |
ATC | ACC | AAC | AGC | C | |||||
ATA | ACA | AAA | (Lys/K) Lysin (b) | AGA | (Arg/R) Arginin (b) | A | |||
ATG ⇒ | (Met/M) Methionin (np) | ACG | AAG | AGG | G | ||||
G | GTT | (Val/V) Valin (np) | GCT | (Ala/A) Alanin (np) | GAT | (Asp/D) Acid aspartic (a) | GGT | (Gly/G) Glycin (np) | T |
GTC | GCC | GAC | GGC | C | |||||
GTA | GCA | GAA | (Glu/E) Acid glutamic (a) | GGA | A | ||||
GTG ⇒ | GCG | GAG | GGG | G |
Amino acid | Codon DNA | Đã nén | Amino acid | Codon DNA | Đã nén | |
---|---|---|---|---|---|---|
Ala, A | GCT, GCC, GCA, GCG | GCN | Ile, I | ATT, ATC, ATA | ATH | |
Arg, R | CGT, CGC, CGA, CGG; AGA, AGG | CGN, AGR; hoặc CGY, MGR |
Leu, L | CTT, CTC, CTA, CTG; TTA, TTG | CTN, TTR; hoặc CTY, YTR | |
Asn, N | AAT, AAC | AAY | Lys, K | AAA, AAG | AAR | |
Asp, D | GAT, GAC | GAY | Met, M | ATG | ||
Asn hoặc Asp, B | AAT, AAC; GAT, GAC | RAY | Phe, F | TTT, TTC | TTY | |
Cys, C | TGT, TGC | TGY | Pro, P | CCT, CCC, CCA, CCG | CCN | |
Gln, Q | CAA, CAG | CAR | Ser, S | TCT, TCC, TCA, TCG; AGT, AGC | TCN, AGY | |
Glu, E | GAA, GAG | GAR | Thr, T | ACT, ACC, ACA, ACG | ACN | |
Gln hoặc Glu, Z | CAA, CAG; GAA, GAG | SAR | Trp, W | TGG | ||
Gly, G | GGT, GGC, GGA, GGG | GGN | Tyr, Y | TAT, TAC | TAY | |
His, H | CAT, CAC | CAY | Val, V | GTT, GTC, GTA, GTG | GTN | |
MỞ ĐẦU | ATG, TTG, GTG, CTG[20] | NTG | KẾT THÚC | TAA, TGA, TAG | TRA, TAR |
Từng có thời điểm mã di truyền được xem là phổ biến:[21] một codon sẽ mã hóa cho cùng một amino acid bất kể đó là sinh vật gì hay nguồn gốc của nó. Tuy nhiên, giờ đây các nhà khoa học đã thống nhất rằng mã di truyền có tiến hóa,[22] dẫn đến khác biệt trong cách codon được dịch mã, tùy thuộc vào nguồn gen.[21][22] Ví dụ như vào năm 1981, các nhà khoa học phát hiện ra việc sử dụng các codon AUA, UGA, AGA và AGG trong hệ thống mã hóa ở ty thể của động vật có vú khác với mã phổ biến.[21] Các codon kết thúc cũng có thể bị ảnh hưởng: ở động vật nguyên sinh có lông roi, các codon kết thúc phổ biến UAA và UAG mã hóa cho glutamine.[22][note 4] Shulgina và Eddy đã phát hiện bốn mã di truyền thay thế (được đánh số 34–37) trong bộ gen của vi khuẩn, cho thấy vị trí codon có nghĩa ở vi khuẩn đã có những thay đổi đầu tiên.[23] Bảng dưới đây trình bày các mã codon khác ấy.
Đặc tính hóa sinh của amino acid | Thể vô cực (np) | Phân cực (p) | Thể base (b) | Thể acid (a) | Kết thúc dịch mã: codon kết thúc * |
Mã | Bảng dịch mã |
Codon DNA tham gia | Codon RNA tham gia | Dịch bằng mã này |
Dịch mã chuẩn | Ghi chú | ||
---|---|---|---|---|---|---|---|---|
Chuẩn | 1 | Gồm cả bảng dịch mã số 8 (lục lạp ở thực vật). | ||||||
Ty thể của động vật có xương sống | 2 | AGA | AGA | Kết thúc * | Arg (R) (b) | |||
AGG | AGG | Kết thúc * | Arg (R) (b) | |||||
ATA | AUA | Met (M) (np) | Ile (I) (np) | |||||
TGA | UGA | Trp (W) (np) | Kết thúc * | |||||
Ty thể của nấm men | 3 | ATA | AUA | Met (M) (np) | Ile (I) (np) | |||
CTT | CUU | Thr (T) (p) | Leu (L) (np) | |||||
CTC | CUC | Thr (T) (p) | Leu (L) (np) | |||||
CTA | CUA | Thr (T) (p) | Leu (L) (np) | |||||
CTG | CUG | Thr (T) (p) | Leu (L) (np) | |||||
TGA | UGA | Trp (W) (np) | Kết thúc * | |||||
CGA | CGA | không có | Arg (R) (b) | |||||
CGC | CGC | không có | Arg (R) (b) | |||||
Nấm mốc, động vật nguyên sinh và ruột khoang + Mycoplasma / Spiroplasma | 4 | TGA | UGA | Trp (W) (np) | Kết thúc * | Gồm cả bảng dịch mã số 7 (kinetoplast). | ||
Ty thể của động vật không xương sống | 5 | AGA | AGA | Ser (S) (p) | Arg (R) (b) | |||
AGG | AGG | Ser (S) (p) | Arg (R) (b) | |||||
ATA | AUA | Met (M) (np) | Ile (I) (np) | |||||
TGA | UGA | Trp (W) (np) | Kết thúc * | |||||
Nhân của nhóm trùng lông, tảo đa nhánh và trùng roi Hexamita | 6 | TAA | UAA | Gln (Q) (p) | Kết thúc * | |||
TAG | UAG | Gln (Q) (p) | Kết thúc * | |||||
Ty thể của động vật da gai và giun dẹp | 9 | AAA | AAA | Asn (N) (p) | Lys (K) (b) | |||
AGA | AGA | Ser (S) (p) | Arg (R) (b) | |||||
AGG | AGG | Ser (S) (p) | Arg (R) (b) | |||||
TGA | UGA | Trp (W) (np) | Kết thúc * | |||||
Nhân của trùng roi euplotid | 10 | TGA | UGA | Cys (C) (p) | Kết thúc * | |||
Vi khuẩn, cổ khuẩn và lạp thể | 11 | Xem bảng dịch mã 1. | ||||||
Nhân thay thế của nấm men | 12 | CTG | CUG | Ser (S) (p) | Leu (L) (np) | |||
Ty thể của hải tiêu | 13 | AGA | AGA | Gly (G) (np) | Arg (R) (b) | |||
AGG | AGG | Gly (G) (np) | Arg (R) (b) | |||||
ATA | AUA | Met (M) (np) | Ile (I) (np) | |||||
TGA | UGA | Trp (W) (np) | Kết thúc * | |||||
Ty thể thay thế của giun dẹp | 14 | AAA | AAA | Asn (N) (p) | Lys (K) (b) | |||
AGA | AGA | Ser (S) (p) | Arg (R) (b) | |||||
AGG | AGG | Ser (S) (p) | Arg (R) (b) | |||||
TAA | UAA | Tyr (Y) (p) | Kết thúc * | |||||
TGA | UGA | Trp (W) (np) | Kết thúc * | |||||
Nhân của trùng Blepharisma | 15 | TAG | UAG | Gln (Q) (p) | Kết thúc * | Tính đến ngày 18 tháng 11 năm 2016: không có trong bản cập nhật NCBI. Tương tự như bảng dịch mã số 6. | ||
Ty thể của lớp tảo lục Chlorophycea | 16 | TAG | UAG | Leu (L) (np) | Kết thúc * | |||
Ty thể của lớp sán lá Trematode | 21 | TGA | UGA | Trp (W) (np) | Kết thúc * | |||
ATA | AUA | Met (M) (np) | Ile (I) (np) | |||||
AGA | AGA | Ser (S) | Arg (R) (b) | |||||
AGG | AGG | Ser (S) (p) | Arg (R) (b) | |||||
AAA | AAA | Asn (N) (p) | Lys (K) (b) | |||||
Ty thể của tảo Scenedesmus obliquus | 22 | TCA | UCA | Kết thúc * | Ser (S) (p) | |||
TAG | UAG | Leu (L) (np) | Kết thúc * | |||||
Ty thể của nấm lỗ Thraustochytrium | 23 | TTA | UUA | Kết thúc * | Leu (L) (np) | Tương tự như bảng dịch mã số 11. | ||
Ty thể của lớp động vật Pterobranchia | 24 | AGA | AGA | Ser (S) (p) | Arg (R) (b) | |||
AGG | AGG | Lys (K) (b) | Arg (R) (b) | |||||
TGA | UGA | Trp (W) (np) | Kết thúc * | |||||
Nhóm SR1 và Gracilibacteria | 25 | TGA | UGA | Gly (G) (np) | Kết thúc * | |||
Nhân của nấm Pachysolen tannophilus | 26 | CTG | CUG | Ala (A) (np) | Leu (L) (np) | |||
Nhân của trùng Karyorelict | 27 | TAA | UAA | Gln (Q) (p) | Kết thúc * | |||
TAG | UAG | Gln (Q) (p) | Kết thúc * | |||||
TGA | UGA | Kết thúc * | hoặc | Trp (W) (np) | Kết thúc * | |||
Nhân của trùng Condylostoma | 28 | TAA | UAA | Kết thúc * | hoặc | Gln (Q) (p) | Kết thúc * | |
TAG | UAG | Kết thúc * | hoặc | Gln (Q) (p) | Kết thúc * | |||
TGA | UGA | Kết thúc * | hoặc | Trp (W) (np) | Kết thúc * | |||
Nhân của trùng Mesodinium | 29 | TAA | UAA | Tyr (Y) (p) | Kết thúc * | |||
TAG | UAG | Tyr (Y) (p) | Kết thúc * | |||||
Nhân của trùng Peritrich | 30 | TA | UAA | Glu (E) (a) | Kết thúc * | |||
TAG | UAG | Glu (E) (a) | Kết thúc * | |||||
Nhân của trùng Blastocrithidia | 31 | TAA | UAA | Kết thúc * | hoặc | Glu (E) (a) | Kết thúc * | |
TAG | UAG | Kết thúc * | hoặc | Glu (E) (a) | Kết thúc * | |||
TGA | UGA | Trp (W) (np) | Kết thúc * | |||||
Ty thể của động vật họ Cephalodiscidae | 33 | AGA | AGA | Ser (S) (p) | Arg (R) (b) | Tương tự bảng dịch mã số 24. | ||
AGG | AGG | Lys (K) (b) | Arg (R) (b) | |||||
TAA | UAA | Tyr (Y) (p) | Kết thúc * | |||||
TGA | UGA | Trp (W) (np) | Kết thúc * | |||||
Enterosoma[23] | 34 | AGG | AGG | Met (M) (np) | Arg (R) (b) | |||
Peptacetobacter[23] | 35 | CGG | CGG | Gln (Q) (p) | Arg (R) (b) | |||
Anaerococcus và Onthovivens[23] | 36 | CGG | CGG | Trp (W) (np) | Arg (R) (b) | |||
Absconditabacteraceae[23] | 37 | CGA | CGA | Trp (W) (np) | Arg (R) (b) | |||
CGG | CGG | Trp (W) (np) | Arg (R) (b) | |||||
TGA | UGA | Gly (G) (np) | Kết thúc * |