Un codón[1][2][3] é cada unha das agrupacións de tres nucleótidos seguidos (tripletes) que se atopan nos ARNm maduros e que codifican a información para a síntese de proteínas, indicando cada codón un aminoácido ou o final da síntese (codóns de parada). O ARNm maduro está formado por codóns en toda a súa lonxitude agás nos seus dous extremos 5' e 3', que son zonas non codificantes. Aínda que a información xenética se almacena de forma permanente no ADN, esta, para expresarse, traspásase primeiro aos ARN durante a transcrición. Cada xene do ADN que codifica unha proteína transcríbese a un ARNm complementario, que é o que será directamente traducido para proteínas nos ribosomas do citoplasma. Por tanto, a información que é directamente descodificada durante a síntese proteica é a do ARNm e non a do ADN, polo que os codóns son tripletes do ARNm e poden levar uracilo.
A información do ARNm escríbese con catro "letras", que corresponden ás catro bases nitroxenadas dos seus nucleótidos: adenina (A), citosina (C), guanina (G) e uracilo (U). Se agrupamos estas catro letras en grupos de 3 podendo repetilas obtemos o que en matemáticas se chama variacións con repetición, e podemos facer 64 distintas. Estes 64 tripletes distintos son os codóns do código xenético. Cada codón codifica un aminoácido determinado ou un sinal de parada. Por exemplo, UUG é un codón, e codifica o aminoácido leucina.
No código xenético cada aminoácido está codificado por un codón ou varios codóns, pero cada codón codifica sempre o mesmo aminoácido. Dos 64 codóns do código hai 61 que codifican aminoácidos e 3 que son sinais de parada da síntese de proteínas (codóns de finalización ou stop). Como hai só 20 aminoácidos distintos nas proteínas normais e hai 61 codóns para codificalos, o código é redundante, o que se denomina dexeneración do código, o que fai, por exemplo, que un aminoácido como a arxinina poida estar codificado por 6 codóns (CGU, CGC, CGA, CGG, AGA e AGG), pero cada un deses codóns codificará arxinina e só arxinina. O codón AUG codifica para o aminoácido metionina, pero tamén funciona como codón de iniciación da síntese proteica.
|
|
Durante a tradución o ARNm entra no ribosoma e expón nel o primeiro codón, o codón de iniciación AUG, e despois vaise movendo, pasando polo ribosoma e expoñendo os sucesivos codóns. No ribosoma cada codón únese ao anticodón dos ARNt que van entrando no ribosoma levando os aminoácidos. Codón e anticodón son complementarios en bases (A con U, e G con C) e establecen entre eles pontes de hidróxeno, de tal xeito que en cada momento da tradución só se pode unir ao ribosoma o ARNt que leve o anticodón complementario do codón do ARNm que está exposto nese momento (o cambaleo no emparellamento de bases dá certa flexibilidade a esta complementariedade dos anticodóns). Ese ARNt levará o aminoácido que segundo o código xenético lle corresponde a ese codón. Os encimas aminoacil ARNt sintetases saben recoñecer un ARNt cun determinado anticodón e "cargalo" co aminoácido axeitado.
Os aminoácidos que traen os ARNt enlázanse formando a proteína. A proteína terá a sucesión de aminoácidos que se corresponde coa sucesión de codóns do ARNm que vai pasando polo ribosoma, polo que a "linguaxe" de nucleótidos do ARNm foi traducida á "linguaxe" de aminoácidos da proteína. Cando o ARNm pasou case todo polo ribosoma chégase a un codón de parada e a síntese proteica remata.
Este codón é a secuencia que indica á maquinaria celular o lugar no que comeza a tradución do ARN mensaxeiro. No ARNm o codón de inicio ou codón iniciador é o AUG.[5] O codón de inicio non só é un sinal de inicio da tradución, senón que tamén se traduce, polo que, todas as proteínas eucariotas teñen no seu extremo N-terminal unha metionina, que é o aminoácido correspondente a ese codón, aínda que despois poida eliminarse durante o procesamento proteolítico posterior da proteína. En procariotas, dita metionina está modificada como N-formilmetionina.[6]
Aínda que o AUG é o codón de inicio máis empregado en eucariotas, existen excepcións. Ditas excepcións son bastante máis comúns en procariotas, onde, como codóns alternativos de inicio da tradución, poden empregarse GUG e UUG. Por exemplo, a bacteria Escherichia coli usa nun 83% dos casos AUG, GUG nun 14% e UUG no 3% e aínda algún outro.[7]
Tamén se chama de finalización, finalizador, de stop, de terminación ou codón sen sentido. Poden funcionar como codón de parada tres codóns, que son: UAG, UGA e UAA. Son codóns que non codifican ningún aminoácido e utilízanse como sinais para o final da tradución de proteínas, situados no extremo 3' do marco aberto de lectura, antes da zona 3' UTR [8] do ARNm.
Descubriunos Sydney Brenner estudando os mutantes do fago T4, que orixinaban proteínas da cápside máis pequenas do normal, porque un codón normal fora substituído polo codón UAG. Deste modo decatouse de que este codón non codificaba un aminoácido, senón unha pausa (ou parada) na mensaxe xenética.[5]
Os nomes dos tres codóns de terminación fan referencia a mutacións atopadas nas que eles estaban implicados. O UAG, o primeiro descuberto, coñécese como «codón ámbar»; UGA, como «codón ópalo»; e UAA, como «codón ocre».[9][10]
Un erro da pauta de lectura dun ARNm no ribosoma pode orixinar codóns de parada "ocultos". Estes erros débense a ARNr inestables que esvaran ao expoñer os sucesivos codóns dun ARNm. Segundo algunhas hipóteses estes codóns de parada "ocultos" poderían ser útiles á célula para deter a síntese dunha proteína cando se produce un erro de lectura, xa que esta sería non funcional [11].