A secuencia Kozak, secuencia consenso Kozak ou consenso Kozak é unha secuencia que aparece no ARNm de eucariotas, ten a secuencia consenso (gcc)gccRccAUGG, e xoga un importante papel na iniciación da tradución de proteínas.[1] Recibe o seu nome de Marilyn Kozak, que deu a coñecer a secuencia.
A secuencia identifícase pola notación (gcc)gccRccAUGG, que resume os datos analizados por Kozak dunha ampla variedade de fontes (699 en total)[2] da seguinte maneira:
A publicación de Kozak ofrecía datos que se limitaban a un conxunto de vertebrados, como humanos, vacas, gatos, cans, pitos, coellos de indias, hámsteres, ratos, porcos, coellos, ovellas e o anfibio Xenopus.
Esta secuencia dos ARNm eucarióticos é recoñecida polo ribosoma como o sitio de inicio da tradución, a partir do cal a proteína está codificada no ARNm. O ribosoma necesita esta secuencia (ou unha variación dela) para iniciar a tradución de proteínas. A secuencia Kozak non debe confundirse co sitio de unión ao ribosoma (RBS), que pode ser o extremo 5' cap do ARNm ou un sitio de entrada ao ribosoma interno (IRES).
In vivo, este sitio a miúdo non coincide exactamente en distintos ARNms e a cantidade de proteína sintetizada a partir dun determinado ARNm depende da forza coa que se une a secuencia Kozak.[4] Algúns nucleótidos desta secuencia son máis importantes que outros: o codón AUG é o máis importante porque é o codón de iniciación real, que codifica o aminoácido metionina no extremo N-terminal da proteína. (Máis raramente, o CUG pode usarse como un codón de iniciación, que codifica unha leucina en vez da típica metionina). Ao nucleótido A do codón "AUG" dáselle o número 1. Para que haxa unha secuencia consenso forte, os nucleótidos nas posicións +4 (é dicir G no consenso) e -3 (é dicir, A ou G no consenso) en relación co nucleótido número 1 deben ambas coincidir co consenso (non hai posición 0). Un consenso adecuado ten só un destes sitios, mentres que un consenso feble non ten ningún. O cc en -1 e -2 non están conservados, pero contribúen á forza global da secuencia.[5] Hai tamén evidencias de que unha G na posición -6 é importante na iniciación da tradución.[1]
Hai exemplos in vivo de cada un destes tipos de secuencia Kozak, e problemente evolucionaron como outro mecanismo de regulación xenética. Lmx1b é un exemplo de xene cunha secuencia consenso Kozak feble.[6] Para a iniciación da tradución dese sitio, requírense outras características na secuencia do ARNm para que o ribosoma recoñeza o codón de iniciación.
As mutacións G—>C na posición -6 do xene da β-globina (β+45; humana) alteran a función fenotípica hematolóxica e biosintética. Esta foi a primeira mutación que se detectou na secuencia Kozak, que se atopou nunha familia do sur de Italia que sufría talasemia intermedia.[1]
(gcc)gccRccAUGG AGNNAUGN ANNAUGG ACCAUGG GACACCAUGG
Biota | Filo | Secuencias consenso |
---|---|---|
Vertebrados | gccRccATGG[2] | |
mosca da froita (Drosophila spp.) | Artrópodos | cAAaATG[7] |
Lévedo (Saccharomyces cerevisiae) | Ascomycota | aAaAaAATGTCt[8] |
Dictyostelium discoideum | Amebozoos | aaaAAAATGRna[9] |
Ciliados | Cilióforos | nTaAAAATGRct[9] |
Protozoos da malaria (Plasmodium spp.) | Apicomplexos | taaAAAATGAan[9] |
Toxoplasma (Toxoplasma gondii) | Apicomplexos | gncAaaATGg[10] |
Tripanosomátidos | Euglenozoos | nnnAnnATGnC[9] |
Plantas terrestres | AACAATGGC[11] |