A sequência de Kozak, ingl. Kozak consensus sequence, é uma determinada sequência presente no RNA mensageiro (mRNA) de organismos eucarióticos. Ela representa um consenso entre as bases nucleotídicas encontradas mais frequentemente em volta do códon de início AUG no mRNA. A sequência de 5'-(gcc)gccRccAUGG-3' é, muitas vezes, chamada de sequência de Kozak, porém há diferenças significativas entre os diferentes grupos de eucariontes.[1] A sequência de Kozak, ou sequências semelhantes, são reconhecidas pelo ribossomo, sendo importantes para o início da Tradução no contexto da biossíntese de proteínas. Variações nessa sequência podem afetar a eficiência e a magnitude da biossíntese da proteína codificada por esse mRNA.[2]
Entre os organismos eucarióticos, encontram-se diferentes variações de sequência de Kozakː
Biota | Filo | Consenso sequências |
---|---|---|
Vertebrados | gccRccATGG | |
Mosca-da-fruta (Drosophila melanogaster) | Arthropoda | cAAaATG[3] |
Fermento de pão (Saccharomyces cerevisiae) | Ascomycota | aAaAaAATGTCt[4] |
Dictyostelium discoideum | Amoebozoa | aaaAAAATGRna[5] |
Ciliophora | Ciliophora | nTaAAAATGRct |
Plasmodium sp. | Apicomplexa | taaAAAATGAan |
Toxoplasma gondii | Apicomplexa | gncAaaATGg[6] |
Trypanosomatidae | Euglenozoa | nnnAnnATGnC |
As plantas terrestres | AACAATGGC[7] |