Secuencia Kozak

Frecuencia de nucleótidos situados en torno al sitio de iniciación de la traducción en proteínas humanas.

La secuencia Kozak es una secuencia de nucleótidos que funciona como el sitio de iniciación de la traducción de proteínas en la mayoría de las transcripciones de ARNm eucariota. Considerada como la secuencia óptima para iniciar la traducción en eucariotas, la secuencia es un aspecto integral de la regulación de proteínas y la salud celular general, además de tener implicaciones en las enfermedades humanas. Asegura que una proteína se traduzca correctamente del mensaje genético, mediando el ensamblaje de ribosomas y el inicio de la traducción. Un sitio de inicio incorrecto puede resultar en proteínas no funcionales. A medida que se ha vuelto más estudiado, han surgido expansiones de la secuencia de nucleótidos, bases de importancia y excepciones notables. La secuencia lleva el nombre de la científica que la descubrió, Marilyn Kozak. Kozak descubrió la secuencia a través de un análisis detallado de secuencias genómicas de ADN.[1][2]

La secuencia de Kozak no debe confundirse con el sitio de unión al ribosoma (RBS), que es la caperuza 5' de un ARN mensajero o un sitio interno de entrada al ribosoma (IRES).[3]

Secuencia

[editar]

La secuencia de Kozak se determinó mediante la secuenciación de 699 ARNm de vertebrados y se verificó mediante mutagénesis dirigida al sitio. Aunque inicialmente se limitó a un subconjunto de vertebrados (es decir, humanos, vacas, gatos, perros, gallinas, conejillos de Indias, hámsteres, ratones, cerdos, conejos, ovejas y armadillos), estudios posteriores confirmaron su conservación en eucariotas en general. La secuencia se definió como 5'- -3' (la notación de nucleobase de la IUPAC se resume aquí) donde: (gcc)gccRccAUGG.[4][5]

  1. Los nucleótidos subrayados indican el codón de inicio de la traducción, que codifica la metionina.
  2. las letras mayúsculas indican bases muy conservadas , es decir, la secuencia 'AUGG' es constante o cambia raramente, si es que alguna vez lo hace.
  3. 'R' indica que siempre se observa una purina (adenina o guanina) en esta posición (siendo la adenina más frecuente según Kozak)
  4. una letra minúscula indica la base más común en una posición en la que la base puede, sin embargo, variar
  5. la secuencia entre paréntesis (gcc) es de significado incierto.

El AUG es el codón de iniciación que codifica un aminoácido metionina en el extremo N-terminal de la proteína. (En raras ocasiones, GUG se usa como codón de iniciación, pero la metionina sigue siendo el primer aminoácido, ya que es el ARN-met ten el complejo de iniciación que se une al ARNm). La variación dentro de la secuencia Kozak altera la "fuerza" de la misma. La fuerza de la secuencia Kozak se refiere a la favorabilidad de la iniciación, lo que afecta la cantidad de proteína que se sintetiza a partir de un ARNm dado. La AEl nucleótido del "AUG" se delinea como +1 en las secuencias de ARNm con la base anterior etiquetada como -1. Para un consenso 'fuerte', los nucleótidos en las posiciones +4 (es decir, G en el consenso) y −3 (es decir, A o G en el consenso) en relación con el nucleótido +1 deben coincidir con el consenso (no hay posición 0). Un consenso 'adecuado' tiene solo 1 de estos sitios, mientras que un consenso 'débil' no tiene ninguno. Los cc en −1 y −2 no están tan conservados, pero contribuyen a la fuerza general. También hay evidencia de que una G en la posición -6 es importante en el inicio de la traducción. Si bien las posiciones +4 y −3 en la secuencia de Kozak tienen la mayor importancia relativa en el establecimiento de un contexto de iniciación favorable, se encontró que un motivo CC o AA en −2 y −1 es importante en el inicio de la traducción. Se descubrió que la biosíntesis proteica se ve muy afectada por la composición de la secuencia de Kozak, y el enriquecimiento de adenina da como resultado niveles más altos de expresión génica. Una secuencia subóptima de Kozak puede permitir que PIC explore más allá del primer sitio AUG y comience la iniciación en un codón AUG aguas abajo.[6][7][8]

Ensamblaje de ribosomas

[editar]

El ribosoma se ensambla en el codón de inicio (AUG), ubicado dentro de la secuencia de Kozak. Antes del inicio de la traducción, el complejo de preiniciación (PIC) realiza un escaneo. El PIC consiste en el 40S (subunidad ribosomal pequeña) unido al complejo ternario, eIF2 -GTP-inciadorMet ARNt (TC) para formar el ribosoma 43S. Con la ayuda de varios otros factores de iniciación (eIF1 y eIF1A, eIF5, eIF3, proteína de unión a polA), se recluta en el extremo 5 'del ARNm. El ARNm eucariota está cubierto con una 7-metilguanosina (m7G) nucleótido que puede ayudar a reclutar el PIC para el ARNm e iniciar la exploración. Este reclutamiento a la caperuza 5' m7G está respaldado por la incapacidad de los ribosomas eucariotas para traducir el ARNm circular, que no tiene un caperuza 5'. Una vez que el PIC se une al ARNm, escanea hasta que alcanza el primer codón AUG en una secuencia de Kozak. Este escaneo se conoce como el mecanismo de escaneo de iniciación.[9][10][11]

El mecanismo de escaneo de iniciación comienza cuando el PIC se une al extremo 5 'del ARNm. El escaneo es estimulado por las proteínas Dhx29 y Ddx3/Ded1 y eIF4. Dhx29 y Ddx3/Ded1 son helicasas de caja muerta que ayudan a desenrollar cualquier estructura secundaria de ARNm que podría dificultar el escaneo. El escaneo de un ARNm continúa hasta que se alcanza el primer codón AUG en el ARNm, esto se conoce como la "primera regla AUG". Si bien existen excepciones a la "Primera regla AUG", la mayoría de las excepciones tienen lugar en un segundo codón AUG que se encuentra de 3 a 5 nucleótidos aguas abajo del primer AUG, o dentro de los 10 nucleótidos desde la caperuza 5 'del ARNm. En el codón AUG, un anticodón de ARNt de metionina es reconocido por el codón de ARNm. Tras el emparejamiento de bases con el codón de inicio, el eIF5 en el PIC ayuda a hidrolizar un trifosfato de guanosina (GTP) unido al eIF2. Esto conduce a un reordenamiento estructural que obliga al PIC a unirse a la subunidad ribosómica grande (60S) y formar el complejo ribosómico (80S). Una vez que se forma el complejo de ribosomas 80S, comienza la fase de elongación de la traducción.[12][13][14][15]

El primer codón de inicio más cercano a la caperuza 5 'de la hebra no siempre se reconoce si no está contenido en una secuencia similar a Kozak. Lmx1b es un ejemplo de un gen con una secuencia de consenso de Kozak débil. Para el inicio de la traducción desde dicho sitio, se requieren otras características en la secuencia del ARNm para que el ribosoma reconozca el codón de inicio. Pueden ocurrir excepciones a la primera regla AUG si no está contenida en una secuencia similar a Kozak. Esto se denomina escaneo con fugas y podría ser una forma potencial de controlar la traducción a través del inicio. Para el inicio de la traducción desde dicho sitio, se requieren otras características en la secuencia del ARNm para que el ribosoma reconozca el codón de inicio.[16][17]

Se cree que el PIC está estancado en la secuencia de Kozak por interacciones entre eIF2 y los nucleótidos -3 y +4 en la posición de Kozak. Este estancamiento permite que el codón de inicio y el anticodón correspondiente tengan tiempo para formar el enlace de hidrógeno correcto. La secuencia de consenso de Kozak es tan común que la similitud de la secuencia alrededor del codón AUG con la secuencia de Kozak se usa como criterio para encontrar codones de inicio en eucariotas.[18]

Mutaciones y enfermedades

[editar]

La científica Marilyn Kozak demostró, a través del estudio sistemático de mutaciones puntuales, que cualquier mutación en una secuencia de consenso fuerte en la posición -3 o en la posición +4 resultó en un inicio de la traducción muy deteriorado tanto in vitro como in vivo.[19]

La investigación ha demostrado que una mutación de G—>C en la posición −6 del gen de la globina β (β+45; humano) altera la función del fenotipo hematológico y biosintético. Esta fue la primera mutación encontrada en la secuencia de Kozak y mostró una disminución del 30% en la eficiencia de traducción. Se encontró en una familia del sureste de Italia que padecía talasemia intermedia. La displasia campomélica, que es un trastorno que provoca problemas esqueléticos, es el resultado de una mutación aguas arriba en la secuencia de Kozak.[20]

Se hicieron observaciones similares con respecto a las mutaciones en la posición -5 desde el codón de inicio, AUG. La citosina en esta posición, a diferencia de la timina, mostró una traducción más eficiente y una mayor expresión del receptor de adhesión plaquetaria, la glicoproteína Ibα en humanos.[21]

Las mutaciones en la secuencia de Kozak también pueden tener efectos drásticos sobre la salud humana, en particular, la enfermedad cardíaca con el gen GATA4. El gen GATA4 es responsable de la expresión génica en una amplia variedad de tejidos, incluido el corazón. Cuando la guanosina en la posición -6 en la secuencia Kozak de GATA4 se muta a una citosina, se produce una reducción en los niveles de proteína GATA4, lo que provoca una comunicación interauricular en el corazón.[22][23]

La capacidad de la secuencia de Kozak para iniciar la traducción puede generar nuevos codones de iniciación en la región típicamente no traducida de la caperuza 5' (5' UTR) del transcrito de ARNm. Cuando se observó una mutación de G a A en esta región, resultó en una mutación fuera de marco y, por lo tanto, en una proteína. Esta proteína mutada produce displasia campomélica. La displasia campomélica es un trastorno del desarrollo que produce malformaciones esqueléticas.[24]

Véase también

[editar]

Referencias

[editar]
  1. Kozak, M. (February 1989). «The scanning model for translation: an update». The Journal of Cell Biology 108 (2): 229-241. ISSN 0021-9525. PMC 2115416. PMID 2645293. doi:10.1083/jcb.108.2.229. 
  2. Kozak, Marilyn (16 de octubre de 2002). «Pushing the limits of the scanning mechanism for initiation of translation». Gene 299 (1): 1-34. ISSN 0378-1119. PMC 7126118. PMID 12459250. doi:10.1016/S0378-1119(02)01056-9. 
  3. Kozak, Marilyn (8 de julio de 1999). «Initiation of translation in prokaryotes and eukaryotes». Gene 234 (2): 187-208. ISSN 0378-1119. PMID 10395892. doi:10.1016/S0378-1119(99)00210-3. 
  4. Hernández, Greco; Osnaya, Vincent G.; Pérez-Martínez, Xochitl (25 de julio de 2019). «Conservation and Variability of the AUG Initiation Codon Context in Eukaryotes». Trends in Biochemical Sciences 44 (12): 1009-1021. ISSN 0968-0004. PMID 31353284. doi:10.1016/j.tibs.2019.07.001. 
  5. Kozak M (October 1987). «An analysis of 5'-noncoding sequences from 699 vertebrate messenger RNAs». Nucleic Acids Res. 15 (20): 8125-8148. PMC 306349. PMID 3313277. doi:10.1093/nar/15.20.8125. 
  6. Kozak M (1986). «Point mutations define a sequence flanking the AUG initiator codon that modulates translation by eukaryotic ribosomes». Cell 44 (2): 283-92. PMID 3943125. S2CID 15613863. doi:10.1016/0092-8674(86)90762-2. 
  7. Kochetov, Alex V. (1 de abril de 2005). «AUG codons at the beginning of protein coding sequences are frequent in eukaryotic mRNAs with a suboptimal start codon context». Bioinformatics 21 (7): 837-840. ISSN 1367-4803. PMID 15531618. doi:10.1093/bioinformatics/bti136. 
  8. Kozak, M (25 de enero de 1984). «Compilation and analysis of sequences upstream from the translational start site in eukaryotic mRNAs.». Nucleic Acids Research 12 (2): 857-872. ISSN 0305-1048. PMC 318541. PMID 6694911. doi:10.1093/nar/12.2.857. 
  9. Kozak, Marilyn (July 1979). «Inability of circular mRNA to attach to eukaryotic ribosomes». Nature 280 (5717): 82-85. Bibcode:1979Natur.280...82K. ISSN 1476-4687. PMID 15305588. S2CID 4319259. doi:10.1038/280082a0. 
  10. Schmitt, Emmanuelle; Coureux, Pierre-Damien; Monestier, Auriane; Dubiez, Etienne; Mechulam, Yves (21 de febrero de 2019). «Start Codon Recognition in Eukaryotic and Archaeal Translation Initiation: A Common Structural Core». International Journal of Molecular Sciences 20 (4): 939. ISSN 1422-0067. PMC 6412873. PMID 30795538. doi:10.3390/ijms20040939. 
  11. Hinnebusch, Alan G. (2014). «The Scanning Mechanism of Eukaryotic Translation Initiation». Annual Review of Biochemistry 83 (1): 779-812. PMID 24499181. doi:10.1146/annurev-biochem-060713-035802. 
  12. Kozak, M. (28 de marzo de 1995). «Adherence to the first-AUG rule when a second AUG codon follows closely upon the first.». Proceedings of the National Academy of Sciences 92 (7): 2662-2666. Bibcode:1995PNAS...92.2662K. ISSN 0027-8424. PMC 42278. PMID 7708701. doi:10.1073/pnas.92.7.2662. 
  13. Cigan, A. M.; Feng, L.; Donahue, T. F. (7 de octubre de 1988). «tRNAi(met) functions in directing the scanning ribosome to the start site of translation». Science 242 (4875): 93-97. Bibcode:1988Sci...242...93C. ISSN 0036-8075. PMID 3051379. doi:10.1126/science.3051379. 
  14. Pestova, Tatyana V.; Lomakin, Ivan B.; Lee, Joon H.; Choi, Sang Ki; Dever, Thomas E.; Hellen, Christopher U. T. (January 2000). «The joining of ribosomal subunits in eukaryotes requires eIF5B». Nature 403 (6767): 332-335. Bibcode:2000Natur.403..332P. ISSN 1476-4687. PMID 10659855. S2CID 3739106. doi:10.1038/35002118. 
  15. Algire, Mikkel A.; Maag, David; Lorsch, Jon R. (28 de octubre de 2005). «Pi Release from eIF2, Not GTP Hydrolysis, Is the Step Controlled by Start-Site Selection during Eukaryotic Translation Initiation». Molecular Cell 20 (2): 251-262. ISSN 1097-2765. PMID 16246727. doi:10.1016/j.molcel.2005.09.008. 
  16. Alekhina, O. M.; Vassilenko, K. S. (2012). «Translation initiation in eukaryotes: Versatility of the scanning model». Biochemistry (Moscow) 77 (13): 1465-1477. PMID 23379522. S2CID 14157104. doi:10.1134/s0006297912130056. 
  17. Hinnebusch, Alan G. (September 2011). «Molecular Mechanism of Scanning and Start Codon Selection in Eukaryotes». Microbiology and Molecular Biology Reviews 75 (3): 434-467. ISSN 1092-2172. PMC 3165540. PMID 21885680. doi:10.1128/MMBR.00008-11. 
  18. Louis, B. G.; Ganoza, M. C. (1988). «Signals determining translational start-site recognition in eukaryotes and their role in prediction of genetic reading frames». Molecular Biology Reports 13 (2): 103-115. ISSN 0301-4851. PMID 3221841. S2CID 25936805. doi:10.1007/bf00539058. 
  19. Kozak, Marilyn (31 de enero de 1986). «Point mutations define a sequence flanking the AUG initiator codon that modulates translation by eukaryotic ribosomes». Cell 44 (2): 283-292. ISSN 0092-8674. PMID 3943125. S2CID 15613863. doi:10.1016/0092-8674(86)90762-2. 
  20. Kozak, Marilyn (March 1984). «Point mutations close to the AUG initiator codon affect the efficiency of translation of rat preproinsulin in vivo». Nature 308 (5956): 241-246. Bibcode:1984Natur.308..241K. ISSN 1476-4687. PMID 6700727. S2CID 4366379. doi:10.1038/308241a0. 
  21. Afshar-Kharghan, Vahid; Li, Chester Q.; Khoshnevis-Asl, Mohammad; LóPez, José A. (1999). «Kozak Sequence Polymorphism of the Glycoprotein (GP) Ib Gene is a Major Determinant of the Plasma Membrane Levels of the Platelet GP Ib-IX-V Complex». Blood 94: 186-191. doi:10.1182/blood.v94.1.186.413k19_186_191. 
  22. Lee, Y.; Shioi, T.; Kasahara, H.; Jobe, S. M.; Wiese, R. J.; Markham, B. E.; Izumo, S. (June 1998). «The cardiac tissue-restricted homeobox protein Csx/Nkx2.5 physically associates with the zinc finger protein GATA4 and cooperatively activates atrial natriuretic factor gene expression». Molecular and Cellular Biology 18 (6): 3120-3129. ISSN 0270-7306. PMC 108894. PMID 9584153. doi:10.1128/mcb.18.6.3120. 
  23. Mohan, Rajiv A.; Engelen, Klaartje van; Stefanovic, Sonia; Barnett, Phil; Ilgun, Aho; Baars, Marieke J. H.; Bouma, Berto J.; Mulder, Barbara J. M.; Christoffels, Vincent M.; Postma, Alex V. (2014). «A mutation in the Kozak sequence of GATA4 hampers translation in a family with atrial septal defects». American Journal of Medical Genetics Part A 164 (11): 2732-2738. ISSN 1552-4833. PMID 25099673. S2CID 32674053. doi:10.1002/ajmg.a.36703. 
  24. Bohlen, Anna E. von; Böhm, Johann; Pop, Ramona; Johnson, Diana S.; Tolmie, John; Stücker, Ralf; Morris‐Rosendahl, Deborah; Scherer, Gerd (2017). «A mutation creating an upstream initiation codon in the SOX9 5′ UTR causes acampomelic campomelic dysplasia». Molecular Genetics & Genomic Medicine 5 (3): 261-268. ISSN 2324-9269. PMC 5441400. PMID 28546996. doi:10.1002/mgg3.282.