GC-sadržaj

Nukleotidne veze sa A–T i G≡C parove. Strelice pokazuju na vodikove veze

GC-sadržaj (G≡C) ili guaninsko-citozinski sadržaj – u molekulskoj biologiji i genetici – je relativna zastupljenost (obično procenat) dušičnih baza u molekulama DNK ili RNK koje su ili guaninske (G ) ili citozinske (C) .[1] Ova mjera ukazuje na udio G i C baza od četiri ukupno moguće, uključujući također adeninsku i timinsku u DNK, odnosno adeninsku i uracilsku u RNK.

GC-sadržaj može se prikazati za određeni fragment DNK ili RNK ili za čitav genom. Kada se odnosi na fragment, može označavati GC-sadržaj pojedih gena ili njihovih dijelov (domena), grupe gena ili genskih klastera, nekodirajući regija ili sintetskih oligonukleotid a kao što je prajmer.

Struktura

[uredi | uredi izvor]

Kvalitativno, guanin (G) i citozin (C) su u specifičnoj međusobnoj vodikovoj vezi, dok se adenin (A) specifično veže za timin (T) u DNKs, a uracilom (U) u RNK. Kvantitativno, svaki G–C bazni par međusobno drže trostruke veze, dok se bazni parovi AT i AU drže zajedno pomoću dvostruke vodikove veze. Da bi se naglasila ova razlika, osnovni parovi su često predstavljeni kao G≡C, nasuprot A = T ili A = U.

Prostorni model DNK – dvostruka zavojnica: vodikove veze nastaju između komplementarnih parova baza u dvostrukom lancu

DNK s malim sadržajem veza GC manje je stabilna od one s visokim sadržajem ovog para; međutim, same vodikove veze nemaju posebno značajan uticaj na molekulsku stabilnost, koja je umjesto toga uglavnom počiva na interakcijama slaganja baza.[2] Unatoč većoj termostabilnosti dodeljenoj nukleinskoj kiselini sa visokim sadržajem GC, primijećeno je da se najmanje neke vrste bakterija sa visokim sadržajem GC u molekulama sa DNK lakše podvrgavaju autolizi, čime se smanjuje dugovječnost ćelije per se.[3] Zbog termostabilnosti G–C parova, pretpostavljalo se da je visok sadržaj GC neophodan za prilagođavanje visokim temperaturama, ali ova hipoteza pobijena je 2001.[4] Uprkos tome, pokazalo se da postoji jaka korelacija između optimalnog rasta prokariota pri višim temperaturama i sadržaja GC strukturnih RNK, kao što je ribosomna RNK, transportna RNK i mnoge druge nekodirajuće RNK.[4][5] Baznini parovi A–U manje su stabilni od G–C parova baza, što strukture RNK sa visokim sadržajem GC čini otpornijim na efekte visokih temperatura.

U nedavno vrijeme pokazano je da je najvažniji faktor koji doprinosi toplinskoj stabilnosti dvolančanih nukleinskih kiselina zapravo posljedica slaganja baza susjednih baza, a ne broja međusobnih vodikovih veza . GC parovi imaju povoljniju energiju slaganja nego za parove AT ili AU, zbog relativnog položaja egzocikličkih grupa. Pored toga, postoji korelacija između redoslijeda slaganja baza i termostabilnosti molekule u cjelini.[6]

Određivanje

[uredi | uredi izvor]

GC-sadržaj se obično izražava kao procentna vrijednost, ali ponekad i kao omjer (nazvan G + C odnos ili GC-omjer). Procent GC-sadržaja izračunava se kao: [7]

dok se odnos AT/GC izračunava kao:[8]

.

Procenti GC sadržaja, kao i G/C odnos, mogu se mjeriti na nekoliko načina, ali jedan od najjednostavnijih metoda je merenje temperatura topljenja dvostruke zavojnice DNK, pomoću spektrofotometrije. Apsorbancija DNK na talasnoj dužini od 260 nm prilično se naglo povećava kada se dvolančana molekula DNK razdvoji u dvije pojedinačne niti (polulanca) kada se dovoljno zagrije.[9] Kao najčešći protokol za određivanje GC-odnosa, za veliki broj uzoraka koristi protočna citometrija.[10]

Alternativno, ako je ispitivana molekula DNK ili RNA koja pouzdano sekvencirana, tada se sadržaj GC može precizno izračunati jednostavnom aritmetikom ili upotrebom različitih javno dostupnih softverskih alata, kao što bespatni onlajn kalkolator [1].

Genomski sadržaj

[uredi | uredi izvor]

Varijacije unutar genoma

[uredi | uredi izvor]

Utvrđeno je da je GC-omjer u genomu izrazito varijabilan. Ove varijacije unutar genoma složenijih organizama rezultiraju mozaičnom formacijom s otočićima pod nazivom izohore.[11] Ovo rezultira varijacijama intenziteta bojenja u hromosomima.[12] Izohore bogate GC parovima tipski uključuju mnoge gene koji kodiraju proteine u sebi, pa stoga određivanje omjera GC ovih specifičnih regija doprinosi mapirranju genomskih regija bogatih genima.[13][14]

Kodirajuće sekvence

[uredi | uredi izvor]

Unutar dugog područja genomske sekvence, geni se često karakteriziraju višim sadržajem GC za razliku od pozadinskog sadržaja GC za čitav genom. Dokazi o odnosu GC sa odnosom dužine kodirajuće regije gena pokazali su da je dužina kodirajuće sekvence direktno proporcionalna veličini sadržaja G + C.[15] Ovo ukazuje na činjenicu da stop kodon ima pristranost prema A i T nukleotidima, i, prema tome, što je kraća sekvenca, veća je AT pristranost (bias).[16]

Poređenje više od 1.000 ortolognih gena kod sisara, pokazalo je značajne varijacije unutar genomskog položaj trećeg kodona GC, u rasponu od manje od 30% do više od 80%.

Varijacija među genomima

[uredi | uredi izvor]

Utvrđeno je da je sadržaj GC kod različitih organizama varijabilan, a predviđa se da će procesu doprinijeti varijacija u selekciji, mutacijskoj pristranosti i pristranim rekombinacijama vezanaim za popravak DNK.[17]

Prosječni sadržaj GC u ljudskim genomima kreće se od 35% do 60% u fragmentima od 100 Kb, sa prosjekom od 41%.[18] Sadržaj GC kvasaca (Saccharomyces cerevisiae) je 38%,[19] a onaj kod drugog uobičajenog modelnog orgsnizma, Arabidopsis thaliana, je 36%.[20] Zbog prirode genetičkog koda, gotovo je nemoguće da organizam ima genom sa sadržajem GC koji se približava ili 0% ili 100%. Međutim, vrsta s izuzetno niskim sadržajem GC je Plasmodium falciparum (GC% = ~ 20%),[21] i često je uobičajeno pozivanje na takve primjere kao da su AT bogati umjesto GC-siromašni.[22]

Nekoliko vrsta sisara (npr. rovka, mikrošišmiš, tenrek i zec) nezavisno su podvrgnute značajnom povećanju sadržaja GC u njihovim genima. Ove promjene sadržaja GC povezane su s vrstama osobine životne povijesti (npr. tjelesna masa ili dugovječnost) i veličina genoma,[23] a mogu biti povezane s molekulskim fenomenom koji se naziva GC-pristrana konverzija gena.[24]

Primjena

[uredi | uredi izvor]

Molekulska biologija

[uredi | uredi izvor]

U eksperimentima s lančane poimerazne reakcije (PCR), sadržaj GC kratkih oligonukleotida poznatih kao začetnice često se koristi za predviđanje njihove temperatura žarenja na DNK predlošku. Viši nivo sadržaja GC ukazuje na relativno višu temperaturu topljenja.

Biositematika

[uredi | uredi izvor]

Rješavanje problema vrste u taksonomiji neeukariota doveo je do različitih prijedloga za klasifikaciju bakterija, a ad hoc odbor za pomirenje pristupa bakterijskoj sistematici preporučio je upotrebu GC omjera u hijerarhijskoj klasifikaciji na višem nivou.[25] Naprimjer Actinobacteria su okarakterizirane kao bakterije sa visokim sadržejem para GC.[26] Kod Streptomyces coelicolor A3(2), GC-sadržaj je 72%.[27]

Softverski alati

[uredi | uredi izvor]

GCSpeciesSorter [28] i TopSort[29] su softverski alati za klasifikaciju vrsta na osnovu njihovih GC-sadržaja.

Također pogledajte

[uredi | uredi izvor]

Reference

[uredi | uredi izvor]
  1. ^ Definition of GC – content on CancerWeb of Newcastle University,UK
  2. ^ Yakovchuk P, Protozanova E, Frank-Kamenetskii MD (2006). "Base-stacking and base-pairing contributions into thermal stability of the DNA double helix". Nucleic Acids Res. 34 (2): 564–74. doi:10.1093/nar/gkj454. PMC 1360284. PMID 16449200.
  3. ^ Levin RE, Van Sickle C (1976). "Autolysis of high-GC isolates of Pseudomonas putrefaciens". Antonie van Leeuwenhoek. 42 (1–2): 145–55. doi:10.1007/BF00399459. PMID 7999.
  4. ^ a b Hurst LD, Merchant AR (mart 2001). "High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes". Proc. Biol. Sci. 268 (1466): 493–7. doi:10.1098/rspb.2000.1397. PMC 1088632. PMID 11296861.
  5. ^ Galtier, N.; Lobry, J.R. (1997). "Relationships between genomic G+C content, RNA secondary structures, and optimal growth temperature in Prokaryotes". Journal of Molecular Evolution. 44 (6): 632–636. Bibcode:1997JMolE..44..632G. doi:10.1007/PL00006186. PMID 9169555.
  6. ^ Yakovchuk, Peter; Protozanova, Ekaterina; Frank-Kamenetskii, Maxim D. (2006). "Base-stacking and base-pairing contributions into thermal stability of the DNA double helix". Nucleic Acids Research. 34 (2): 564–574. doi:10.1093/nar/gkj454. ISSN 0305-1048. PMC 1360284. PMID 16449200.
  7. ^ Madigan,MT. and Martinko JM. (2003). Brock biology of microorganisms (10th izd.). Pearson-Prentice Hall. ISBN 978-84-205-3679-8.
  8. ^ "Definition of GC-ratio on Northwestern University, IL, USA". Arhivirano s originala, 20. 6. 2010. Pristupljeno 18. 3. 2021.
  9. ^ Wilhelm J, Pingoud A, Hahn M (maj 2003). "Real-time PCR-based method for the estimation of genome sizes". Nucleic Acids Res. 31 (10): e56. doi:10.1093/nar/gng056. PMC 156059. PMID 12736322.
  10. ^ Vinogradov AE (maj 1994). "Measurement by flow cytometry of genomic AT/GC ratio and genome size". Cytometry. 16 (1): 34–40. doi:10.1002/cyto.990160106. PMID 7518377.
  11. ^ Bernardi G (januar 2000). "Isochores and the evolutionary genomics of vertebrates". Gene. 241 (1): 3–17. doi:10.1016/S0378-1119(99)00485-0. PMID 10607893.
  12. ^ Furey TS, Haussler D (maj 2003). "Integration of the cytogenetic map with the draft human genome sequence". Hum. Mol. Genet. 12 (9): 1037–44. doi:10.1093/hmg/ddg113. PMID 12700172.
  13. ^ Sumner AT, de la Torre J, Stuppia L (august 1993). "The distribution of genes on chromosomes: a cytological approach". J. Mol. Evol. 37 (2): 117–22. Bibcode:1993JMolE..37..117S. doi:10.1007/BF02407346. PMID 8411200.
  14. ^ Aïssani B, Bernardi G (oktobar 1991). "CpG islands, genes and isochores in the genomes of vertebrates". Gene. 106 (2): 185–95. doi:10.1016/0378-1119(91)90198-K. PMID 1937049.
  15. ^ Pozzoli U, Menozzi G, Fumagalli M, et al. (2008). "Both selective and neutral processes drive GC content evolution in the human genome". BMC Evol. Biol. 8: 99. doi:10.1186/1471-2148-8-99. PMC 2292697. PMID 18371205.
  16. ^ Wuitschick JD, Karrer KM (1999). "Analysis of genomic G + C content, codon usage, initiator codon context and translation termination sites in Tetrahymena thermophila". J. Eukaryot. Microbiol. 46 (3): 239–47. doi:10.1111/j.1550-7408.1999.tb05120.x. PMID 10377985.
  17. ^ Birdsell JA (1. 7. 2002). "Integrating genomics, bioinformatics, and classical genetics to study the effects of recombination on genome evolution". Mol. Biol. Evol. 19 (7): 1181–97. doi:10.1093/oxfordjournals.molbev.a004176. PMID 12082137.
  18. ^ International Human Genome Sequencing Consortium (Feb 2001). "Initial sequencing and analysis of the human genome". Nature. 409 (6822): 860–921. Bibcode:2001Natur.409..860L. doi:10.1038/35057062. PMID 11237011.CS1 održavanje: upotreba parametra authors (link) (page 876)
  19. ^ Whole genome data of Saccharomyces cerevisiae on NCBI
  20. ^ Whole genome data of Arabidopsis thaliana on NCBI
  21. ^ Whole genome data of Plasmodium falciparum on NCBI
  22. ^ Musto H, Cacciò S, Rodríguez-Maseda H, Bernardi G (1997). "Compositional constraints in the extremely GC-poor genome of Plasmodium falciparum" (PDF). Mem. Inst. Oswaldo Cruz. 92 (6): 835–41. doi:10.1590/S0074-02761997000600020. PMID 9566216.
  23. ^ Romiguier, Jonathan; Ranwez, Vincent; Douzery, Emmanuel J. P.; Galtier, Nicolas (1. 8. 2010). "Contrasting GC-content dynamics across 33 mammalian genomes: Relationship with life-history traits and chromosome sizes". Genome Research (jezik: engleski). 20 (8): 1001–1009. doi:10.1101/gr.104372.109. ISSN 1088-9051. PMC 2909565. PMID 20530252.
  24. ^ Duret L, Galtier N (2009). "Biased gene conversion and the evolution of mammalian genomic landscapes". Annu Rev Genom Hum Genet. 10: 285–311. doi:10.1146/annurev-genom-082908-150001. PMID 19630562.
  25. ^ Wayne LG; et al. (1987). "Report of the ad hoc committee on reconciliation of approaches to bacterial systematic". International Journal of Systematic Bacteriology. 37 (4): 463–4. doi:10.1099/00207713-37-4-463.
  26. ^ Taxonomy browser on NCBI
  27. ^ Whole genome data of Streptomyces coelicolor A3(2) on NCBI
  28. ^ Karimi K, Wuitchik D, Oldach M, Vize P (2018). "Distinguishing Species Using GC Contents in Mixed DNA or RNA Sequences". Evol Bioinform Online. 14 (January 1, 2018): 1176934318788866. doi:10.1177/1176934318788866. PMC 6052495. PMID 30038485.
  29. ^ Lehnert E, Mouchka M, Burriesci M, Gallo N, Schwarz J, Pringle J (2014). "Extensive differences in gene expression between symbiotic and aposymbiotic cnidarians". G3 (Bethesda). 4 (2): 277–95. doi:10.1534/g3.113.009084. PMC 3931562. PMID 24368779.

Vanjski linkovi

[uredi | uredi izvor]