Dio članaka o |
Genetici |
---|
Ključne komponente |
Historija i teme |
Istraživanje |
Personalizovana medicina |
Personalizovana medicina |
Metagenomika je proučavanje genetičkog materijala dobijenog direktno iz okruženja ili kliničkih uzoraka, metodom zvanom sekvenciranje. Široko polje se također može nazvati genomika okoline, ekogenomika, genomika zajednice ili mikrobiomika.
Dok se tradicionalna mikrobiologija i mikrobno sekvenciranje genoma i genomika oslanjaju na kultivirane klonske kulture, rano sekvenciranje gena u okolini kloniralo je specifične gene (često 16S rRNK) za proizvodnju profila raznolikosti u prirodnom uzorku. Takav rad je otkrio da je velika većina mikrobne bioraznolikosti propuštena metodama zasnovanim na uzgoju.[2]
Zbog svoje sposobnosti da otkrije prethodno skrivenu raznolikost mikroskopskog života, metagenomika nudi moćno sočivo za sagledavanje mikrobnog svijeta, koje ima potencijal da revolucionira razumijevanjem cijelog živog svijeta.[3] Kako cijena sekvenciranja DNK nastavlja da opada, metagenomika sada omogućava da se mikrobna ekologija istražuje u mnogo većoj skali i detaljima nego prije. Nedavne studije koriste ili "nasumićno sekvenciranje" ili PCR usmjereno sekvenciranje kako bi se dobili uglavnom nepristrasni uzorci svih gena od svih članova uzorkovanih zajednica.[4]
Termin "metagenomika" prvi su upotrijebili Jo Handelsman, Robert M. Goodman, Michelle R. Rondon, Jon Clardy i Sean F. Brady, a prvi put se pojavio u publikaciji 1998.[5] Termin metagenom se odnosio na ideju da se kolekcija gena sekvenciranih iz okoline može analizirati na način analogan proučavanju jednog genoma. Godine 2005., Kevin Chen i Lior Pachter (istraživači na Univerzitetu Kalifornije, Berkeley) definisali su metagenomiku kao "primenu moderne tehnike genomike bez potrebe za izolacijom i laboratorijskim uzgojem pojedinačnih vrsta".< ref name="Chen2005"/>
Šablon:DNK barkodiranje Konvencijsko sekvenciranje počinje kulturom identičnih ćelija kao izvora DNK. Međutim, rane metagenomske studije otkrile su da vjerovatno postoje velike grupe mikroorganizama u mnogim sredinama koje se ne mogu kultivisati i stoga ne mogu sekvencirati. Ove rane studije fokusirale su se na sekvence 16S ribosomske RNK (rRNK) koje su relativno kratke, često konzervirane unutar vrsta, i općenito različite među vrstama. Pronađene su mnoge sekvence 16S rRNK koje ne pripadaju nijednoj poznatoj kultivisanoj vrsti, što ukazuje da postoje brojni neizolovani organizmi. Ova istraživanja gena ribosomske RNK uzetih direktno iz okoline otkrila su da metode zasnovane na kultivaciji pronalaze manje od 1% bakterijskih i Archaeal vrsta u uzorku.[2] Veliki dio interesovanja za metagenomiku potiče od ovih otkrića koja su pokazala da je velika većina mikroorganizama ranije prošla nezapaženo. Ranih 1980-ih molekulska istraživanja na terenu su vodili Norman R. Pace i kolege, koji su koristili PCR za istraživanje raznolikosti sekvenci ribosomske RNK.[6] Uvidi stečeni iz ovih revolucionarnih studija naveli su Pacea da predloži ideju kloniranja DNK direktno iz uzoraka okoliša još 1985.[7] Ovo je dovelo do prvog izvještaja o izolaciji i kloniranja masovne DNK iz uzorka okoliša, koji su objavili Pace i kolege 1991.[8] dok je Pace bio na Odsjeku za biologiju u Univerziteta Indijana. Značajni napori su osigurali da ovo nisu PCR lažno pozitivni i podržali postojanje složene zajednice neistraženih vrsta. Iako je ova metodologija bila ograničena na istraživanje visoko konzerviranih, gena koji ne kodiraju proteine, ona je podržala rana zapažanja zasnovana na mikrobnoj morfologiji da je raznolikost daleko složenija nego što je to bilo poznato metodama uzgoja. Ubrzo nakon toga, 1995. godine, Healy je izvijestio o metagenomskoj izolaciji funkcionalnih gena iz "zooliblioteka" konstruiranih od kompleksne kulture ekoloških organizama uzgojenih u laboratoriji na osušenim travama.[9] Nakon odlaska Laboratorija Pace, Edward DeLong nastavio je na terenu i objavio rad koji je u velikoj mjeri postavio temelje za filogenije životne sredine, zasnovane na signaturnim sekvencama 16S, počevši od njegove grupe izgradnjom biblioteka iz morskih uzoraka .[10]
Godine 2002. Mya Breitbart, Forest Rohwer i kolege su koristili nasumično sekvenciranje (vidi dolje) kako bi pokazali da 200 litara morske vode sadrži preko 5000 različitih virusa.[11] Naknadne studije su pokazale da postoji više od hiljadu vrsta virusa u ljudskoj stolici i možda milion različitih virusa po kilogramu morskog sedimenta, uključujući mnoge bakteriofage. U suštini svi virusi u ovim studijama bili su nove vrste. Godine 2004, Gene Tyson, Jill Banfield i kolege sa Univerzitet Kalifornije, Berkeley i Joint Genome Institute su sekvencionirali DNK ekstrahiranu iz acid mine drainage sistema.[12] Ovaj napor je rezultirao kompletnim, ili gotovo potpunim, genomima za šačicu bakterija i archaea koji su se ranije odupirali pokušajima njihovog uzgoja.[13]
Počevši od 2003. godine, Craig Venter, vođa privatno finansirane paralele Projekta ljudskog genoma, predvodi Globalnu ekspediciju za uzorkovanje okeana (GOS), obilazeći svijet i prikupljajući metagenomske uzorke širom svijeta putovanje. Svi ovi uzorci su sekvencionirani pomoću nasumičnog sekvenciranja, u nadi da će novi genomi (a samim tim i novi organizmi) biti identificirani. Pilot projekat, sproveden u Sargaškom moru, pronašao je DNK od skoro 2000 različitih vrsta, uključujući 148 tipova bakterija koje nikada ranije nisu viđene.[14] Venter je temeljito istražio Zapadnu obalu Sjedinjenih Država, i završio dvogodišnju ekspediciju da istraži Baltik, Mediteran i Crno more. Analiza metagenomskih podataka prikupljenih tokom ovog putovanja otkrila je dvije grupe organizama, jednu sastavljenu od taksona prilagođenih ekološkim uvjetima 'gozba ili glad', a drugu sastavljenu od relativno manjeg broja, ali obilnije i šire rasprostranjenih taksona prvenstveno sastavljenih od planktona.[15]
Godine 2005. Stephan C. Schuster i kolege sa Penn State University objavili su prve sekvence uzorka okoline generirane pomoću visokopropusnog sekvenciranja, u ovom slučaju masovno paralelnog pirosekvenciranja koje je razvio 454 Life Sciences.[16] Još jedan rani rad u ovoj oblasti pojavio se 2006. Robert Edwards, Forest Rohwer, i kolege sa San Diego State Univerziteta.[17]
Oporavak DNK sekvenci dužih od nekoliko hiljada baznih parovas iz okoline uzoraka bio je veoma težak sve dok nedavni napredak u molekularno biološkim tehnikama nije omogućio konstrukciju biblioteke u bakterijski umjetni hromozom (BAC), što je omogućilo bolje vektore za molekularno kloniranje.[19]
Napredak u bioinformatici, poboljšanja amplifikacije DNK i širenje računarske snage uveliko su pomogli analizi sekvenci DNK dobijenih iz uzoraka okoline, omogućavajući prilagođavanje nasumičnog sekvenciranja metagenomskim uzorcima (poznatim i kao cjeloviti metagenomska sačmarica ili WMGS sekvenciranje). Pristup, koji se koristi za sekvenciranje mnogih kultiviranih mikroorganizama i ljudski genom, nasumično siječe DNK, sekvencira mnogo kratkih sekvenci i rekonstruiše ih u konsenzusnu sekvencu. Nasumično sekvenciranje otkriva gene prisutne u uzorcima okoliša. Historijski gledano, biblioteke klonova su korištene da bi se olakšalo ovo sekvenciranje. Međutim, s napretkom u tehnologijama sekvenciranja visoke propusnosti, korak kloniranja više nije neophodan i veći prinosi podataka sekvenciranja mogu se dobiti bez ovog napornog koraka uskog grla. Ova metagenomika pruža informacije o tome koji su organizmi prisutni i koji su metabolički procesi mogući u zajednici.[20] Budući da je prikupljanje DNK iz okoline uglavnom nekontrolisano, najzastupljeniji organizmi u uzorku životne sredine su najzastupljeniji u rezultujućim podacima sekvence. Da bi se postigla visoka pokrivenost koja je potrebna za potpuno rješavanje genoma nedovoljno zastupljenih članova zajednice, potrebni su veliki uzorci, često pretjerano. S druge strane, nasumična priroda sekvenciranja osigurava da će mnogi od ovih organizama, koji bi inače ostali nezapaženi koristeći tradicijske tehnike uzgoja, biti predstavljeni barem nekim malim segmentima sekvence.[12]
Prednost sekvenciranja visoke propusnosti je ta što ova tehnika ne zahtijeva kloniranje DNK prije sekvenciranja, uklanjajući jednu od glavnih predrasuda i uskih grla u uzorkovanju okoliša. Prve metagenomske studije sprovedene korišćenjem visokopropunsnog sekvenciranja koristile su masovno paralelno sa 454 pirosekvenciranjem.[16] Tri druge tehnologije koji se uobičajeno primenjuju na uzorkovanje životne sredine su Ionske Torrentove personalne genomske mašine, Illumina MiSeq ili HiSeq i Applied Biosystems SOLiD sistem.[21] Ove tehnike sekvenciranja DNK stvaraju kraće fragmente od Sangerovskog sekvenciranja; Ion Torrent PGM sistem i 454 pirosekvenci obično daju ~400 bp čitanja, Illumina MiSeq proizvodi 400-700bp čitanja (u zavisnosti od toga da li se koriste uparene krajnje opcije), a SOLiD proizvodi 25-75 bp čitanja.<20 name="schu" /> Istorijski gledano, ove dužine čitanja su bile znatno kraće od tipične dužine čitanja Sanger sekvence od ~750 bp, međutim Illumina tehnologija se brzo približava ovom standardu. Međutim, ovo ograničenje je nadoknađeno mnogo većim brojem čitanja sekvence. U 2009. metagenomi s pirosekvenciranjem generiraju 200–500 megabaza, a Illumina platforme generiraju oko 20–50 gigabaza, ali su se ti rezultati posljednjih godina povećali za redove veličine.[22]
Pristup u nastajanju kombinuje nasumično sekvenciranje i hvatanje konformacije hromosoma (Hi-C), koji mjeri blizinu bilo koje dvije DNK sekvence unutar iste ćelije, kako bi se usmjerio sklop mikrobnog genoma.[23] Tehnologije za sekvenciranje dugog čitanja, uključujući PacBio RSII i PacBio Sequel od Pacific Biosciences, i Nanopore MinION, GridION, PromethION od Oxford Nanopore Technologies, je još jedan izbor za dobijanje dugih čitanja sekvenci sačmarica koja bi trebala olakšati proces sastavljanja.[24]
Podaci dobijeni metagenomskim eksperimentima su ogromni i inherentno bogati, sadrže fragmentirane podatke koji predstavljaju čak 10.000 vrsta.[[1] Sekvenciranje metagenoma kravljeg rumena generiralo je 279 gigabaza, ili 279 milijardi baznih parova podataka o sekvenci nukleotida,[26] dok je katalog gena mikrobioma ljudskog crijeva identificirao 3,3 miliona gena sastavljenih iz 567,7 gigabaza podataka o sekvenci.[27] Prikupljanje, kuriranje i izdvajanje korisnih bioloških informacija iz skupova podataka ove veličine predstavljaju značajan računski izazov za istraživače.[20][28][29][30]
Prvi korak analize metagenomskih podataka zahtijeva izvršenje određenih koraka prethodnog filtriranja, uključujući uklanjanje suvišnih, nekvalitetnih sekvenci i sekvenci vjerovatnog eukariotskog porijekla (posebno u metagenomima ljudskog porijekla).[31][32] Dostupni metodi za uklanjanje kontaminirajućih eukariotskih genomskih DNK sekvenci uključuju Eu-Detect i DeConseq.[33][34]
Podaci o sekvenci DNK iz genomskih i metagenomskih projekata su u suštini isti, ali podaci o genomskoj sekvenci nude veću pokrivenost dok su metagenomski podaci obično vrlo nesuvišni.[29] Nadalje, povećane upotreba tehnologije sekvenciranja druge generacije s kratkim dužinama čitanja znači da će veliki dio budućih metagenomskih podataka biti sklon greškama. Uzeti u kombinaciji, ovi faktori čine sklapanje čitanja metagenomskih sekvenci u genome teškim i nepouzdanim. Pogrešne sastavljanja su uzrokovane prisustvom ponavljajućih sekvenci DNK koje posebno otežavaju sastavljanje, zbog razlike u relativnoj brojnosti vrsta prisutnih u uzorku.[35] Pogrešne sklapanje također može uključivati kombinaciju sekvenci iz više od jedne vrste u himerne kontige.[35]
Postoji nekoliko programa za sklapanje, od kojih većina može koristiti informacije iz forme upareni kraj sa krajem, kako bi se poboljšala tačnost sklopova. Neki programi, kao što su Phrap ili Celera Assembler, dizajnirani su da se koriste za sastavljanje pojedinačnih genoma, ali ipak daju dobre rezultate pri sastavljanju skupova metagenomskih podataka.[1] Ostali programi, kao što je Velvet asembler, optimizirani su za kraća čitanja proizvedena sekvenciranjem druge generacije korištenjem de Brujinovih grafikona.[36][37] Upotreba referentnih genoma omogućava istraživačima da poboljšaju sastavljanje najzastupljenijih mikrobnih vrsta, ali ovaj pristup je ograničen malim podskupom mikrobnih tipova za koje su dostupni sekvencirani genomi.[35] Nakon sklapanja stvoren, dodatni izazov je "metagenomska dekonvolucija", ili određivanje koje sekvence potiču od koje vrste u uzorku.[38]
Metagenomska analiza Pipelinea koristi dva pristupa u označavanju regiona kodiranja u sastavljenim kontigama.[35] Prvi pristup je da se identifikuju geni na osnovu homologije sa genima koji su već javno dostupni u bazi podataka sekvenci, obično BLAST pretragama. Ovaj tip pristupa implementiran je u programu MEGAN4.[39] Drugi, ab initio, koristi unutrašnje karakteristike sekvence za predviđanje regiona kodiranja na osnovu na setove za obuku gena iz srodnih organizama. Ovo je pristup koji koriste programi kao što su GeneMark[40] i GLIMMER. Glavna prednost ab initio predviđanja je da omogućava detekciju kodirajućih regiona kojima nedostaju homolozi u bazama podataka sekvenci; međutim, najprecizniji je kada postoje velike regije susjedne genomske DNK dostupne za poređenje.[1]
Metagenomska analiza pipelines koristi dva pristupa u označavanju regiona kodiranja u sastavljenim kontigama.[35] Prvi pristup je da se identifikuju geni na osnovu homologija sa genima koji su već javno dostupni u bazi podataka sekvencis, obično BLAST pretragama. Ovaj tip pristupa implementiran je u programu MEGAN4.[39] Drugi, ab initio, koristi intrinzične karakteristike sekvence za predviđanje regiona kodiranja na osnovu na setove za obuku gena iz srodnih organizama. Ovo je pristup koji koriste programi kao što su GeneMark[40] i GLIMMER. Glavna prednost ab initio predviđanja je da omogućava detekciju kodirajućih regiona kojima nedostaju homolozi u bazama podataka sekvenci; međutim, najprecizniji je kada postoje velike regije susedne genomske DNK dostupne za poređenje.[1]
Anotacije gena daju "šta", dok mjerenja raznolikost vrsta daju "ko".[41] Da bi se povezao sastav zajednice i funkcija u metagenomima, sekvence moraju biti binirane. Bining je proces povezivanja određene sekvence sa organizmom.[35] U biningu zasnovanom na sličnosti, metodi kao što je BLAST koriste se za brzo pretraživanje za filogenetske markere ili na drugi način slične sekvence u postojećim javnim bazama podataka. Ovaj pristup je implementiran u MEGAN.[42] Drugi alat, PhymmBL, koristi interpolirani Markovljev model za dodjelu čitanja.[1] MetaPhlAn i AMPHORA su metodi zasnovani na jedinstvenim markerima specifičnim za kladuse za procjenu relativne zastupljenosti organizma uz poboljšane računarske performanse.[43] Ostali alati, poput mOTUs[44][45] i MetaPhyler,[46] koriste univerzalne markerske gene za profiliranje prokariotskih vrsta. Pomoću mOTUs profilera moguće je profilirati vrste bez referentnog genoma, poboljšavajući procjenu raznolikosti mikrobne zajednice.[45] Najnoviji metodi, kao npr. SLIMM, koristite pejzaž pokrivenosti čitanja pojedinačnih referentnih genoma da minimiziraju lažno pozitivne pogotke i dobiju pouzdane relativno bogate podatke.[47] U grupisanju zasnovanom na kompoziciji, metodi koriste unutrašnjee karakteristike sekvence, kao što su frekvencije oligonukleotida ili kodon pristranosti upotrebe.[1] Kada se sekvence sakupe, moguće je izvršiti komparativnu analizu raznolikosti i bogatstva.
Ogromna količina eksponencijalno rastućih podataka o sekvenci je zastrašujući izazov koji je komplikovan zbog složenosti metapodataka povezanih s metagenomskim projektima. Metapodaci uključuju detaljne informacije o trodimenzijskoj (uključujući dubinu ili visinu) geografiji i karakteristikama okoliša uzorka, fizičke podatke o mjestu uzorkovanja i metodologiju uzorkovanja.[29] Ove informacije su neophodne kako bi se osigurala replikacija i omogućila nizvodna analiza. Zbog svoje važnosti, metapodaci i kolaborativni pregled i kuriranje podataka zahtijevaju standardizirane formate podataka koji se nalaze u specijaliziranim bazama podataka, kao što je Genomes OnLine Database (GOLD).[48]
Razvijeno je nekoliko alata za integraciju metapodataka i podataka o sekvenci, omogućavajući nizvodno komparativne analize različitih skupova podataka korištenjem brojnih ekoloških indeksa. Godine 2007, Folker Meyer i Robert Edwards i tim u Argonne National Laboratory i Univerzitet u Chicagu objavili su Metagenomics Rapid Annotation koristeći server Subsystem Technology (MG-RAST) resurs zajednice za Analize skupova podataka metagenoma.[49] Od juna 2012. analizirano je više od 14,8 terabaza (14x1012 baza) DNK, sa više od 10.000 javnih skupova podataka koji su slobodno dostupni za poređenje u okviru MG-RAST. Preko 8.000 korisnika je sada dostavilo ukupno 50.000 metagenoma MG-RAST-u. Integrisani mikrobiološki genomi/metagenomi (IMG/M) također obezbeđuje kolekciju alata za funkcionalnu analizu mikrobnih zajednica, na osnovu njihove metagenomske sekvence, zasnovane na referentnim genomima izolata uključenih iz Integrated Microbial Genomes (IMG) sistem i Genomic Encyclopedia of Bacteria and Archaea (GEBA) projekt.[50]
Jedan od prvih samostalnih alata za analizu podataka o metagenomskim pretragama visoke propusnosti bio je MEGAN (MEta Genome ANAlyzer).[39][42] Prva verzija programa je korištena 2005. za analizu metagenomskog konteksta DNK sekvenci dobijenih iz kosti mamuta.[16] Na osnovu BLASTnog poređenja sa referentnom bazom podataka, ovaj alat obavlja taksonomski i funkcionalni bining, postavljanjem očitavanja na čvorove NCBI taksonomije, koristeći jednostavan algoritam najnižeg zajedničkog pretka (LCA) ili na čvorove SEED ili KEGG klasifikacije.< ref name="mitra2011"/>
Sa pojavom brzih i jeftinih instrumenata za sekvenciranje, rast baza podataka sekvenci DNK sada je eksponencijalan (npr. NCBI GenBank baza podataka [51]). Potrebni su brži i efikasniji alati da bi se držao korak sa sekvenciranjem visoke propusnosti, jer pristupi zasnovani na BLAST-u, kao što su MG-RAST ili MEGAN, rade sporo za označavanje velikih uzoraka (npr. nekoliko sati za obradu skupa podataka/uzorka male/srednje veličine [52]). Tako su se nedavno pojavili ultrabrzi klasifikatori, zahvaljujući pristupačnijim moćnim serverima. Ovi alati mogu izvršiti taksonomsko označavanje izuzetno velikom brzinom, na primjer CLARK [53] (prema CLARK-ovim autorima, može precizno klasificirati "32 miliona metagenomskih kratkih čitanja u minuti"). Pri takvoj brzini, veoma veliki skup podataka/uzoraka od milijardu kratkih čitanja može se obraditi za oko 30 minuta.
Uz sve veću dostupnost uzoraka koji sadrže drevnu DNK i zbog nesigurnosti povezane s prirodom tih uzoraka (oštećenja drevne DNK),[54] brz alat sposoban za proizvodnju konzervativnih procjena sličnosti je stavljen na raspolaganje. Prema FALCON-ovim autorima, može koristiti opuštene pragove i uređivati udaljenosti bez utjecaja na memoriju i performanse brzine.
Komparativne analize metagenoma mogu pružiti dodatni uvid u funkciju složenih mikrobnih zajednica i njihovu ulogu u zdravlju domaćina.[55] Uparena ili višestruka poređenja između metagenoma mogu se napraviti na nivou sastava sekvence (upoređivanje GC-sadržaja ili veličina genoma), taksonomska raznolikost ili funkcionalna dopuna. Poređenja strukture populacije i filogenetske raznolikosti mogu se napraviti na osnovu 16S rRNA i drugih gena filogenetskih markera, ili — u slučaju zajednica sa niskim diverzitetom — rekonstrukcijom genoma iz metagenomskog skupa podataka.< ref name="simon2011"/> Funkcionalna poređenja između metagenoma mogu se napraviti poređenjem sekvenci sa referentnim bazama podataka kao što su COG ili KEGG, i tabelariziranjem brojnosti po kategorijama i procjenom svih razlika za statističke značaj.[56] Ovaj gen-centrični pristup naglašava funkcionalnu dopunu zajednice u cjelini, a ne taksonomske grupe, i pokazuje da su funkcionalni komplementi analogni u sličnim uvjetima okoline.[57] Posljedično, metapodaci o okolišnom kontekstu metagenomskog uzorka posebno su važni u komparativnim analizama, jer istraživačima pružaju mogućnost proučavanja uticaja staništa, prema strukturi i funkciji zajednice.[1]
Osim toga, nekoliko studija je također koristilo obrasce upotrebe oligonukleotida, kako bi se identificirale razlike između različitih mikrobnih zajednica. Primjeri takvih metodologija uključuju pristup relativnog obilja dinukleotida kod Willner et al.[58] and the HabiSign approach of Ghosh et al.[59] Ova potonja studija je također pokazala da se razlike u obrascima upotrebe tetranukleotida mogu koristiti za identifikaciju gena (ili metagenomskih očitanja) koji potiču iz specifičnih staništa. Pored toga, neki metodi, kao što su TriageTools[60] ili Compareads[61] otkrivaju slična čitanja između dva skupa čitanja. Mjera sličnosti koju primjenjuju na čitanja zasniva se na broju identičnih riječi dužine koje dijele parovi čitanja.
Ključni cilj u komparativnoj metagenomici je da se identifikuju mikrobne grupe koje su odgovorne za davanje specifičnih karakteristika datom okruženju. Međutim, zbog problema u tehnologijama sekvenciranja artefakte treba uzeti u obzir kao u metagenomeSeq.[28] Drugi su karakterizirali međumikrobne interakcije između rezidentnih mikrobnih grupa. Aplikaciju za komparativnu metagenomsku analizu zasnovanu na GUI pod nazivom Community-Analyzer razvili su Kuntal et al.[62] koji implementira algoritam rasporeda grafikona zasnovan na korelaciji koji ne samo da olakšava brzu vizualizaciju razlika u analiziranim mikrobnim zajednicama (u smislu njihovog taksonomskog sastava), već također pruža uvid u inherentne međumikrobne interakcije koje se u njima dešavaju. Značajno je da ovaj algoritam rasporeda takođe omogućava grupiranje metagenoma na osnovu vjerovatnih obrazaca međumikrobne interakcije, a ne jednostavno upoređivanje vrednosti obilja različitih taksonomskih grupa. Osim toga, alat implementira nekoliko interaktivnih GUI-baziranih funkcionalnosti koje omogućavaju korisnicima da izvrše standardne komparativne analize kroz mikrobiome.
U mnogim bakterijskim zajednicama, prirodnim ili napravljenim (kao što su bioreaktor), postoji značajna podjela rada u metabolizmu (sintrofija), tokom koje su otpadni proizvodi nekih organizama metaboliti za druge.<ref. name="werner2011"/> U jednom takvom sistemu, metanogeni bioreaktor, funkcionalna stabilnost zahtijeva prisustvo nekoliko sintrofijskih redova (Syntrophobacterales i Synergistia) koje rade zajedno kako bi se sirovi resursi pretvorili u potpuno metabolizirani otpad (metan).[63] Koristeći komparativne studije gena i eksperimenata ekspresije sa mikročipovima ili proteomikom istraživači mogu sastaviti metaboličku mrežu koja nadilazi granice vrsta. Takve studije zahtijevaju detaljno znanje o tome koje su verzije kojih proteina kodirane od strane koje vrste, pa čak i od kojih sojeva koje vrste. Stoga su genomske informacije zajednice još jedno osnovno sredstvo (sa metabolomikom i proteomikom) u potrazi za određivanjem kako se metaboliti prenose i transformiraju od strane zajednice.[64]
Metagenomika omogućava istraživačima da pristupe funkcionalnoj i metaboličkoj raznolikosti mikrobnih zajednica, ali ne može pokazati koji su od ovih procesa aktivni.[57] Ekstrakcija i analiza metagenomske iRNK (' metatranskriptom) pruža informacije o regulaciji i ekspresijskim profilima složenih zajednica. Zbog tehničkih poteškoća (kratki poluživot iRNK, naprimjer) u prikupljanju okolinske RNK bilo je relativno malo in situ metatranskriptomske studije mikrobnih zajednica do danas.[57] Iako su prvobitno ograničene na tehnologiju mikronizne, metatranskriptomske studije su koristile tehnologije transkriptomike za mjerenje ekspresije cijelog genoma i kvantifikacije mikrobne zajednice,[57] prvi put korišten u analizi oksidacije amonijaka u tlu.[65]
Metagenomsko sekvenciranje je posebno korisno u proučavanju virusnih zajednica. Kako virusima nedostaje zajednički univerzalni filogenetski marker (kao 16S RNK za bakterije i arheje i 18S RNK za eukariote), jedini način da se pristupi genetičkoj raznolikosti virusnih zajednica iz uzorka životne sredine je putem metagenomike. Virusni metagenomi (koji se nazivaju i viromi) bi stoga trebali pružiti sve više i više informacija o virusnoj raznolikosti i evoluciji.[66][67][68][69][70] Naprimjer, metagenomski cjevovod pod nazivom Gigantski pretraživač virusa pokazao je prvi dokaz postojanja gigantskih virusa u slanoj pustinji [71] and in Antarctic dry valleys.[72]
Metagenomika ima potencijal da unapredi znanje u raznim oblastima. Može se primijeniti i za rješavanje praktičnih izazova u medicini, inženjersrtvu, poljoprivredi, održivosti i ekologiji.[29][73]
Tla u kojima biljke rastu naseljene su mikrobnim zajednicama, pri čemu jedan gram tla sadrži oko 109-1010 mikrobnih ćelija koje čine oko jedne gigabaze informacija o sekvenci.[74][75] Zajednice mikroba koje naseljavaju tlo su neke od najsloženijih poznatih nauci i ostaju slabo shvaćene uprkos njihovoj ekonomskoj važnosti.[76] Mikrobni konzorciji obavljaju širok spektar ekosistemskih usluga, neophodnih za rast biljaka, uključujući fiksiranje atmosferskog dušika, kruženje nutrijenata, suzbijanje bolesti i sekvester gvožđe i druge metale.[77] Funkcionalne metagenomske strategije se koriste za istraživanje interakcija između biljaka i mikroba, proučavanjem ovih mikrobnih zajednica neovisno o uzgoju.[78][79] Omogućujući uvid u ulogu prethodno neobrađenih ili rijetkih članova zajednice u kruženju [nutrijent|nutrijenata]] i promociji rasta biljaka, metagenomski pristupi mogu doprinijeti poboljšanom otkrivanju bolesti u usjevima i stoci i prilagođavanju poboljšanih poljoprivredbih praksi koje poboljšavaju zdravlje usjeva iskorištavanjem odnosa između mikroba i biljaka.[29]
Biogoriva su goriva izvedena iz konverzije biomase, kao u konverziji celuloze sadržane u stabljikama kukuruza, smetnjača i druge biomase u celulozni etanol.[29] Ovaj proces zavisi od konzorcija (udruženja) mikroba koji pretvaraju celulozu u šećer, nakon čega slijedi fermentacija šećera u etanol. Mikrobi također proizvode različite izvore bioenergije, uključujući metan i vodik.[29] Efikasna dekonstrukcija u industrijskim razmjerima biomase zahtijevaju nove enzime sa većom produktivnošću i nižom cijenom.[26] Metagenomski pristupi analizi složenih mikrobnih zajednica omogućavaju ciljani skrining enzima sa industrijskom primjenom u proizvodnji biogoriva, kao što su glikozidne hidrolaze.[80] Nadalje, znanje o tome kako ove mikrobne zajednice funkcionišu kako bi ih kontrolisale, a metagenomika je ključno oruđe u njihovom razumevanju. Metagenomski pristupi omogućavaju komparativne analize između konvergentna mikrobnih sistema kao što su biogasni fermentori[81] ili insekti biljojedi kao što je mravlja bašta gljiva mrav rezačas.[82]
Mikrobne zajednice proizvode široku lepezu biološki aktivnih hemikalija koje se koriste u nadmetanju i komunikaciji.[77] Mnogi od lijekova koji se danas koriste prvobitno su otkriveni u mikrobima; nedavni napredak u dobijanju bogatih genetičkih resursa nekultiviranih mikroba doveo je do otkrića novih gena, enzima i prirodnih proizvoda.[57][83] Primjena metagenomike omogućio je razvoj roba i finih hemikalija, agrohemikalija i farmaceutike, gdje je korist enzimski katalizirana hiralna sinteza se sve više prepoznaje.[84]
Dva tipa analiza koriste se u bioprospekcijama metagenomskih podataka: skrining vođen funkcijama za izraženu osobinu i skrining vođen sekvencijom za sekvence DNK od interesa.[85] Analiza vođena funkcijama nastoji identificirati klonove koji izražavaju željenu osobinu ili korisnu aktivnost, nakon čega slijedi biohemijska karakterizacija i analiza sekvence. Ovaj pristup je ograničen dostupnošću odgovarajućeg ekrana i zahtjevom da se željena osobina izrazi u ćeliji domaćinu. Štaviše, niska stopa otkrivanja (manje od jednog na 1.000 pregledanih klonova) i njegova radno intenzivna priroda dodatno ograničavaju ovaj pristup.[86] Nasuprot tome, analiza vođena sekvencom koristi konzervirana DNK sekvence do dizajna PCR prajmera za skrining klonova za sekvencu od interesa.[85] U poređenju sa pristupima zasnovanim na kloniranju, korištenje pristupa samo sekvenci dodatno smanjuje količinu potrebnog rada na stolu. Primjena masovnog paralelnog sekvenciranja također uveliko povećava količinu generiranih podataka o sekvenci, koji zahtijevaju visokopropusne bioinformatičke analize.[86] Pristup skriningu vođen sekvenciranjem ograničen je širinom i preciznošću funkcije gena prisutne u javnim bazama podataka sekvenci. U praksi, eksperimenti koriste kombinaciju i funkcionalnih i pristupa zasnovanih na sekvencama zasnovanih na funkciji od interesa, složenosti uzorka koji treba pregledati i drugim faktorima.[86][87] Primjer uspješnog korištenja metagenomike kao biotehnologije za otkrivanje lijekova je ilustrovan sa malacidinskim antibioticima.[88]
Metagenomika može pružiti vrijedan uvid u funkcionalnu ekologiju ekoloških zajednica.[89] Metagenomska analiza bakterijskih zajednica pronađenih u defekaciji australskih morskih lavova sugerira da izmet morskog lava bogat nutrijentima može biti važan izvor hranjivih tvari za obalne ekosisteme. To je zato što su bakterije koje se izbacuju istovremeno s defekacijom sposobne razgraditi hranjive tvari u fecesu u bioraspoloživi oblik koji se može unijeti u lanac ishrane.[90]
Sekvenciranje DNK se također može koristiti šire za identifikaciju vrsta prisutnih u vodnom tijelu,[91] krhotine filtrirane iz zraka, uzoraka prljavštine ili životinjskog izmeta,[92] pa čak i detektovati dijetetske proizvode iz obroka iz krvi.[93] Ovo može utvrditi raspon invazivnih i ugroženih vrsta, te pratiti sezonske populacije.
Metagenomika može poboljšati strategije za praćenje uticaja zagađivača na ekosisteme i za čišćenje kontaminiranog okruženja. Povećano razumijevanje načina na koji se mikrobne zajednice nose sa zagađivačima poboljšava procjenu potencijala kontaminiranih lokacija da se oporave od zagađenja i povećava šanse za uspjeh pokušaja bioaugmentacija ili biostimulacija.[94]
Mikrobne zajednice imaju ključnu ulogu u očuvanju ljudskog zdravlja, ali njihov sastav i mehanizam pomoću kojeg to čine ostaju misteriozni.[95] Metagenomsko sekvenciranje se koristi za karakterizaciju mikrobne zajednice sa 15-18 tjelesnih mjesta od najmanje 250 jedinki. Ovo je dio Inicijativa za ljudski mikrobiom s primarnim ciljevima da se utvrdi postoji li jezgro ljudskog mikrobioma, da se razumiju promjene u ljudskom mikrobiomu koje mogu biti povezane sa ljudskim zdravljem i razviti nove tehnološke i bioinformatičke alate za podršku ovim ciljevima.[96]
Još jedno medicinsko istraživanje u sklopu projekta MetaHit (Metagenomika ljudskog crijevnog trakta) sastojalo se od 124 osobe iz Danske i Španijee, koje su se sastojale od zdravih, gojaznih i iritabilnih pacijenata sa bolestima crijeva. Studija je pokušala kategorizirati dubinu i filogenetsku raznolikost gastrointestinalnih bakterija. Koristeći Illumina GA sekvencione podatke i SOAPdenovo, alatku zasnovanu na de Bruijnpvom grafikonu posebno dizajniranu za sklapanje kratkih čitanja, uspjeli su generirati 6,58 miliona kontiga većih od 500 bp za ukupnu dužinu kontiga od 10,3 Gb i dužinu N50 od 2,2 kb.
Studija je pokazala da dvije bakterijske divizije, Bacteroidetes i Firmicutes, čine preko 90% poznatih filogenetskih kategorija koje dominiraju bakterijama distalnog crijeva. Koristeći relativne frekvencije gena pronađene u crijevima, ovi istraživači su identificirali 1.244 metagenomska klastera koji su kritično važni za zdravlje crijevnog trakta. Postoje dva tipa funkcija u ovim grupama: održavanje i one specifične za crijeva. Klasteri gena za održavanje su potrebni svim bakterijama i često su glavni faktori u glavnim metaboličkim putevima, uključujući centralni metabolizam ugljika i sintezu aminokiselina. Funkcije specifične za crijeva uključuju adheziju na proteine domaćina i prikupljanje šećera iz glikolipida globoze. Pokazalo se da pacijenti sa sindromom iritabilnog crijeva pokazuju 25% manje gena i manju bakterijsku raznolikost od pojedinaca koji ne pate od sindroma iritabilnog crijeva, što ukazuje da promjene u raznolikosti bioma crijeva pacijenata mogu biti povezane s ovim stanjem. Iako ove studije naglašavaju neke potencijalno vrijedne medicinske primjene, samo 31–48,8% očitavanja moglo bi se uskladiti sa 194 javna bakterijska genoma ljudskog crijeva i 7,6–21,2% s bakterijskim genomima dostupnim u GenBank-u, što ukazuje da je još uvijek potrebno mnogo više istraživanja za uhvatanje novih bakterijskih genoma.[97]
U Projektu ljudskog mikrobioma (HMP), mikrobne zajednice crijeva su analizirane korištenjem sekvenciranja DNK visoke propusnosti. HMP je pokazao da su, za razliku od pojedinačnih mikrobnih vrsta, mnogi metabolički procesi prisutni u svim tjelesnim staništima s različitim frekvencijama. Mikrobne zajednice od 649 metagenoma sa sedam primarnih tjelesnih mjesta na 102 osobe proučavane su u sklopu projekta Ljudski mikrobiom. Metagenomska analiza otkrila je varijacije u obilju specifičnih za nišu među 168 funkcionalnih modula i 196 metaboličkih puteva unutar mikrobioma. To uključuje razgradnju glikozaminoglikana u crijevima, kao i transport fosfata i aminokiselina vezan za fenotip domaćina (vaginski pH) u stražnjem forniksu. HMP je iznio na vidjelo korisnost metagenomike u dijagnostici i medicini zasnovanoj na dokazima. Stoga je metagenomika moćan alat za rješavanje mnogih hitnih pitanja u području personalizirane medicine.[98]
Kod životinja, metagenomika se može koristiti za profiliranje njihovih crijevnih mikrobioma i omogućavanje otkrivanja bakterija otpornih na antibiotike.[99] Ovo može imati implikacije u praćenju širenja bolesti sa divljih životinja na životinje i ljude na farmama.
Razlikovanje između infektivne i neinfektivne bolesti i utvrđivanje osnovne etiologije infekcija može biti izazovno. Naprimjer, više od polovine slučajeva encefalitisa ostaje nedijagnosticirano, uprkos opsežnim ispitivanjima korištenjem najsavremenijih kliničkih laboratorijskih metoda. Kliničko metagenomsko sekvenciranje obećava osjetljiv i brz metod za dijagnosticiranje infekcije, uspoređivanjem genetskog materijala pronađenog u uzorku pacijenta s bazama podataka svih poznatih mikroskopskih ljudskih patogena i hiljadama drugih bakterijskih, virusnih, gljivičnih i parazitskih organizama i baza podataka o sekvencama gena za antimikrobnu rezistenciju sa povezanim kliničkim fenotipovima.
Metagenomika je bila neprocjenjivo sredstvo koje pomaže u karakterizaciji raznolikosti i ekologije patogena koje prenose hematofagni insekti (koji se hrane krvlju), kao što su komarci i krpelji.[100][101][102] Metagenomiku danas rutinski koriste službenici javnog zdravstva i organizacije za nadzor arbovirusa.[103][104]
|pmc=
(pomoć). PMID 33971086 Provjerite vrijednost parametra |pmid=
(pomoć).
|s2cid=
(pomoć).
|pmid=
(pomoć). S2CID 248739527 Provjerite vrijednost parametra |s2cid=
(pomoć).
|pmc=
(pomoć). PMID 34442732 Provjerite vrijednost parametra |pmid=
(pomoć).CS1 održavanje: više imena: authors list (link)
Greška kod citiranja: <ref>
oznaka s imenom "Chen2005" definirana u <references>
nije korištena u ranijem tekstu.
Greška kod citiranja: <ref>
oznaka s imenom "schuster2008" definirana u <references>
nije korištena u ranijem tekstu.
<ref>
oznaka s imenom "werner2011" definirana u <references>
nije korištena u ranijem tekstu.