Seqüència conservada

En el context de l'evolució, una seqüència conservada és aquella seqüència homòloga d'àcids nucleics (ADN i ARN) o de proteïna idèntica o semblant entre espècies (ortòloga), entre el mateix genoma (paràloga) o generada per transferència horitzontal de gens entre diferents espècies que comparteixen un ancestre comú (xenòloga).  

Una seqüència altament conservada és aquella que es manté sense canvis en l'arbre filogenètic i durant les diferents etapes geològiques. Que una seqüència estigui conservada al llarg de l'evolució indica que és valuosa i per això la selecció natural l'ha mantingut. Alguns exemples de seqüències altament conservades són els components ARN dels ribosomes que es troben en tots els superregnes de la vida, la caixa homeòtica en eucariotes, i l'ARN mitocondrial en bacteris. L'estudi de la conservació de les seqüències inclou múltiples àrees d'investigació com ara la genòmica, la proteòmica, la biologia evolutiva, la filogenètica, la bioinformàtica i les matemàtiques

Història

[modifica]

El descobriment del paper de l'ADN en l'herència i les observacions de Frederick Sanger sobre com varia la insulina entre animals [1]van ser el detonant perquè es comencés a estudiar la taxonomia des d'una perspectiva molecular.[2][3] Estudis realitzats durant els anys 60 van utilitzar la hibridació de l'ADN i tècniques de reactivitat creuada en proteïnes per mesurar la similitud entre proteïnes ortòlogues ja conegudes. Un exemple d'aquestes serien l'hemoglobina [4] i el citocrom C.[5]

L'any 1965, l'austríac Émile Zuckerkandl i l'americà Linus Pauling van introduir el concepte de rellotge molecular,[6] que consisteix en utilitzar la taxa de substitucions constants dels aminoàcids per determinar el temps de divergència entre dos organismes. Així com les primeres filogènies concordaven amb els registres fòssils, l'observació del que semblaven diferents ritmes en l'evolució dels gens va dur al desenvolupament de les teories de l'evolució molecular.[2][3] La importància de les seqüències conservades es va materialitzar amb la comparació que va realitzar Margaret Dayhoff l'any 1966 entre diferents seqüències de ferredoxina, en la que va observar com la selecció natural actua per conservar i optimitzar aquelles seqüències de proteïnes essencials per la vida.[7]

Mecanismes

[modifica]

Vegeu també: Selecció natural i teoria neutral de l'evolució molecular

Les seqüències d'àcids nucleics del genoma d'un llinatge poden canviar gradualment en el temps i en vàries generacions degut a mutacions i delecions a l'atzar.,.[8][9] Aquestes seqüències també poden recombinar-se o suprimir-se degut a reorganitzacions cromosòmiques. Les seqüències conservades són aquelles que tot i aquests mecanismes, persisteixen en el genoma i tenen una taxa de mutació més baixa que l'esperada per atzar.[10]

La conservació pot tenir lloc en seqüències d'àcids nucleics codificants i no-codificants. Teòricament, les seqüències d'ADN altament conservades tenen valor funcional, encara que es coneix poc el paper de les regions altament conservades no codificants. (,)[11][12]

El fet que una seqüència es conservi o no pot dependre de les diferents pressions selectives, la seva tolerància a les mutacions, la genètica de poblacions i la deriva genètica. A més a més, moltes seqüències funcionals són també modulars, i per tant, contenen regions que poden estar subjectes a pressions selectives independents, com per exemple els dominis proteics, que estan subjectes a una pressió evolutiva diferent de la resta de la seqüència.[13]

Seqüències codificants

[modifica]

Degut a la degeneració del codi genètic, les mutacions sinònimes en una seqüència codificant no afecten a la pròpia seqüència dels aminoàcids ni a la proteïna que codifiquen. Això ens porta a concloure que les seqüències d'àcids nucleics i aminoàcids (i per tant, codificants) poden estar conservades en diferent grau.[14]

Les seqüències d'aminoàcids poden conservar-se de cara a mantenir una estructura o una funció d'una proteïna o d'un domini. Les proteïnes conservades no acostumen a patir substitucions d'aminoàcids, o si en pateixen acostumen a ser substitucions per aminoàcids amb propietats bioquímiques similars.[15]

Dins d'una seqüència, els aminoàcids que són importants pel plegament proteic, l'estabilitat estructural, o que formen un lloc d'unió són aquells que probablement estaran més conservats.[16][17]

La seqüència d'àcids nucleics d'una proteïna que codifica per un gen també pot conservar-se mitjançant altres pressions selectives. El biaix en l'ús de codons de certs organismes pot restringir el tipus de mutacions sinònimes d'una seqüència. Aquelles seqüències d'àcids nucleics que indueixen una estructura secundària a l'ARN missatger poden ser seleccionades en contra, ja que algunes estructures poden afectar negativament a la traducció, o bé es poden conservar allà on el ARNm en qüestió actuï també com a ARN no codificant.[18][19]

Seqüències no codificants

[modifica]

Vegeu també: conservació de seqüències no codificants

Les seqüències no codificants importants per la regulació gènica, així com els llocs de reconeixement o unió de ribosomes i factors de transcripció seran probablement conservats en el genoma. Per exemple, el promotor d'un gen conservat o d'un operó, i en les proteïnes, aquells àcids nucleics importants per l'estructura i la funció de l'ARN no codificant (ARNnc), es conservaran. Tanmateix, la conservació de seqüències en el ARNnc és bastant pobre en comparació amb la de les seqüències de proteïnes codificants. Consegüentment, aquells parells de bases que contribueixin a l'estructura i la funció es preservaran.[20][21]

Identificació

[modifica]

Vegeu també: alineament de seqüències

Les seqüències conservades es poden identificar mitjançant mètodes bioinformàtics que es basen en l'alineament de seqüències. Des de l'any 2000 els avenços en espectrometria de masses de proteïnes i en la seqüenciació de l'ADN han permès obtenir moltes seqüències de proteïnes i molts genomes per dur a terme estudis comparatius.[22][23]

Cerca d'homologia

[modifica]

Les seqüències conservades es poden identificar buscant homologia entre seqüències, utilitzant eines com BLAST, HMMER, OrthologR [24] i Infernal [25]

Aquestes eines solen prendre com a input una seqüència d'una proteïna o d'un àcid nucleic, o bé utilitzen models estadístics generats en alineaments múltiples de seqüències conegudes i evolutivament properes.

Els models estadístics com ara profile-HMMs i els models de covariància d'ARN són útils en la cerca d'homologia de seqüències més llunyanes evolutivament perquè proporcionen informació estructural.[26]

Les seqüències input s'alineen amb una base de dades de seqüències d'individus relacionats però d'altres espècies. Els alineaments resultants es puntuen partint del nombre d'aminoàcids o bases que coincideixen, i el número de gaps o delecions.

Les substitucions conservades s'identifiquen mitjançant les matrius de substitució com PAM i BLOSUM. S'assumeix que els alineaments amb alta puntuació provenen de seqüències homòlogues. La conservació d'una seqüència s'infereix per la detecció de regions homòlogues en un ampli rang filogenètic.[27]

Un logo de la seqüència del motiu d'unió de la proteïna LexA dels bacteris gram positius. Com que l'adenosina de la posició 5 es troba altament conservada, apareix més alta que tots els altres caràcters.[28]

Alineament múltiple de seqüències

[modifica]

L'alineament de seqüències múltiples és útil per visualitzar regions conservades. Hi ha diversos programes com CLUSTAL que et permeten dur a terme aquests alineaments. Aquest programa et permet anotar les columnes conservades, distingint seqüències conservades (*), mutacions conservades (:), semiconservades (.)i no conservades.[29]

Els logos de seqüències també ens mostren les seqüències més conservades mitjançant una representació de les proporcions dels caràcters (alçada) en cada punt de l'alineament.[28]

Alineament genòmic

[modifica]

Els estudis d'associació del genoma complet (en anglès, GWAS (Genome-wide association study) o WGAS (Whole genome association study)) també serveixen per trobar regions conservades al llarg de diferents espècies. L'ús d'aquests mètodes està limitat donada la complexitat computacional causada pels reordenaments, les regions repetides, i la llargada de molts genomes eucariotes.[30] Tot i això, la fiabilitat dels GWAS de bacteris de 30 o més espècies properes està augmentant.[31][32]

Sistemes de puntuació

[modifica]

També hi ha altres aproximacions que utilitzen mètodes basats en tests estadístics. Aquests programes identifiquen seqüències que tenen un índex de mutacions diferent de l'esperat.

GERP (en anglès Genomic Evolutionary Rate Profiling) és un sistema de puntuació de la conservació de les seqüències genètiques al llarg de les espècies. Aquesta aproximació fa una estimació de l'índex de mutacions neutres en un conjunt d'espècies a partir d'un alineament de seqüències múltiple. Seguidament identifica les regions de les seqüències que presenten menys mutacions de les esperades. A aquestes regions se'ls assigna una puntuació d'acord amb la diferència entre l'índex de mutació observada i el de l'esperada. Un perfil alt de GERP indica que ens trobem amb una seqüència altament conservada.[33][34]

  • LIST (en anglès Local Identity and Shared Taxa) es basa en el supòsit que les variacions observades en espècies estretament relacionades amb l'ésser humà son més significatives a l'hora d'avaluar la conservació que aquelles variacions observades en espècies més distants. El programa utilitza la identitat en els alineaments locals de cada posició per identificar seqüències rellevants en l'alineament de seqüències múltiple. Tot seguit estima la conservació segons la distància taxonòmica d'aquestes seqüències en comparació amb l'ésser humà.[35][36]
  • Aminode: combina alineaments múltiples amb anàlisis filogenètics per analitzar canvis en proteïnes homòlogues. El programa ens proporciona un gràfic en el qual podem veure els índexs de mutacions locals i els canvis evolutius que comporten. Aquest mètode identifica Regions Evolutivament Constrenyides d'una proteïna, que són regions que estan sota la pressió de la selecció negativa i normalment són imprescindibles per la funció correcta d'aquesta proteïna.[37]
  • PhyloP i PhylopHmm incorporen anàlisis filogenètiques per comparar la distribució de probabilitats dels índexs de substitució. Això permet la detecció de mutacions accelerades i conservades. A partir d'un arbre filogenètic es calcula una distribució de probabilitats de les substitucions esperades per una columna de l'alineament de seqüències múltiple. Les relacions evolutives entre les espècies d'interès s'utilitzen per calcular la significança de qualsevol substitució (una substitució entre dues espècies properes és menys probable que es doni, i per tant és més significant). Per detectar les seqüències més conservades, es calcula la distribució de probabilitats per un subconjunt de l'alineament múltiple de seqüències, i es compara amb la distribució esperada. Per valorar la significança estadística es realitza un test com el test de raó de versemblança o l'score test. Els valors de p (p-value en anglès) obtinguts de comparar les dues distribucions de probabilitat s'utilitzen per identificar les regions conservades.  PhyloHMM utilitza el model ocult de Màrkov per generar les distribucions de probabilitat. El programari PhyloP compara les distribucions de probabilitats utilitzant el test de raó de versemblança, el score test, o el sistema de puntuació GERP-like score (en anglès Genomic Evolutionary Rate Profiling) [38][39][40]

Conservació extrema

[modifica]

Elements ultra conservats

[modifica]

Els elements ultra conservats o UCEs (en anglès) són seqüències que són molt similars o idèntiques entre múltiples categories taxonòmiques. Es van descobrir per primer cop en vertebrats,[41] i posteriorment han estat identificats en tàxons que difereixen entre ells.[42]

Tot i que es desconeix bona part de l'origen i la funció dels UCEs,[43] aquests han estat utilitzats per investigar divergències en amniotes,[44] insectes,[45] i entre animals i plantes [46]

Gens universalment conservats

[modifica]

Els gens més altament conservats són aquells que podem trobar en tots els organismes. Aquests consisteixen bàsicament en els ARNnc i les proteïnes que es requereixen a l'hora de realitzar la transcripció i la traducció, i s'assumeix que han estat conservats des de l'últim avantpassat comú universal.[47]

Entre els gens o les famílies de gens que s'han identificat com a universalment conservats, trobem els factors d'elongació termoinestables d'unió a GTP, la metionina aminopeptidasa 2, la serina hidroximetiltransferasa, i els transportadors d'ATP (Transportadors ABC).[48] Altres elements universalment conservats són els components de la maquinària de transcripció, com ara l'ARN polimerasa i les helicases, i els components de la traducció, com l'ARN ribosòmic, l'ARN de transferència i les proteïnes ribosomals.[49]

Aplicacions

[modifica]

Filogenètica i taxonomia

[modifica]

Els conjunts de seqüències conservades s'utilitzen per generar arbres filogenètics, ja que s'assumeix que organismes amb seqüències similars són filogenèticament propers.[50]

La tria de les seqüències pot canviar en funció de l'objectiu taxonòmic de l'estudi. Per exemple, gens altament conservats com el 16S ARN i altres seqüències ribosòmiques, són útils per reconstruir relacions filogenètiques llunyanes i identificar els fílums de bacteris en estudis metagenòmics.[51][52]Les seqüències que es conserven en un clade però pateixen algunes mutacions, com els gens constitutius, es poden utilitzar per estudiar les relacions entre espècies.[53][54][55] L'espaiador transcrit intern, que és necessari per espaiar els gens del rRNA conservats però alhora pateix una evolució ràpida, s'utilitza per classificar els fongs i les soques de bacteris que també evolucionen ràpidament.[56][57][58][59]

Recerca mèdica

[modifica]

Com normalment les seqüències conservades tenen funcions biològiques importants, poden ser útils per identificar causes de malalties genètiques. Molts desordres metabòlics congènits i malalties per dipòsit liposomal són el resultat de canvis individuals en gens conservats, donant lloc a enzims defectuosos que són la causa dels símptomes de la malaltia. Les malalties genètiques es poden preveure amb la identificació de seqüències conservades entre persones i organismes de laboratori com els ratolins [60] o les mosques del vinagre,[61] i amb l'estudi dels efectes d'aquests organismes genoanul·lats.[62] Els estudis d'associació de tot el genoma (GWAS) també poden ser útils per identificar variacions en seqüències conservades que es puguin associar a un estat de salut o malaltia. Per exemple en investigacions sobre l'Alzehimer s'han trobat més de dues dotzenes de nous locis potencialment relacionats amb aquesta malaltia. Encara que falten altres investigacions amb una mostra més gran de pacients es pot confirmar que aquest tipus d'estudis serveixen per trobar nous gens que permetin entendre millor la malaltia.[63][64]

Anotació funcional

[modifica]

Identificar seqüències conservades pot servir per descobrir i preveure seqüències funcionals com ara gens.[65] Les seqüències conservades amb una funció coneguda, com els dominis proteics, poden utilitzar-se per preveure la funció d'una seqüència. Les bases de dades dels dominis proteics conservats com Pfam i Conserved Domain Database poden servir per anotar dominis funcionals en gens que es preveu que són codificants per proteïnes.[66]

Vegeu també

[modifica]

Referències

[modifica]
  1. Sanger, F. «Species Differences in Insulins». Nature, 164, 4169, 9-1949, pàg. 529–529. DOI: 10.1038/164529a0. ISSN: 0028-0836.
  2. 2,0 2,1 Marmur, J; Falkow, S; Mandel, M «New Approaches to Bacterial Taxonomy» (en anglès). Annual Review of Microbiology, 17, 1, 10-1963, pàg. 329–372. DOI: 10.1146/annurev.mi.17.100163.001553. ISSN: 0066-4227.
  3. 3,0 3,1 Pace, N. R.; Sapp, J.; Goldenfeld, N. «Phylogeny and beyond: Scientific, historical, and conceptual significance of the first tree of life». Proceedings of the National Academy of Sciences, 109, 4, 17-01-2012, pàg. 1011–1018. DOI: 10.1073/pnas.1109716109. ISSN: 0027-8424.
  4. Pauling, Linus; Zuckerkandl, Emile. Chance in Evolution--Some Philosophical Remarks. Boston, MA: Springer US, 1972, p. 113–126. ISBN 978-1-4684-2021-0. 
  5. Margoliash, E. «PRIMARY STRUCTURE AND EVOLUTION OF CYTOCHROME C». Proceedings of the National Academy of Sciences, 50, 4, 01-10-1963, pàg. 672–679. DOI: 10.1073/pnas.50.4.672. ISSN: 0027-8424.
  6. ZUCKERKANDL, EMILE; PAULING, LINUS. Evolutionary Divergence and Convergence in Proteins. Elsevier, 1965, p. 97–166. ISBN 978-1-4832-2734-4. 
  7. Eck, R. V.; Dayhoff, M. O. «Evolution of the Structure of Ferredoxin Based on Living Relics of Primitive Amino Acid Sequences». Science, 152, 3720, 15-04-1966, pàg. 363–366. DOI: 10.1126/science.152.3720.363. ISSN: 0036-8075.
  8. KIMURA, MOTOO «Evolutionary Rate at the Molecular Level». Nature, 217, 5129, 2-1968, pàg. 624–626. DOI: 10.1038/217624a0. ISSN: 0028-0836.
  9. King, J. L.; Jukes, T. H. «Non-Darwinian Evolution». Science, 164, 3881, 16-05-1969, pàg. 788–798. DOI: 10.1126/science.164.3881.788. ISSN: 0036-8075.
  10. Kimura, M.; Ohta, T. «On Some Principles Governing Molecular Evolution». Proceedings of the National Academy of Sciences, 71, 7, 01-07-1974, pàg. 2848–2852. DOI: 10.1073/pnas.71.7.2848. ISSN: 0027-8424.
  11. Asthana, Saurabh; Roytberg, Mikhail; Stamatoyannopoulos, John; Sunyaev, Shamil «Analysis of Sequence Conservation at Nucleotide Resolution». PLoS Computational Biology, 3, 12, 28-12-2007, pàg. e254. DOI: 10.1371/journal.pcbi.0030254. ISSN: 1553-7358.
  12. Cooper, G. M.; Brown, C. D. «Qualifying the relationship between sequence conservation and molecular function». Genome Research, 18, 2, 01-02-2008, pàg. 201–205. DOI: 10.1101/gr.7205808. ISSN: 1088-9051.
  13. Gilson, Amy I.; Marshall-Christensen, Ahmee; Choi, Jeong-Mo. «The role of evolutionary selection in the dynamics of protein structure evolution», 18-06-2016. [Consulta: 20 desembre 2020].
  14. Hunt, Ryan C.; Simhadri, Vijaya L.; Iandoli, Matthew; Sauna, Zuben E.; Kimchi-Sarfaty, Chava «Exposing synonymous mutations» (en anglès). Trends in Genetics, 30, 7, 7-2014, pàg. 308–321. DOI: 10.1016/j.tig.2014.04.006.
  15. Zhang, Jianzhi «Rates of Conservative and Radical Nonsynonymous Nucleotide Substitutions in Mammalian Nuclear Genes». Journal of Molecular Evolution, 50, 1, 1-2000, pàg. 56–68. DOI: 10.1007/s002399910007. ISSN: 0022-2844.
  16. Sousounis, Konstantinos; Haney, Carl E; Cao, Jin; Sunchu, Bharath; Tsonis, Panagiotis A «Conservation of the three-dimensional structure in non-homologous or unrelated proteins». Human Genomics, 6, 1, 2012, pàg. 10. DOI: 10.1186/1479-7364-6-10. ISSN: 1479-7364.
  17. Kairys, Visvaldas; Fernandes, Miguel X. «SitCon: Binding site residue conservation visualization and protein sequence-to-function tool». International Journal of Quantum Chemistry, 107, 11, 2007, pàg. 2100–2110. DOI: 10.1002/qua.21396. ISSN: 0020-7608.
  18. Chamary, JV; Hurst, Laurence D Genome Biology, 6, 9, 2005, pàg. R75. DOI: 10.1186/gb-2005-6-9-r75. ISSN: 1465-6906.
  19. Wadler, C. S.; Vanderpool, C. K. «A dual function for a bacterial small RNA: SgrS performs base pairing-dependent regulation and encodes a functional polypeptide». Proceedings of the National Academy of Sciences, 104, 51, 27-11-2007, pàg. 20454–20459. DOI: 10.1073/pnas.0708102104. ISSN: 0027-8424.
  20. Johnsson, Per; Lipovich, Leonard; Grandér, Dan; Morris, Kevin V. «Evolutionary conservation of long non-coding RNAs; sequence, structure, function». Biochimica et Biophysica Acta (BBA) - General Subjects, 1840, 3, 3-2014, pàg. 1063–1071. DOI: 10.1016/j.bbagen.2013.10.035. ISSN: 0304-4165.
  21. Freyhult, E. K.; Bollback, J. P.; Gardner, P. P. «Exploring genomic dark matter: A critical assessment of the performance of homology search methods on noncoding RNA». Genome Research, 17, 1, 06-12-2006, pàg. 117–125. DOI: 10.1101/gr.5890907. ISSN: 1088-9051.
  22. Edwards, John R.; Ruparel, Hameer; Ju, Jingyue «Mass-spectrometry DNA sequencing». Mutation Research/Fundamental and Molecular Mechanisms of Mutagenesis, 573, 1-2, 6-2005, pàg. 3–12. DOI: 10.1016/j.mrfmmm.2004.07.021. ISSN: 0027-5107.
  23. Margulies, E. H. «Identification and Characterization of Multi-Species Conserved Sequences». Genome Research, 13, 12, 01-12-2003, pàg. 2507–2518. DOI: 10.1101/gr.1602203. ISSN: 1088-9051.
  24. Drost, Hajk-Georg; Gabel, Alexander; Grosse, Ivo; Quint, Marcel «Evidence for Active Maintenance of Phylotranscriptomic Hourglass Patterns in Animal and Plant Embryogenesis». Molecular Biology and Evolution, 32, 5, 27-01-2015, pàg. 1221–1231. DOI: 10.1093/molbev/msv012. ISSN: 1537-1719.
  25. Nawrocki, E. P.; Eddy, S. R. «Infernal 1.1: 100-fold faster RNA homology searches». Bioinformatics, 29, 22, 04-09-2013, pàg. 2933–2935. DOI: 10.1093/bioinformatics/btt509. ISSN: 1367-4803.
  26. Eddy, Sean R.; Durbin, Richard «RNA sequence analysis using covariance models». Nucleic Acids Research, 22, 11, 1994, pàg. 2079–2088. DOI: 10.1093/nar/22.11.2079. ISSN: 0305-1048.
  27. Trivedi, Rakesh; Nagarajaram, Hampapathalu Adimurthy «Substitution scoring matrices for proteins ‐ An overview» (en anglès). Protein Science, 29, 11, 11-2020, pàg. 2150–2163. DOI: 10.1002/pro.3954. ISSN: 0961-8368.
  28. 28,0 28,1 Tang, Steven; Peterson, Joshua C.; Pardos, Zachary A. Predictive Modelling of Student Behavior Using Granular Large-Scale Action Data. Society for Learning Analytics Research (SoLAR), 2017-05, p. 223–233. ISBN 978-0-9952408-0-3. 
  29. Aiyar, Ashok. The Use of CLUSTAL W and CLUSTAL X for Multiple Sequence Alignment. New Jersey: Humana Press, p. 221–241. ISBN 1-59259-192-2. 
  30. Earl, Dent; Nguyen, Ngan K; Hickey, Glenn. «Alignathon: A competitive assessment of whole genome alignment methods.», 10-03-2014. [Consulta: 20 desembre 2020].
  31. Rouli, L.; Merhej, V.; Fournier, P.-E.; Raoult, D. «The bacterial pangenome as a new tool for analysing pathogenic bacteria». New Microbes and New Infections, 7, 9-2015, pàg. 72–85. DOI: 10.1016/j.nmni.2015.06.005. ISSN: 2052-2975.
  32. Méric, Guillaume; Yahara, Koji; Mageiros, Leonardos; Pascoe, Ben; Maiden, Martin C. J. «A Reference Pan-Genome Approach to Comparative Bacterial Genomics: Identification of Novel Epidemiological Markers in Pathogenic Campylobacter». PLoS ONE, 9, 3, 27-03-2014, pàg. e92798. DOI: 10.1371/journal.pone.0092798. ISSN: 1932-6203.
  33. Cooper, G. M. «Distribution and intensity of constraint in mammalian genomic sequence» (en anglès). Genome Research, 15, 7, 17-06-2005, pàg. 901–913. DOI: 10.1101/gr.3577405. ISSN: 1088-9051.
  34. Davydov, Eugene V.; Goode, David L.; Sirota, Marina; Cooper, Gregory M.; Sidow, Arend «Identifying a High Fraction of the Human Genome to be under Selective Constraint Using GERP++». PLoS Computational Biology, 6, 12, 02-12-2010, pàg. e1001025. DOI: 10.1371/journal.pcbi.1001025. ISSN: 1553-7358.
  35. Malhis, Nawar; Jones, Steven J. M.; Gsponer, Jörg «Improved measures for evolutionary conservation that exploit taxonomy distances». Nature Communications, 10, 1, 05-04-2019. DOI: 10.1038/s41467-019-09583-2. ISSN: 2041-1723.
  36. Malhis, Nawar; Jacobson, Matthew; Jones, Steven J M; Gsponer, Jörg «LIST-S2: taxonomy based sorting of deleterious missense mutations across species» (en anglès). Nucleic Acids Research, 48, W1, 02-07-2020, pàg. W154–W161. DOI: 10.1093/nar/gkaa288. ISSN: 0305-1048. PMC: PMC7319545. PMID: 32352516.
  37. Chang, Kevin T.; Guo, Junyan; di Ronza, Alberto; Sardiello, Marco «Aminode: Identification of Evolutionary Constraints in the Human Proteome». Scientific Reports, 8, 1, 22-01-2018. DOI: 10.1038/s41598-018-19744-w. ISSN: 2045-2322.
  38. Pollard, K. S.; Hubisz, M. J.; Rosenbloom, K. R.; Siepel, A. «Detection of nonneutral substitution rates on mammalian phylogenies». Genome Research, 20, 1, 26-10-2009, pàg. 110–121. DOI: 10.1101/gr.097857.109. ISSN: 1088-9051.
  39. «Table S3: Blast results of PHAST predicted genes». [Consulta: 20 desembre 2020].
  40. Fan, Xiaodan; Zhu, Jun; Schadt, Eric E; Liu, Jun S «Statistical power of phylo-HMM for evolutionarily conserved element detection». BMC Bioinformatics, 8, 1, 2007, pàg. 374. DOI: 10.1186/1471-2105-8-374. ISSN: 1471-2105.
  41. Bejerano, G. «Ultraconserved Elements in the Human Genome». Science, 304, 5675, 28-05-2004, pàg. 1321–1325. DOI: 10.1126/science.1098119. ISSN: 0036-8075.
  42. Siepel, A. «Evolutionarily conserved elements in vertebrate, insect, worm, and yeast genomes» (en anglès). Genome Research, 15, 8, 01-08-2005, pàg. 1034–1050. DOI: 10.1101/gr.3715005. ISSN: 1088-9051.
  43. Harmston, Nathan; Barešić, Anja; Lenhard, Boris «The mystery of extreme non-coding conservation». Philosophical Transactions of the Royal Society B: Biological Sciences, 368, 1632, 19-12-2013, pàg. 20130021. DOI: 10.1098/rstb.2013.0021. ISSN: 0962-8436.
  44. Faircloth, Brant C.; McCormack, John E.; Crawford, Nicholas G.; Harvey, Michael G.; Brumfield, Robb T. «Ultraconserved Elements Anchor Thousands of Genetic Markers Spanning Multiple Evolutionary Timescales». Systematic Biology, 61, 5, 09-01-2012, pàg. 717–726. DOI: 10.1093/sysbio/sys004. ISSN: 1076-836X.
  45. Faircloth, Brant C.; Branstetter, Michael G.; White, Noor D.; Brady, Seán G. «[http://dx.doi.org/10.1111/1755-0998.12328 Target enrichment of ultraconserved elements from arthropods provides a genomic perspective on relationships among H ymenoptera]». Molecular Ecology Resources, 15, 3, 29-09-2014, pàg. 489–501. DOI: 10.1111/1755-0998.12328. ISSN: 1755-098X.
  46. Reneker, J.; Lyons, E.; Conant, G. C.; Pires, J. C.; Freeling, M. «Long identical multispecies elements in plant and animal genomes». Proceedings of the National Academy of Sciences, 109, 19, 10-04-2012, pàg. E1183–E1191. DOI: 10.1073/pnas.1121356109. ISSN: 0027-8424.
  47. Isenbarger, Thomas A.; Carr, Christopher E.; Johnson, Sarah Stewart; Finney, Michael; Church, George M. «The Most Conserved Genome Segments for Life Detection on Earth and Other Planets». Origins of Life and Evolution of Biospheres, 38, 6, 14-10-2008, pàg. 517–533. DOI: 10.1007/s11084-008-9148-z. ISSN: 0169-6149.
  48. Harris, J. K. «The Genetic Core of the Universal Ancestor». Genome Research, 13, 3, 12-02-2003, pàg. 407–412. DOI: 10.1101/gr.652803. ISSN: 1088-9051.
  49. Ban, Nenad; Beckmann, Roland; Cate, Jamie HD; Dinman, Jonathan D; Dragon, François «A new system for naming ribosomal proteins». Current Opinion in Structural Biology, 24, 2-2014, pàg. 165–169. DOI: 10.1016/j.sbi.2014.01.002. ISSN: 0959-440X.
  50. Gadagkar, Sudhindra R.; Rosenberg, Michael S.; Kumar, Sudhir «Inferring species phylogenies from multiple genes: Concatenated sequence tree versus consensus gene tree» (en anglès). Journal of Experimental Zoology Part B: Molecular and Developmental Evolution, 304B, 1, 15-01-2005, pàg. 64–74. DOI: 10.1002/jez.b.21026. ISSN: 1552-5007.
  51. Ludwig, W.; Schleifer, K.H. «Bacterial phylogeny based on 16S and 23S rRNA sequence analysis» (en anglès). FEMS Microbiology Reviews, 15, 2-3, 10-1994, pàg. 155–173. DOI: 10.1111/j.1574-6976.1994.tb00132.x.
  52. Hug, Laura A.; Baker, Brett J.; Anantharaman, Karthik; Brown, Christopher T.; Probst, Alexander J. «A new view of the tree of life» (en anglès). Nature Microbiology, 1, 5, 5-2016, pàg. 16048. DOI: 10.1038/nmicrobiol.2016.48. ISSN: 2058-5276.
  53. Zhang, Liqing; Li, Wen-Hsiung «Mammalian Housekeeping Genes Evolve More Slowly than Tissue-Specific Genes» (en anglès). Molecular Biology and Evolution, 21, 2, 2-2004, pàg. 236–239. DOI: 10.1093/molbev/msh010. ISSN: 1537-1719.
  54. Clermont, Olivier; Bonacorsi, Stéphane; Bingen, Edouard «Rapid and Simple Determination of theEscherichia coli Phylogenetic Group» (en anglès). Applied and Environmental Microbiology, 66, 10, 01-10-2000, pàg. 4555–4558. DOI: 10.1128/AEM.66.10.4555-4558.2000. ISSN: 1098-5336.
  55. Kullberg, Morgan; Nilsson, Maria A.; Arnason, Ulfur; Harley, Eric H.; Janke, Axel «Housekeeping Genes for Phylogenetic Analysis of Eutherian Relationships» (en anglès). Molecular Biology and Evolution, 23, 8, 01-08-2006, pàg. 1493–1503. DOI: 10.1093/molbev/msl027. ISSN: 1537-1719.
  56. Schoch, C. L.; Seifert, K. A.; Huhndorf, S.; Robert, V.; Spouge, J. L. «Nuclear ribosomal internal transcribed spacer (ITS) region as a universal DNA barcode marker for Fungi» (en anglès). Proceedings of the National Academy of Sciences, 109, 16, 17-04-2012, pàg. 6241–6246. DOI: 10.1073/pnas.1117018109. ISSN: 0027-8424. PMC: PMC3341068. PMID: 22454494.
  57. Man, Si Ming; Kaakoush, Nadeem O.; Octavia, Sophie; Mitchell, Hazel «The Internal Transcribed Spacer Region, a New Tool for Use in Species Differentiation and Delineation of Systematic Relationships within the Campylobacter Genus» (en anglès). Applied and Environmental Microbiology, 76, 10, 15-05-2010, pàg. 3071–3081. DOI: 10.1128/AEM.02551-09. ISSN: 0099-2240.
  58. Ranjard, L.; Poly, F.; Lata, J.-C.; Mougel, C.; Thioulouse, J. «Characterization of Bacterial and Fungal Soil Communities by Automated Ribosomal Intergenic Spacer Analysis Fingerprints: Biological and Methodological Variability» (en anglès). Applied and Environmental Microbiology, 67, 10, 01-10-2001, pàg. 4479–4487. DOI: 10.1128/AEM.67.10.4479-4487.2001. ISSN: 1098-5336.
  59. Bidet, Philippe; Barbut, Frédéric; Lalande, Valérie; Burghoffer, Béatrice; Petit, Jean-Claude «Development of a new PCR-ribotyping method for Clostridium difficile based on ribosomal RNA gene sequencing» (en anglès). FEMS Microbiology Letters, 175, 2, 6-1999, pàg. 261–266. DOI: 10.1111/j.1574-6968.1999.tb13629.x.
  60. Ala, Ugo; Piro, Rosario Michael; Grassi, Elena; Damasco, Christian; Silengo, Lorenzo «Prediction of Human Disease Genes by Human-Mouse Conserved Coexpression Analysis» (en anglès). PLoS Computational Biology, 4, 3, 28-03-2008, pàg. e1000043. DOI: 10.1371/journal.pcbi.1000043. ISSN: 1553-7358.
  61. Pandey, Udai Bhan; Nichols, Charles D. «Human Disease Models in Drosophila melanogaster and the Role of the Fly in Therapeutic Drug Discovery» (en anglès). Pharmacological Reviews, 63, 2, 6-2011, pàg. 411–436. DOI: 10.1124/pr.110.003293. ISSN: 0031-6997.
  62. Huang, Hui; Winter, Eitan E; Wang, Huajun; Weinstock, Keith G; Xing, Heming «"Evolutionary conservation and selection of human disease gene orthologs in the rat and mouse genomes"». Genome Biology, 5, 7, 2004, pàg. R47. DOI: 10.1186/gb-2004-5-7-r47.
  63. Ge, Dongliang; Fellay, Jacques; Thompson, Alexander J.; Simon, Jason S.; Shianna, Kevin V. «Genetic variation in IL28B predicts hepatitis C treatment-induced viral clearance» (en anglès). Nature, 461, 7262, 9-2009, pàg. 399–401. DOI: 10.1038/nature08309. ISSN: 0028-0836.
  64. Bertram, L.; Tanzi, R. E. «Genome-wide association studies in Alzheimer's disease» (en anglès). Human Molecular Genetics, 18, R2, 15-10-2009, pàg. R137–R145. DOI: 10.1093/hmg/ddp406. ISSN: 0964-6906.
  65. Kellis, Manolis; Patterson, Nick; Endrizzi, Matthew; Birren, Bruce; Lander, Eric S. «Sequencing and comparison of yeast species to identify genes and regulatory elements» (en anglès). Nature, 423, 6937, 5-2003, pàg. 241–254. DOI: 10.1038/nature01644. ISSN: 0028-0836.
  66. Marchler-Bauer, A.; Lu, S.; Anderson, J. B.; Chitsaz, F.; Derbyshire, M. K. «CDD: a Conserved Domain Database for the functional annotation of proteins» (en anglès). Nucleic Acids Research, 39, Database, 01-01-2011, pàg. D225–D229. DOI: 10.1093/nar/gkq1189. ISSN: 0305-1048.