A filoxenia molecular (ou filoxenética molecular) é unha rama da filoxenia que analiza as diferenzas moleculares hereditarias, principalmente nas secuencias de ADN, para obter información sobre as relacións evolutivas entre os organismos. O resultado dunha análise de filoxenia molecular exprésase nunha árbore filoxenética. A filoxenia molecular é un aspecto da sistemática molecular, un termo de significado amplo que tamén inclúe o uso dos datos moleculares en taxonomía e bioxeografía.
Os fundamentos teóricos da sistemática molecular establecéronse na década de 1960 cos traballos de Emile Zuckerkandl, Emanuel Margoliash, Linus Pauling, e Walter M. Fitch.[1] Nas aplicacións da sistemática molecular foron pioneiros Charles G. Sibley (aves), Herbert C. Dessauer (herpetoloxía), e Morris Goodman (primates), seguidos de Allan C. Wilson, Robert K. Selander, e John C. Avise (que estudaron diversos grupos). Os traballos sobre electroforese de proteínas empezaron arredor de 1956. Aínda que os resultados non eran cuantitativos e non melloraron inicialmente as clasificacións morfolóxicsas, si proporcionaron tentadoras pistas de que as nocións que se levaban mantendo durante moito tempo sobre as clasificacións das aves, por exemplo, necesitaban unha revisión substancial. No período 1974–1986, a hibridación ADN-ADN foi a técnica dominante.[2]
Cada organismo vivo contén ADN, ARN, e proteínas. En xeral, os organismos que están estreitamente relacionados presentan un alto grao de coincidencia na estrutura molecular destas substancias, mentres que as moléculas de organismos cunha relación máis distante xeralmente presentan maiores diferenzas. As secuencias conservadas, como o ADN mitocondrial, espérase que vaian acumulando mutacións co paso do tempo, e asumindo unha taxa constante de mutación, poden servir como un reloxo molecular para datar o momento da diverxencia. A filoxenia molecular usa eses datos para construír unha "árbore de relacións" que mostra a posible evolución de varios organismos. Coa aparición das técnicas xenómicas modernas foi posible illar e identificar estas estruturas moleculares.
A estratexia máis común é a comparación de secuencias homólogas nos xenes utilizando técnicas de aliñamento de secuencias para identificar as semellanzas. Outras aplicacións da filoxenia molecular son o método do código de barras do ADN (DNA barcoding), onde se identifica a especie á que pertence un determinado organismo utilizando pequenas seccións do seu ADN mitocondrial ou do cloroplasto. Outra aplicación destas técnicas que fixo isto posible utilizouse no campo limitado da xenética humana, como as probas xenéticas para determinar a paternidade, e a aparición da nova rama das técnicas forenses en investigación criminal centrada no estudo de probas de delitos de mostras de ADN por medio do perfil de ADN.
En Nature Protocol pode consultarse un protocolo completo paso a paso para construír unha árbore filoxenética, incluíndo a ensamblaxe de secuencias contiguas de ADN/aminoácidos, aliñamentos de secuencias múltiples, probas modelo (comprobar cales son os modelos de substitución máis axeitados) e reconstrución de filoxenias usando os métodos de Máxima Verosimilitude e Inferencia Bayesiana[3]
Os primeiros intentos de aplicar a sistemática molecular denomináronse quimiotaxonomía e utilizaban proteínas, encimas, carbohidratos, e outras moléculas, que eran separadas e caracterizadas utilizando técnicas como a cromatografía. Estas técnicas foron substituídas en gran parte en tempos máis recentes pola secuenciación do ADN, a cal dá as secuencias exactas de nucleótidos ou bases de segmentos de ADN ou ARN extraídos usando diferentes técnicas. En xeral, estes considéranse estudos mellores para as análises evolutivas, xa que a pegada da evolución queda en última instancia reflectida nas secuencias xenéticas. Actualmente, aínda é un proceso relativamente caro secuenciar xenomas enteiros de organismos, e non se fixo aínda para moitas especies (aínda que as técnicas se están abaratando ano tras ano e o número de xenomas secuenciados aumenta rapidamente, especialmente de microorganismos). É moito máis fácil e rápido determinar a secuencia dunha área definida dun determinado cromosoma. As análises de sistemática molecular típicas requiren a secuenciación de arredor de 1000 pares de bases. Nun determinado sitio dentro dunha secuencia as bases poden variar entre distintos organismos. A secuencia particular que se encontre nun organismo dise que é o seu haplotipo. En principio, como hai catro bases, en 1000 pares de bases, habería 41000 haplotipos distintos posibles. Porén, en organismos que pertencen a unha mesma especie ou en grupos de especies relacionadas, observouse que só unha minoría dos sitios mostran algunha variación e a maioría das variacións encontradas están correlacionadas, de modo que o número de haplotipos distintos que se encontran é relativamente pequeno.
Nunha análise de sistemática molecular, os haplotipos están determinados por unha área definida do material xenético; utilízase unha mostra substancial de individuos da especie ou taxon estudado, aínda que moitos dos estudos actuais están baseados nun só individuo. Tamén se determinan os haplotipos de individuos de taxons estreitamente relacionadas, pero diferentes. Finalmente, tamén se determinan os haplotipos dun menor número de individuos dun taxon claramente distinto: estes denomínanse grupo externo. Compáranse as secuencias de bases dos haplotipos. No caso máis simple, a diferenza entre dous haplotipos é avaliada contando o número de lugares onde teñen bases diferentes: isto denomínase número de substitucións (tamén poden producirse outro tipo de diferenzas entre os haplotipos, por exemplo a inserción dunha sección de secuencia xenética nun haplotipo que non está presente no outro). A diferenza entre oganismos é xeralmente re-expresada como porcentaxe de diverxencia, ao dividir o número de substitucións polo número de pares de bases analizadas: a esperanza é que esta medida sexa independente da localización e da lonxitude da sección de ADN que é secuenciada.
Unha estratexia máis vella e xa superada era determinar a diverxencia entre os xenotipos dos individuaos por hibridación ADN-ADN. A vantaxe que se consideraba que tiña usar a hibridación en vez da secuenciación de xenes era que está baseada no xenotipo enteiro e non só en pequenas seccións do ADN secuenciadas, pero as modernas técnicas de comparación de secuencias superaron esta obxección ao utilizaren moitas secuencias.
Unha vez que se determinaron as diverxencias entre todos os pares de mostras, a matriz triangular de diferenzas resultante é sometida a algunha forma de algoritmo de agrupamento estatístico, e o dendrograma resultante examínase para ver se o agrupamento de mostras se corresponde ou non co esperado segundo as ideas actuais sobre a taxonomía do grupo. Un grupo de haplotipos que son entre si máis similares que o que é calquera deles con respecto a outro haplotipo pode dicirse que constitúe un clado. Algunhas técnicas estatísticas como o bootstrapping e o Jackknife axudan a facer estimacións confiables das posicións dos haplotipos dentro das árbores evolutivas.
A sistemática molecular é unha estratexia esencialmente cladística, que asume que a clasificación debe corresponderse coa descendencia filoxenética, e que todos os taxons válidos deben ser monofiléticos.
O recente descubrimento de amplas transferencias horizontais de xenes entre organismos supón unha complicación significativa para a sistemática molecular, o que indica que xenes diferentes nun mesmo organismo poden ter diferentes filoxenias.
Ademais, as filoxenias moleculares son sensibles ás asuncións e modelos que se usan para elaboralas. Enfróntanse a problemas como a atracción das ramas longas, a saturación, e problemas de mostraxe de taxons. Isto significa que poden obterse resultados moi diferentes ao aplicar diferentes modelos ao mesmo conxunto de datos.[4]