Un supertree est un arbre phylogénétique unique assemblé à partir d'une combinaison d'arbres phylogénétiques plus petits, qui peuvent avoir été assemblés en utilisant différents ensembles de données (par exemple morphologiques et moléculaires) ou une sélection différente de taxons[1]. Les algorithmes Supertree peuvent mettre en évidence les domaines dans lesquels des données supplémentaires résoudraient le plus utilement les ambiguïtés[2]. Les branches d'entrées d'un arbre supérieur doivent se comporter comme des échantillons de l'arbre plus grand[3].
La construction d'un supertree grandit exponentiellement avec le nombre de taxons inclus. Par conséquent, pour un arbre de toute taille raisonnable, il n'est pas possible d'examiner tous les supertree possibles et d'évaluer son succès à combiner les informations d'entrées. Les méthodes heuristiques sont donc essentielles, bien que ces méthodes puissent être peu fiables, le résultat extrait est souvent biaisé ou affecté par des caractéristiques non pertinentes des données d'entrées[1].
La méthode la plus connue pour la construction de supertree est la représentation matricielle avec parcimonie (MRP pour Matrix Representation with Parsimony) dans laquelle les arbres qui sont source d'entrée sont représentés par des matrices avec 0s, 1s et ?s (c'est-à-dire que chaque bord de chaque arbre source définit une bipartition du jeu de feuilles en deux parties disjointes et les feuilles d'un côté obtiennent 0, les feuilles de l'autre côté obtiennent 1, et les feuilles manquantes obtiennent ?). Les matrices sont concaténées puis analysées à l'aide d'heuristiques pour une parcimonie maximale[4]. Une autre approche pour la construction de supertree inclut une version à maximum de vraisemblance du MRP appelée "MRL" (représentation matricielle avec vraisemblance et matrix representation with likelihood en anglais), qui analyse la même matrice MRP mais utilise l'heuristique pour un maximum de vraisemblance au lieu d'une parcimonie maximale pour construire le supertree.
La distance Robinson-Foulds est la plus populaire car il y a de nombreuses façons de mesurer la similitude d'un arbre secondaire avec les arbres d'entrée. Il s'agit d'une métrique pour le nombre de clades des arbres d'entrée qui sont conservés dans le supertree. Les méthodes d'optimisation de Robinson-Foulds recherchent un surpertree qui minimise les différences totales (additionnées) de Robinson-Foulds entre le surpertree (binaire) et chaque arbre d'entrée[1].
Une innovation récente a été la construction de supertrees avec un maximum de vraisemblance et l'utilisation de scores de probabilités «en entrée» pour effectuer des tests de deux supertrees[5].
Les méthodes supplémentaires incluent la Min Cut Supertree approach[6], la Most Similar Supertree Analysis (MSSA), la Distance Fit (DFIT) et la Quartet Fit (QFIT), implémentées dans le logiciel CLANN[7],[8].
Des supertrees ont été construits pour produire des phylogénie de nombreux groupes, notamment les angiospermes[9], eucaryotes[10] et les mammifères[11]. Ils ont également été appliqués à des problèmes à plus grande échelle tels que les origines de la diversité, la vulnérabilité à l'extinction[12] et les modèles évolutifs de structure écologique[13].
Bininda-Emonds, O. R. P, Phylogenetic Supertrees : Combining Information to Reveal the Tree of Life, , 550 p. (ISBN978-1-4020-2328-6, lire en ligne)
Bininda-Emonds, Gittleman et Steel, « The (Super)Tree of Life: Procedures, Problems, and Prospects », Annual Review of Ecology and Systematics, vol. 33, , p. 265–289 (DOI10.1146/annurev.ecolsys.33.010802.150511, JSTOR3069263)
↑Gordon, « Consensus supertrees: the synthesis of rooted trees containing overlapping sets of labeled leaves », Journal of Classification, vol. 3, no 2, , p. 335–348 (DOI10.1007/BF01894195)
↑C. J. Creevey et J. O. McInerney, Trees from Trees: Construction of Phylogenetic Supertrees Using Clann - Springer, vol. 537, Humana Press, coll. « Methods in Molecular Biology », , 139–161 p. (ISBN978-1-58829-910-9, PMID19378143, DOI10.1007/978-1-59745-251-9_7), « Trees from Trees: Construction of Phylogenetic Supertrees Using Clann »
↑Davies, Barraclough, Chase et Soltis, « Darwin's abominable mystery: Insights from a supertree of the angiosperms », Proceedings of the National Academy of Sciences of the United States of America, vol. 101, no 7, , p. 1904–1909 (PMID14766971, PMCID357025, DOI10.1073/pnas.0308127100, Bibcode2004PNAS..101.1904D)
↑Pisani, Cotton et McInerney, « Supertrees disentangle the chimerical origin of eukaryotic genomes », Molecular Biology and Evolution, vol. 24, no 8, , p. 1752–1760 (PMID17504772, DOI10.1093/molbev/msm095)
↑Davies, Fritz, Grenyer et Orme, « Phylogenetic trees and the future of mammalian biodiversity », Proceedings of the National Academy of Sciences of the United States of America, vol. 105 Suppl 1, no Supplement_1, , p. 11556–11563 (PMID18695230, PMCID2556418, DOI10.1073/pnas.0801917105, Bibcode2008PNAS..10511556D)
↑Webb, Ackerly, McPeek et Donoghue, « Phylogenies and Community Ecology », Annual Review of Ecology and Systematics, vol. 33, , p. 475–505 (DOI10.1146/annurev.ecolsys.33.010802.150448)