Loi de von Mises bivariée

Échantillonages de la variante cosinus de la loi de von Mises bivariée. Les points verts sont échantillonnés à partir d'une distribution à forte concentration et sans corrélation ( , ), les points bleus sont échantillonnés à partir d'une distribution à forte concentration et corrélation négative ( , ), et les points rouges sont échantillonnés à partir d'une distribution à faible concentration et sans corrélation ( ).

La loi de von Mises bivariée est une loi de probabilité prenant ses valeurs sur un tore. Elle peut être considéré comme un analogue sur le tore de la distribution normale bivariée. Elle dérive de la loi de von Mises, qui se définit sur un cercle.

Cette distribution appartient au domaine des statistiques directionnelles. La formule générale de la loi bivariée de von Mises a été proposée pour la première fois par Kanti Mardia en 1975[1],[2]. L'une de ses variantes est aujourd'hui utilisée dans le domaine de la bioinformatique pour formuler des modèles probabilistes de la structure des protéines au niveau atomique[3],[4].

Définition

[modifier | modifier le code]

La loi de von Mises bivariée est une loi de probabilité définie sur un tore, plongé dans . La forme générale de la fonction de densité d'une distribution de von Mises bivariée pour des angles est donnée par :

et sont les moyennes associées à et , et leur concentration (une mesure inverse de la dispersion statistique) et la matrice est une mesure de leur corrélation.

On utilise fréquemment des formules alternatives de la fonction de distribution n'utilisant que la fonction sinus ou cosinus

La variante cosinus de la fonction de distribution bivariée de von Mises [5] est donnée par:

et sont les moyennes associées à et , et leurs concentrations respectives et est liée à leur corrélation. est une constante de normalisation. Cette répartition avec = 0 a été utilisé pour les estimations du noyau de la densité de la distribution des angles dièdres des protéines[3].

La variante sinus a la fonction de densité de probabilité suivante[6]:

où les paramètres ont la même interprétation que pour la version cosinus.

Références

[modifier | modifier le code]

 

  1. K. V. Mardia, Statistics of directional data, Academic Press, (ISBN 0-12-471150-2 et 978-0-12-471150-1, OCLC 481414, lire en ligne)
  2. Kanti V. Mardia et Jes Frellsen, « Statistics of Bivariate von Mises Distributions », dans Bayesian Methods in Structural Bioinformatics, Springer Berlin Heidelberg, (ISBN 978-3-642-27224-0, DOI 10.1007/978-3-642-27225-7_6, lire en ligne), p. 159–178
  3. a et b (en) Wouter Boomsma, Kanti V. Mardia, Charles C. Taylor et Jesper Ferkinghoff-Borg, « A generative, probabilistic model of local protein structure », Proceedings of the National Academy of Sciences, vol. 105, no 26,‎ , p. 8932–8937 (ISSN 0027-8424 et 1091-6490, PMID 18579771, PMCID PMC2440424, DOI 10.1073/pnas.0801715105, lire en ligne, consulté le )
  4. (en) Maxim V. Shapovalov et Roland L. Dunbrack, « A Smoothed Backbone-Dependent Rotamer Library for Proteins Derived from Adaptive Kernel Density Estimates and Regressions », Structure, vol. 19, no 6,‎ , p. 844–858 (PMID 21645855, PMCID PMC3118414, DOI 10.1016/j.str.2011.03.019, lire en ligne, consulté le )
  5. Boomsma, Mardia, Taylor et Ferkinghoff-Borg, « A generative, probabilistic model of local protein structure », Proceedings of the National Academy of Sciences, vol. 105, no 26,‎ , p. 8932–7 (PMID 18579771, PMCID 2440424, DOI 10.1073/pnas.0801715105, Bibcode 2008PNAS..105.8932B)
  6. (en) H. Singh, « Probabilistic model for two dependent circular variables », Biometrika, vol. 89, no 3,‎ , p. 719–723 (ISSN 0006-3444 et 1464-3510, DOI 10.1093/biomet/89.3.719, lire en ligne, consulté le )