En probabilité et statistique, un processus ponctuel est un type particulier de processus stochastique pour lequel une réalisation est un ensemble de points isolés du temps et/ou de l'espace. Par exemple, la position des arbres dans une forêt peut être modélisée comme la réalisation d'un processus ponctuel.
Les processus ponctuels sont des objets très étudiés en probabilité et en statistique pour représenter et analyser des données spatialisées qui interviennent dans une multitude de domaines telle que l'écologie, l'astronomie, l'épidémiologie, la géographie, la sismologie, les télécommunications, la science des matériaux et beaucoup d'autres.
Le cas particulier des processus ponctuels sur la droite réelle est très étudié, la connaissance de la distance entre deux points consécutifs caractérisant le processus. Ce type de processus ponctuel est très utilisé pour modéliser des événements aléatoires dans le temps, tels que l'arrivée d'un client (théorie des files d'attente), l'impulsion d'un neurone...
En mathématiques, un processus ponctuel est un élément aléatoire dont les valeurs sont des motifs de points, c'est-à-dire des « collections » de points sur un ensemble .
Il est possible de généraliser en définissant un motif de points comme étant une mesure de comptage localement finie.
Soit un espace métrique localement compact équipé de sa tribu borélienne . On note l'ensemble des motifs de points de , c'est-à-dire l'ensemble des sous-ensembles localement finis de . Un élément de sera appelé "configuration" et sera noté .
On munit de la tribu [1],[2],[3] engendrée par les applications de comptage : , où B est un compact de et où désigne le cardinal de l'ensemble fini considéré.
Un processus ponctuel est alors une application mesurable d'un espace de probabilité vers l'espace mesuré .
L'exemple le plus commun d'espace est l'espace euclidien ou un de ses sous-espaces. Mais les processus ponctuels ne sont pas limités à ces exemples.
Un cas particulier des processus ponctuels est celui des processus ponctuels définis sur la droite réelle (ou la demi-droite réelle ). Dans les applications concrètes, cela représente souvent l'occurrence d'événements dans le temps. Pour donner quelques exemples, un processus ponctuel dans le temps peut modéliser les temps d'arrivée de visiteurs dans un musée (avec le processus de Poisson par exemple), la durée avant déclenchement d'une maladie chez une personne (processus de Cox) ou encore les temps auxquels on observe des influx nerveux dans les neurones (processus de Hawkes).
La mesure intensité du processus est une mesure sur qui mesure le nombre moyen de points du processus qui tombe dans un borélien de , et s'écrit pour , .
Dans le cas où on étudie des processus ponctuels sur (ou ), on peut proposer une autre façon intuitive de mesurer l'intensité d'un processus ponctuel : cette mesure est appelée l'intensité du processus ponctuel et est définie comme[4] :
D'après le théorème de Khinchin[4], cette limite existe si le processus ponctuel est stationnaire (mais elle peut être infinie). Intuitivement, l'intensité représente la probabilité qu'il y ait au moins une occurrence dans l'intervalle quand tend vers zéro.
La fonctionnelle de Laplace[3] d'un processus ponctuel , noté , est une fonctionnelle de l'ensemble de toutes les fonctions positives de dans et est définie comme suit:
Cette fonctionnelle joue un rôle similaire à la fonction caractéristique d'une variable aléatoire. En effet la fonctionnelle de Laplace caractérise la loi d'un processus ponctuel, c'est-à-dire que deux processus ponctuels qui ont des fonctionnelles de Laplace égales ont la même loi.
Compte tenu de la structure de la tribu sur , la loi d'un processus ponctuel est entièrement déterminée par les probabilités où parcourt l'ensemble des entiers naturels et l'ensemble des boréliens bornés de . Mais le théorème de Rényi nous donne une caractérisation beaucoup plus simple.
Théorème de Rényi — Si l'espace est séparable complet, alors la loi d'un processus ponctuel est entièrement déterminée par les probabilités de vide (void probabilities en anglais), c'est-à-dire par la famille , où parcours l'ensemble des boréliens bornés.
Le processus ponctuel de Poisson est le plus simple et le plus universel des processus ponctuels. C'est une généralisation spatiale du processus de Poisson utilisé en théorie des files d'attente.
Définition d'un processus ponctuel de Poisson — Soit une mesure non atomique sur . Un processus ponctuel est un processus ponctuel de Poisson de mesure d'intensité si, pour toutes familles de boréliens bornés disjoints et pour tous entiers naturels ,
Cette section regroupe les propriétés fondamentales des processus ponctuels de Poisson. Ces résultats sont souvent la conséquence du théorème de Rényi.
Proposition (Superposition de deux processus ponctuels de Poisson)[1],[3] — Soient et deux processus ponctuels de Poisson de mesures d'intensité et . Alors la superposition des deux processus est un processus ponctuel de Poisson de mesure d'intensité .
Proposition (Amincissement (thinning) d'un processus ponctuel de Poisson)[1],[3] — Soient un processus ponctuel de Poisson de mesure d'intensité et une fonction mesurable. Nous construisons le processus en décidant pour chaque point du processus , et de manière indépendante, de la garder avec probabilité et de l'effacer avec probabilité .
Alors le processus est un processus ponctuel de Poisson de mesure d'intensité .
Proposition (Loi du processus conditionné par le nombre de points)[1],[3] — Soit un processus ponctuel de Poisson d'intensité et soit un borélien borné de . Alors conditionnellement à l'événement , les points du processus sont des réalisations indépendantes et identiquement distribuées de loi .
La dernière proposition fournit une méthode simple et très efficace pour simuler des processus ponctuels de Poisson.
Pour simuler un processus ponctuel de Poisson d'intensité dans un compact [1],[3] :
L'objet simulé est une réalisation du processus ponctuel de Poisson sur la fenêtre de mesure d'intensité .
La formule de Slivnyak-Mecke[5],[6], aussi connue sous le nom de formule de Campbell, est une formule très utilisée en géométrie stochastique et en physique statistique.
Théorème — Soit une fonction mesurable et un processus ponctuel de Poisson d'intensité . Alors nous avons
Le terme de droite est dans de nombreux cas calculable et permet de calculer en moyenne, grâce à la formule de Slivnyak-Mecke, la somme des contributions de chaque point du processus.
Le processus ponctuel de Hawkes (ou processus auto-excité) est un processus ponctuel pour lequel les réalisations futures dépendent des réalisations passées. Cette caractéristique le différencie des processus ponctuels de Poisson pour lesquels l'indépendance entre deux événements est une propriété fondamentale.
Le processus de Hawkes a été formalisé pour la première fois par Alan G. Hawkes en 1971[7], sous le nom de processus auto-excité. Ce processus a d'abord été utilisé en sismologie[8] pour modéliser la survenue de répliques suites à un séisme. Depuis, de nombreuses variantes du processus ont été développées et utilisées dans divers domaines, par exemple en sociologie pour étudier la diffusion des mèmes sur les réseaux sociaux[9], en épidémiologie pour modéliser la diffusion d'une maladie[10] ou encore en neurosciences pour modéliser les influx nerveux dans les neurones[11].
Dans l'article fondateur de Alan G. Hawkes[7], le processus auto-excité est défini à partir de son intensité au temps , notée . L'intensité d'un processus ponctuel est une mesure du taux instantané d'occurrence d'événements. Dans le cas du processus de Hawkes, l'intensité s'écrit :
Dans cette formule, l'intensité est formée de deux composantes : le scalaire qui représente le taux d'occurrence spontané (qui n'est pas dû aux événements antérieurs) et l'intégrale entre et , qui désigne la dépendance aux temps antérieurs. Ainsi, l'intensité au temps dépend du nombre d'événements qui sont survenus au temps (antérieur à ) .
L'influence de sur est décrite par la fonction , appelée noyau. Le noyau décrit la façon dont l'excitation évolue en fonction du délai entre un événement passé (survenu au temps ) et le temps . Cette fonction doit tendre vers zéro quand l'intervalle de temps est grand (l'excitation s'atténue) et elle doit prendre des valeurs positives uniquement. Cependant, des extensions du processus de Hawkes ont été proposées dans lesquelles peut prendre des valeurs négatives, et ainsi modéliser une auto-inhibition. Une paramétrisation simple de est l'exponentielle décroissante, par exemple de la forme (avec un paramètre de la fonction, scalaire).
Les processus de Hawkes ont également été généralisés au cas multivarié[3] : c'est-à-dire que plusieurs éléments (dimensions) s'excitent mutuellement. Par exemple, il peut s'agir de plusieurs neurones qui vont se transmettre des influx nerveux les uns aux autres. Dans le cas multivarié, l'équation du processus de Hawkes devient :
L'indice () signifie qu'on s'intéresse à la dimension (neurone par exemple). Comme dans le cas univarié, représente le taux d'occurrence spontané (qui peut être différent pour chaque dimension ). L'intégrale entre et décrit l'influence de l'histoire du processus : pour la dimension , on va sommer les influences des dimensions, et le noyau décrit l'influence du neurone () sur le neurone . On intègre la fonction sur , qui est le nombre d'événements survenus au temps dans la dimension . Dans le cas où , décrit l'auto-excitation de la dimension sur elle-même.
Dans le cas où on observe un processus de Hawkes, mais qu'on ne connaît pas les , la question d'intérêt est souvent de déterminer quelles fonctions sont non-nulles. En effet, si est différente de zéro, cela signifie que la dimension excite la dimension . Par exemple, dans le cas où on observe des neurones, une fonction non nulle peut signifier que le neurone est connecté au neurone .
De nombreuses généralisations du processus de Hawkes ont été proposées : pour prendre en compte l'auto-inhibition, dans le cas spatio-temporel, avec des noyaux non-paramétriques ou encore avec une intensité log-linéaire. De nombreux algorithmes d'inférence ont aussi été proposés afin de déterminer les paramètres (inconnus) d'un processus de Hawkes à partir d'une de ses réalisations.