by Bernard Roynette and Pierre Vallois
Marc travailla sur la théorie de la pénalisation une petite dizaine d’années, jusqu’en 2009 environ. Il publia sur ce thème avec ses co-auteurs environ une quinzaine d’articles, monographie et livre. Il n’est donc pas question de détailler ici l’ensemble de ses résultats mais seulement d’en esquisser les idées principales.
1. Qu’est ce qu’une pénalisation?
a) Soit \( \Omega:=\mathcal{C}(\mathbb{R}_+,\mathbb{R}) \) (ou \( \mathcal{C}(\mathbb{R}_+,\mathbb{R}^d) \), ou \( \mathcal{C}(\mathbb{R}_+,\mathbb{R}_+) \)) l’espace canonique, \( (X_t(\omega):=\omega(t),\; t\geq 0) \) le processus des coordonnées et \( (\mathcal{F}_t=\sigma(X_s,\; s\leq t))_{t\geq 0} \) la filtration naturelle. Désignons par \( \mathcal{F}_\infty \) la \( \sigma \)-algèbre \( \bigvee_{t\geq 0}\mathcal{F}_t=\sigma(X_s,\; s\geq 0) \). L’espace \( \Omega \) est muni de la famille de probabilités \( (W_x,\; x\in \mathbb{R}^d) \) ou \( (W_x,\; x\in \mathbb{R}_+) \) telle que, sous \( W_x \), \( (X_t) \) est un mouvement Brownien à valeurs dans \( \mathbb{R}^d \) ou un processus de Bessel, issu de \( x \). On notera \( E_x \) l’espérance sous \( W_x \).
b) Soit par ailleurs \( (\Gamma_t,\; t\geq 0) \) une fonctionnelle de pénalisation, i.e. une famille de variables aléatoires positives (non nécessairement adaptée) et telle que, \[ 0 < E_x(\Gamma_t) < \infty, \quad \mbox{pour tout } t\geq 0 \mbox{ et } x\in \mathbb{R}. \] Définissons alors la nouvelle probabilité \( W_{x,t}^\Gamma \) sur \( (\Omega, \mathcal{F}_\infty) \) par la relation: \begin{equation} W_{x,t}^\Gamma:=\frac{\Gamma_t}{E_x(\Gamma_t)} \;W_x,\quad t\geq 0,\; x\in \mathbb{R}. \end{equation} Par définition, \( W_{x,t}^\Gamma \) est absolument continue par rapport \( W_x \), mais la famille de probabilités \( (W_{x,t}^\Gamma,\; t\geq 0) \) n’est pas, en général, projective.
c) Supposons que la propriété suivante soit satisfaite: \begin{equation}\label{propP} \eqalign{ &\mbox{pour tout } s\geq0 \mbox{ et } F_s\in\mathcal{F}_s, W_{x,t}^\Gamma(F_s) \mbox{ admet une limite,} \cr&\hskip180pt\mbox{ notée } W_{x,\infty}^\Gamma(F_s), \mbox{ quand }\ t\rightarrow \infty. } \end{equation} Nous noterons parfois dans la suite, lorsqu’il n’y a pas d’ambiguité, \( W_\infty^\Gamma(F_s) \) au lieu de \( W_{x,\infty}^\Gamma(F_s) \).
Si la propriété \eqref{propP} est satisfaite, il n’est pas difficile de démontrer:
- \( W_{x,\infty}^\Gamma \) induit une probabilité sur \( (\Omega, \mathcal{F}_\infty) \) qui est appelée probabilité obtenue par la pénalisation \( (\Gamma_t,\; t\geq 0) \).
- Pour tout \( s\geq0 \), la restriction de \( W_{x,\infty}^\Gamma \) à \( \mathcal{F}_s \) admet une densité \( M^x_s \) et \( (M_s^{x},\; s\geq 0) \) est une \( (\mathcal{F}_s)_{s\geq 0} \) \( W_x \)-martingale positive et \begin{equation}\label{9h2} W_{x,\infty}^\Gamma=M^x_{s}\; W_x\quad \mbox{sur } \mathcal{F}_s. \end{equation}
d) En quoi consiste l’étude d’une pénalisation?
Le processus \( (\Gamma_t,\;t\geq 0) \) étant donné, une étude de pénalisation consiste d’abord à prouver que la propriété \eqref{propP} a lieu. Pour ce faire, la première étape est d’exhiber un équivalent de \( E_x(\Gamma_t) \) lorsque \( t\rightarrow\infty \). La quantité \( E_x(\Gamma_t) \) est appelé le facteur de normalisation.
Dans la plupart des exemples considérés, bien que la probabilité \( W_{x,\infty}^\Gamma \) soit absolument continue par rapport à la probabilité initiale \( W_x \) sur chaque \( \mathcal{F}_t \), il n’en va pas de même sur \( \mathcal{F}_\infty \). Ainsi beaucoup de probabilités obtenues par pénalisation du mouvement brownien ont un comportement trajectoriel à l’infini très différent de la trajectoire brownienne usuelle, ce qui en fait leur intérêt. Il est ainsi possible que la trajectoire puisse être rendue transiente sous la nouvelle probabilité, voir l’Exemple TL, Section 3 ci-dessous.
e) L’un des premiers exemples de processus pénalisé est sans doute dû à F. Knight [◊] lors de son étude des “taboo processes”, où l’auteur construit dans cet article un mouvement brownien conditionné à rester à l’intérieur d’un intervalle borné. Il faudrait plutôt parler ici de processus conditionné par un événement de probabilité nulle. L’exemple de F. Knight est un cas particulier de pénalisation.
2. Les pénalisations du type Feynman–Kac
Ces pénalisations sont ainsi désignées car la fonctionnelle de pénalisation associée est de la forme: \begin{equation} \Gamma_t:=\exp\Bigl\{-\frac{1}{2} \int_0^t q(X_s)\,ds\Bigr\},\quad t\geq 0, \end{equation} où \( q :\; \mathbb{R} \rightarrow\mathbb{R}_+ \) est une fonction satisfaisant à: \begin{equation}\label{Jyv2} \int_\mathbb{R}(1+|x|)q(x)\,dx < \infty. \end{equation} Ces pénalisations furent les premières étudiées par Marc et ses co-auteurs [◊]. Un premier manuscrit sur ce sujet fut rédigé à Noël 2001.
L’origine de ce travail est l’intérêt que portait Marc aux fonctionnelles browniennes exponentielles et plus particulièrement à la question suivante: quel est l’équivalent, quand \( t\rightarrow\infty \) de \( E_x(\Gamma_t) \) lorsque la fonction \( q \) vérifie par exemple \eqref{Jyv2}, ou d’autres conditions à l’infini. Sous l’hypothèse \eqref{Jyv2}, la réponse à cette question est la suivante: \begin{equation}\label{Jyv3} E_x(\Gamma_t) \sim\frac{\varphi_q(x)}{\sqrt{t}},\quad t\rightarrow\infty, \end{equation} où la fonction \( \varphi_q \) est l’unique solution d’une équation de Sturm–Liouville avec conditions ad-hoc à l’infini. La première démonstration de ce résultat utilisait les théorèmes taubériens.
Le processus pénalisé, qui est obtenu comme solution d’une équation différentielle stochastique explicite, est un processus transient alors que le processus de départ, le mouvement brownien linéaire, est récurrent. Par conséquent, la nouvelle probabilité est donc singulière par rapport à la mesure de Wiener. L’explication intuitive de ce résultat est la suivante: d’après \eqref{Jyv2}, la fonction \( q \) est “petite à l’infini”; ainsi \( \Gamma_t \) est grande sur les trajectoires “qui vont souvent à l’infini”. La pénalisation favorise donc ce type de trajectoires, ce qui explique intuitivement l’aspect transient du processus pénalisé. Signalons que dans ce cas particulier, le processus pénalisé est markovien, ce qui n’est pas en général le cas, comme dans l’exemple TL (cf. Section 3).
3. D’autres pénalisations
Pendant plusieurs années, jusqu’en 2009 environ, Marc et ses co-auteurs se sont intéressés à d’autres fonctionnelles de pénalisation:
- des fonctions du maximum unilatère, ou du maximum de la valeur absolue, ou du temps local en 0 ou du nombre de descentes, du mouvement brownien linéaire [◊];
- des fonctions du maximum unilatère du pont brownien [◊];
- des fonctions du temps local en 0 pour des processus de Bessel récurrents [◊];
- des fonctions dépendant du nombre de tours ou du module pour le mouvement brownien multidimensionnel [◊];
- des fonctions liées à la longueur des excursions, ou du maximum unilatère après un temps de premier passage, ou des fonctions de fonctionnelles additives browniennes, etc. [◊], [◊] et [◊].
Bien qu’il ne soit pas envisageable de décrire ici l’ensemble des résultats obtenus, faisons toutefois quelques remarques.
\( \bullet \) D’une façon assez extraordinaire et fascinante, les méthodes utilisées dans ces travaux font appel de manière essentielle à de nombreux résultats récents du calcul stochastique, résultats dont beaucoup ont été soit initialisés, soit développés par Marc. On a parfois l’impression que ces résultats “collent” tellement bien à la problématique des pénalisations qu’ils ont été crées à cet fin. Citons parmi ces méthodes et outils: le balayage et les martingales d’Azéma–Yor, les plongements de Skorokhod (par la méthode d’Azéma–Yor [◊] et [◊]), les grossissements initial et progressif de filtrations, l’extension du théorème de Pitman relatif au processus de Bessel de dimension 3 ([◊] et [◊]), les théorèmes de Ray–Knight, les études de fonctionnelles exponentielles, la théorie des excursions, etc.
\( \bullet \) Notons aussi que, d’après le point 1 c) ci dessus, à chaque pénalisation est associée une martingale positive, si bien que l’étude des pénalisations est une “machine” à fabriquer de nombreuses et nouvelles martingales. Certaines — par exemple celles liées aux pénalisations de processus de Bessel récurrents par une fonctionnelle dépendant des longueurs des excursions classées par ordre décroissant — ont le parfum exquis et troublant de ces nouvelles espèces de fleurs découvertes par des botanistes-explorateurs au fin fond de l’Océanie.
\( \bullet \) Les procédures de pénalisation ont beaucoup de rapport avec ce que l’on pourrait appeler un “plongement de Skorokhod asymptotique”. Pour être clair et sans chercher à faire une théorie, illustrons ceci avec un exemple simple (cf. [◊]).
Exemple TL (Temps Local)
Soit \( (L_t,\; t\geq 0) \) le temps local en 0 du mouvement brownien \( (X_t,\; t\geq 0) \), issu de 0 et soit \( h : \; \mathbb{R}_+\rightarrow \mathbb{R}_+ \) une fonction intégrable que l’on peut supposer, sans perte de généralité, d’intégrale 1, i.e. \( \int_0^\infty h(x)\,dx=1 \). Pénalisons le mouvement brownien par la fonctionnelle: \[ \Gamma_t:=h(L_t),\quad t\geq 0, \] et notons \( W_{x,\infty}^{h(L)} \) la probabilité obtenue par cette pénalisation. Ce qui signifie que \[ \lim_{t\rightarrow\infty}E_x\biggl(F_s\frac{h(L_t)}{E[h(L_t)]}\biggr)= W_{x,\infty}^{h(L)}(F_s),\quad \mbox{pour tous } s\geq 0,\ F_s\in \mathcal{F}_s. \] Sous la probabilité \( W_{x,\infty}^{h(L)} \),
- \( L_t \) converge presque sûrement vers une v.a. notée \( L_\infty \);
- \( L_\infty \) a pour densité \( h \), lorsque \( x=0 \).
On a ainsi construit sur l’espace canonique du mouvement brownien, une v.a. \( L_\infty \) qui, sous \( W_{0,\infty}^{h(L)} \) admet pour densité la fontion \( h \) donnée à l’avance. En ce sens, il s’agit d’une sorte de “plongement de Skorokhod asymptotique”.
\( \bullet \) La plupart des processus pénalisés ne sont plus markoviens, même si le processus de départ l’est. Dans [◊], apparaissent ainsi des processus non-markoviens mais qui sont “max-markoviens”. Une caratérisation des processus pénalisés markoviens est esquissée dans [◊].
4. Une tentative d’unification de différentes pénalisations
Si l’on observe les différentes pénalisations décrites, très brièvement, dans la Section 3, en dépit de la grande variété des fonctionnelles de pénalisation utilisées et des martingales en résultant, en dépit des comportements très divers des processus pénalisés, force est de reconnaitre que tous ces résultats ont “un air de famille”. En particulier, beaucoup de décompositions de trajectoires pénalisées ont un point commun: après un certain temps (qui n’est pas un temps d’arrêt), les trajectoires se comportent comme celles d’un processus de Bessel de dimension 3, alors qu’au départ, un tel processus n’apparaissait nulle part. Cet aspect troublant incitait à se poser la question suivante:
(Q) existe-t-il un cadre plus général — universel? — englobant toutes ou, à défaut, beaucoup de pénalisations?
Bien sûr, une telle question conduit alors à ne plus seulement considérer les pénalisations individuellement mais au contraire à les regarder “globalement”, en quelque sorte comme fonction de la fonctionnelle de pénalisation. Pour être plus explicite, revenons aux pénalisations de Feynman–Kac introduites dans la Section 1. Notons \( W_{x,\infty}^{(q)} \) la probabilité pénalisée par la fonctionnelle: \[ \Gamma^{(q)}_t:=\exp\Big\{-\frac{1}{2} \int_0^t q(X_s)\,ds\Big\},\quad t\geq 0, \] afin d’indiquer la dépendance en la fonction \( q \).
Le résultat principal qui répond à (Q) est le suivant: il existe une famille de mesures \( \sigma \)-finies \( (\mathcal{W}_x,\; x\in \mathbb{R}) \) sur l’espace canonique, qui ne dépend pas de \( q \), telle que pour toute fonction \( q \) satisfaisant \eqref{Jyv2} on ait, \begin{equation}\label{Jyv4} W_{x,\infty}^{(q)}(F) =\frac{1}{\varphi_q(x)}\mathcal{W}_x\Big(1_F\exp\Big\{-\frac{1}{2} \int_0^\infty q(X_s)\,ds\Big\}\Big),\quad F\in \mathcal{F}_\infty, \end{equation} où \( \varphi_q \) est la fonction qui a été introduite dans la Section 1 et qui apparait dans l’équivalent \eqref{Jyv3}.
Notons que d’après \eqref{Jyv4}, \begin{equation}\label{Jyv5} \varphi_q(x)=\mathcal{W}_x\Big(\exp\Big\{-\frac{1}{2} \int_0^\infty q(X_s)\,ds\Big\}\Big). \end{equation} En d’autres termes, toutes les probabilités pénalisées \( W_{x,\infty}^{(q)} \) sont absolument continues par rapport à cette unique mesure \( \sigma \)-finie \( \mathcal{W}_x \) et la densité associée a une forme simple: \[ \frac1{\varphi_q(x)}\exp\biggl\{-\frac{1}{2} \int_0^\infty q(X_s)\,ds\biggr\} \] qui dépend bien sûr de la fonction \( q \).
Cette mesure \( \mathcal{W}_x \) possède la propriété suivante: pour tout \( t\geq 0 \) et tout \( F\in \mathcal{F}_t \), \[ \mathcal{W}_x(F)= \begin{cases} 0 & \mbox{si }\ W_{x,\infty}^{(q)}(F)=0,\\ \infty& \mbox{si }\ W_{x,\infty}^{(q)}(F) > 0. \end{cases} \] Notons que cette alternative ne dépend pas de \( q \). Ainsi, \( \mathcal{W}_x \) ne prend que 2 valeurs sur \( \mathcal{F}_t \).
Marc a joué un rôle majeur dans la découverte des mesures \( \mathcal{W}_x \).
Fait remarquable, non seulement cette mesure \( \sigma \)-finie “rend compte de toutes les pénalisations de type Feynman–Kac”, via \eqref{Jyv4}, mais elle se généralise à bon nombre d’autres pénalisations, celles dont le facteur de normalisation “est en \( 1/\sqrt{t} \)”. Illustrons ce fait sur un exemple simple (la monographie [◊] en compte beaucoup d’autres).
Reprenons pour cela l’exemple TL décrit dans la Section 3. On a alors, et c’est une généralisation de directe de \eqref{Jyv4}: \begin{equation}\label{Jyv6} W_{x,\infty}^{h(L)}(F)=c_x\mathcal{W}_x(1_F h(L_\infty)), \quad \forall\; F\in \mathcal{F}_\infty, \end{equation} où la constante \( c_x \) vaut \( 1/\mathcal{W}_x(h(L_\infty)) \).
Remarquons que la v.a. \( L_\infty \) est finie presque sûrement à la fois sous \( W_{x,\infty}^{h(L)} \) et \( \mathcal{W}_x \).
En d’autres termes, pour cette pénalisation avec une fonction du temps local en 0, la formule \eqref{Jyv4} est encore vraie, avec la même mesure \( \sigma \)-finie \( \mathcal{W}_x \), à condition de remplacer la v.a. \( \exp\bigl\{-\frac{1}{2} \int_0^\infty q(X_s)\,ds\bigr\} \) par \( h(L\infty) \). Comme une formule du type \eqref{Jyv4} existe pour une large classe de pénalisations (cf. [◊], Section 1.2.5), on peut dire que \( \mathcal{W}_x \) est une mesure “universelle”.
La construction de cette mesure \( \mathcal{W}_x \) est menée à bien dans le chapitre 2 de [◊], tandis que ses principales propriétés, utilisations et extensions sont développées dans [◊].
Le premier signataire de ce mini-résumé du travail de Marc sur les pénalisations tient à dire que la contribution de Joseph Najundel dans la rédaction de [◊] a été extrêmement importante. Discutant avec Marc, il nous arrivait souvent de parler de la propriété de Joseph ou du théorème de Joseph - cf. en particulier le point 2 du Théorème 1.18 p. 8 de [◊], qui est un point clé ainsi que le Théorème 1.2.14, p. 48 [◊], qui est en quelque sorte un aboutissement de la théorie. Enfin, le chapitre 4, de [◊], consacré à une adaptation — non-triviale! — des résultats de pénalisation à des chaines de Markov “générales” est entièrement dû à J. Najnudel.