Théorie de la mesure et probabilité Notes PDF
Document Details
Uploaded by EasyToUseJasper7957
ENSAI
2023
Basile de Loynes
Tags
Summary
These notes cover measure theory and the fundamentals of probability theory. The material is suitable for a first-year course at the École nationale supérieure de l'aéronautique et de l'espace (ENSAI).
Full Transcript
Théorie de la mesure et probabilité Basile de Loynes 25 septembre 2023 Ce document est mis à disposition selon les termes de la licence Creative Commons “Attribution – Partage dans les mêmes conditions 4.0 Internatio...
Théorie de la mesure et probabilité Basile de Loynes 25 septembre 2023 Ce document est mis à disposition selon les termes de la licence Creative Commons “Attribution – Partage dans les mêmes conditions 4.0 Internatio- nal”. ii Table des matières Introduction vii I Topologie et théorie de la mesure 1 1 Rappels et compléments d’analyse 3 1.1 Espaces vectoriels normés.................................... 3 1.2 Espaces métriques........................................ 4 1.2.1 Métrique, boule ouverte, boule fermée, parties bornées................ 4 1.2.2 Topologie des espaces métriques............................ 5 1.2.3 Notion de limites..................................... 9 1.2.4 Continuité......................................... 12 1.2.5 Topologies et opérations ensemblistes......................... 13 1.2.6 Compacité........................................ 15 1.2.7 Espaces métriques complets............................... 20 1.3 Espaces polonais......................................... 23 2 Tribus, applications mesurables et mesures 25 2.1 Tribus et Applications mesurables............................... 25 2.1.1 Tribu........................................... 25 2.1.2 Tribu borélienne..................................... 27 2.1.3 La droite achevée..................................... 28 2.1.4 Applications mesurables, applications boréliennes................... 29 2.1.5 Approximation des fonctions mesurables........................ 31 2.2 Mesures positives......................................... 32 2.2.1 Définitions et propriétés élémentaires.......................... 32 2.2.2 Quelques exemples de mesures : mesures discrètes et mesure de Lebesgue..... 35 2.2.3 Théorème des classes monotones, caractérisation des mesures et théorème de pro- longement de Carathéodory............................... 37 2.2.4 Régularité des mesures, mesures de Borel et espaces polonais............ 46 3 Intégrale au sens de Lebesgue 51 3.1 Construction de l’intégrale de Lebesgue............................ 51 3.1.1 Intégration des fonctions étagées positives....................... 51 3.1.2 Intégration des fonctions mesurables positives..................... 52 3.1.3 Intégration des fonctions mesurables.......................... 54 3.2 L’intégrale de Lebesgue en pratique............................... 56 3.2.1 L’intégrale de Lebesgue contre des mesures discrètes................. 56 3.2.2 Mesures à densité..................................... 57 3.2.3 Mesure image et théorème de transfert......................... 58 3.2.4 Intégrale de Riemann et intégrale de Lebesgue.................... 59 iii 4 Théorèmes limites 63 4.1 Lemme de Fatou......................................... 63 4.2 Ensembles et fonctions mesurables négligeables........................ 63 4.3 Théorème de convergence dominée............................... 65 4.4 Intégrale à paramètres...................................... 66 5 Mesure produit 69 5.1 Mesure produit.......................................... 69 5.2 Théorèmes de Fubini-Tonelli et de Fubini-Lebesgue...................... 71 5.3 La mesure produit en application................................ 73 5.4 Mesure image et changement de variables........................... 75 6 Espaces Lp et Lp 79 6.1 Généralités............................................ 79 6.2 Inégalités de Hölder et de Minkowski.............................. 80 6.3 Théorème de Radon-Nikodym.................................. 82 6.3.1 Un peu d’espace de Hilbert............................... 82 6.3.2 Lemme de Fréchet-Riesz................................. 85 6.3.3 Théorème de Radon-Nikodym, cas des mesures positives............... 86 6.3.4 Théorème de Radon-Nikodym, cas des mesures signées................ 88 6.4 Approximation dans les espaces Lp , p ∈ [1, ∞)........................ 90 6.4.1 Approximation par des fonctions étagées mesurables................. 90 6.4.2 Approximation par des fonctions continues à support compact........... 91 6.4.3 Convolution........................................ 92 II Probabilités générales 97 7 Variables aléatoires réelles et vecteurs aléatoires 99 7.1 Variables aléatoires........................................ 99 7.2 Variables aléatoires réelles.................................... 101 7.2.1 Intégration des variables aléatoires réelles....................... 101 7.2.2 Caractérisation de la loi d’une v.a.r........................... 104 7.2.3 Exemples de calcul de lois................................ 108 7.2.4 Classification des lois de probabilités sur R...................... 110 7.2.5 Simulation de lois.................................... 110 7.3 Vecteurs aléatoires........................................ 112 7.3.1 Généralités........................................ 112 7.3.2 Loi d’un vecteur aléatoire, lois marginales....................... 112 7.3.3 Moments......................................... 112 7.3.4 Lois à densité....................................... 113 7.3.5 Fonction de répartition................................. 113 7.3.6 Transformation des vecteurs aléatoires à densité................... 114 8 Indépendance 115 8.1 Tribus indépendantes....................................... 115 8.2 Lemme de Borel-Cantelli..................................... 117 8.3 Variables aléatoires indépendantes............................... 118 8.3.1 Définition et caractérisation élémentaire........................ 118 8.3.2 Constructions de variables aléatoires indépendantes................. 118 8.3.3 Caractérisation de l’indépendance de v.a.r....................... 120 8.4 Une application du second lemme de Borel-Cantelli...................... 122 iv 9 Fonctions caractéristiques 123 9.1 Fonction caractéristique d’une v.a.r............................... 123 9.2 Fonctions caractéristiques et moments............................. 125 9.3 Fonctions caractéristiques de vecteurs aléatoires........................ 126 9.4 Fonctions caractéristiques et indépendance........................... 126 10 Vecteurs gaussiens 127 10.1 Manipulation des vecteurs gaussiens.............................. 127 10.2 Loi du χ2 , moyenne et variance empiriques.......................... 130 11 Convergences de suites de variables aléatoires 133 11.1 Convergences trajectorielles................................... 133 11.1.1 Convergence presque sûre ou presque partout..................... 133 11.1.2 Convergence dans Lp................................... 134 11.1.3 Convergence en probabilité............................... 135 11.1.4 Convergence trajectorielle et critère de type Cauchy................. 137 11.2 Convergence étroite et convergence en loi........................... 138 11.2.1 Convergence étroite................................... 139 11.2.2 Convergence en loi.................................... 143 11.3 Loi du 0-1 de Kolmogorov et séries aléatoires......................... 146 12 Loi des grands nombres et Théorème Central Limite 153 12.1 Loi des grands nombres..................................... 153 12.2 Théorème Central Limite.................................... 158 12.3 TCL multivarié.......................................... 158 12.4 Applications de la loi des grands nombres........................... 159 13 Espérance conditionnelle 163 13.1 Conditionnement par un événement.............................. 163 13.2 Espérance conditionnelle..................................... 165 13.3 Propriétés de l’espérance conditionnelle............................ 166 13.4 Inégalité de Jensen et de Markov conditionnelles....................... 168 13.5 Conditionnement des vecteurs gaussiens............................ 168 13.6 Point de vue hilbertien des espérances conditionnelles.................... 169 13.7 Lois conditionnelles régulières.................................. 169 13.7.1 Densité conditionnelle.................................. 169 13.7.2 Noyau de transition et loi conditionnelle régulière................... 171 Lois usuelles 173 13.8 Lois discrètes........................................... 173 13.9 Lois continues........................................... 173 v vi Introduction Ces notes constituent le support d’un cours dispensé en première année de l’Ensai. L’objectif principal de ce cours est d’introduire le formalisme moderne de la théorie des probabilités. Un cours de probabilité moderne ne saurait se dispenser des bases solides données par la théorie de la mesure. C’est ainsi que ce cours est découpé en deux parties : la première est dédiée la construction de l’intégrale de Lebesgue dans le formalisme de la théorie de la mesure ; la seconde quant à elle s’attachera à introduire les concepts fondamentaux de probabilité. Dans l’axiomatique de la théorie de la mesure, on se donne un triplet (X, X , µ) où — X est un ensemble ; — X est une collection de parties de X dites parties mesurables ; — µ est une fonction d’ensembles de X dans R+. On s’attachera dans la première partie du cours à définir proprement la notion de partie mesurable et mesure. Puis, on donnera un sens aux notations Z Z Z f dµ, f (x) µ(dx) ou encore f (x) dx. X R R Au vu de la notation utilisée ci-dessus à droite, on peut s’interroger sur l’utilité de construire une nouvelle intégrale. D’autant plus que, comme nous le verrons, toute fonction numérique réelle, intégrable au sens de Riemann sur un intervalle [a, b] de R, est en particulier intégrable au sens de Lebesgue et les deux intégrales coı̈ncident. Avant de décrire le contenu de ce cours, prenons le temps de discuter les raisons nous poussant à construire une nouvelle intégrale. Pour cela, rappelons succinctement la construction de l’intégrale de Riemann. Soit f : [a, b] → R une fonction bornée que l’on supposera positive pour simplifier. On considère une subdivision de l’intervalle [a, b], notée σ, a = t0 < t1 < · · · < tn−1 < tn = b. Les sommes de Darboux inférieure et supérieure relativement à la subdivision σ sont définies respectivement par n−1 X n−1 X s(f, σ) = (ti+1 − ti ) inf f (x) et S(f, σ) = (ti+1 − ti ) sup f (x). x∈[ti ,ti+1 ] x∈[ti ,ti+1 ] i=0 i=0 En notant S l’ensemble des subdivisions de l’intervalle [a, b], une fonction f : [a, b] → R est dite intégrable au sens de Riemann si inf{S(f, σ) : σ ∈ S} ≤ sup{s(f, σ) : σ ∈ S}. Rb La valeur commune de cet infimum et ce supremum est alors notée a f (x) dx. Cette construction a l’avantage de la simplicité, quelques lignes suffisent à définir l’intégrale de Rie- mann. Cette simplicité est aussi son principal défaut : l’ensemble des fonctions intégrables au sens de Riemann est trop restreint. La raison en est que l’intégrabilité au sens de Riemann impose une cer- taine régularité sur la fonction f , celle-ci ne doit pas trop osciller au risque que les sommes de Darboux inférieure et supérieure ne puissent coı̈ncider à la limite. C’est le cas par exemple pour f = 1[0,1]∩Q. Nous verrons que cette dernière fonction est intégrable au sens de Lesbesgue et d’intégrale nulle. D’une manière plus générale, pratiquement toute fonction positive peut être intégrée (dans un sens large, c’est à dire l’intégrale peut être infinie) au sens de Lebesgue ; de telles fonctions sont dites mesurables positives ; en fait, il y a bien un exemple de fonction de non mesurable mais sa construction utilise l’axiome du choix. Cependant, s’il n’était seulement question que d’intégrer plus de fonctions, ce serait un peu court. Le réel défaut de la notion d’intégrale au sens de Riemann est qu’elle n’est pas préservée par passage à la limite : on peut exhiber une suite (fn )n≥0 croissante de fonctions Riemann intégrables qui converge vii simplement vers une fonction non intégrable au sens de Riemann 1. Dans le contexte de l’intégrale de Lebesgue, la positivité des fonctions fn suffira à donner un sens à l’intégrale de la limite. Une condition tout aussi simple pour des fonctions non partout positives existe bien entendu. Dans le contexte Riemann, la bonne hypothèse est en général la continuité et la convergence uniforme ; celle-ci est beaucoup trop technique et surcharge souvent inutilement les preuves. Ses bonnes propriétés de convergence sont sans doute à mettre à l’actif de ce que l’intégrale de Lesbesgue est définie comme une borne supérieure ; en ce sens, on approche l’intégrale de Lebesgue par valeurs inférieures, contrairement à l’intégrale de Riemann qui est définie via la convergence de deux suites adjacentes. Notons en outre que lors de la démonstration du théorème de convergence monotone, nous introduisons la fonction v = u1u≤f. Lorsque u est une fonction étagée (la fonction u admet un nombre fini de valeurs distinctes) alors v sera également une fonction étagée. Au contraire, si u est une fonction en escalier, c’est à dire une combinaison linéaire d’indicatrice d’ouverts, et que f est raisonnablement pathologique il est à peu près sûr que v n’héritera pas de cette propriété. L’intégrale de Lebesgue est aussi plus maniable pour traiter le cas de fonctions présentant des sin- gularités ou lorsque l’intervalle [a, b] considéré n’est plus borné. Considérons l’exemple de la fonction f (x) = √1x que l’on souhaite intégrer sur [0, 1]. Dans le contexte de l’intégrale de Riemann, on définit Z 1 Z 1 dx dx √ = lim √ , 0 x ε→0 ε x dès que la limite à droite existe. Dans ce cas précis, le théorème fondamental de l’analyse montre que cette limite existe effectivement. Dans le contexte de l’intégrale de Lebesgue, la positivité et la régularité R1 √ de f 2 sur ]0, 1] suffit à donner un sens à 0 dx/ x ∈ [0, ∞) ∪ {∞} 3. Le principe consiste à approcher f par en-dessous par des fonctions étagées positives et passer à la limite. En approchant f par en-dessous, la singularité en 0 n’est plus véritablement un problème. La théorie de Lebesgue date du début du siècle dernier, l’axiomatique de Kolmogorov formalisant la théorie des probabilités dates des années trente (évidemment, nous avons pas attendu ce formalisme pour faire du calcul de probabilités). Cette formalisation a le très grand avantage de rendre transparente la distinction artificielle entre les probabilités discrètes et diffuses (ou continues). Ceci a coût, celui de l’appréhension de ce morceau conceptuel que l’on appelle théorie de la mesure. Outre cette unification, ce formalisme est rendu nécessaire lorsque les modèles probabilistes deviennent plus complexes : comment faire du calcul de probabilités proprement sur des espaces tels que {0, 1}N ou encore sur l’espace de fonctions C 0 ([0, 1], R) ? La théorie de la mesure met ainsi à disposition des concepts clairs pour définir et manipuler proprement des objets aléatoires comme le mouvement brownien — Figure 1a — qui est à la base de beaucoup de modèle de dynamiques réelles perturbées et/ou bruitées — Figures 1b, 1c et 1d. Si nous devions citer un inconvénient de l’intégrale de Lebesgue, ce serait l’absence en tant que tel d’un théorème fondamental de l’analyse. En réalité, c’est un faux problème puisque nous verrons que toute fonction Riemann intégrable est Lebesgue intégrable et les intégrales coı̈ncident. Cela donne un moyen simple de calculer explicitement, dans certains cas, l’intégrale de Lebesgue d’une fonction réelle. Dans les cas concrets, l’ensemble X est naturellement muni d’une topologie permettant de définir les notions de parties ouvertes, fermées, compactes ou encore les notions de convergences. La plupart du temps, la topologie et la mesure sont définies de manière consistante si bien que des propriétés liées aux mesures et des propriétés de nature topologique se trouvent mêlées. Nous insisterons ici essentiellement sur le cas un peu plus restrictif mais souvent largement suffisant des espaces métriques. Néanmoins, afin de bien distinguer les notions intrinsèquement topologiques de celles propres aux espaces métriques, nous définirons la notion d’espace topologique et démontrerons autant que possible les résultats dans le contexte général des espaces topologiques. Ces notions sont introduites dans le chapitre 1 donnant quelques rappels et des compléments d’analyse. On rappelle en particulier la notion d’espace vectoriel normé. Les espaces vectoriels normés sont en particulier des espaces métriques. On termine ce chapitre par considérer la propriété de compacité ainsi que la notion d’espace complet. 1. Soit en effet (qn )n≥0 une énumération de [0, 1] ∩ Q et posons, pour tout n ≥ 0, fn = n P k=0 1{qn }. La suite (fn )n≥0 est bien monotone croissante et pour chaque n ≥ 0 est intégrable au sens de Riemann d’intégrale nulle. Enfin, la suite (fn )n≥0 converge simplement vers 1[0,1]∩Q. 2. La fonction f est continue, mais le raisonnement est valide plus généralement pour des fonctions qui seront dites mesurables. La fonction 1Q∩[0,1] est un exemple de telle fonction. 3. Dans la suite, l’intervalle semi-ouvert [a, b[ sera toujours noté à la mode anglo-saxonne [a, b). viii 1.0 10 8 0.5 6 0.0 W X 4 −0.5 2 0 −1.0 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 5 Time Time (a) Processus de Wiener. (b) Processus d’Orstein-Uhlenbeck. 25000 20000 20000 Indice Dow Jones X 15000 15000 10000 10000 0 2 4 6 8 10 2010 2012 2014 2016 2018 2020 Time Date (c) Modèle de Black-Scholes. (d) Indice du Dow Jones : août 2009 à août 2019. Figure 1 – (a) Cinq réalisations du mouvement brownien W = (Wt )t≥0 aussi appelé processus de Wiener. La variable aléatoire W est à valeurs dans l’espace des fonctions continue muni de la topologie de la convergence uniforme sur les compacts. Le processus de Wiener est la loi limite naturelle du théorème central limite fonctionnelle, il a un rôle similaire à la loi normale dans le cas réel. (b) Processus d’Orstein- Uhlenbeck : (Xt )t≥0 satisfait l’Équation Différentielle Stochastique dXt = −θ(Xt − µ)dt + σdWt (θ = 2, µ = 3, σ = 3). Le paramètre θ définit l’intensité de la force de rappel vers µ. En bleu, la version sans bruit (σ = 0). (c) Modèle de Black-Scholes : l’EDS définissant cette dynamique est dXt = τ Xt dt + σXt dWt (τ = 0.1, σ = 0.07). Le paramètre τ modélise le taux d’intérêt. En bleu, la version non bruitée, i.e. σ = 0. (d) Indice du Dow Jones sur la période août 2009 à août 2019. Le chapitre 2 est consacrée à la théorie de la mesure abstraite. Les axiomes ensemblistes de cette théorie sont pour l’essentielle la traduction de propriétés intuitives du calcul d’aire ou de volume. L’un des axiomes de la théorie de la mesure traduit cette assertion bien connue énonçant que le tout est la somme de ses parties. En substance, cela signifie que pour calculer l’aire de la réunion de deux parties disjointes il suffit de sommer les aires de chacune des deux parties. La théorie de la mesure tire toute sa puissance de ses théorèmes limites. Ces derniers sont en réalité conséquence directe la propriété de σ-additivité qui n’est autre que l’extension du dicton ci-dessus à des réunions dénombrables d’ensembles disjoints. On pourra se questionner sur cette restriction aux réunions dénombrables qui paraı̂t de prime abord arbitraire. Il s’agit en fait d’un compromis : cette restriction est suffisante car elle permet de déduire les théorèmes limites usuels et elle est nécessaire pour des questions de consistance de la théorie. Pour ce dernier point, sans cet artifice, il arrive que le tout ne soit pas la somme de ses parties. À ce stade, nous avons donc à disposition une collection de parties mesurables et une mesure qui permet de les mesurer. Ces deux ingrédients permettent de construire de façon abstraite une intégrale. Il est important de préciser que cette construction ne donne pas de moyen pratique de calculer l’intégrale d’une fonction arbitraire ; celle-ci est définie comme une limite qui peut être ardue à calculer explicite- ment. Par contre cette construction est complètement agnostique quant à la nature discrète ou diffuse de la mesure considérée ce qui permet une théorie unifiée de l’intégrale. On termine ce chapitre par préciser ix le sens que l’on donne à cette intégrale lorsque la mesure sous-jacente est discrète ou diffuse. Dans le premier cas, il s’agit simplement d’une somme (une série) et dans le second, on peut considérer très grossièrement qu’il s’agit de la l’intégrale au sens usuel. En particulier, les résultats d’interversion de limites, d’intégration par parties etc sont valables à la fois dans le cas diffus et dans le cas discret. Il est du reste assez remarquable que la méthode d’intégration par partie soit très souvent bien connue dans le cas des fonctions numériques réelles mais que sa contre-partie pour les suites, appelée transformée d’Abel, soit si souvent ignorée. Le lien entre ces deux outils sera clairement établi en exercice. Le chapitre 4 est certainement le plus important en pratique puisqu’il établit les théorèmes d’in- terversion limite/intégrale les plus importants : théorème de convergence monotone ou théorème de Beppo-Lévy 4.1.1, lemme de Fatou 4.1.2 et théorème de convergence dominée de Lebesgue 4.3.1. Le premier d’entre eux est une conséquence directe de l’hypothèse de σ-additivité dans la définition d’une mesure. Ce théorème constitue le socle de nombreux théorème d’intégration dont le lemme de Fatou et le théorème de convergence dominée. Le chapitre 5 permet de munir d’une mesure un espace mesurable produit. Cette mesure est à la racine de la notion d’intégrale multiple. De cette construction, qui n’a rien de complètement triviale, on déduit le théorème de Fubini qui permet d’écrire l’intégrale contre la mesure produit comme une intégrale itérée contre des mesures unidimensionnelles. On termine ce chapitre par quelques calculs pratiques d’intégrales multiples et l’énoncé du théorème de changement de variables multidimensionnels. Cette notion de mesure produit est à la racine de la notion d’indépendance en probabilité et sera donc retrouvée au chapitre 8. Le dernier chapitre de cette partie (chapitre 6) est une introduction à l’analyse fonctionnelle. Outre les inégalités usuelles, on s’intéressera au caractère complet des espaces Lp. On énoncera également le théorème de Radon-Nikodym particulièrement important pour le formalisme des modèles paramétriques en statistique. Ce théorème permet également de prouver l’existence de l’espérance conditionnelle qui est la généralisation de la notion de probabilité conditionnelle aux variables aléatoires diffuses : elle donne un sens au conditionnement par rapport à un événement de probabilité nulle (voir le chapitre 13). On étudiera enfin les propriétés d’approximation dans les espaces Lp. À cette occasion on introduira la notion de convolution et d’approximation de l’identité. Ce dernier chapitre utilisera intensivement les propriétés vues au chapitre 1. Le premier objectif de cette deuxième partie du cours est de démontrer deux théorèmes essentiels de la théorie des Probabilités : la loi des grands nombres (Figure 2a) et le théorème central limite (Figure 2b). Ces deux théorèmes justifie a posteriori l’axiomatique introduite par Kolmogorov. 1.0 8 6 0.8 Fréquence Sn/n 4 0.6 2 0.4 0 0 20 40 60 80 100 0.4 0.5 0.6 0.7 n Sn/n (a) Loi des grands nombres (LGN). (b) Théorème central limite (TCL). Figure 2 – (a) Loi des grands nombres : trajectoire de la moyenne Sn /n, n = 1,... , 100, où Sn est le nombre de face d’une pièce équilibrée. La moyenne théorique est matérialisée en bleu. (b) Théorème (1) (N ) central limite : la distribution empirique de (S100 /100,... , S100 /100), N = 104 , se rapproche d’une distribution normale. En bleu est représentée la densité de la loi normale N (µ, σ 2 ), µ = 12 , σ 2 = 4 · 10−3 , 2 2 e−(x−µ) /2σ x→ √ σ 2π. Une notion centrale en théorie des probabilités est celle de variables aléatoires. Une variable aléatoire n’est rien d’autre qu’une application mesurable. Une problématique récurrente en probabilité consiste à caractériser la loi d’une variable aléatoire. Partant d’un espace probabilisé (Ω, F, P), la loi PX d’une x variable aléatoire X : (Ω, F, P) → (E, E) est la mesure de probabilité image de P par X. Le chapitre 7 est dédié à la caractérisation par différentes méthodes de la loi d’une variable aléatoire en particulier lorsque celle-ci est à valeur dans R ou Rd. Il sera fait usage d’un grand nombre de notions vues dans la première partie de ce cours. Notons enfin que la notion de variable aléatoire est identique à celle d’observable en physique (clas- sique). Lors d’une expérience aléatoire (ou de physique classique) l’expérimentateur n’a en général pas accès au triplet probabiliste mais plutôt à une observation. Le triplet (Ω, F, P) est purement théorique et doit être considéré comme une “boı̂te noire” : ce que l’expérimentateur observe réellement est la valeur de la variable aléatoire X définie sur (Ω, F, P). En ce sens, le triplet probabiliste n’est pas un objet canonique, plusieurs choix sont possibles : il est facile, par exemple, de construire deux triplets distincts et une variable aléatoire sur chacun des triplets décrivant la même expérience aléatoire du pile ou face. Le chapitre 8 introduit la notion d’indépendance. Cette notion là-encore est purement théorique en ce sens qu’elle est difficile à exhiber dans la nature. Quoiqu’il en soit, c’est une hypothèse suffisante à la LGN et au TCL du chapitre 12. Néanmoins, d’autres hypothèses plus faibles peuvent être faites pour l’établissement de ces théorèmes comme par exemple dans [Kin73]. Le chapitre 9 introduit la notion de fonction caractéristique. Il s’agit ni plus ni moins de la notion de transformée de Fourier en analyse fonctionnelle appliquée à la théorie des probabilités. La démonstration du TCL au chapitre 12 utilise pleinement les fonctions caractéristiques. Elles permettent également de simplifier les calculs ainsi que l’établissement de résultats théoriques telles des convergences en loi. Au-delà de son usage en probabilités, l’analyse de Fourier ainsi que l’analyse en ondelettes, que l’on regroupe sous la terminologie analyse du signal, trouvent de nombreuses applications en ingénierie telles le débruitage d’un son, d’une image, la compression, l’analyse statistique de processus stochastiques. Le chapitre 10 traite de vecteurs aléatoires, appelés vecteurs gaussiens, aux propriétés remarquables. Ceux-ci apparaissent naturellement en de nombreuses occasions et tout particulièrement dans le TCL multivarié énoncé au chapitre 12. Le chapitre 11 introduit les notions de convergences trajectorielles de variables aléatoires ainsi que celles de convergences des mesures et lois de probabilité. La première intervient dans la LGN alors que la seconde apparaı̂t dans le TCL. De manière plus générique, la convergence trajectorielle permet d’établir la convergence d’estimateurs statistiques et la convergence en loi permet d’établir les intervalles de confiances correspondants. En outre, le TCL est parfois interprété comme une vitesse de convergence dans la loi des grands nombres. Enfin, le dernier chapitre introduit l’espérance conditionnelle. Ce chapitre est quelque peu à l’écart des autres. C’est également un outils primordiale en théorie des probabilités et théorie des processus. Cela permet notamment d’étudier des processus non i.i.d.. xi xii Première partie Topologie et théorie de la mesure 1 Chapitre 1 Rappels et compléments d’analyse Sauf mention contraire, dans la suite, K représente le corps des nombres réels R ou le corps des nombres complexes C. On notera indifféremment | · | la valeur absolue ou le module selon que K = R ou K = C. 1.1 Espaces vectoriels normés Définition 1.1.1 (Norme). Soit E un K-espace vectoriel. Une norme sur E est une application ∥ · ∥ : E → R+ satisfaisant 1. ∥x∥ = 0 si et seulement si x = 0 ; 2. pour tout λ ∈ K et tout x ∈ E, ∥λx∥ = |λ|∥x∥ ; 3. pour tout x, y ∈ E, ∥x + y∥ ≤ ∥x∥ + ∥y∥. Un espace vectoriel normé est la donnée d’un couple (E, ∥ · ∥) où E est un K-espace vectoriel et ∥ · ∥ une norme sur E. Exemple 1. 1. K muni de | · | sont des espaces vectoriels normés. 2. Pour p ≥ 1, on note ∥ · ∥p l’application définie pour tout x = (x1 ,... , xn ) ∈ Kn n !1/p X p ∥x∥p = |xi |. i=1 Et si p = ∞, ∥x∥∞ = max |xi |. 1≤i≤n n Alors l’espace K muni de ∥ · ∥p est un espace vectoriel normé. 3. Plus généralement, si S est un ensemble dénombrable, sur KS , on définit les normes !1/p X p ∥x∥p = |xs | et ∥x∥∞ = sup |xs |. s∈S s∈S Alors l’ensemble ℓpK = {x ∈ KS : ∥x∥p < ∞}, p ∈ [1, ∞], muni de la norme ∥ · ∥p est un espace vectoriel normé. 4. Soit (E, ∥ · ∥E ) et (F, ∥ · ∥F ) deux espaces vectoriels normés et A : E → F un opérateur linéaire. On définit ∥ · ∥E→F par ∥Ax∥F ∥A∥E→F = sup. x∈E\{0} ∥x∥E On note L(E, F ) = {A : E → F, A linéaire , ∥A∥E→F < ∞} l’espace vectoriel des opérateurs linéaires continus de E dans F. On montre que ∥ · ∥E→F est une norme sur L(E, F ) appelée norme subordonnée. 3 Exercice 1. Montrer que les exemples données ci-dessus définissent bien des normes. Exercice 2. Soit (G, ∥ · ∥G ) est un troisième espace vectoriel normé. Montrer, pour tout A ∈ L(E, F ) et B ∈ L(F, G), l’inégalité ∥BA∥E→G ≤ ∥B∥F →G ∥A∥E→F. 1.2 Espaces métriques 1.2.1 Métrique, boule ouverte, boule fermée, parties bornées Définition 1.2.1. Soit E un ensemble. Une distance (ou métrique) d sur E est une application d : E × E → R+ telle que : 1. d(x, y) = 0 si et seulement si x = y ; 2. pour tout x, y ∈ E, d(x, y) = d(y, x) (symétrie) ; 3. pour tout x, y, z ∈ E, d(x, y) ≤ d(x, z) + d(z, y) (inégalité triangulaire). Un espace métrique est la donnée d’un couple (E, d) où E est un ensemble et d une distance sur E. Proposition 1.2.2 (Deuxième inégalité triangulaire). Soit (E, d) un espace métrique, alors pour tout x, y, z ∈ E |d(x, z) − d(y, z)| ≤ d(x, y). Démonstration. Nous avons par l’inégalité triangulaire et la propriété de symétrie d(x, z) ≤ d(x, y) + d(y, z) et d(y, z) ≤ d(y, x) + d(x, z) = d(x, y) + d(x, z). De ces deux inégalités, on déduit −d(x, y) ≤ d(x, z) − d(y, z) ≤ d(x, y) =⇒ |d(x, z) − d(y, z)| ≤ d(x, y). Exemple 2. 1. Si (E, ∥ · ∥) est un espace vectoriel normé alors (E, d) avec d(x, y) = ∥x − y∥, x, y ∈ E, est un espace métrique. 2. R muni de la métrique d(x, y) = | arctan x − arctan y |, x, y ∈ E, est espace métrique. 3. R2 muni de la métrique ∥x − y∥2 si 0, x et y sont alignés, δ(x, y) = ∥x∥2 + ∥y∥2 sinon. 4. Un ensemble E muni de la métrique discrète 1 si x ̸= y, d(x, y) = 0 sinon. 5. Soit G = (V, E) un graphe fini simple non dirigé, i.e. V est un ensemble fini de nœuds et E est un ensemble de paires {x, y} ⊂ V × V appelées arêtes. Un chemin est une suite finie (x1 , x2 ,... , xn ) de nœuds satisfaisant, pour tout i = 1,... , n − 1, {xi , xi+1 } ∈ E. L’entier n est la longueur du chemin. On note Πx,y l’ensemble des chemins de longueur finie de x à y, i.e. x1 = x et xn = y avec les notations précédentes Si p ∈ Πx,y , on note |p| la longueur de p. On définit pour tout x, y ∈ V d(x, y) = inf{|p| : p ∈ Πx,y }. Alors, (V, d) est un espace métrique. Un chemin p ∈ Πx,y tel que |p| = d(x, y) est appelé géodésique. Le graphe G est dit complet si pour tout x, y ∈ V , {x, y} ∈ E. Dans ce cas, la métrique définie ci-dessus est la métrique discrète sur V. 4 Exercice 3. Vérifier que les exemples ci-dessus sont des espaces métriques. Exercice 4. Montrer l’inégalité de Hölder et de Minkowski : soit p ∈ [1, ∞), soit ai , bi , i = 1,... , n, des nombres réels ou complexes Pn Pn 1/p Pn 1/q 1. Hölder : | i=1 ai bi | ≤ ( i=1 |ai |p ) ( i=1 |bi |q ) avec p1 + 1q = 1 ; Pn 1/p Pn 1/p Pn 1/p 2. Minkowski : ( i=1 |ai + bi |p ) ≤ ( i=1 |ai |p ) + ( i=1 |bi |p ). Soit (E, d) un espace métrique. La boule ouverte de centre a ∈ E et de rayon r > 0, notée B(a, r) est définie par B(a, r) = {x ∈ E : d(a, x) < r}. La boule fermée sera notée B(a, r) et est définie par B(a, r) = {x ∈ E : d(a, x) ≤ r}. Si A, B ⊂ E sont deux parties, la distance entre ces deux parties est donnée par d(A, B) = inf{d(x, y) : x ∈ A, y ∈ B}. On utilise en général la convention inf ∅ = ∞ si bien que cette distance vaut l’infini si et seulement si l’une des deux parties est vide. Proposition 1.2.3. Soit A ⊂ E une partie non vide. Alors pour tout x, y ∈ E, |d(x, A) − d(y, A)| ≤ d(x, y). Démonstration. C’est immédiat à partir de la proposition 1.2.2. Le diamètre d’une partie A de E est défini par Diam A = sup{d(x, y) : x, y ∈ A}. Par convention, le diamètre d’une partie vide est égale à −∞. Cette convention est cependant moins utile en pratique. Une partie A ⊂ E est dite bornée si Diam A < ∞. En particulier, l’ensemble vide est borné. 1.2.2 Topologie des espaces métriques Définition 1.2.4 (Topologie). Soit X un ensemble. Une topologie sur X est une famille de parties de X, notée T , satisfaisant 1. ∅ ∈ T et X ∈ T ; 2. pour toute famille (Oi ∈ T )i∈I , la réunion ∪i∈I Oi ∈ T ; 3. pour toute famille finie O1 ,... , On ∈ T , l’intersection ∩ni=1 Oi ∈ T. Les éléments de T sont appelés les ouverts. Exemple 3. Soit X un ensemble. Les familles T1 = {∅, X} et T2 = P(X) (ensemble des parties de X) sont des topologies sur X appelée respectivement la topologie grossière et la topologie discrète. Définition 1.2.5 (Ouvert). Soit (E, d) un espace métrique. Une partie A ⊂ E est ouverte si pour tout x ∈ A, il existe r > 0 tel que B(x, r) ⊂ A. Remarque 1. L’ensemble vide est ouvert ! Proposition 1.2.6. La boule ouverte est ouverte. Démonstration. Soient x ∈ E, r > 0 et y ∈ B(x, r). On pose r0 = d(x, y) < r et ρ = r − r0 > 0, alors B(y, ρ) ⊂ B(x, r). En effet, si z ∈ B(y, ρ) alors d(x, z) ≤ d(x, y) + d(y, z) < r0 + (r − r0 ) = r et z ∈ B(x, r). Proposition 1.2.7. Soit (E, d) un espace métrique. Une partie A ⊂ E est ouverte si et seulement si elle est réunion de boule ouverte. Démonstration. Une réunion arbitraire d’ouverts étant ouverte et la boule ouverte étant ouverte, la condition est évidemment suffisante. Réciproquement, pour tout x ∈ A, il existe rx > 0 tel que B(x, rx ) ⊂ A. Alors, il est immédiat que A = ∪x∈A B(x, rx ). 5 Proposition 1.2.8. Soit (E, d) un espace métrique. La famille T = {O ⊂ E, O ouvert } définie une topologie sur E. Démonstration. On vérifie facilement que ∅, E ∈ T. Soit x ∈ ∪i∈I Oi , alors il existe i ∈ I tel que x ∈ Oi. Puisque que Oi est ouvert, il existe r > 0 tel que B(x, r) ⊂ Oi ⊂ ∪i∈I Oi , d’où le résultat. Soit x ∈ ∩i=1,...,n Oi , alors x ∈ Oi pour tout i = 1,... , n. Pour chaque i = 1,... , n, il existe ri > 0 tel que B(x, ri ) ⊂ Oi. Posons r = min ri , alors B(x, r) ⊂ B(x, ri ) pour tout i = 1,... , n et donc B(x, r) ⊂ ∩i=1,...,n Oi. Exercice 5. Soit E un ensemble. Montrer que la topologie associée à la métrique discrète est discrète. Remarque 2. Il existe des topologies non métrisables qui peuvent être néanmoins intéressantes. Le contexte des espaces métriques est cependant très souvent suffisant mais les énoncés s’écrivent par- fois plus facilement dans le langage de la topologie. Dans la suite, on jonglera avec les deux notions selon les cas. Définition 1.2.9 (Voisinage ouvert, voisinage). Soient (X, T ) un espace topologie et A ⊂ X non vide. 1. Un voisinage ouvert de A est un ouvert contenant A ; 2. Un voisinage de A est un ensemble contenant un voisinage ouvert de A. Si A = {x} on parle de voisinage ouvert (resp. de voisinage) de x. On notera V(x) l’ensemble des voisinages de x. Proposition 1.2.10. Soit (X, T ) un espace topologique. Un ensemble V ⊂ X est ouvert si et seulement si V est voisinage de chacun de ses points. Démonstration. La condition est évidemment suffisante. Réciproquement, pour tout x ∈ V , il existe Ux ouvert tel que x ∈ Ux ⊂ V. Ainsi, V = ∪x∈V Ux ce qui montre que V est ouvert. Proposition 1.2.11. Soient (E, d) un espace métrique et x ∈ E. Un ensemble V est un voisinage de x si et seulement si il existe n ∈ N∗ tel que B(x, 1/n) ⊂ V. Démonstration. Par définition, il existe un ouvert V ′ tel que x ∈ V ′ ⊂ V. Puisque V ′ est ouvert, il existe r > 0 tel que B(x, r) ⊂ V ′ , donc pour tout n ∈ N∗ tel que 1/n < r, on a B(x, 1/n) ⊂ V ′ ⊂ V. La réciproque est immédiate puisque x ∈ B(x, 1/n) ⊂ V. Définition 1.2.12 (Base de voisinage). Soient (X, T ) un espace topologique et x ∈ X. Une collection B est appelée base de voisinage de x si pour tout V ∈ V(x), il existe U ∈ B tel que x ∈ U ⊂ V. La proposition 1.2.11 exprime que, dans le contexte des espaces métriques, {B(x, 1/n), n ≥ 1} est une base de voisinage de x. En particulier, un espace métrique est à base de voisinages dénombrable : chacun de ses points admet une base de voisinages dénombrable. C’est une des propriétés importantes que n’ont pas les topologies en générale. Une notion duale est celle de base d’ouverts. Définition 1.2.13 (Base d’ouverts). Une famille d’ouverts O est une base d’ouverts pour la topologie T si tout O ∈ T est réunion d’éléments de O. Exemple 4. Soit (E, d) un espace métrique, alors tout ouvert O ⊂ E s’écrit comme réunion de boules ouvertes : [ O= B(x, r) où S = {(x, r) ∈ E × R+ ∗ : B(x, r) ⊂ O}. (x,t)∈S L’ensemble des boules ouvertes de E est donc une base d’ouverts de E. Définition 1.2.14 (Intérieur). Soit A ⊂ E, l’intérieur de A est le plus grand ouvert contenu dans A noté Int A. Définition 1.2.15. L’extérieur de A ⊂ E est l’intérieur de A∁. Une notion duale est celle de fermé. Définition 1.2.16 (Fermé). Une partie F ⊂ E est fermée si F ∁ est ouverte. Proposition 1.2.17. Soit (X, T ) un espace topologique. Alors, 6 1. ∅, E sont fermés ; 2. Si (Fi )i∈I est famille infinie de fermés, alors ∩i∈I Fi est fermée. 3. Si F1 ,... , Fn sont des fermés, alors ∪ni=1 Fi est fermé. Démonstration. Immédiat. Définition 1.2.18. L’adhérence d’une partie A ⊂ E est le plus petit fermé contenant A, noté A. Remarque 3. Dans le cas d’un espace vectoriel normé sur K, l’adhérence de la boule ouverte est la boule fermée. Dans le cas des espaces métriques, il se peut que l’adhérence de la boule ouverte ne soit pas la boule fermée. Pour voir cela, il suffit de considérer l’ensemble E = {0, 1} muni de la métrique discrète. Dans ce cas, la boule ouverte B(0, 1) = {0} et le plus petit fermé contenant la boule ouverte est {0}. En revanche la boule fermée B(0, 1) = {0, 1}. Proposition 1.2.19. Soient (X, T ) un espace topologique et A ⊂ X une partie de X. Alors A = {x ∈ X, ∀V ∈ V(x), V ∩ A ̸= ∅} = (Ext A)∁. Démonstration. L’égalité suivante est immédiate : ∁ [ \ (Ext A)∁ = O = O∁. A∁ ⊃O∈T A⊂O ∁ ∈T En effet, il est facile de voir que la réunion sur des ouverts contenus dans A∁ n’est autre que l’intérieur de A∁ (c’est un ouvert contenu dans A∁ et tous les ouverts contenu dans A∁ sont inclus dans la réunion), soit l’extérieur de A. De même, l’intersection à droite est un fermé contenant A et tous les fermés contenant A contiennent cette intersection, c’est l’adhérence de A. Ceci montre A = (Ext A)∁. Montrons la seconde égalité qui peut se réécrire : {x ∈ X, ∀V ∈ V(x), V ∩ A ̸= ∅}∁ = Ext A. Comme Ext A est ouvert, il est voisinage de chacun de ses points y ∈ Ext A, or Ext A ∩ A = ∅ puisque Ext A ⊂ A∁ et A ∩ A∁ = ∅. On a donc trouver un voisinage de y ∈ Ext A qui n’intersecte pas A si bien que Ext A ⊂ {x ∈ X, ∀V ∈ V(x), V ∩ A ̸= ∅}∁. (1.1) Inversement, si x ∈ X est tel qu’il existe V ∈ V(x) tel que V ∩ A = ∅ alors il existe un ouvert U tel que x ∈ U ⊂ V et U ∩ A = ∅ d’où U ⊂ A∁ si bien que U ⊂ Ext A. Ceci montre l’inclusion inverse de (1.1). Proposition 1.2.20. Soient (X, T ) un espace topologique et A, B ⊂ X. Alors 1. A ⊂ A, 2. A = A, 3. A ∪ B = A ∪ B, 4. A ∩ B ⊂ A ∩ B. Exercice 6. Montrer qu’en général l’inclusion du quatrième point est stricte. Démonstration. Le premier point découle directement de la définition puisque A est un fermé contenant A. Pour le deuxième point, il suffit de remarquer qu’un ensemble est fermé si et seulement si il est égale à son adhérence. Montrons le point (3). On remarque que A∪B ⊂ A∪B par le point (1). Puisque A∪B est fermé comme la réunion de deux fermés, c’est donc un fermé qui contient A ∪ B, ainsi A ∪ B ⊂ A ∪ B. Réciproquement, nous avons A ⊂ A ∪ B ⊂ A ∪ B, donc A ∪ B est un fermé qui contient A. Il contient B également. Ainsi A et B sont tout deux contenus dans A ∪ B, leur réunion l’est donc aussi : A ∪ B ⊂ A ∪ B. Pour le point (4), nous avons A ∩ B ⊂ A ⊂ A qui est fermé. De même, A ∩ B ⊂ B ⊂ B. Comme A ∩ B est fermé, il vient que A ∩ B ⊂ A ∩ B. 7 Proposition 1.2.21. Soient (X, T ) un espace topologique et A, B ⊂ X. Alors 1. Int A ⊂ A, 2. Int Int A = Int A, 3. Int (A ∩ B) = Int A ∩ Int B, 4. Int A ∪ Int B ⊂ Int (A ∪ B). Exercice 7. Montrer que la dernière inclusion est stricte en général. Démonstration. Le premier point découle directement de la définition. Pour le deuxième point, il suffit de remarquer qu’une partie est ouverte si et seulement si elle est égale à son intérieur. Montrons (3). Puisque Int A ⊂ A et Int B ⊂ B, il vient que l’ouvert Int A ∩ Int B est contenu dans A ∩ B. Ainsi, Int A ∩ Int B ⊂ Int (A ∩ B) par définition de l’intérieur Réciproquement, Int (A ∩ B) ⊂ A ∩ B ⊂ A mais il est aussi contenu dans B. Puisque Int (A ∩ B) est ouvert, il est contenu dans Int A et dans Int B, il est donc contenu dans Int A ∩ Int B. Pour le point (4) on remarque que Int A ⊂ A ⊂ A ∪ B et Int B ⊂ B ⊂ A ∪ B. Ainsi l’ouvert Int A ∪ Int B est contenu dans A ∪ B donc dans Int (A ∪ B). Proposition 1.2.22. Soient (X, T ) un espace topologique et A ⊂ X. Alors 1. X \ Int A = X \ A, 2. X \ A = Int (X \ A). Démonstration. Pour le point (1), il suffit de remarquer que si un ouvert O est contenu dans A, alors O∁ est un fermé qui contient A∁. Le complémentaire du plus grand ouvert contenu dans A correspond au plus petit fermé contenant A∁. Le point (2) est immédiat par passage au complémentaire dans (i) appliqué à B = X \ A. Définition 1.2.23. La frontière d’une partie A ⊂ E, notée Fr A, est définie par Fr A = A ∩ A∁. Proposition 1.2.24. Soit (X, T ) un espace topologique. Alors pour toute partie A ⊂ X, le triplet (Int A, Fr A, Ext A) forme une partition de X. Démonstration. Du fait de la définition de la frontière et de la proposition 1.2.22, on a Fr A = A ∩ X \ A = A ∩ (X \ Int A) = A \ Int A. Clairement X = Int A ∪ A \ Int A ∪ X \ A est une réunion disjointe dont le deuxième ensemble est Fr A et le troisième ensemble n’est autre que Ext A puisque X \ A = Int (X \ A) par la proposition 1.2.22. Définition 1.2.25 (Partie dense). Soit (X, T ) un espace topologique. Une partie D ⊂ X est dite dense si D = X. Proposition 1.2.26. Une partie D est dense dans un espace topologique (X, T ) si et seulement si pour tout x ∈ X et tout voisinage V de x, V ∩ D ̸= ∅. Démonstration. C’est une conséquence de la définition et de la proposition 1.2.19. Remarque 4. Notons qu’on peut se restreindre aux voisinages ouverts. Théorème 1.2.27 (Sous-groupe de (R, +)). Soit G un sous-groupe de (R, +). Alors G = aZ pour un certain réel a, ou G est dense dans R. Démonstration. Soit G un sous-groupe de (R, +). Évacuons d’entrée le cas où G est le groupe trivial {0}. Alors il existe g ∈ G \ {0} et ou bien g > 0 ou bien g < 0. Dans ce second cas, puisque G est un groupe, −g ∈ G et −g > 0. Aussi, G ∩ R∗+ est une partie non vide. Elle est également minorée et on note a = inf G ∩ R∗+ qui est positif car 0 est un minorant. Supposons d’abord a > 0 et montrons que a ∈ G. Supposons au contraire que a ∈ / G. Nous avons 2a > a si bien que 2a n’est pas un minorant de G ∩ R∗+. Il existe donc b ∈ G tel que a < b < 2a. Mais b n’est pas plus un minorant de G ∩ R∗+ et il existe donc de même c ∈ G tel que a < c < b < 2a. Ainsi, b − c ∈ G ∩ R∗+ et b − c < a. C’est une contradiction au fait a est la borne inférieure de G ∩ R∗+. Par conséquent, a ∈ G et donc aZ ⊂ G. Il reste à montrer l’inclusion opposée. 8 Soit g ∈ G et posons n = ⌊g/a⌋ la partie entière de g/a. Par définition n ≤ g/a < n + 1 ou encore na ≤ g < a(n + 1). Alors, 0 ≤ g − na < a. Puisque a ∈ G, na ∈ G et donc g − na ∈ G. Supposons g ̸= na, alors 0 < g − na < a et donc g − na ∈ G ∩ R∗+ et g − na < a. C’est la même contradiction que précédemment, donc g = na. Finalement, G ⊂ aZ. Soit maintenant a = 0. Il s’agit de montrer que G est dense dans R. Soit x, y ∈ R avec x < y. Puisque a = 0, il existe g ∈ G tel que 0 < g < y −x. Posons désormais n = ⌊x/g⌋+1 On obtient (n−1)g ≤ x < ng. Alors : x < ng = (n − 1)g + g ≤ x + g < x + (y − x) = y. Autrement dit, pour tout x, y ∈ R tels que x < y, il existe g ∈ G tel que x < g < y. Donc G est dense dans R par la proposition 1.2.26. 1.2.3 Notion de limites Convergence de suite Définition 1.2.28 (Convergence dans les espaces topologiques). Soient (X, T ) un espace topologique, (xn )n≥0 une suite de points de X et x ∈ X. On dit que la suite (xn )n≥0 converge vers x dans (X, T ) si pour tout voisinage V de x, il existe N ≥ 0 tel que si n ≥ N alors xn ∈ V. Exemple 5. Si on munit X de la topologie grossière, alors toutes les suites sont convergentes. Pour la topologie discrète, les seules suites convergentes sont les suites constantes à partir d’un certain rang. Dans le cas des espaces métriques, nous avons la définition suivante. Proposition 1.2.29 (Convergence dans les espaces métriques). Soit (xn )n≥0 une suite à valeurs dans (E, d) et x ∈ E. La suite (xn )n≥0 converge vers x si et seulement si ∀ε > 0, ∃N ≥ 0 : n ≥ N =⇒ d(xn , x) < ε. Démonstration. Exercice. Définition 1.2.30 (Topologie séparée). Un espace topologique (X, T ) est dite séparé si pour tout x, y ∈ X, x ̸= y, il existe Vx un voisinage de x et Vy un voisinage de y tel que Vx ∩ Vy = ∅. Lorsque la topologie sépare les points, le point vers lequel une suite converge est unique. Proposition 1.2.31. Soit (xn )n≥0 qui converge vers x et y dans un espace topologique séparé (X, T ). Alors x = y. Le point x est appelé limite de (xn )n≥0 et on note limn→∞ xn = x. Démonstration. Exercice. Proposition 1.2.32. La topologie définie par une métrique sépare les points. Démonstration. Immédiat. Remarque 5. Les espaces métriques jouissent de deux propriétés remarquables : l’une d’elle est le fait que la topologie associée sépare les points ; l’autre est que chaque point admet une base de voisinage dénombrable. Proposition 1.2.33. Soit X un ensemble. Si T et T ′ sont deux topologies sur X telle que T ⊂ T ′ , alors toute suite (xn )n≥0 qui converge vers x pour la topologie T ′ converge vers x pour la topologie T. Démonstration. Immédiat. Remarque 6. Cette proposition élémentaire est très régulièrement utilisée en probabilité mais aussi en analyse fonctionnelle : l’idée est qu’en supprimant des ouverts (ou des fermés) à une topologie, nous trouverons plus de suite convergente, la contrepartie étant que la convergence est plus faible : elle donne moins d’informations. Proposition 1.2.34 (Caractérisation séquentielle des points adhérents). Soient (E, d) un espace mé- trique, A ⊂ E et x ∈ E. Alors, x ∈ A si et seulement il existe une suite (xn )n≥0 de points de A qui converge vers x dans (X, d). 9 Démonstration. Soit x ∈ A, alors par la proposition 1.2.19, pour tout n ≥ 1, la boule ouverte B(x, 1/n) ∩ A ̸= ∅, il suffit donc de choisir xn dans cette intersection. De fait, d(x, xn ) → 0, d’où (xn )n≥0 converge vers x. Réciproquement, soit (xn )n≥0 une suite de points de A qui converge vers x ∈ X. Alors pour tout voisinage V de x, il existe N ≥ 0 tel que pour tout n ≥ N , xn ∈ V. En particulier V ∩A ̸= ∅ et x ∈ A. Remarque 7. Notons que la condition reste suffisante dans des espaces topologiques généraux. Points d’accumulation, points isolés, valeurs d’adhérence Nous avons déjà évoquer l’adhérence d’une partie A d’un espace topologie (X, T ). Un point est dit adhérent si il est dans l’adhérence de A. Ci-dessous, nous définissons les notions de point d’accumulation, de point isolés et de valeur d’adhérence. Définition 1.2.35 (Points d’accumulation, points isolés). Soit (X, T ) un espace topologique et soit A ⊂ X. 1. un point x ∈ X est un point d’accumulation si pour tout voisinage V de x, V ∩ A \ {x} = ̸ ∅; 2. un point x ∈ A est isolé dans A si il existe un voisinage V de x tel que V ∩ A = {x}. Lorsque A est l’image d’une suite, c’est à dire A = {xn : n ≥ 0}, il existe une notion plus forte que celle de points adhérents : ce sont les valeurs d’adhérences. Définition 1.2.36 (Valeur d’adhérence). Soient (X, T ) un espace topologique et (xn )n≥0 une suite de points de X. Un point x ∈ X est une valeur d’adhérence (ou point limite) si pour tout voisinage V de x, xn ∈ V pour une infinité de n ∈ N. Exemple 6. — La suite ((−1)n )n≥0 admet deux valeurs d’adhérences qui sont −1 et 1. — Soient p ∈ Z, q ∈ N∗ , alors l’ensemble des valeurs d’adhérences de la suite (cos(2πnp/q))n≥0 est {0, cos(2πp/q),... , cos(2πp(n − 1)/q)}. — Ces deux exemples font intervenir des suites périodiques. Mais, on peut considérer des exemples plus élaborés : si α ∈ / Q alors l’ensemble des valeurs d’adhérence de la suite (cos(2παn))n≥0 est [−1, 1]. On remarque d’abord en utilisant la parité de cos que {cos(2παn), n ≥ 0} = cos(2παZ + 2πZ). Comme la fonction x → cos(x) est une surjection continue de R dans [−1, 1]. Il suffit de montrer que 2παZ + 2πZ est dense dans R. Or, 2παZ + 2πZ est un sous-groupe de R. Par le théorème 1.2.27, il est soit dense soit de la forme aZ pour un certain a ∈ R. Supposons qu’il soit de cette seconde forme, alors il existe p, q ∈ Z tel que 2πα = pa et 2π = qa d’où α = p/q puisque aq ̸= 0. C’est une contradiction avec α ∈ / Q donc 2παZ + 2πZ est dense dans R. Le même genre de résultat est vrai pour la fonction sin à l’aide d’un déphasage d’angle π/2. Proposition 1.2.37. Soit (xn )n≥0 une suite de (E, d). L’ensemble des valeurs d’adhérence de (xn )n≥0 est le fermé \ F = {xn , n ≥ N }. N ≥0 Pour tout a ∈ F , il existe une suite nk qui tend vers l’infini lorsque k tend vers l’infini telle que limk→∞ xnk = a. En particulier, une valeur d’adhérence est un point adhérent. Démonstration. Notons AN = {xn : n ≥ N }. Par la proposition 1.2.19 \ AN = {x ∈ X : ∀ε > 0, B(x, ε) ∩ AN ̸= ∅} = {x ∈ X : B(x, ε) ∩ AN ̸= ∅}. ε>0 D’où \ \ \ \ F = {x ∈ X : B(x, ε) ∩ AN ̸= ∅} = {x ∈ X : B(x, ε) ∩ AN ̸= ∅}. N ≥0 ε>0 ε>0 N ≥0 C’est à dire, x ∈ F si et seulement si pour tout ε > 0, tout N ≥ 0, il existe n ≥ N tel que xn ∈ B(x, ε) si et seulement si x est une valeur d’adhérence. Pour la deuxième partie de la proposition, si a ∈ F alors pour k ≥ 1, on peut trouver au moins xnk tel que d(a, xnk ) < 1/k. D’où le résultat. 10 Limites et fonctions Définition 1.2.38. Soient (X1 , T1 ), (X2 , T2 ) deux espaces topologiques. On dit que f : X1 → X2 tend vers b ∈ X2 quand x tend vers a ∈ X1 si pour tout voisinage W de b dans X2 il existe un voisinage V de a dans X1 tel que f (V ) ⊂ W. Il arrive bien souvent qu’une fonction ne soit pas définie sur tout le domaine X1 mais plutôt sur un sous-ensemble strict A ⊂ X1. On peut alors chercher à définir une notion de limite vers un point en dehors de A. Typiquement, la fonction x → sin(x)/x est définie sur A = R \ {0}. Il est alors naturelle de chercher à définir la notion de limite lorsque x tend vers 0 ce qui n’est pas possible avec la définition donnée ci-dessus. De même, on s’intéresse souvent aux limites en +∞ ou −∞ sans pour autant que la fonction soit définie en ces points. La définition suivante est celle considérée classiquement : il ne s’agit de rien d’autre que la définition ci-dessus appliquée à l’espace topologique induit (A, TA ) — voir la proposition 1.2.46 — à ceci près qu’il faut ajouter l’hypothèse a est adhérent à A afin d’assurer que V ∩ A soit non vide — la notion serait alors triviale. Définition 1.2.39. Soient (X1 , T1 ), (X2 , T2 ) deux espaces topologiques et A ⊂ X1. On dit qu’une fonction f : A → X2 tend vers b ∈ X2 quand x tend vers a ∈ A dans X1 , x ∈ A, si pour tout voisinage W de b dans X2 , il existe un voisinage V de a dans X1 tel que f (V ∩ A) ⊂ W. Exemple 7. Il faut être vigilant et remarquer qu’il s’agit de la limite quand x tends vers a dans A et que cette limite dépend a priori de A comme l’illustre l’exemple suivant. Soit f : [0, 2] → R définie pour x ∈ [0, 2) par f (x) = x2 et f (2) = 5. Alors, limx→2,x∈[0,1]∪{2} f (x) = 5 bien que limx→2,x∈[0,2] f (x) = 4. En effet, soit W un voisinage de 5, alors on peut poser V = B(2, 1/2) alors f (V ∩ A) = f ({2}) = {5} ⊂ W. On montre de même la seconde limite. Les topologies étant séparées, la limite est unique et on observe l’importance du choix de A. Exercice 8. Une suite (xn )n≥0 à valeurs dans un espace topologique (X, T ) peut être vue comme une fonction x : N → X. Montrer que la notion de convergence pour les fonctions coı̈ncide avec celle des suites, en posant a = ∞ et A = N et en munissant N ∪ {∞} de la topologie dont les ouverts sont les singletons et les complémentaires de parties finies. Si (X2 , T2 ) est séparé, la limite d’une fonction est unique et on note : limx→A,x∈A f (x) = b. Proposition 1.2.40. Soient (E, d) et (E ′ , d′ ) deux espaces métriques, A ⊂ E une partie de E, f : A → E ′ une application et a ∈ A. On dit que f tend vers b ∈ E ′ quand x tend vers a dans X, x ∈ A si ∀ε > 0, ∃δ > 0, ∀x ∈ A : d(x, a) < δ =⇒ d(f (x), b) < ε. Démonstration. Exercice. La proposition suivante est très utile en pratique. Par simplicité, on se restreint au cadre des espaces métriques même si certaines propriétés reste vraie dans un cadre plus général. Proposition 1.2.41 (Caractérisation séquentielle). Soient (E, d) et (E ′ , d′ ) deux espaces métriques, A ⊂ E une partie de E, f : A → E ′ une fonction, a ∈ A et b ∈ E ′. Alors b = limx→a,x∈A f (x) si et seulement si pour toute suite (xn )n≥0 ∈ AN telle que limn→∞ xn = a alors limn→∞ f (xn ) = b. Démonstration. On se donne une suite (xn )n≥0 de points de A qui converge vers a ∈ A et on veut montrer que (f (xn ))n≥0 converge vers b ∈ E ′. Soit W un voisinage de b, puisque limx→a,x∈A f (x) = b, il existe V un voisinage de a tel que f (A ∩ V ) ⊂ W. Puisque V est un voisinage de a, il existe N ≥ 0 tel que pour tout n ≥ N , xn ∈ V et donc pour tout n ≥ N , f (xn ) ∈ W car xn ∈ V ∩ A. Réciproquement, on suppose que f ne tend pas vers b quand x ∈ A tend vers a. C’est à dire qu’il existe W un voisinage de b tel que pour tout voisinage de a, f (V ∩ A)∁ ∩ W ̸= ∅. En particulier, posons Vn = B(a, 1/n), n ≥ 1, alors il existe xn ∈ B(a, 1/n) ∩ A tel que f (xn ) ∈ / W. Mais alors, (xn )n≥0 est une suite de points de A qui converge vers a tel que pour tout n ≥ 1, f (xn ) ∈ / W , donc (f (xn ))n≥0 ne peut converger vers b. 11 1.2.4 Continuité Définition 1.2.42 (Continuité ponctuelle, continuité). Soient (X, T ), (X′ , T ′ ) deux espaces topologiques et f : X → X′ une fonction. 1. La fonction f est dite continue en x ∈ X si pour tout voisinage W de f (x) il existe un voisinage V de x tel que f (V ) ⊂ W ; 2. La fonction f est dite continue si elle est continue en tout point x ∈ X. Remarque 8. La continuité d’une fonction f en a ∈ X est équivalente à l’égalité limx→a,x∈A f (x) = f (a) avec A = X. Exercice 9. Donner une caractérisation séquentielle de la continuité. Proposition 1.2.43. Soit (E, d) et (E ′ , d′ ) deux espaces métriques et f une application de (E, d) dans (E ′ , d′ ). L’application f est dite continue en x ∈ E si ∀ε > 0, ∃δ > 0 : ∀y ∈ E, d(x, y) < δ =⇒ d′ (f (x), f (y)) < ε. L’application f sera dite continue si f est continue pour tout x ∈ E. Démonstration. C’est une condition suffisante. Soit W un voisinage de f (x), alors il existe un ouvert O tel que f (x) ∈ O ⊂ W , et on peut trouver ε > 0 tel que f (x) ∈ B(f (x), ε) ⊂ O ⊂ W. Cela assure l’existence d’un δ > 0 tel f (B(x, δ)) ⊂ B(f (x), ε) ⊂ W. Or, B(x, δ) est un voisinage de x. C’est une condition nécessaire. Soit ε > 0, comme B(f (x), ε) est un voisinage de f (x), il existe un voisinage V de x tel que f (V ) ⊂ B(f (x), ε). Or, par définition, il existe δ > 0 tel que x ∈ B(x, δ) ⊂ V et on conclut f (B(x, δ)) ⊂ B(f (x), ε). Proposition 1.2.44. Soient (X, T ) et (X′ , T ′ ) deux espaces topologiques. Les assertions suivantes sont équivalentes : 1. f : X → X′ est continue ; 2. pour tout ouvert O de X′ , f −1 (O) est un ouvert de X ; 3. pour tout fermé F de X′ , f −1 (F ) est un fermé de X ; 4. pour toute partie A ⊂ X, f (A) ⊂ f (A). Démonstration. Montrons que (i) implique (ii). Clairement, f −1 (∅) = ∅. Si O est un ouvert non vide de X′ , alors ou bien f −1 (O) = ∅ et f −1 (O) est un ouvert de X, ou bien f −1 (O) est non vide et on peut choisir x0 ∈ f −1 (O), autrement dit f (x0 ) ∈ O. Comme O est ouvert, c’est en particulier un voisinage de f (x0 ). La continuité de f donne l’existence d’un voisinage V de x0 tel que x0 ∈ V ⊂ f −1 (O). Il existe donc un ouvert Wx0 de X tel que x0 ∈ Wx0 ⊂ V ⊂ f −1 (O). On pose [ U= Wx , x∈f −1 (O) où Wx est un ouvert tel que x ∈ Wx ⊂ f −1 (O). Ainsi, U est un ouvert contenu dans f −1 (O) qui recouvre f −1 (O) : c’est exactement f −1 (O). Réciproquement, soient x0 ∈ X et W un voisinage de f (x0 ), il existe donc O un ouvert de X′ tel que f (x0 ) ∈ O ⊂ W. Par hypothèse, f −1 (O) est un ouvert. De plus, x0 ∈ f −1 ({f (x0 )}) ⊂ f −1 (O), donc f −1 (O) est un voisinage de x0. Il est clair que (ii) est équivalent à (iii). Il reste à montrer que (i) est équivalent à (iv). On suppose f continue. Soit A ⊂ X, f (A) est un fermé, donc f −1 (f (A)) est un fermé par continuité. Puisque f (A) ⊂ f (A), f −1 (f (A)) contient A, donc il contient A. Ainsi, pour tout x ∈ A, il existe y ∈ f (A) tel que f (x) = y. Autrement dit, f (A) ⊂ f (A). Réciproquement, soit F un fermé de X′. On note A = f −1 (F ). Alors f (A) = f (f −1 (F )) ⊂ F. Par hypothèse, f (A) ⊂ f (A) ⊂ F = F puisque F est fermé. Donc, A = f −1 (f (A)) ⊂ f −1 (F ) = A par définition. Donc A = A et A est fermé. Proposition 1.2.45. Soient (X1 , T1 ), (X2 , T2 ) et (X2 , T2 ) trois espaces topologiques. Soient f : X1 → X2 continue en x0 ∈ X1 et g : X2 → X3 continue en f (x0 ). Alors g ◦ f est continue en x0. Démonstration. Immédiat. 12 1.2.5 Topologies et opérations ensemblistes Topologie induite Proposition 1.2.46 (Topologie induite). Soient (X, T ) un espace topologique et Y une partie de X. Alors, l’ensemble de parties donné par TY = {O ∩ Y, O ∈ Y} définit une topologie sur Y appelée topologie induite. Démonstration. Immédiat. Proposition 1.2.47 (Sous-espace métrique). Soit (E, d) un espace métrique et F ⊂ E une partie de E. L’application d restreinte à F × F définit encore une métrique appelée métrique induite sur F. L’espace (F, d) est appelé sous-espace métrique. Démonstration. Immédiat. Proposition 1.2.48. La topologie définie par la métrique induite coı̈ncide avec la topologie induite. Démonstration. Soit O un ouvert de (F, d), alors pour tout x ∈ O, il existe ρx > 0 tel que B(x, ρx ) ∩ F ⊂ O. Ainsi, O = ∪x∈O [B(x, ρx ) ∩ F ] = (∪x∈O B(x, ρx )) ∩ F. De plus, pour tout x ∈ O, B(x, ρx ) est ouvert dans (E, d) d’où O ∈ TF. Réciproquement, si O ∈ TF , alors il existe O e un ouvert de (E, d) tel que O = O e ∩ F. Soit donc x∈O=O e ∩ F alors il existe ρ > 0 tel que B(x, ρ) ⊂ O e et donc B(x, ρ) ∩ F ⊂ O. Or B(x, ρ) ∩ F n’est rien d’autre que la boule ouverte centrée en x ∈ F et de rayon ρ > 0 dans l’espace métrique (F, d). Ainsi, O est un ouvert de (F, d). De même que pour la notion de limite, une fonction définie sur une partie A d’un espace topologique est dite continue sur A si la restriction f|A de f à A est continue sur l’espace topologique induit (A, TA ). Le théorème suivant est alors une conséquence immédiate des définitions. Proposition 1.2.49 (Prolongement par continuité). Soient (E, d) et (E ′ , d′ ) deux espaces métriques, f : A ⊂ E → E ′ une fonction et a ∈ A. Alors, les assertons suivantes sont équivalentes 1. il existe une unique application continue f˜ : A ∪ {a} → E ′ qui coı̈ncident avec f sur A ; 2. f est continue sur A et limx→a,x∈A f (x) existe. Démonstration. Exercice. Topologie initiale, topologie produit Définition 1.2.50 (Comparaison de topologies). Soient X un ensemble, T1 et T2 deux topologies sur X. On dit que T2 est plus fine que T1 si T1 ⊂ T2. On dit aussi que T1 est moins fine que T2. Proposition 1.2.51 (Topologie engendrée). Soit X un ensemble et O un ensemble de parties. Alors il existe une topologie T , contenant O, qui est moins fine que toute autre topologie vérifiant cette propriété. La topologie T est dite engendrée par O. Démonstration. On remarque que l’intersection d’une famille arbitraire de topologie est encore une to- pologie. On conclut en considérant la topologie définie comme l’intersection des topologies contenant O : elle est non vide (la topologie discrète contient O) et elle est moins fine que toute autre topologie contenant O. Définition 1.2.52 (Topologie initiale). Soit X un ensemble et (fi )i∈I une famille d’applications chacune définie sur X et à valeurs dans un espace topologique (Yi , Ti ). La topologie la moins fine rendant les applications fi : X → Yi continues est appelée topologie initiale. La topologie initiale est donc la topologie sur X engendrée par O = {fi−1 (O), i ∈ I, O ∈ Ti }. Cette définition s’applique directement à la notion d’espace produit. 13 Q Définition 1.2.53. Soit ((Xi , Ti ))i∈I une collection d’espaces topologique. On note X = i∈I Xi et pi : X → Xi la projection sur la coordonnée i ∈ I qui à x = (xi )i∈I associe p(x) = xi ∈ Xi. La topologie produit est la topologie initiale associée à la famille de projections (pi )i∈I. Remarquons que si O est un ouvert de Xi0 alors p−1 Q i0 (O) = i∈I Oi où Oi = Xi pour tout i ∈ I \ {i0 }. D’autre part, une intersection finie d’ouvert Q étant ouverte, cela mène à la définition de cylindre ouvert. Un cylindre ouvert est une partie O = i∈I Oi , Oi ∈ Ti pour tout i ∈ I, vérifiant Oi = Xi sauf pour un nombre fini de i ∈ I. On note T la collection des parties de X qui sont réunions de cylindre ouverts. Proposition 1.2.54 (Topologie produit). L’ensemble T est la topologie produit sur X. Démonstration. Il est immédiat que les projections pi , i ∈ I, sont continues de (X, T ) dans (Xi , Ti ) car, pour tout i ∈ I, p−1 ′ i (O) est un cylindre ouvert pour tout O ∈ Ti. Soit T une topologie sur X telle que, pour tout i ∈ I, pi est continue et considérons O ∈ T. Il est immédiat que si C est un cylindre ouvert alors il existe un ensemble I0 ⊂ I fini et des ouverts Oi ∈ Xi , i ∈ I0 , tels que C = ∩i∈I0 p−1i (Oi ). Comme O est par définition une réunion de tels cylindres, il vient que O est réunion d’intersections finies d’images réciproques d’ouverts par les applications pi donc O ∈ T ′ par continuité des pi : (X, T ′ ) −→ (Xi , Ti ). Exemple 8. Soit ((En , dn ))n∈N P une famille d’espaces métriques au Q plus dénombrable. Soit (αn )n≥0 une suite de réels positifs telle que n≥0 αn < ∞. On pose sur E = n∈N En la distance X dn (xn , yn ) Y d(x, y) = αn , x = (xn )n≥0 , y = (yn )n≥0 ∈ E = En. 1 + dn (xn , yn ) n≥0 n≥0 On définit également 1 Y δ(x, y) = sup dn (xn , yn ) ∧ , x = (xn )n≥0 , y = (yn )n≥0 ∈ E = En. (1.2) n≥0 1+n n≥0 Exercice 10. Montrer que d et δ définissent des métriques sur E. Montrer que ces métriques définissent la même topologie sur E. Quelle est-elle ? Q Proposition 1.2.55. Soit ((Xi , Ti ))i∈I une collection d’espaces topologiques. On note X = i∈I Xi et pi : X → Xi la projection sur la coordonnée i ∈ I qui à x = (xi )i∈I associe pi (x) = xi ∈ Xi. Une suite (xn )n≥0 ∈ XN converge vers x dans X muni de la topologie produit si et seulement si pour tout i ∈ I, la suite (pi (xn ))n≥0 converge vers xi dans Xi. Exemple 9. Soit F = R[0,1] l’ensemble des fonctions de [0, 1] dans R. On munit R de sa topologie usuelle associée à | · | et F de la topologie produit. Par la proposition 1.2.55, une suite de fonctions (fn )n≥0 de F converge vers f si et seulement si, pour tout x ∈ [0, 1], fn (x) converge vers f (x). La topologie produit dans ce contexte n’est rien d’autre que la topologie de la converge simple. Cette topologie est séparée : si x, y ∈ F sont tels que x ̸= y alors il existe i ∈ [0, 1] tel que xi ̸= yi. Puisque (R, | · |) est un espace métrique, c’est un espace séparé : il existe un voisinage Vxi de xi et un voisinage Vyi de yi vérifiant Vxi ∩ Vyi = ∅. Par continuité de la projection pi , p−1 −1 i (Vxi ) et pi (Vyi ) sont −1 −1 −1 des voisinages de x et y tels que pi (Vxi ) ∩ pi (Vyi ) = pi (Vxi ∩ Vyi ) = ∅. Notons que l’espace F muni de la topologie produit n’est par contre pas métrisable. Pour montrer ce fait, on cherche à contredire la caractérisation séquentielle des points adhérents. On appelle fonction simple un élément x ∈ F tel que xi = 0 pour Q tout i ∈ [0, 1] sauf peut-être un nombre fini. L’ensemble des fonctions simples est dense dans F : si O = i∈[0,1] Oi est un cylindre ouvert non vide, alors seul un nombre fini d’ouverts Oi0 ,... , OiJ , tous non vides, ne sont pas R tout entier. Soient a0 ∈ Oi0 ,... , aJ ∈ OiJ et posons xij = aj pour tout j = 0,... , J alors que xi = 0 partout ailleurs. On constate que x est une fonction simple. Ainsi, l’ensemble des fonctions simples intersecte tous les cylindres ouverts et donc tous les ouverts : l’ensemble des fonctions simples est dense dans F pour la topologie produit. D’autre part, soient y ∈ F limite d’une suite de fonctions simples (y (n) )n≥0. Alors (m) [ A = {i ∈ [0, 1] : yi ̸= 0} ⊂ {i ∈ [0, 1] : |yi | ≥ 2−n }. n≥0,m≥0 Ainsi, l’ensemble A est inclus dans une réunion dénombrable d’ensembles finis et est donc dénombrable. Ceci montre qu’une fonction non nulle sur un ensemble indénombrable ne peut être limite d’une suite de fonctions simples. La topologie de la convergence simple ne peut donc être métrisable. 14 Démonstration. Exercice. Proposition 1.2.56. Q Soient ((Xi , Ti ))i∈I une collection d’espaces topologique et (Y, U) un espace topo- logique. On note X = i∈I Xi et pi : X → Xi la projection sur la coordonnée i ∈ I qui à x = (xi )i∈I associe p(x) = xi ∈ Xi. Alors, X muni de la topologie produit, une fonction f : Y → X est continue si et seulement si pi ◦ f : Y → Xi est continue pour tout i ∈ I. Démonstration. Exercice. Topologie finale, topologie quotient Proposition 1.2.57 (Topologie finale). Soient X un ensemble, ((Xi , Ti ))i∈I une famille d’espace topolo- giques et pour chaque i ∈ I une application fi : Xi −→ X. La topologie finale sur X associée à la famille (fi )i∈I est la topologie T = {O ⊂ X : ∀i ∈ I, fi−1 (O) ∈ Ti }. C’est la topologie la plus fine rendant les applications fi continues. Démonstration. C’est un exercice de montrer que T est la topologie la plus fine rendant les applications fi continues. Soit (X, T ) un espace topologique et R une relation d’équivalence sur X. On note X/R l’ensemble quotient et π : X → X/R la projection canonique. Définition 1.2.58 (Topologie quotient). La topologie quotient sur X/R est la topologie finale associée à l’unique application π. Proposition 1.2.59. Soient (X, T ) et (Y, U) deux espaces topologiques, R une relation d’équivalence sur X et f : X/R → Y. Alors, si on munit X/R de la topologie quotient, l’application f : X/R → Y est continue si et seulement si f ◦ π : X → Y est continue. Démonstration. Exercice. 1.2.6 Compacité Propriété de Borel-Lebesgue et théorème de Bolzano-Weierstrass Définition 1.2.60 (Recouvrement ouvert). Soit (X, T ) un espace topologique. Un recouvrement ouvert de X est une famille (Oi )i∈I d’ouverts tels que X ⊂ ∪i∈I Oi. Un sous-recouvrement ouvert est un recou- vrement ouvert donné par une famille (Oj )j∈J avec J ⊂ I. Un recouvrement ouvert est dit fini si I est lui-même fini. Définition 1.2.61 (Compacité). Un espace topologique séparé (X, T ) est dit compact s’il vérifie l’une des deux propriétés suivantes : 1. de tout recouvrement ouvert de X, on peut extraire un sous-recouvrement fini de X ; 2. de toute famille de fermés dont l’intersection est vide, on peut extraire une sous famille finie d’intersection vide. Une partie X ⊂ X est compacte si, muni de la topologie induite, X est un espace topologique compact. Remarque 9. Les deux propriétés ci-dessus, appelées propriétés de Borel-Lebesgue, sont évidemment équivalente par passage au complémentaire. Exemple 10. Quelques exemples et contre-exemples : — L’ensemble ∅ est compact (pour n’importe quelle métrique) ; — (R, | · |) n’est pas compact ; — un ensemble discret (c’est à dire muni de la métrique discrète) est compact si et seulement si il est fini. Remarque 10. Remarquons que la compacité est une notion purement topologique. Par conséquent, si deux espaces topologiques sont homéomorphes — c.f. la définition 1.2.79 — alors ils sont simultanément compacts ou non compacts. 15 Proposition 1.2.62 (Propriétés des fermés emboı̂tés). Soit (X, T ) compact et (Fn )n∈N une suite décroissante de fermés ( i.e. Fn+1 ⊂ Fn pour tout n ≥ 0) d’intersection vide. Alors il existe N ≥ 0 tel que FN = ∅. Remarque 11. La contraposée est particulièrement intéressante : si (Fn )n≥0 est une famille décroissante de fermés non vides dans un espace topologique (X, T ) compact, alors ∩n≥0 Fn est (fermé) non vide. C’est la propriétés bien connues des segments emboı̂tés dans R. Démonstration. Soit (Fn )n≥0 une suite décroissante de fermés non vides d’un espace topologique (X, T ) compact. Par la seconde caractérisation de Borel-Lebesgue, il existe des indices n0 ,... , nk tels que ∩kℓ=0 Fnk = ∅. Soit alors n le plus grand de ces indices, alors par décroissance ∩kℓ=0 Fnk = Fn , d’où le résultat. Le théorème de Bolzano-Weierstrass énoncé ci-dessous ne s’applique que dans le contexte des espaces métriques. La deuxième assertion, appelée propriété de Bolzano-Weierstrass, est parfois posée comme définition de la compacité. Théorème 1.2.63 (Théorème de Bolzano-Weierstrass). Soit (E, d) un espace métrique et A ⊂ E. Alors les assertions suivantes sont équivalentes : 1. A est compact ; 2. (BW) de toute suite (xn )n≥0 de points de A on peut extraire une sous-suite (xnk )k≥0 convergente vers un point de A 3. tout ensemble infini B ⊂ A admet au moins un point d’accumulation dans A. Lemme 1.2.64 (Lemme de Lebesgue). Soient (E, d) un espace métrique et (Oi )i∈I un recouvrement ouvert de E. On suppose que (E, d) vérifie la propriété de Bolzano-Weierstrass : toute suite à valeur dans E admet une valeur d’adhérence dans E. Alors il existe ρ > 0 tel que pour tout x ∈ E il existe i = i(x) ∈ I tel que B(x, ρ) ⊂ Oi. Preuve du lemme de Lebesgue. On suppose qu’un tel ρ > 0 n’existe pas. En particulier, pour tout n ≥ 1, il existe un point xn ∈ E tel que pour tout i ∈ I, B(xn , 1/n) ∩ Oi∁ ̸= ∅. Par la propriété de Bolzano- Weierstrass, on peut trouver une sous-suite (xnk )k≥1 qui converge vers un point x de E. Puisque (Oi )i∈I est un recouvrement de E, il existe i ∈ I tel que x ∈ Oi. Or, Oi est ouvert donc on peut trouver r > 0 tel que B(x, r) ⊂ Oi. De plus, par convergence de (xnk )k≥1 il existe K ≥ 1 tel que pour tout k ≥ K, xnk ∈ B(x, r). Choisissons k ≥ K tel que 1/nk ≤ r/2 alors B(xnk , 1/nk ) ⊂ B(x, r) ⊂ Oi. C’est une contradiction. Preuve du théorème de Bolzano-Weierstrass. On ne montre que l’équivalence entre les deux premiers points. L’équivalence entre les deux derniers points est immédiate. Montrons que (1) implique (2). Soient A compact et (xn )n≥0 une suite de points de A. On pose, pour tout n ≥ 0, An = {xp : p > n}. Ainsi, An ⊂ A et An+1 ⊂ An. On note, pour tout n ≥ 0, Fn la fermeture de An dans A si bien que Fn ⊂ A. Clairement, Fn+1 ⊂ Fn. Par la propriété des fermés emboı̂tés dans les compacts, on obtient ∩n≥0 Fn ̸= ∅. Soit x ∈ ∩n≥0 Fn ⊂ A, alors x ∈ F0 = A0. Ainsi, B(x, 1) ∩ A0 ̸= ∅ et il existe xn0 tel que d(x, xn0 ) < 1. De même, x ∈ Fn0 = An0 si bien que B(x, 1/2) ∩ An0 ̸= ∅. On peut donc trouver n1 > n0 tel que d(x, xn1 ) < 1/2, et ainsi de suite. Nous construisons ainsi une suite 1 (xnk )k≥0 extraite de (xn )n≥0 telle que d(x, xnk ) < k+1. Ainsi, xnk → x ∈ A. Montrons que (2) implique (1). Soit A ⊂ E, alors puisque (E, d) est un espace métrique, E est séparé de même que ses parties. Montrons que A satisfait la première caractérisation de Borel-Lebesgue. Soit (Oi )i∈I un recouvrement d’ouvert (pour la topologie définie par (E, d)) de A. Soit ρ > 0 le rayon de Lebesgue, donné par le lemme 1.2.64 de Lebesgue, associé à ce recouvrement. Par hypothèse, A vérifie la propriété de Bolzano-Weierstrass. Soit x1 ∈ A, alors : ou bien A ⊂ B(x1 , ρ) et c’est terminé puisque par le lemme de Lebesgue B(x1 , ρ) ⊂ Oi(x1 ) , la caractérisation de Borel-Lebesgue est satisfaite ; sinon, il existe x2 ∈ A tel que d(x1 , x2 ) ≥ ρ. À nouveau : ou bien A ⊂ B(x1 , ρ) ∪ B(x2 , ρ), i.e. Borel-Lebesgue est satisfaite ; ou bien il existe x3 ∈ A tel que d(xi , xj ) ≥ ρ dès i ̸= j. Au besoin, on peut réitérer ce procédé indéfiniment, mais alors cela signifie que l’on a construit une suite (xn )n≥0 de point de A tel que d(xi , xj ) ≥ ρ dès que i ̸= j. C’est une contradiction avec la propriété de Bolzano- Weierstrass. 16 Quelques propriétés et conséquences de la compacité Proposition 1.2.65. Soit (X, T ) un espace topologique compact. Toute partie F ⊂ X fermée est com- pacte. Démonstration. La partie F ⊂ X est séparée puisque X l’est. Soit (Fi )i∈I une famille de fermés contenus dans F et d’intersection vide. Si F est fermé, (Fi )i∈I = (F ∩ Fi )i∈I est également une famille de fermés de X d’intersection vide. On peut donc en extraire une sous-famille finie F1 ,... , Fn tels que ∩N i=1 Fi , d’où le résultat. Proposition 1.2.66. Soient (X, T ) un espace topologique séparé et K ⊂ X un compact. Alors K est fermé. Démonstration. Il s’agit de montrer que X\K est ouvert. Soit x ∈ X\K. Pour tout y ∈ K, par hypothèse de séparation, il existe un voisinage ouvert Ox,y de x et Oy de y tel que Ox,y ∩Oy = ∅. Aussi K ⊂ ∪y∈K Oy , puis par compacité, on peut trouver y1 ,... , yN tel que K ⊂ ∪N N i=1 Oyi. On pose Ox = ∩i=1 Ox,yi qui est un voisinage ouvert de x vérifiant N ! [ ∅ = Ox ∩ Oyi ⊃ Ox ∩ K. i=1 D’où le résultat. Proposition 1.2.67 (Théorème de Borel-Lebesgue). Tout segment [a, b] est compact dans R muni de sa topologie usuelle. Démonstration. Soit (Oi )i∈I un recouvrement ouvert de [a, b]. On note A = {x ∈ [a, b] : [a, x] soit recouvert par un nombre fini de Oi , i ∈ I}. Alors, A satisfait les trois assertions suivantes : 1. A ⊂ [a, b] ; 2. A ̸= ∅ ; 3. A est majoré par b. Les premiers et troisièmes points sont des conséquences directes de la définition. Le second point, quant à lui, s’obtient en remarquant que a ∈ A puisqu’il existe ia ∈ I tel que a ∈ Oia. On note m = sup A. On va montrer que m ∈ A, puis que m = b. Comme m ∈ [a, b] ⊂ ∪i∈I Oi , il existe im ∈ I tel que m ∈ Oim. Ainsi, on peut trouver ε > 0 tel que (m − ε, m + ε) ⊂ Oim et par définition de la borne supérieure, il existe x ∈ A ∩ (m − ε, m + ε). Ensuite, en observant que [a, m] = [a, x] ∪ [x, m] et que x ∈ A, on obtient que le premier intervalle peut être recouvert par un nombre fini de Oi et le deuxième intervalle par l’ouvert Oim. Finalement, m ∈ A. Supposons que m < b et choisissons ε > 0 tel que m + ε < b et m ∈ (m − ε, m + ε) ⊂ Oim. Soit x ∈ (m, m + ε), puis on décompose comme précédemment l’intervalle [a, x] = [a, m] ∪ [m, x]. On constate que [m, x] est recouvert par Oim et que [a, m] peut être recouvert par un nombre fini Oi puisque m ∈ A. Manifestement, m < sup A, d’où m = b. Corollaire 1.2.68. Soit E un K-espace vectoriel normé de dimension finie. Les parties compacts de E sont les parties fermés bornés. Démonstration. On considère seulement R muni de la norme | · |. L’extension aux K-espaces vectoriels normés de dimension finie est élémentaire. Soit K une partie compacte S de R qui est séparé. Alors K est fermée par la proposition 1.2.66. De plus, on observe que K ⊂ m≥0 B(0, m). Par compacité, de ce recouvrement par des ouverts, on peut extraire un sous-recouvrement fini. Ainsi, il existe m0 ≥ 0 tel que K ⊂ B(0, m0 ) et K est une partie bornée. Réciproquement, si K est fermé et borné, alors K ⊂ [a, b] pour certains réels a < b. Les propositions 1.2.67 et 1.2.65 permettent de conclure. Proposition 1.2.69. Soit (X, T ) un espace topologique séparé. Alors 17 1. toute réunion finie de compacts est compacte ; 2. toute intersection de compacts est compacte. Démonstration. Puisque (X, T ) est séparé, il en va de même pour toutes ses parties. Soient K1 ,... , KN des compacts et (Oi )i∈I un recouvrement ouvert de ∪N j=1 Kj. C’est aussi un re- couvrement d’ouvert de Kj pour tout j = 1,... , N. Pour chaque j = 1,... , N , on peut trouver un sous recouvrement fini O1j ,... ON j j de Kj. Alors, N Nj N [ [ [ Kj ⊂ Oℓj , j=1 j=1 ℓ=1 si bien que (Oℓj )j=1,...,N,ℓ=1,...,Nj est un recouvrement ouvert finie de l’union. Soient (Ki )i∈I une famille de compacts et (Fj )j∈J des fermés contenus dans ∩i∈I Ki tel que ∩j∈J Fj = ∅. Soit i0 ∈ I, alors (Fj )j∈J est une famille de fermés contenus dans Ki0 , par compacité, on peut en extraire une sous-famille finie F1 ,... , FN de fermés tels que ∩N j=1 Fj = ∅. Ainsi ∩i∈I Ki est compact. Proposition 1.2.70. Soient (X1 , T1 ) un espace topologique, (X2 , T2 ) un espace topologique séparé et f : X1 → X2 une application continue. Alors f (K) est compacte pour tout compact K ⊂ X1. Démonstration. Tout d’abord, f (K) est séparée puisque T2 sépare les points. Soit (Oi )i∈I un recouvre- ment ouvert de f (K), alors par continuité, (f −1 (Oi ))i∈I est recouvrement ouvert de K. On peut extraire un recouvrement ouvert fini f −1 (O1 ),... , f −1 (ON ) de K. On montre que les ouverts O1 ,... , ON recouvre −1 −1 f (K) : soit x ∈ f (K) tel que x ∈ ∩N ∁ i=1 Oi , alors f ({x}) ⊂ ∩N i=1 f (Oi )∁. On a ainsi trouvé y ∈ K tel −1 ∁ que y ∈ ∪N i=1 f (Oi ). Contradiction. Corollaire 1.2.71. Soit f : (X, T ) → R une application continue où (X, T ) est un espace topologique compact non vide. Alors f est bornée et atteint ses bornes. Démonstration. La fonction f est à valeurs dans R un espace métrique donc séparé, il s’ensuit que f (X) est séparé. Par la proposition précédente, f (X) est donc compacte, or les compacts de R sont les fermés bornées. Ainsi, f est bornée. De plus supx∈X f (x) et inf x∈X f (x) sont dans f (X) = f (X), ainsi f atteint ses bornes. Exercice 11. Soit f : (E, d) →