On propose la démonstration du théorème centrale limite. Il est utiliser pour démontrer le théorème de Weierstrass pour la densité des polynomes dans les espace de fonctions continues. Quel est le théorème central limite ? Le théorème dit que dans des circonstances plutôt générales, si vous additionnez des variables aléatoires indépendantes et normalisez
Théorème centrale limite
Formellement, te théorème central limite dit que la distribution des moyennes d’échantillon se rapproche d’une loi normale quand la taille de l’échantillon augmente, quelle que soit la distribution de la population.
Voici maintenant la version mathématique de ce théorème important et classique de la théorie des probabilités.
Théorème: On se donne une suite $(X_n)_n$ de variables aléatoires indépendantes identiquement distribuées tel que chaque moment d’ordre $2$, $\mathbb{E}(X_n^2)$ existe, pour tout $n$. Si on pose \begin{align*} & \mathbb{E}(X)=m,\quad \sigma^2=V(X)=E(X^2)-(E(X))^2,\cr & S_n=X_1+\cdots+X_n,\cr & Y_n=\frac{S_n-nm}{\sigma^2\sqrt{n}},\end{align*} alors la loi de $Y_n$ converge vers la loi normale centrée réduite. Autrement dit \begin{align*} \mathbb{P}(Y_n\le x) \underset{n\to\infty}{\longrightarrow} \frac{1}{\sqrt{2\pi}}\int^x_{-\infty} e^{-\frac{t^2}{2}}dt.\end{align*}
Importance du théorème
Avant de présenter la démonstration du théorème centrale limite nous signalons l’utilité du théorème. Le théorème central limite est utile lors de l’analyse de grands ensembles de données car il permet de supposer que la distribution d’échantillonnage de la moyenne sera distribuée normalement dans la plupart des cas. Cela permet une analyse statistique et une inférence plus faciles. Par exemple, les investisseurs peuvent utiliser le théorème central limite pour agréger les données de performance de titres individuels et générer une distribution de moyennes d’échantillons qui représentent une distribution de population plus large pour les rendements des titres sur une période de temps.
Démonstration du théorème centrale limite
Pour la démonstration du théorème centrale limite nous allons utilises la notion de fonctions caractéristiques des variables aléatoires. Pour chaque $n,$ la fonction caractéristique de la variable aléatoire $X_n$ est $\varphi_{X_n}(t)=\mathbb{E}(e^{it X})$ (l’intégral existe toujours et la transformation de Fourier de $X_n$.) On peut réécrire montrer que \begin{align*} Y_n= \frac{\overline{X}_n-m}{\frac{\sigma}{\sqrt{n}}},\end{align*} avec \begin{align*} \overline{X}_n=\frac{X_1+\cdots+X_n}{n}.\end{align*} Si on pose $Z_k=\frac{X_k-m}{\sigma}$, alors \begin{align*} Y_n= \sum_{k=1}^{n} \frac{Z_k}{\sqrt{n}}.\end{align*} Comme les $X_k$ sont indépendantes identiquement distribuées, alors aussi pour les variables $Z_k$. Et donc par les propriétés des fonctions caractéristiques on a \begin{align*} \varphi_{Y_n}(t)&=\prod_{k=1}^n \varphi_{\frac{Z_k}{\sqrt{n}}}(t) \cr &= \prod_{k=1}^n \varphi_{Z_k}\left(\frac{t}{\sqrt{n}}\right)=\left(\varphi_{Z_1}\left(\frac{t}{\sqrt{n}}\right)\right)^n\cr &= \left( 1-\frac{t^2}{n}+o\left(\frac{t^2}{n}\right)\right)^n.\end{align*} Ainsi \begin{align*} \varphi_{Y_n}(t) \underset{n\to\infty}{\longrightarrow} e^{-\frac{t^2}{2}}.\end{align*} Cette limite est la fonction caractéristique d’une variable aléatoire qui suit la loi normale $\mathscr{N}(0,1)$. Pour conclure il suffit d’applique le théorème de convergence de Lévy qui caractérise la convergence en loi d’une suite de variables aléatoires par la convergence de la suite de fonctions caractéristiques associées.