Lo sviluppo di una serie binomiale di valori casuali converge alla distribuzione normale . Questo effetto viene descritto dai teoremi del limite centrale. I teoremi del limite centrale sono una famiglia di teoremi di convergenza debole nell'ambito della teoria della probabilità .
Una delle formulazioni più note del teorema è la seguente:
Sia X j {\displaystyle X_{j}} una delle n {\displaystyle n} variabili aleatorie indipendenti e identicamente distribuite , e siano E [ X j ] = μ {\displaystyle E[X_{j}]=\mu } e V a r [ X j ] = σ 2 , {\displaystyle \mathrm {Var} [X_{j}]=\sigma ^{2},} per j = 1 , … , n , {\displaystyle j=1,\ldots ,n,} con 0 < σ 2 < + ∞ {\displaystyle 0<\sigma ^{2}<+\infty } .
Posto Y n = 1 n ∑ j = 1 n X j − μ σ / n {\displaystyle \displaystyle Y_{n}={\frac {{\frac {1}{n}}\sum _{j=1}^{n}X_{j}-\mu }{{\sigma }/{\sqrt {n}}}}} allora Y n {\displaystyle Y_{n}} presenterà una distribuzione normale standard : Y n → D Y ∼ N ( 0 , 1 ) {\displaystyle Y_{n}{\stackrel {D}{\to }}Y\sim N(0,1)} .
Ciò spiega l'importanza che la funzione gaussiana assume nelle branche matematiche della statistica e della teoria della probabilità in particolare. Fu dimostrato nel 1922 da Lindeberg nell'articolo "Eine neue Herleitung des Exponentialgesetzes in der Wahrscheinlichkeitsrechnung" , e poi in modo indipendente da Turing .
La più nota formulazione del teorema del limite centrale è quella dovuta a Lindeberg e Paul Lévy ; si consideri una successione di variabili casuali { x j } j = 1 n {\displaystyle \ \left\{x_{j}\right\}_{j=1}^{n}} indipendenti e identicamente distribuite, definendo come variabile casuale complessiva:
x ∗ = 1 n ∑ j = 1 n x j − ⟨ x ⟩ n σ n = 1 n ∑ j = 1 n y j . {\displaystyle x^{*}={\frac {1}{\sqrt {n}}}\sum _{j=1}^{n}{\frac {x_{j}-\langle x\rangle _{n}}{\sigma _{n}}}={\frac {1}{\sqrt {n}}}\sum _{j=1}^{n}y_{j}.} Bisogna semplicemente dimostrare che la variabile complessiva x ∗ {\displaystyle x^{*}} converge in distribuzione alla gaussiana con valore atteso 0 e varianza 1, ovvero che:
lim n → + ∞ x ∗ = e − 1 2 x 2 2 π . {\displaystyle \lim _{n\to +\infty }x^{*}={\frac {e^{-{\frac {\scriptscriptstyle 1}{\scriptscriptstyle 2}}x^{2}}}{\sqrt {2\pi }}}.} Sempre per semplicità di notazione sono state definite esplicitamente anche le variabili normalizzate come:
y j = x j − ⟨ x ⟩ n σ n . {\displaystyle y_{j}={\frac {x_{j}-\langle x\rangle _{n}}{\sigma _{n}}}.} Si osservi che E [ y j ] = 0 , Var ( y j ) = E [ y j 2 ] = 1 , ∀ j {\displaystyle {\textrm {E}}[y_{j}]=0,\ {\textrm {Var}}(y_{j})={\textrm {E}}[y_{j}^{2}]=1,\ \forall j} .
La seguente dimostrazione[ 1] fa uso della nozione di funzione caratteristica della x ∗ {\displaystyle x^{*}} , definibile in modo equivalente come una particolare funzione valore atteso o come la trasformata di Fourier di una funzione di densità f x ∗ {\displaystyle \ f_{x^{*}}} in una variabile (complessiva) x ∗ {\displaystyle x^{*}} :
φ x ∗ ( t ) = E [ e − i t x ∗ ] = ∫ R e − i t x ∗ f ( x ∗ ) d x ∗ , {\displaystyle \varphi _{x^{*}}(t)={\textrm {E}}\left[e^{-itx^{*}}\right]=\int _{\mathbb {R} }e^{-itx^{*}}f(x^{*})dx^{*},} dove i {\displaystyle i} è l'unità immaginaria . Nel dominio di Fourier, l'enunciato del teorema:
lim n → + ∞ f ( x n ∗ ) = e − 1 2 x ∗ 2 2 π , {\displaystyle \lim _{n\to +\infty }f(x_{n}^{*})={\frac {e^{-{\frac {\scriptscriptstyle 1}{\scriptscriptstyle 2}}x^{*2}}}{\sqrt {2\pi }}},} diventa equivalente a:
lim n → ∞ φ x ∗ ( t ) = e − t 2 2 , ∀ f ( x ∗ ) , {\displaystyle \lim _{n\rightarrow \infty }\varphi _{x^{*}}(t)=e^{-{\frac {t^{2}}{2}}},\qquad \forall f(x^{*}),} infatti il secondo membro è la funzione caratteristica della distribuzione normale.
Nel caso presente, si ha:
φ x ∗ ( t ) = E [ exp { − i t x ∗ } ] = E [ exp { − i t n ∑ j = 1 n y j } ] = ∏ j = 1 n E [ exp { − i t n y j } ] , {\displaystyle }{\varphi _{x^{*}}(t)={\textrm {E}}\left[\exp \left\{-itx^{*}\right\}\right]={\textrm {E}}\left[\exp \left\{{\frac {-it}{\sqrt {n}}}\sum _{j=1}^{n}y_{j}\right\}\right]=\prod _{j=1}^{n}{\textrm {E}}\left[\exp \left\{{\frac {-it}{\sqrt {n}}}y_{j}\right\}\right],} dove l'ultima uguaglianza discende dalla indipendenza degli x j {\displaystyle \ x_{j}} quindi anche degli y j {\displaystyle \ y_{j}} . Effettuando lo sviluppo di Maclaurin dell'esponenziale , si può calcolarne il valore atteso :
E [ exp { − i t n y j } ] = E [ 1 − i n t y j − 1 n t 2 2 y j 2 + o ( t 2 y j 2 ) ] = 1 − 1 n ( t 2 2 ) , ∀ j . {\displaystyle \ {\textrm {E}}\left[\exp \left\{{\frac {-it}{\sqrt {n}}}y_{j}\right\}\right]={\textrm {E}}\left[1-{\frac {i}{\sqrt {n}}}ty_{j}-{\frac {1}{n}}{\frac {t^{2}}{2}}y_{j}^{2}+o\left(t^{2}y_{j}^{2}\right)\right]=1-{\frac {1}{n}}\left({\frac {t^{2}}{2}}\right),\ \forall j.} [ 1] Segue che:
φ x ∗ ( t ) = ∏ j = 1 n ( 1 − 1 n ( t 2 2 ) ) = ( 1 − 1 n ( t 2 2 ) ) n . {\displaystyle \varphi _{x^{*}}(t)=\prod _{j=1}^{n}\left(1-{\frac {1}{n}}\left({\frac {t^{2}}{2}}\right)\right)=\left(1-{\frac {1}{n}}\left({\frac {t^{2}}{2}}\right)\right)^{n}.} Ma applicando il limite notevole : lim n → ∞ ( 1 − x n ) n = e − x {\displaystyle \ \lim _{n\rightarrow \infty }\left(1-{\frac {x}{n}}\right)^{n}=e^{-x}} , si ha:
lim n → ∞ φ x ∗ ( t ) = e − t 2 2 , {\displaystyle \lim _{n\rightarrow \infty }\varphi _{x^{*}}(t)=e^{-{\frac {t^{2}}{2}}},} come volevasi dimostrare.
Si tratta di un'applicazione del teorema di Lindeberg-Lévy al caso di distribuzione binomiale :
Se Y = B i ( n , p ) {\displaystyle Y=Bi(n,p)} è una variabile casuale binomiale, che possiamo vedere come somma di n {\displaystyle n} variabili casuali bernoulliane. Allora per n → ∞ {\displaystyle n\to \infty } :
Y = N ( n p , n p ( 1 − p ) ) , {\displaystyle Y=N(np,np(1-p)),} ossia una gaussiana con media n p {\displaystyle np} e varianza n p ( 1 − p ) {\displaystyle np(1-p)} .
Se standardizziamo:
lim n → ∞ Y n − n p n p ( 1 − p ) = Z . {\displaystyle \lim _{n\to \infty }{\frac {Y_{n}-np}{\sqrt {np(1-p)}}}=Z.} Questo teorema è molto utile nel caso si vogliano valori approssimati del numero di successi nella ripetizione di un esperimento indipendente dagli esiti passati, visto che la variabile aleatoria binomiale risulta spesso difficile da calcolare con numeri elevati. L'approssimazione è tanto migliore quanto più è alto il numero di esperimenti.
Il teorema di De Moivre-Laplace può essere dimostrato più facilmente del teorema del limite centrale, con una prova per la quale è necessaria la conoscenza degli sviluppi di Taylor e dell'approssimazione di Stirling . Per il fattoriale di un numero n {\displaystyle n} sufficientemente grande vale la formula di Stirling, secondo cui:
n ! ≃ 2 π n ( n e ) n , {\displaystyle n!\simeq {\sqrt {2\pi n}}\left({\frac {n}{e}}\right)^{n},} o equivalentemente:
n ! ≃ n n e − n 2 π n . {\displaystyle n!\simeq n^{n}e^{-n}{\sqrt {2\pi n}}.} La funzione di densità di B i ( n , p ) {\displaystyle \mathrm {Bi} (n,p)} si potrà scrivere allora come:
( n k ) p k q n − k = n ! k ! ( n − k ) ! p k q n − k ≃ n n e − n 2 π n k k e − k 2 π k ( n − k ) n − k e − ( n − k ) 2 π ( n − k ) p k q n − k = 2 π n 2 π k 2 π ( n − k ) ⋅ n n k k ( n − k ) n − k ⋅ e − n e − k e − ( n − k ) p k q n − k = n k 2 π ( n − k ) ⋅ n n k k ( n − k ) n − k ⋅ e − n e − k e − n e k p k q n − k = n 2 π k ( n − k ) n n ( p k ) k ( q n − k ) ( n − k ) e − n + k + n − k = n 2 π k ( n − k ) n n − k + k ( p k ) k ( q n − k ) ( n − k ) = n 2 π k ( n − k ) n n − k n k ( p k ) k ( q n − k ) ( n − k ) = n 2 π k ( n − k ) ( n p k ) k ( n q n − k ) ( n − k ) = n 2 π k ( n − k ) ( k n p ) − k ( n − k n q ) − ( n − k ) {\displaystyle {\begin{aligned}{n \choose k}\,p^{k}q^{n-k}&={\frac {n!}{k!\left(n-k\right)!}}p^{k}q^{n-k}\\&\simeq {\frac {n^{n}e^{-n}{\sqrt {2\pi n}}}{k^{k}e^{-k}{\sqrt {2\pi k}}{(n-k)}^{n-k}e^{-(n-k)}{\sqrt {2\pi (n-k)}}}}p^{k}q^{n-k}\\&={\frac {\sqrt {2\pi n}}{{\sqrt {2\pi k}}{\sqrt {2\pi (n-k)}}}}\cdot {\frac {n^{n}}{k^{k}{(n-k)}^{n-k}}}\cdot {\frac {e^{-n}}{e^{-k}e^{-(n-k)}}}p^{k}q^{n-k}\\&={\frac {\sqrt {n}}{{\sqrt {k}}{\sqrt {2\pi (n-k)}}}}\cdot {\frac {n^{n}}{k^{k}{(n-k)}^{n-k}}}\cdot {\frac {e^{-n}}{e^{-k}e^{-n}{e}^{k}}}p^{k}q^{n-k}\\&={\sqrt {\frac {n}{2\pi k(n-k)}}}n^{n}{\left({\frac {p}{k}}\right)}^{k}{\left({\frac {q}{n-k}}\right)}^{(n-k)}e^{-n+k+n-k}\\&={\sqrt {\frac {n}{2\pi k(n-k)}}}n^{n-k+k}{\left({\frac {p}{k}}\right)}^{k}{\left({\frac {q}{n-k}}\right)}^{(n-k)}\\&={\sqrt {\frac {n}{2\pi k(n-k)}}}n^{n-k}n^{k}{\left({\frac {p}{k}}\right)}^{k}{\left({\frac {q}{n-k}}\right)}^{(n-k)}\\&={\sqrt {\frac {n}{2\pi k(n-k)}}}{\left({\frac {np}{k}}\right)}^{k}{\left({\frac {nq}{n-k}}\right)}^{(n-k)}\\&={\sqrt {\frac {n}{2\pi k(n-k)}}}{\left({\frac {k}{np}}\right)}^{-k}{\left({\frac {n-k}{nq}}\right)}^{-(n-k)}\\\end{aligned}}} Sia ora
x = ( k − n p ) n p q {\displaystyle x={\frac {(k-np)}{\sqrt {npq}}}} ⇒ k = n p + x n p q {\displaystyle \Rightarrow \ k=np+x{\sqrt {npq}}\quad } e n − k = n q − x n p q {\displaystyle \quad n-k=nq-x{\sqrt {npq}}} ⇒ k n p = 1 + x q n p {\displaystyle \Rightarrow \ {\frac {k}{np}}=1+x{\sqrt {\frac {q}{np}}}\quad } e n − k n q = 1 − x p n q {\displaystyle \quad {\frac {n-k}{nq}}=1-x{\sqrt {\frac {p}{nq}}}} ⇒ ( n k ) p k q n − k ≃ n 2 π k ( n − k ) ( 1 + x q n p ) − k ( 1 − x p n q ) − ( n − k ) . {\displaystyle \Rightarrow \ {n \choose k}p^{k}q^{n-k}\simeq {\sqrt {\frac {n}{2{\mathbf {\pi } }k(n-k)}}}{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-(n-k)}.} Consideriamo dapprima il primo termine tra parentesi quadre nell'ultima uguaglianza:
n 2 π k ( n − k ) = n 2 π k ( n − k ) ⋅ 1 / n 2 1 / n 2 = 1 / n 2 π k ( n − k ) / n 2 = 1 / n 2 π k n ( n − k ) n = 1 / n 2 π k n ( 1 − k n ) = 1 / n 2 π p ( 1 − p ) [ ∵ k → n p ⇒ k n → p ] = 1 / n 2 π p q [ ∵ p + q = 1 ⇒ q = 1 − p ] = 1 2 π n p q = 1 2 π n p q {\displaystyle {\begin{aligned}{\sqrt {\frac {n}{2\pi k\left(n-k\right)}}}&={\sqrt {{\frac {n}{2\pi k\left(n-k\right)}}\cdot {\frac {{1}/{n^{2}}}{{1}/{n^{2}}}}}}\\&={\sqrt {\frac {{1}/{n}}{{2\pi k(n-k)}/{n^{2}}}}}\\&={\sqrt {\frac {{1}/{n}}{2\pi {\frac {k}{n}}{\frac {(n-k)}{n}}}}}\\&={\sqrt {\frac {{1}/{n}}{2\pi {\frac {k}{n}}\left(1-{\frac {k}{n}}\right)}}}\\&={\sqrt {\frac {{1}/{n}}{2\pi p\left(1-p\right)}}}\qquad \qquad \qquad \left[\because k\to np\Rightarrow {\frac {k}{n}}\to p\right]\\&={\sqrt {\frac {{1}/{n}}{2\pi pq}}}\qquad \qquad \qquad \left[\because p+q=1\Rightarrow q=1-p\right]\\&={\sqrt {\frac {1}{2\pi npq}}}\\&={\frac {1}{\sqrt {2\pi npq}}}\end{aligned}}} ⇒ ( n k ) p k q n − k ≃ 1 2 π n p q ( 1 + x q n p ) − k ( 1 − x p n q ) − ( n − k ) . {\displaystyle \Rightarrow {n \choose k}p^{k}q^{n-k}\simeq {\frac {1}{\sqrt {2{\mathbf {\pi } }npq}}}{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-(n-k)}.} E quindi:
( 1 + x q n p ) − k ( 1 − x p n q ) − ( n − k ) = e ln [ ( 1 + x q n p ) − k ( 1 − x p n q ) − ( n − k ) ] . {\displaystyle {\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}=e^{\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}.} Per cui si ha che:
( n k ) p k q n − k ≃ 1 2 π n p q e ln [ ( 1 + x q n p ) − k ( 1 − x p n q ) − ( n − k ) ] . {\displaystyle {n \choose k}p^{k}q^{n-k}\simeq {\frac {1}{\sqrt {2{\mathbf {\pi } }npq}}}e^{\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}.} Consideriamo quindi il logaritmo naturale che appare nell'ultima uguaglianza.
ln [ ( 1 + x q n p ) − k ( 1 − x p n q ) − ( n − k ) ] = ln ( 1 + x q n p ) − k + ln ( 1 − x p n q ) − ( n − k ) = − k ln ( 1 + x q n p ) − ( n − k ) ln ( 1 − x p n q ) . {\displaystyle \ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]=\ln {\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}+\ln {\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}=-k\ln \left(1+x{\sqrt {\frac {q}{np}}}\right)-\left(n-k\right)\ln \left(1-x{\sqrt {\frac {p}{nq}}}\right).} Utilizzando le espansioni di Taylor seguenti:
ln ( 1 + y ) = y − y 2 2 + y 3 3 − y 4 4 + ⋯ , {\displaystyle \ln \left(1+y\right)=y-{\frac {y^{2}}{2}}+{\frac {y^{3}}{3}}-{\frac {y^{4}}{4}}+\cdots ,} ln ( 1 − y ) = − y − y 2 2 − y 3 3 − y 4 4 − ⋯ , {\displaystyle \ln \left(1-y\right)=-y-{\frac {y^{2}}{2}}-{\frac {y^{3}}{3}}-{\frac {y^{4}}{4}}-\cdots ,} si ha:
ln ( 1 + x q n p ) = x q n p − x 2 q 2 n p + ⋯ {\displaystyle \ln \left(1+x{\sqrt {\frac {q}{np}}}\right)=x{\sqrt {\frac {q}{np}}}-{\frac {x^{2}q}{2np}}+\cdots } e
ln ( 1 − x p n q ) = − x p n q − x 2 p 2 n q − ⋯ {\displaystyle \ln \left(1-x{\sqrt {\frac {p}{nq}}}\right)=-x{\sqrt {\frac {p}{nq}}}-{\frac {x^{2}p}{2nq}}-\cdots } da cui:
ln [ ( 1 + x q n p ) − k ( 1 − x p n q ) − ( n − k ) ] = − k ( x q n p − x 2 q 2 n p + ⋯ ) − ( n − k ) ( − x p n q − x 2 p 2 n q − ⋯ ) = − ( n p + x n p q ) ( x q n p − x 2 q 2 n p + ⋯ ) − ( n q − x n p q ) ( − x p n q − x 2 p 2 n q − ⋯ ) , {\displaystyle {\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}=-k\left(x{\sqrt {\frac {q}{np}}}-{\frac {x^{2}q}{2np}}+\cdots \right)-\left(n-k\right)\left(-x{\sqrt {\frac {p}{nq}}}-{\frac {x^{2}p}{2nq}}-\cdots \right)=-\left(np+x{\sqrt {npq}}\right)\left(x{\sqrt {\frac {q}{np}}}-{\frac {x^{2}q}{2np}}+\cdots \right)-\left(nq-x{\sqrt {npq}}\right)\left(-x{\sqrt {\frac {p}{nq}}}-{\frac {x^{2}p}{2nq}}-\cdots \right),} per cui
ln [ ( 1 + x q n p ) − k ( 1 − x p n q ) − ( n − k ) ] = − ( n p ⋅ x q n p − n p ⋅ x 2 q 2 n p + x n p q ⋅ x q n p − x n p q ⋅ x 2 q 2 n p + ⋯ ) − ( − n q ⋅ x p n q − n q ⋅ x 2 p 2 n q + x n p q ⋅ x p n q + x n p q ⋅ x 2 p 2 n q + ⋯ ) = − ( x n p q − x 2 q 2 + x 2 q + ⋯ ) − ( − x n p q − x 2 p 2 + x 2 p + ⋯ ) = − ( x n p q + x 2 q 2 + ⋯ ) − ( − x n p q + x 2 p 2 + ⋯ ) = − x n p q − x 2 q 2 + x n p q − x 2 p 2 − ⋯ = − x 2 q 2 − x 2 p 2 − ⋯ = − x 2 2 ( q + p ) − ⋯ = − x 2 2 − ⋯ {\displaystyle {\begin{aligned}{\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}&=-\left(np\cdot x{\sqrt {\frac {q}{np}}}-np\cdot {\frac {x^{2}q}{2np}}+x{\sqrt {npq}}\cdot x{\sqrt {\frac {q}{np}}}-x{\sqrt {npq}}\cdot {\frac {x^{2}q}{2np}}+\cdots \right)\\&-\left(-nq\cdot x{\sqrt {\frac {p}{nq}}}-nq\cdot {\frac {x^{2}p}{2nq}}+x{\sqrt {npq}}\cdot x{\sqrt {\frac {p}{nq}}}+x{\sqrt {npq}}\cdot {\frac {x^{2}p}{2nq}}+\cdots \right)\\&=-\left(x{\sqrt {npq}}-{\frac {x^{2}q}{2}}+x^{2}q+\cdots \right)-\left(-x{\sqrt {npq}}-{\frac {x^{2}p}{2}}+x^{2}p+\cdots \right)\\&=-\left(x{\sqrt {npq}}+{\frac {x^{2}q}{2}}+\cdots \right)-\left(-x{\sqrt {npq}}+{\frac {x^{2}p}{2}}+\cdots \right)\\&=-x{\sqrt {npq}}-{\frac {x^{2}q}{2}}+x{\sqrt {npq}}-{\frac {x^{2}p}{2}}-\cdots \\&=-{\frac {x^{2}q}{2}}-{\frac {x^{2}p}{2}}-\cdots \\&=-{\frac {x^{2}}{2}}\left(q+p\right)-\cdots \\&=-{\frac {x^{2}}{2}}-\cdots \end{aligned}}} ⇒ ln [ ( 1 + x q n p ) − k ( 1 − x p n q ) − ( n − k ) ] ≃ − x 2 2 {\displaystyle \Rightarrow {\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}\simeq -{\frac {x^{2}}{2}}} ⇒ ( n k ) p k q n − k ≃ 1 2 π n p q e ln [ ( 1 + x q n p ) − k ( 1 − x p n q ) − ( n − k ) ] ≃ 1 2 π n p q e − x 2 / 2 . {\displaystyle \Rightarrow {n \choose k}p^{k}q^{n-k}\simeq {\frac {1}{\sqrt {2{\mathbf {\pi } }npq}}}e^{\ln \left[{\left(1+x{\sqrt {\frac {q}{np}}}\right)}^{-k}{\left(1-x{\sqrt {\frac {p}{nq}}}\right)}^{-\left(n-k\right)}\right]}\simeq {\frac {1}{\sqrt {2{\mathbf {\pi } }npq}}}e^{{-x^{2}}/{2}}.} Possiamo ignorare i termini di grado maggiore del secondo, essendo x {\displaystyle x} proporzionale a ( k − n p ) {\displaystyle (k-np)} che tende a 0 {\displaystyle 0} al crescere di n {\displaystyle n} . Dunque, elevando al quadrato e dividendo per due x , {\displaystyle x,} si ha:
x 2 2 = ( ( k − n p ) n p q ) 2 2 = ( k − n p ) 2 2 n p q . {\displaystyle {\frac {x^{2}}{2}}={\frac {{\left({\frac {(k-np)}{\sqrt {npq}}}\right)}^{2}}{2}}={\frac {{\left(k-np\right)}^{2}}{2npq}}.} Quindi,
( n k ) p k ( 1 − p ) n − k ≃ 1 2 π n p ( 1 − p ) e − ( k − n p ) 2 / 2 n p ( 1 − p ) , {\displaystyle {n \choose k}p^{k}(1-p)^{n-k}\simeq {\frac {1}{\sqrt {2{\mathbf {\pi } }np(1-p)}}}e^{{-{\left(k-np\right)}^{2}}/{2np(1-p)}},} che è esattamente l'asserto che volevamo provare, infatti il termine a destra è una distribuzione gaussiana con media n p {\displaystyle np} e varianza n p ( 1 − p ) . {\displaystyle np(1-p).}
Sheldon M. Ross, Probabilità e statistica per l'ingegneria e le scienze , Trento, Apogeo, 2003, ISBN 88-7303-897-2 . Franco Flandoli, Teorema limite centrale (PDF ), su users.dma.unipi.it . URL consultato il 13 gennaio 2013 . limite centrale, teorema del , in Enciclopedia della Matematica , Istituto dell'Enciclopedia Italiana , 2013. (EN ) Richard Routledge, central limit theorem , su Enciclopedia Britannica , Encyclopædia Britannica, Inc. (EN ) Eric W. Weisstein, Teoremi del limite centrale , su MathWorld , Wolfram Research.