Web Analytics Made Easy - Statcounter

[HOME PAGE] [STORES] [CLASSICISTRANIERI.COM] [FOTO] [YOUTUBE CHANNEL]

Teorema del l??mit central - Viquip??dia

Teorema del l??mit central

De Viquip??dia

En matem??tiques, el Teorema del l??mit central (o Teorema central del l??mit) indica que la distribuci?? de la suma estandarditzada de variables aleat??ries independents que tenen una vari??ncia finita tendeix a una distribuci?? normal est??ndard quan el nombre de termes de la suma creix indefinidament. Com a conseq????ncia d'aquest teorema, s'explica el fet que moltes variables aleat??ries siguin aproximadament normals i justifica la import??ncia te??rica i pr??ctica de la distribuci?? normal.

Aquest teorema, pertanyent a la Teoria de la probabilitat, troba aplicaci?? en molts camps relacionats, com ara l'Estad??stica inferencial o la Teoria de renovaci??.

Taula de continguts

[edita] Teorema

[edita] Enunciat

Existeixen diverses versions del teorema (segons les hip??tesis escollides). L'enunciat m??s simple ??s aquest :

Teorema de Lindeberg-L??vy:

Donada una successi?? (X_n)_{\,n\, \in\, \mathbb{N}^\ast} de variables aleat??ries (definides sobre el mateix espai de probabilitat) independents i id??nticament distribu??des (abreujadament i.i.d), amb vari??ncia finita, es posa :

\ \mu = \operatorname{E}(X_n) i \sigma = \sqrt{\operatorname{Var}(X_n)} , on se suposa que ?? ??s diferent de 0.

Si es defineix per a tot n :

\overline{X_n} = \frac{X_1 + \cdots + X_n}{n} i
\overline{X_n}\,^\ast =\frac{\overline{X_n} - \operatorname{E}\left(\overline{X_n}\right)}{\sqrt{\operatorname{Var}\left(\overline{X_n}\right)}} = \frac{\overline{X_n} - \mu}{\left(\frac{\sigma}{\sqrt{n}}\right)} (variable aleat??ria estandarditzada associada a \overline{X_n} )

aleshores la successi?? \Big(\overline{X_n}\,^\ast\Big)_{\,n\, \in\, \mathbb{N}^\ast} convergeix en distribuci?? cap a una variable aleat??ria normal est??ndard.
Altrament dit :

\forall\, t \in \mathbb{R}, \mathbb{P}\left(\overline{X_n}\,^\ast \leq t\right) \to \Phi(t) quan n \to +\infty (vegeu l??mit d'una successi??),

on ?? ??s la funci?? de distribuci?? normal : per a tot real t,

\ \Phi(t) = \int_{-\infty}^{\,t}\frac{1}{\sqrt{2\,\pi}}\,\mathrm{e}^{-\frac{u^2}{2}}\, du .

Remarca : un enunciat lleugerament diferent (per?? equivalent) ??s aquest, amb les mateixes hip??tesis :

Si es defineix per a tot n :

S_n = X_1 + \cdots + X_n i
S_n^\ast =\frac{S_n - \operatorname{E}\left(S_n\right)}{\sqrt{\operatorname{Var}\left(S_n\right)}} = \frac{S_n - n\,\mu}{\sigma\, \sqrt{n}} (variable aleat??ria estandarditzada associada a Sn)

aleshores la successi?? \left(S_n^\ast\right)_{\,n\, \in\, \mathbb{N}^\ast} convergeix en distribuci?? cap a una variable aleat??ria normal est??ndard.

Altrament dit :

\forall\, t \in \mathbb{R}, \mathbb{P}\left(S_n^\ast \leq t\right) \to \Phi(t) quan n \to +\infty.

(en efecte, ??s clar que per a tot n, S_n^\ast = \overline{X_n}\,^\ast ).

[edita] Interpretaci??

En estad??stica, el teorema del l??mit central s'interpreta i s'utilitza aix?? : sigui X1, X2, ..., Xn una mostra aleat??ria de mida n d'una distribuci?? amb mitjana ?? i vari??ncia ??2 finites (?? ??? 0).

Llavors, si n ??s suficientment gran (una condici?? freq??ent ??s : n \geq 30) :

  • la variable aleat??ria \overline{X} =\frac{1}{n}\sum_{i=1}^{n}X_i (mitjana mostral) t?? aproximadament una distribuci?? normal amb mitjana \mu_{\overline{X}} = \mu i vari??ncia \sigma_{\overline{X}}^2 = \sigma^2 / n ;
  • tamb?? es compleix que la variable aleat??ria S = X_1 + \cdots + X_n t?? aproximadament una distribuci?? normal amb mitjana \mu_S = n\, \mu i vari??ncia {\sigma_S}^2 = n \sigma^2 .

Com m??s gran sigui el valor de n, millor ser?? l'aproximaci??. L'aproximaci?? entre les dues distribucions ??s, en general, major en el centre que en els extrems o cues, motiu pel qual s'anomena "Teorema del l??mit central" ("central" fa refer??ncia al l??mit de la successi?? estandarditzada, m??s que no al teorema).

[edita] Import??ncia pr??ctica

Aquesta propietat d'aproximaci?? t?? aplicacions pr??ctiques importants. Sovint, no es coneix la distribuci?? "exacta" d'una variable aleat??ria, per?? es pot aproximar per una distribuci?? normal ; fins i tot quan es coneix la distribuci?? exacta, pot resultar m??s senzill aproximar-la per una distribuci?? normal ??? sempre que sigui justificat.

[edita] Demostraci?? del teorema de Lindeberg-L??vy

Per demostrar aquest teorema, s'utilitza les funcions caracter??stiques i el teorema de continu??tat de L??vy.

[edita] Il??lustraci?? gr??fica

Una densitat de probabilitat
Una densitat de probabilitat

[edita] Densitat de probabilitat inicial

La densitat de probabilitat f1 representada aqu?? ??s discont??nua i no t?? cap simetria. Si una variable aleat??ria segueix la distribuci?? definida per aquesta densitat, aleshores la seva mitjana ??s 0 i la seva vari??ncia ??s 1.

Considerem aqu?? variables aleat??ries independents i id??nticament distribu??des X1, X2, X3 ... que segueixen la distribuci?? definida per aquesta densitat.


Densitat de la suma de dues variables
Densitat de la suma de dues variables

[edita] Suma de dues variables aleat??ries

Despr??s determinem (per convoluci?? de f1 per f1) la densitat f2 de S2 = X1 + X2.

La densitat de probabilitat representada ??s la de la variable aleat??ria estandarditzada S_2^\ast associada a S2.

Aquesta densitat ja ??s m??s regular (m??s "llisa") que la densitat inicial. Tanmateix, s'hi veuen punts angulosos.


Densitat de la suma de tres variables
Densitat de la suma de tres variables

[edita] Suma de tres variables aleat??ries

Despr??s determinem (per convoluci?? de f1 per f2) la densitat f3 de S3 = X1 + X2 + X3.

La densitat de probabilitat representada ??s la de la variable aleat??ria estandarditzada S_3^\ast associada a S3.

Aquesta densitat ??s encara m??s regular que la precedent.


Densitat de la suma de quatre variables
Densitat de la suma de quatre variables

[edita] Suma de quatre variables aleat??ries

Finalment, determinem (per convoluci?? de f1 per f3) la densitat f4 de S4 = X1 + X2 + X3 + X4.

La densitat de probabilitat representada ??s la de la variable aleat??ria estandarditzada S_4^\ast associada a S4.

A ull nu, no es pot distingir aquesta densitat de la densitat normal est??ndard.

[edita] Cas particular : el teorema de De Moivre-Laplace

Aquest cas particular del teorema del l??mit central en va ser hist??ricament la primera atestaci??.

S'enuncia aix?? :

Sigui una successi?? (X_n)_{\,n\, \in\, \mathbb{N}^\ast} de variables aleat??ries de Bernoulli independents amb par??metre (com??) p, on 0 < p < 1 . Per a tot n,

\operatorname{E}(X_n) = p\, \text{ i }\,\operatorname{Var}(X_n) = p\, (1 - p) s??n finites.

El teorema del l??mit central ??s aplicable. Si es defineix per a tot n :

\overline{X_n} = \frac{X_1 + \cdots + X_n}{n} i
\overline{X_n}\,^\ast =\frac{\overline{X_n} - \operatorname{E}\left(\overline{X_n}\right)}{\sqrt{\operatorname{Var}\left(\overline{X_n}\right)}} = \frac{\overline{X_n} - p}{\sqrt{\frac{p\, (1 - p)}{n}}} (variable aleat??ria estandarditzada associada a \overline{X_n} )

aleshores la successi?? \Big(\overline{X_n}\,^\ast\Big)_{\,n\, \in\, \mathbb{N}^\ast} convergeix en distribuci?? cap a una variable aleat??ria normal est??ndard.


O encara, si es defineix per a tot n :

S_n = X_1 + \cdots + X_n i
S_n^\ast =\frac{S_n - \operatorname{E}(S_n)}{\sqrt{\operatorname{Var}(S_n)}} = \frac{S_n - n\,p}{\sqrt{n\,p\,(1 -p)}} (variable aleat??ria estandarditzada associada a Sn)

aleshores la successi?? (S_n^\ast)_{\,n\, \in\, \mathbb{N}^\ast} convergeix en distribuci?? cap a una variable aleat??ria normal est??ndard.

De Moivre va estudiar el cas de les variables aleat??ries de Bernoulli amb par??metre p = \frac{1}{2} (joc de cara o creu) i Laplace el va generalitzar ulteriorment.

[edita] Interpretaci??

Si n ??s suficientment gran, la variable aleat??ria

S = X_1 + \cdots + X_n

t?? aproximadament una distribuci?? normal amb mitjana \mu_S = n\, p i vari??ncia {\sigma_S}^2 = n\, p\, (1 -p) .

Com que S segueix exactament la distribuci?? binomial de par??metres n i p, el teorema de De Moivre-Laplace es pot interpretar en termes d'aproximaci?? de la distribuci?? binomial \mathcal{B}(n,\, p) per la distribuci?? normal \mathcal{N}(n\, p,\, n\, p\, (1 - p)) .

Remarca :
Si n ??s suficientment gran, la variable aleat??ria \overline{X_n} t?? aproximadament una distribuci?? normal amb mitjana \ p i vari??ncia \frac{p\, (1 - p)}{n}.

En estad??stica inferencial, es pot utilitzar aquesta aproximaci?? per construir intervals de confian??a per a una proporci?? desconeguda p.

[edita] Aplicaci?? : simulaci?? de la distribuci?? normal est??ndard

Sigui una successi?? (X_n)_{\,n\, \in\, \mathbb{N}^\ast} de variables aleat??ries independents i id??nticament distribu??des amb distribuci?? uniforme cont??nua sobre l'interval [0, 1]. Se sap que per a tot n,

\operatorname{E}(X_n) = \frac{1}{2}\, \text{ i }\,\operatorname{Var}(X_n) = \frac{1}{12} s??n finites.

El teorema del l??mit central ??s aplicable. Si es defineix per a tot n :

S_n = X_1 + \cdots + X_n i
T_n = S_n^\ast =\frac{S_n - \operatorname{E}\left(S_n\right)}{\sqrt{\operatorname{Var}\left(S_n\right)}} = \frac{S_n - \frac{n}{2}}{\sqrt{\frac{n}{12}}} ,

aleshores la successi?? (T_n)_{\,n\, \in\, \mathbb{N}^\ast} convergeix en distribuci?? cap a una variable aleat??ria normal est??ndard. Tenint en compte la simetria de la distribuci?? uniforme cont??nua sobre l'interval [0, 1], la converg??ncia ??s molt r??pida : es considera que a partir del valor n = 12, l'aproximaci?? de la distribuci?? de Tn per la distribuci?? normal est??ndard ??s excel??lent ; en particular, es pot considerar que la distribuci?? de

T_{12} = S_{12} - 6 = X_1 + \cdots + X_{12} - 6

??s pr??cticament normal est??ndard.

En un llenguatge de programaci?? on existeix un generador de nombres pseudoaleatoris (sovint anomenat "random") simulant una variable aleat??ria amb distribuci?? uniforme cont??nua sobre l'interval [0, 1], ??s f??cil simular una variable aleat??ria (pr??cticament) normal est??ndard. Heus aqu?? un algorisme en Pascal :

T := - 6.0 ;
for k := 1 to 12 do T : = T + random ;

La variable T, que simula la variable aleat??ria T12 , ??s (pr??cticament) normal est??ndard.

[edita] Contraexemple

En totes les versions del teorema del l??mit central, es suposa l'exist??ncia de la vari??ncia (finita) de cadascuna de les variables aleat??ries de la successi??.

Sigui una successi?? (X_n)_{\,n\, \in\, \mathbb{N}^\ast} de variables aleat??ries independents i id??nticament distribu??des amb distribuci?? de Cauchy sim??trica \mathcal{C}(0,\, \gamma) ; no tenen ni mitjana ni vari??ncia.

Aleshores, per a tot n, la variable aleat??ria

\overline{X_n} = \frac{X_1 + \cdots + X_n}{n}

segueix la mateixa distribuci?? de Cauchy \mathcal{C}(0,\, \gamma) que cadascuna de les variables aleat??ries X_1,\, X_2, \dots (??s f??cil demostrar-ho mitjan??ant les funcions caracter??stiques): no hi ha converg??ncia cap a una distribuci?? normal.

[edita] Vegeu tamb??

[edita] Refer??ncies

  • De Moivre (Abraham) ??? The Doctrine of Chances, or a Method of Calculating the Probabilities of Events in Play. ??? London, 1756
  • Laplace (Pierre-Simon) ??? Th??orie analytique des probabilit??s. ??? Paris, 1812
  • Feller (William) ??? An Introduction to Probability Theory and Its Applications. (vol. 2) ??? New York, 1971. John Wiley & Sons

[edita] Enlla??os externs