Ano ang central limit theorem?

Ano ang central limit theorem?
Anonim

Sagot:

Ang gitnang limitasyon teorema ay gumagawa ng mahigpit na intuitive na ideya na ang mga pagtatantya ng ibig sabihin (tinatayang mula sa ilang sample) ng ilang pagsukat na nauugnay sa ilang populasyon ay nagpapabuti ng laki ng sample increases.

Paliwanag:

Isipin ang kagubatan na naglalaman ng 100 puno.

Ngayon isipin na (sa halip unrealistically) na, sinusukat sa metro, isang-kapat ng mga ito ay may isang taas ng 2, isang-kapat ng mga ito ay may taas ng 3, isang isang-kapat ng mga ito ay may taas ng 4, at isang-kapat ng mga ito ay may isang taas ng 5.

Isipin ang pagsukat ng taas ng bawat puno sa kagubatan, at paggamit ng impormasyon upang bumuo ng isang histogram na may mga sukat na angkop na binili (hal. 1.5 hanggang 2.5, 2.5-3.5, 3.5 hanggang 4.5, at 5.5 hanggang 6.5; Napagtanto ko na hindi ko tinukoy ang bin kung saan nabibilang ang mga hangganan ngunit hindi mahalaga dito).

Maaari mong gamitin ang histogram upang matantya ang probabilidad ng pamamahagi ng mga puno. Maliwanag, hindi ito magiging isang normal.Sa katunayan, ang pagbibigay ng mga punto ng pagtatapos ay napili nang naaangkop, magiging isang unipormeng isa dahil magkakaroon ng pantay na bilang ng mga puno na tumutugma sa isa sa tinukoy na taas sa bawat bin.

Ngayon isipin ang pagpunta sa kagubatan at pagsukat ng taas ng dalawang puno lamang; kalkulahin ang ibig sabihin ng taas ng dalawang puno na ito at gumawa ng tala nito. Ulitin ang operasyon nang maraming beses, upang magkakaroon ka ng isang koleksyon ng mga ibig sabihin ng mga halaga para sa mga sample ng laki 2. Kung ikaw ay magplot ng isang histogram ng mga pagtatantya ng ibig sabihin, hindi na ito magiging pare-pareho. Sa halip, sa ay malamang na magkakaroon ng mas maraming measurements (mga pagtatantya ng ibig sabihin batay sa mga sample ng laki 2) malapit sa pangkalahatang mean taas ng lahat ng mga puno sa kagubatan (sa partikular na kaso,

#(2 + 3 + 4 + 5)/4 = 3.5# metro).

Tulad ng marami pang iba mga pagtatantya ng ibig sabihin malapit sa ibig sabihin ng tunay na populasyon (na kung saan ay kilala sa hindi makatotohanang halimbawa), kaysa sa malayo mula sa ibig sabihin, ang hugis ng bagong histogram na ito ay mas malapit sa isang normal na pamamahagi (na may tugatog na malapit sa ibig sabihin).

Ngayon isipin ang pagpunta sa gubat at paulit-ulit ang ehersisyo maliban na sukatin mo ang taas ng 3 puno, pagkalkula ng ibig sabihin sa bawat kaso, at paggawa ng isang tala ng ito. Ang histogram na gagawin mo ay magkakaroon ng higit pang mga pagtatantya ng ibig sabihin ng malapit sa tunay na ibig sabihin, na may mas mababa na pagkalat (ang pagkakataon ng pagpili ng tatlong puno sa anumang sample na tulad na lahat sila ay nanggaling sa alinman sa mga grupo ng pagtatapos --- alinman sa napaka matangkad o masyadong maikli --- ay mas mababa kaysa sa pagpili ng tatlong puno na may seleksyon ng mga taas). Ang hugis ng iyong histogram na binubuo ng isang pagtatantya ng ibig sabihin ng laki (ang bawat ibig sabihin ay batay sa tatlong sukat) ay magiging mas malapit sa na ng isang normal na pamamahagi at ang katumbas na karaniwang paglihis (ng mga pagtatantya ng ibig sabihin, hindi ng populasyon ng magulang) ay magiging mas maliit.

Ulitin ito para sa mga 4, 5, 6, atbp, mga puno sa bawat ibig sabihin, at ang histogram na iyong itatayo ay magiging mas katulad ng isang normal na pamamahagi (na may mas malaki na laki ng sample), na ang ibig sabihin ng pamamahagi ng ang mga pagtatantya ng ibig sabihin na mas malapit sa tunay na ibig sabihin, at ang karaniwang paglihis ng mga pagtatantya ng ibig sabihin ay nagiging mas makitid at mas makitid.

Kung ulitin mo ang ehersisyo para sa (dalisdis) na kaso kung saan ang lahat ng mga puno ay sinusukat (sa ilang mga pagkakataon, na gumagawa ng isang tala ng ibig sabihin sa bawat kaso), pagkatapos ay ang histogram ay magkakaroon ng mga pagtatantya ng ibig sabihin lamang sa isa sa mga sis (ang isang nararapat sa tunay na ibig sabihin), nang walang anumang pagkakaiba-iba upang ang karaniwang paglihis ng (ang pamamahagi ng probabilidad mula sa tinatayang) na ang "histogram" ay magiging zero.

Kaya, ang gitnang limitasyon ng teorema ay tumutukoy na ang ibig sabihin ng ilang mga pagtatantya ng ibig sabihin ng ilang populasyon na asymptotically ay nalalapit sa tunay na ibig sabihin, at ang karaniwang paglihis ng pagtantya ng ibig sabihin (kaysa sa karaniwang paglihis ng pamamahagi ng populasyon ng magulang) ay nagiging mas maliit para sa mas malaking laki ng sample.