Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Ako sa vám klastra dát o odbere vzoriek Distribúcia Bližšie k Mean

? Inferenčných štatistiky je proces odhadovanie premennej v populácii na základe známych údajov z menšieho množstva vzorky tejto populácie . Aby presných odhadov ktoré majú byť vykonané , strednej a distribúcia vzorky by mala byť čo najbližšie k počtu obyvateľov , z ktorého je prijaté . Existuje niekoľko krokov , ktoré môžete podniknúť na tento účel . Pokyny dovolená 1

Použite veľké veľkosti vzorky ako čas a finančné prostriedky dovolia . Ak použijete menšiu veľkosť vzorky , to je viac pravdepodobné , že váš príklad bude zoskupovať okolo strednej hodnoty , ktorá nepredstavuje vašu populáciu . Naopak , väčšia je vzorka , tým väčšia je pravdepodobnosť , že bude štatisticky odpovedať populáciu .
2

Použite náhodný výber . V ideálnom prípade by každý dátový bod v populácii by mal mať rovnakú šancu , že skončí vo vašom vzorke . Ak tomu tak nie je , bude vaša odhady byť skreslená . Napríklad , ak chcete odhadnúť priemernú čistú hodnotu ľudí vo vašej krajine , a vy len zbierať vzorové údaje z najbohatší mesta , váš príklad bude s najväčšou pravdepodobnosťou v priebehu odhadnúť populácie znamenať .
3

Odstrániť odľahlých hodnôt . Outlier je dátový bod , ktorý sa nachádza ďaleko od hlavného klastra . Aj keď predstavujú legitímne dátové body zo svojho vzorky , možno budete chcieť , aby ich odstránenie v niektorých prípadoch , ako keď váš veľkosť vzorky je pomerne malý , alebo ak z nejakého dôvodu musíte namiesto toho použiť priemer iného opatrenia centrálnej tendencie ako medián . Napríklad , ak vaše čisté imanie prieskumu zahrnutých 10 osôb - 9 strednú triedu , a Bill Gates - váš odhad priemernej mzdy bude pravdepodobne nadsadené , takže môžete čeliť tým , že odstránením outlier
klipart .

Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené