Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky
Použite veľké veľkosti vzorky ako čas a finančné prostriedky dovolia . Ak použijete menšiu veľkosť vzorky , to je viac pravdepodobné , že váš príklad bude zoskupovať okolo strednej hodnoty , ktorá nepredstavuje vašu populáciu . Naopak , väčšia je vzorka , tým väčšia je pravdepodobnosť , že bude štatisticky odpovedať populáciu .
2
Použite náhodný výber . V ideálnom prípade by každý dátový bod v populácii by mal mať rovnakú šancu , že skončí vo vašom vzorke . Ak tomu tak nie je , bude vaša odhady byť skreslená . Napríklad , ak chcete odhadnúť priemernú čistú hodnotu ľudí vo vašej krajine , a vy len zbierať vzorové údaje z najbohatší mesta , váš príklad bude s najväčšou pravdepodobnosťou v priebehu odhadnúť populácie znamenať .
3
Odstrániť odľahlých hodnôt . Outlier je dátový bod , ktorý sa nachádza ďaleko od hlavného klastra . Aj keď predstavujú legitímne dátové body zo svojho vzorky , možno budete chcieť , aby ich odstránenie v niektorých prípadoch , ako keď váš veľkosť vzorky je pomerne malý , alebo ak z nejakého dôvodu musíte namiesto toho použiť priemer iného opatrenia centrálnej tendencie ako medián . Napríklad , ak vaše čisté imanie prieskumu zahrnutých 10 osôb - 9 strednú triedu , a Bill Gates - váš odhad priemernej mzdy bude pravdepodobne nadsadené , takže môžete čeliť tým , že odstránením outlier
klipart .
Copyright © počítačové znalosti Všetky práva vyhradené