Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Ako rozvíjať kvalitu údajov metriky

Dátový sklad a dolovania dát nástroje uľahčujú extrahovať a analyzovať obrovské objemy informácií , ale kvalita analýzy je len tak dobrý , ako je kvalita údajov . Prvým krokom v každom výskumné štúdie alebo dátového skladu projektu musí byť posúdenie kvality údajov ísť do projektu . Opatrenia pre úplnosť , platnosť a konzistenciu všetky zaraďovať do tohto hodnotenia . Ak chcete vytvoriť kvalitné údaje metriky , musíte dodržiavať určité kroky . Pokyny dovolená 1

Vypracovať rámec pre meranie kvality dát . Vytvorte priestor , v každej databáze , kde môžu byť uložené výsledky kontrol kvality . Vypracovať správy alebo panelov z týchto údajov .
2

Opatrenia dát úplnosť . Vyberte kľúčové prvky v každej databáze a počítať percento hodnoty Null , prázdnych polí alebo hodnôt , ktoré predstavujú nedostupné alebo neznáma dáta .
3

Meranie percenta povolených hodnôt . Keď pole má niekoľko preddefinovaných hodnôt kódu , meranie rozloženia týchto hodnôt proti počtu chybných a chýbajúcich hodnôt . Analyzovať tieto distribúcia určiť , či niektoré kódy sa objavujú príliš často . Ak áno , môže byť potrebné túto hodnotu je potrebné rozdeliť pre lepší popis . Napríklad , v prípade , že odpovede sú čierne , biele a farebné a 98 % odpovedí je farba , to by mohlo dávať zmysel nahradiť farbu s červenou , modrou alebo zelenou .
4

Pozrite sa na rozumných hodnotách . Číselné hodnoty sa zvyčajne objaví v rámci povoleného rozsahu . Napríklad denné meranie teploty počasie Fahrenheit sa zvyčajne objavujú ako hodnota v rozmedzí od asi -40 do 120. Akákoľvek hodnota mimo tento rozsah je pravdepodobne neplatná .
5

Porovnanie hodnôt v rovnakom záznamu pre konzistenciu . Je teplota bola 90 Celzia a hodnoty zrážanie je sneh , jedna z dvoch hodnôt , je pravdepodobne chybné .
6

Kontrola konzistencie medzi súvisiacich záznamov . Použite podobných kontroly konzistencie medzi záznamami v vzťahy nadradenosti a podriadenosti , a v rámci viacerých položiek dieťa . Rodič a dieťa vzťahy sú vzťahy medzi databázových prvkov . Napríklad , v mnohých časovo súvisiace s predmetmi , v prípade , že súbor hodinových zoznamu teplota meranie teploty stále rastie 50-70 stupňov po celej ráno , ale 10 hodín čítania je -20 , táto hodnota je pravdepodobne chybné . Celým
7

Vytváranie správ , panelov alebo oznámenia na základe zhromaždených údajov . Zhrnúť by organizačné skupiny , dodávateľa alebo typ zákazníka sa schopnosťou prechádzať na konkrétne dátové prvky . Analýza dát na určenie , kde dochádza k chybám , a to , čo sa dá urobiť pre zlepšenie kvality dát .
8

Zlepšiť kvalitu dát . Revidovať obchodné pravidlá , oprava softvér odmietnuť zlé údaje , informovať zákazníkov o problematike dátových a nájsť spôsob , ako odmeniť kvalitnú iniciatívy . Monitor týchto meraní v priebehu času .

Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené