Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Čistenie dát Stratégia

Dáta môžu byť poškodené v mnohých rôznymi spôsobmi , od vstupných chýb užívateľov k formátovanie nezrovnalosti . Duplikáty sú jedným z najčastejších dátových problémov v databázach väčšiny spoločností . Najlepší spôsob , ako zabezpečiť presnosť údajov je , aby sa zabránilo korupcii , ale je rozumné mať plán , ako riešiť problémy s údajmi by mali nastať problémy . Duplikácia

duplicity môže byť frustrujúce vec vidieť ako dátový audítorom . Často , môže obrazovka údaje front - end nie je zachytiť určité typy duplikátov , napríklad , v tabuľky adries , je 123 Main Street a 123 Main St Zdá sa , že dve samostatné adresy , keď v skutočnosti sú rovnaká adresa < . br >

To možno vyriešiť pomocou jednej z dvoch metód : Odstránenie dát alebo korekcie dát . Odstránenie dát by znamenalo vymazanie všetkých ale jednu inštanciu sady duplikátov , zatiaľ čo dáta korekcia by sa aktualizovať všetky inštancie duplikácia na jednom dohodnutej hodnoty . Softvérové ​​balíky sú k dispozícii , ktoré používajú algoritmus pre identifikáciu odľahlých hodnôt na základe smerodajnej odchýlky , klastrov alebo iných kritérií , potom odľahlej hodnoty sú vyhodnocované expert predmetu zákazky , ktorý určuje osud nečakanom vstupe .
Extrakty , Transform , Load

extrakt , transformovať , zaťaženie , alebo ETF , je bežne používaný spôsob , ako sa pohybovať a čisté údaje . Zatiaľ čo bez ručného čistenia dochádza , sú automatizované úlohy v preklade fáze . Napríklad , v prípade , že zdroj tabuľka ukladá " M " a " F " a cieľ tabuľka ukladá " mužské " a " ženské " , skript je spustený previesť dáta do novej hodnoty .

Akonáhle dát sa čistí a overená , môže byť dovezené do cieľovej tabuľky . To môže tiež byť importované nad starými dátami prepísať údaje . To funguje dobre , keď celý stĺpec údajov v tabuľke je potrebné zmeniť .
Aktualizácia starších systémov

Aktualizácia staršej verzie systému obvykle zahŕňa presunutie dát do strednej polohy , alebo pracovnej oblasti , kde sa potom podstúpi automatizované aj ručné čistenie dát koleso . To sa vykonáva , aby sa zabránilo robiť žiadne nevratné chyby na dáta staršie pred importom do nového systému . Je potrebné poznamenať , že údaje o starší by nemali byť aktualizovaný , v súlade s informáciou - management.com , aby sa zabránilo zachovania dvoch samostatných súborov dát . To by malo byť v dôchodku , miesto a nový systém by mal byť jediný v prevádzke do budúcnosti .

Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené