Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Data Mining & ETL procesov

výpočtového výkonu počítačov umožňuje výskumným pracovníkom a podnikom analyzovať dáta v zložitejších spôsobov , ako každý predtým . Data mining je proces pokúšať sa nájsť užitočné informácie v rozsiahlych dátových sád . ETL procesu data mining odkazuje na krokoch , ktoré sú údaje zaznamenané , kódovaných a zapísané do databázy pre neskoršiu analýzu . Definícia

dáta mining je definovaná ako proces analýzy dát a agregáciu do informácií , ktoré možno dať na užitočné účely . Dolovania dát proces zahŕňa vyhľadanie vzoriek v dátových sád , ktoré poskytujú kategorický informácie o tom , ako je množina dát organizovaná . Data mining môže byť použitý k analyzovať vzťah medzi takmer akékoľvek merateľné premenné , niekoľko reálnych aplikáciách dolovania dát zahŕňať analýzu marketingových stratégií , výrobných procesov a ľudskej tendencie správania. Termín ETL je skratka pre extraktu , transformáciu a zaťaženie . Extrakt , transformácie a načítanie odkazujú na tri procesy , ktorými je databázový systém vytvorený pre analýzu .
Ťažba

Prvým krokom pri vytváraní dátového skladu , ktorý môže byť ťaží pre analýzu je získať dáta z pôvodnej zdroj . Extrakčný postup sa líši v závislosti od typu údajov , ktorá sa ťaží . Niekedy sa extrakcie zahŕňa umiestnenie a načítanie podmnožinu dát z jedného alebo viacerých existujúcich databáz . V ostatných prípadoch , proces extrakcie vyžaduje pôvodnú výskum , ako je vyhľadávanie na webe pre stránky , ktoré obsahujú relevantné informácie .
Transform

Akonáhle príslušné dáta sa nachádza v proces extrakcie potom , že údaje musia byť manipulované tak , že môžu byť uložené v databáze pre neskoršiu analýzu . Proces zmeny dát od svojej pôvodnej podobe do legalizované forme sa nazýva transformácia . Transformácia môže zahŕňať ľubovoľný počet zmien údajov , vrátane relatívne jednoduché funkcie , ako je napríklad prevod písmen na malé a odstránenie interpunkčné znamienka zo znakových reťazcov . Proces transformácie môže tiež obsahovať viac zložité postupy , ako je vykonávanie aritmetických funkcií na zdrojových hodnôt , triedenie dát a overenie platnosti zdrojových dát . Cieľom fázy transformácie je vziať nerafinované Extrakcia dát a premeniť ju na údaje , ktoré sú užitočné pre dosiahnutie cieľov dolovanie dát projektu .
Zaťaženie

raz dáta sa transformujú do vhodného formátu , musia byť uložené v dátovom sklade . Fáza zaťaženie sa vzťahuje k procesu , ktorý sa transformuje údaje prihlásený do počítačovej databázy . Akonáhle informácie sú uložené v databáze , môže byť podrobený kvalitatívnej a kvantitatívnej analýzy k hľadaniu vzorov záujmu .

Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené