* počítačové znalosti >> otázka >> PC Riešenie problémov >> .

Top 10 Algoritmy v dolovania dát

Data mining je proces analýzy a zhrnutie dát z rôznych perspektív . Snaží sa definovať dátové štruktúry a vzťahy naprieč veľkými bazénmi informácií pomocou algoritmov --- sady pravidiel , ktorá rieši problém , cez sériu konkrétnych krokov ( myslím , že Euclidean algoritmus v algebre , ktorá nájde dve čísla " najväčší spoločný deliteľ ) . 2006 IEEE medzinárodná konferencia na dolovanie dát zaradil 10 najlepších algoritmov v odbore . Rozhodovacie stromy

Rozhodnutie strom algoritmy majú za cieľ usporiadať údaje o konkurenčných volieb do vetiev vplyvu po počiatočnom rozhodnutí . Kmeň stromu predstavuje počiatočné rozhodnutie , a to začína áno - alebo - nie otázky , ako či jesť raňajkách . Stravovanie raňajky a nie jesť raňajkách by prvé dva rozdielne vetvy stromu , a každá voľba potom by mať vlastnú rozchádzajúce vetvy vedúce až ku koncovému bodu .
K - means algoritmus

k - means algoritmus je založený na analýze klastra . Jej cieľom je rozbiť zhromaždené dáta do samostatných " klastrov " , zoskupených podľa podobnej povahy .
Support Vector Machines

Podpora Vector Machine algoritmy vstupné dáta a predvídať ktorý z dvoch možných kategórií , ktoré zahŕňajú vstupné dáta . Príkladom by mohol byť zber zips kódy bazéna voličov a snaží sa predpovedať , či dať volič je demokrat alebo republikán .
Apriori algoritmus

Apriori algoritmus zvyčajne sleduje transakčných dát . Napríklad , v obchode s oblečením , algoritmus mohol sledovať , ktorá košele zákazníci spravidla nakupujú spoločne .
EM algoritmus

Tento algoritmus definuje parametre , na základe analýzy dát a predpovedá pravdepodobnosť budúceho výsledku alebo náhodnej udalosti v rámci parametrov dát . Napríklad , EM algoritmus by sa mohol pokúsiť predpovedať čas nasledujúcej erupcie gejzíru na základe časových údajov z minulých erupcií .
PageRank algoritmus

PageRank algoritmus je základom algoritmu pre vyhľadávače . Radí sa a odhaduje relevantnosti jedného kusu dát v rámci väčšieho súboru dát , ako sú jediné internetové stránky v rámci väčšieho súboru všetkých webových stránok na internete .
AdaBoost Algoritmus

Adaboost algoritmus pracuje v iných algoritmov , ktoré predvídajú správanie na základe pozorovaných dát tak , aby boli viac citlivé na štatistické odľahlých hodnôt . Hoci EM algoritmus môže byť skreslený tým , gejzír , ktorý má dva výbuchy za menej ako minútu , keď to zvyčajne prepuká raz denne , algoritmus Adaboost by vyladiť výstup EM algoritmus je analýzou relevantnosti bradlá .

K - algoritmu najbližšieho suseda

Tento algoritmus rozpoznáva vzorca v umiestnení dát a spolupracovníkmi , že dáta s väčšou identifikátorom . Napríklad , ak ste chceli priradiť poštu každej domácnosti geografickej oblasti a mal dátový fond každej domácnosti zemepisnej oblasti , k - algoritmu najbližšieho suseda by priradiť domovy na najbližšej pošte na základe ich blízkosti k sebe navzájom .
Naivný Baya

Naive Bayes algoritmus predpovedá výsledok totožnosti na základe údajov od známych pozorovania. Napríklad , ak je človek g stôp šesť palcov vysoký a nosí veľkosť 14 topánky , Naive Bayes algoritmus by sa predpovedať s určitou pravdepodobnosťou , že osoba je muž .
Košíku Algoritmus

" košíka " je skratka pre " Klasifikácia a Regresná strom " analýzy . Rovnako ako analýza rozhodovacieho stromu organizuje údaje na základe konkurenčných možností , napríklad či osoba prežila zemetrasenie ? Na rozdiel od rozhodovacích stromov algoritmov , ktoré možno klasifikovať iba výsledok , alebo dávajú regresia založená na numerickej výsledky , CART algoritmus možno použiť ako predpovedať pravdepodobnosť udalosti .

Predchádzajúca strana: Prečo sú všetky moje prehliadače tak pomalý ?
Ďalšia strana: Ako analyzovať API Feed Google Base

Top 10 Algoritmy v dolovania dát

Odporúčané články

Najnovšie články

PC Riešenie problémov

otázka