Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky
Získať súbory dát , ktoré budú použité pre analýzu a verifikáciu konečné stromu . Ďalšie údaje použité v analýze prinesie presnejší strom zastúpenie rozhodovacieho procesu . Existuje mnoho rôznych spôsobov , ako vytvoriť a štruktúrovať rozhodovací strom . ID3 algoritmus je skorý prístup , na ktorého sofistikovanejšie varianty boli založené .
2
Zoznam všetkých atribútov , ktoré sú používané v súbore dát . Napríklad , v sade dát aplikácií bankový úver , záznam pre každého žiadateľa bude obsahovať atribúty , ako je meno , adresa , telefón , príjmy , hodnota domov , hypotéky , bankové a kreditné karty zostatkov .
- Li ručne vytvoriť rozhodovací strom , prirodzene vylúčiť atribúty , ako sú meno , ktoré by ste očakávať , že vplyv na rozhodnutie o poskytnutí úveru . Pri použití dolovania dát výpočtovej techniky , všetky atribúty sú považované , pričom počítačový program určiť tie , ktoré nemajú význam pre konečný výsledok .
3
Určte , ktorý atribút je atribút target . V príklade žiadosti o úver , cieľový atribút je ten , ktorý označuje , či úver bol poskytnutý alebo odmietnutý .
4
Vyberte atribút poskytnúť čo najväčšie informačné zisk pre použitie ako koreňový uzol . Strom sa skladá z rozhodovacích uzlov a koncové uzly . V rozhodovacích uzloch , pobočka je vytvorená pre každú možnú hodnotu cieľového atribútu . Každá pobočka predstavuje dátové záznamy , ktoré zdieľajú rovnakú hodnotu pre cieľový atribút .
List uzol je dosiahnuť, keď všetky záznamy , ktoré sa na aktuálnom uzle majú rovnaký výsledok pre cieľový atribút . V príklade úveru , ak každý , kto žiada o úver je schválený , celý rozhodovací strom je triviálne prípad jedného uzla , s žiadnymi pobočiek . To je viac pravdepodobné , že údaje budú rozdelené do dvoch vetiev : . Schválené a poprel
Výpočtové metódy zvolí atribút použiť v každom uzle stromu sú veľmi zložité . Pozrite sa na atribút , ktorý najsilnejšie predpovedá cieľovú výsledok . Intuitívne , " zisk " by bolo lepšie kandidát na koreňový uzol , než " krstné meno . "
5
Odobrať atribút koreňový zo zoznamu možností atribúty použiť pre uzly pobočky . Vyberte zostávajúce atribút s najväčšou informačné zisk priradiť uzly pobočiek .
V aktuálnom príklade , uzly pobočky na každom mieste v strome vytvorí konáre schválených a zamietnutých úverov . Tam môže byť ľubovoľný počet vetiev pochádzajúcich z uzla stromu rozhodnutie , v závislosti na tom , koľko je to možné hodnoty môžu byť priradené do cieľového atribútu .
6
postup opakujte po každom odbore , kým ste dosiahli list uzol , kde všetky dáta zdieľa rovnakú hodnotu pre cieľový atribút . Maximálna hĺbka stromu v ľubovoľnom mieste bude celkový počet znakov stanovených na začiatku .
Je pravdepodobné , že nie každý atribút je relevantné pre rozhodnutie v každom odbore , a tak niektoré vetvy budú kratšie . Akonáhle ste dokončili strom , prejsť to , aby si pravidlá , že odvodené . Napríklad , možno zistíte , že " pôžička bude schválená , ak máte vysoké príjmy , vysoké úspory a žiadny dlh . "
7
pomocou testovacích dát stanovenej pre overenie strom vytvorený . Strom by mal presne predpovedať výsledky v nových údajov .
Copyright © počítačové znalosti Všetky práva vyhradené