Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Ako sa stavia rozhodovacieho stromu databázy

Rozhodovacie stromy sú predmetom intenzívneho akademického štúdia v oblasti operačného výskumu a informatike . Aj keď nemusí byť nutne najlepší spôsob , ako štruktúrovať informácie potrebné dospieť k záveru , rozhodovacie stromy dobre pracovať so štandardnými počítačovými algoritmy pre podporu rozhodovania . Okrem toho , že poskytujú spôsob vyjadrenia obchodných pravidiel takým spôsobom , že ľudia bez predchádzajúcich skúseností s rozhodovacou stromy sú schopné sledovať . Rozhodovací strom je podobný diagramu , ktorý umožňuje navigáciu v dráhe možností , kým nie je dosiahnuté konečné záver . Veci , ktoré budete potrebovať
dát nastavený na " učenie " stromovú štruktúru
dát sada pre testovanie výsledného stromu
Zobraziť ďalšie inštrukcie Cestuj 1

Získať súbory dát , ktoré budú použité pre analýzu a verifikáciu konečné stromu . Ďalšie údaje použité v analýze prinesie presnejší strom zastúpenie rozhodovacieho procesu . Existuje mnoho rôznych spôsobov , ako vytvoriť a štruktúrovať rozhodovací strom . ID3 algoritmus je skorý prístup , na ktorého sofistikovanejšie varianty boli založené .
2

Zoznam všetkých atribútov , ktoré sú používané v súbore dát . Napríklad , v sade dát aplikácií bankový úver , záznam pre každého žiadateľa bude obsahovať atribúty , ako je meno , adresa , telefón , príjmy , hodnota domov , hypotéky , bankové a kreditné karty zostatkov .

- Li ručne vytvoriť rozhodovací strom , prirodzene vylúčiť atribúty , ako sú meno , ktoré by ste očakávať , že vplyv na rozhodnutie o poskytnutí úveru . Pri použití dolovania dát výpočtovej techniky , všetky atribúty sú považované , pričom počítačový program určiť tie , ktoré nemajú význam pre konečný výsledok .
3

Určte , ktorý atribút je atribút target . V príklade žiadosti o úver , cieľový atribút je ten , ktorý označuje , či úver bol poskytnutý alebo odmietnutý .
4

Vyberte atribút poskytnúť čo najväčšie informačné zisk pre použitie ako koreňový uzol . Strom sa skladá z rozhodovacích uzlov a koncové uzly . V rozhodovacích uzloch , pobočka je vytvorená pre každú možnú hodnotu cieľového atribútu . Každá pobočka predstavuje dátové záznamy , ktoré zdieľajú rovnakú hodnotu pre cieľový atribút .

List uzol je dosiahnuť, keď všetky záznamy , ktoré sa na aktuálnom uzle majú rovnaký výsledok pre cieľový atribút . V príklade úveru , ak každý , kto žiada o úver je schválený , celý rozhodovací strom je triviálne prípad jedného uzla , s žiadnymi pobočiek . To je viac pravdepodobné , že údaje budú rozdelené do dvoch vetiev : . Schválené a poprel

Výpočtové metódy zvolí atribút použiť v každom uzle stromu sú veľmi zložité . Pozrite sa na atribút , ktorý najsilnejšie predpovedá cieľovú výsledok . Intuitívne , " zisk " by bolo lepšie kandidát na koreňový uzol , než " krstné meno . "
5

Odobrať atribút koreňový zo zoznamu možností atribúty použiť pre uzly pobočky . Vyberte zostávajúce atribút s najväčšou informačné zisk priradiť uzly pobočiek .

V aktuálnom príklade , uzly pobočky na každom mieste v strome vytvorí konáre schválených a zamietnutých úverov . Tam môže byť ľubovoľný počet vetiev pochádzajúcich z uzla stromu rozhodnutie , v závislosti na tom , koľko je to možné hodnoty môžu byť priradené do cieľového atribútu .
6

postup opakujte po každom odbore , kým ste dosiahli list uzol , kde všetky dáta zdieľa rovnakú hodnotu pre cieľový atribút . Maximálna hĺbka stromu v ľubovoľnom mieste bude celkový počet znakov stanovených na začiatku .

Je pravdepodobné , že nie každý atribút je relevantné pre rozhodnutie v každom odbore , a tak niektoré vetvy budú kratšie . Akonáhle ste dokončili strom , prejsť to , aby si pravidlá , že odvodené . Napríklad , možno zistíte , že " pôžička bude schválená , ak máte vysoké príjmy , vysoké úspory a žiadny dlh . "
7

pomocou testovacích dát stanovenej pre overenie strom vytvorený . Strom by mal presne predpovedať výsledky v nových údajov .

Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené