Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky
generatívne alebo pravdepodobnosť na základe pokúšať sa zaradiť dátovej sady ako akési známe distribúcie , spoločné zoskupenie numerických dát . Tento druh algoritmus môže byť použitý iba na číselné údaje . Generatívne algoritmy prísť s niekoľkými výhradami . Problém môže byť neriešiteľný , ak údaje je povolené meniť príliš voľne . Generatívne algoritmy tiež predpokladať , že údaje stelesňuje známy distribúcie , čo nie je vždy pravda . Tieto typy algoritmov tiež neberú do úvahy " hluk " v dátach .
K - means clustering
K - means clustering bol jedným z prvých clustering metód byť vyvinuté . Je to jednoduché na prevedenie , ale má tú nevýhodu , že sú veľmi citlivé na východiskových vstupy . K - means clustering diela rozdelenie dát do náhodného súboru klastrov a recomputing stredy každý klaster a opakovanie procesu , kým je tam len jeden zhluk . Toto je známe ako konvergencia .
Fuzzy Clustering
Miesto identifikačné údaje , ktoré patrí do špecifickej skupiny , fuzzy zhlukovanie sa pokúša určiť , do akej miery údaje bod patrí do skupiny . Algoritmy , ktoré sa používajú k tomu Fuzzy zhlukovanie sú známe ako " C - means algoritmu . " Vo fuzzy clustering prístupu , dátový bod môže patriť k viac ako jednej skupine . Tento typ zhlukovaniu je užitočné , keď sa môžu dátových bodov musieť patriť k viac ako jednej skupine .
Aglomerativní Clustering
aglomerativní zhlukovaniu bola jedným z prvých clustering algoritmy sa vyvinuté . Zostáva v použití , ako je to tiež jeden z najjednoduchších algoritmov vyvinutých k dnešnému dňu . Aglomerativní clustering funguje tak , že sa každý jednotlivý dátový bod ako zoskupenia a zoskupenia s najviac podobným dátového bodu . Tento proces sa opakuje , až kým sa dáta " konverguje , " alebo je tam jeden veľký zhluk obsahuje všetky dáta . Tento proces môže byť tiež vykonané v opačnom smere s rovnakým účinkom . Od jedného klastra , všetky dáta môžu byť opakovane delia , až kým každý dátový bod je jeho vlastná klastra .