Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky
* Štruktúrované údaje: Toto sú údaje usporiadané v preddefinovanom formáte, ľahko prístupné a analyzované tradičnými databázovými systémami. Príklady zahŕňajú:
* Relačné databázy (RDBMS): Dáta uložené v tabuľkách s riadkami a stĺpcami (napr. MySQL, Postgresql, Oracle, SQL Server).
* tabuľky: Údaje usporiadané v riadkoch a stĺpcoch (napr. Súbory Excel).
* CSV (hodnoty oddelené čiarky): Jednoduché textové súbory s údajmi oddelenými čiarkami.
* XML (Extensible Markup Language) a JSON (NOTATION JAVASCRIPT NOTATION): Dáta formátované pomocou značiek alebo párov kľúč-hodnota.
* protokoly transakcií: Záznamy o obchodných transakciách.
* pološtrukturované údaje: Údaje, ktoré nie sú v súlade so štruktúrou tuhej tabuľky, ale majú niektoré organizačné vlastnosti. Príklady zahŕňajú:
* NOSQL DATABASE: Dátové obchody ako MongoDB alebo Cassandra.
* protokolové súbory: Záznamy o systémových udalostiach.
* XML a JSON (ak nie sú striktne v súlade so schémou).
* Neštruktúrované údaje: Toto sú údaje, ktoré nemajú preddefinovaný formát a je ťažké spracovať tradičné metódy. Príklady zahŕňajú:
* Textové súbory: Dokumenty, e -maily, príspevky v sociálnych médiách.
* obrázky: Fotografie, skenovanie.
* Audio súbory: Nahrávky, podcasty.
* Video súbory: Videá, nahrávky.
* Externé zdroje údajov: Údaje získané z vonkajšej organizácie, napríklad:
* API tretích strán: Prístup k údajom od iných spoločností alebo služieb.
* verejné súbory údajov: Vládne údaje, údaje o výskume.
* Sociálne médiá: Dáta zoškrabané z platforiem sociálnych médií.
Stručne povedané, vstup sa môže pohybovať od vysoko organizovaných, úhľadne zabalených údajov po surové chaotické informácie. Konkrétne vstupy budú závisieť od podnikania, položených otázok a schopností spracovania údajov a použitých nástrojov BI. Tento proces často zahŕňa čistenie, transformáciu a integráciu údajov z viacerých zdrojov skôr, ako sa môžu efektívne použiť na analýzu a rozhodovanie.