Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Čo sú zdrojové vstupné údaje?

Zdrojové vstupné údaje (SID) sú údaje, ktoré chcete použiť ako vstup pre váš model. Môže ísť o akýkoľvek typ údajov vrátane:

* Štruktúrované údaje: Tento typ údajov je uložený v štruktúrovanom formáte, ako je tabuľka alebo databáza.

* Neštruktúrované údaje: Tento typ údajov nie je uložený v štruktúrovanom formáte, ako je text alebo obrázky.

SID môže pochádzať z rôznych zdrojov vrátane:

* Interné údaje: Tieto údaje sa generujú vo vašej organizácii a zvyčajne sa ukladajú do databázy alebo systému plánovania podnikových zdrojov (ERP).

* Externé údaje: Tieto údaje sú generované mimo vašej organizácie a možno ich nájsť na webe, v sociálnych médiách alebo vo vládnych databázach.

Kvalita vášho SID je rozhodujúca pre úspech vášho modelu. Zlé údaje povedú k zlým výsledkom. Preto je dôležité venovať čas vyčisteniu a príprave vášho SID predtým, ako ho použijete na modelovanie.

Tu je niekoľko tipov na prípravu vášho SID:

* Vyčistite svoje údaje: To zahŕňa odstránenie všetkých duplicitných alebo chybných údajov.

* Štandardizujte svoje údaje: To zahŕňa konverziu všetkých vašich údajov do konzistentného formátu.

* Obohaťte svoje údaje: To zahŕňa pridávanie ďalších údajov do vášho SID, ako sú demografické informácie alebo údaje o počasí.

Keď si pripravíte svoje SID, môžete ho začať používať na zostavenie svojho modelu.

Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené