Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Čo je OCR Scanner

? Optické rozpoznávanie znakov ( OCR ) je data - vstup technika , ktorá používa špecifický typ písma a OCR skener čítať znakovú sadu a poslať ich do počítača . American National Standards Institute , alebo ANSI definuje typ písma ako súbor znakov , 0-9 , A až Z , a niekoľko špeciálnych znakov , z ktorých každý obsahuje definovanú veľkosť a tvar . OCR fonty sú reprodukovateľné , a ľudia a OCR skenery vie čítať a rozlišovať ich. Kategórie

OCR skenery sú buď vkladanie textu alebo zber dát skenery . Textový vstup skenery prečítať celý dokument , alebo aspoň veľkú časť z nej . Vstupné dáta môžu byť ručne kŕmené alebo skener môžu mať automatické kŕmenie dát , čítanie , triedenie a stohovanie schopnosti . Pri použití Text Input skener , editácia prebieha buď v priebehu alebo po skenovaní . Data Capture skenery zachytávanie a formátovanie dát počas procesu skenovania , a žiadny človek editácia dát prebieha . Pretože toto , zber dát skenery musia byť presnejší .
Typy

typy skenerov môžu byť stacionárne alebo ručné . Stacionárne skenery , ako valník , s podávačom a bubnové skenery používajú prevažne textového vstupu čítať , spracovávať a ukladať dáta snímok na vašom počítači , kde si potom môžete upravovať alebo inak naformátovať zachytený text . Ručné skenery , ako sú digitálne perá alebo čítačky čiarových kódov , pomocou buď textového vstupu alebo zber dát pre čítanie a informácie o procesných dát a potom uložiť pre neskoršie editáciu alebo " zamknúť " dáta , aby sa zabránilo úpravy .

metódy

Stručne povedané , OCR skener vytvorí snímku dokumentu , a potom softvér OCR skener sa pozerá na OCR font obraz obsahuje , a potom sa číta a konvertuje ho na texte buď pomocou matice Matching alebo metódu Feature Extraction . Matrix Matching je forma vzorov , kde skener sa pozerá na charaktere a zodpovedá jednému v jeho knižnici znakov alebo šablóny postáv . Feature Extraction nespolieha na preddefinované knižnice , ale o všeobecných funkcií , ako je voľné priestranstvo , uzavreté tvary , a krížiacich sa liniek pri dešifrovaní znaky . Feature Extraction ide tiež o názov Intelligent Character Recognition , alebo ICR .
Výhody

Najvýznamnejšou výhodou použitia OCR skener je eliminácia chýb ľudského vstupných dát . OCR skenery čítať dáta rýchlosťou , ktorá môže dosiahnuť viac ako 200 znakov za sekundu . Rýchlosť Presnosť OCR skenera je 99,9975 percent , alebo jeden znak nesprávne prečítať v 40000 , v porovnaní s rýchlosťou ľudskej chybne jedného do 300 znakov . Automatické overenie kontrolnej číslice môže priniesť presnosť sadzbu OCR na menej ako jedného z 3,000,000 .
Úvahy

Zlá kvalita predlohy bude mať za následok menej presných dokumentov OCR . Ručne písané dokumenty , dokumenty , ktoré obsahujú štylizované texte , staršie dokumenty , fotokópie a väčšina faxovanie dokumentov nefungujú dobre s OCR skenery . Odporúčania pre prijateľné dokumenty patria tlačený text veľkosť písma menšie ako 72 bodov , laserové a atramentové texte jet tlačiarne , faxové dokumenty s 200 bodov na palec ( dpi ) alebo vyššie rozlíšenie a komerčne tlačovín , ako sú knihy , brožúry a časopisy .

Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené