Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky
* PDF sú navrhnuté pre prenosnosť dokumentov, nie na úpravu. Ukladajú obsah spôsobom, ktorý je ťažké priamo upraviť.
* OCR je kľúč k extrakcii textu. Keď skopírujete text z PDF, váš počítač používa optické rozpoznávanie znakov (OCR) na konverziu obrázkov písmen na upraviteľný text.
Tu je niekoľko spoločných dôvodov, prečo sa text môže javiť ako „nepoznateľný“ v slove po skopírovaní z PDF:
* PDF bol skenovaný. Ak bol PDF vytvorený skenovaním papierového dokumentu, proces OCR nemusí byť presný, čo vedie k chybám v kopírovanom texte.
* Komplexné formátovanie. PDF s komplexným formátovaním, ako sú stĺpce, tabuľky alebo obrázky zabudované do textu, môžu spôsobiť chyby OCR.
* neštandardné písma. Ak PDF používa nezvyčajné písma alebo písma, ktoré nie sú k dispozícii vo vašom počítači, OCR môže nesprávne interpretovať znaky.
Čo robiť namiesto toho:
1. Použite PDF na prevodník slov: Nástroje ako Adobe Acrobat Pro, Nitro Pro alebo online prevodníky dokážu zvládnuť OCR a poskytnúť presnejšiu konverziu.
2. Kopírujte a vkladajte priamo z PDF: Ak bol PDF vytvorený z textu, zvyčajne môžete skopírovať a vložiť priamo do programu Word, hoci formátovanie sa môže stratiť.
3. uložte pdf ako dokument Word: Mnoho PDF má možnosť uložiť ako dokument Word (.docx), ktorý si zachová formátovanie a rozpoznávanie textu.
Dôležitá poznámka: Aj s najlepšími nástrojmi môžu mať niektoré PDF stále text, ktorý nie je dokonale rozpoznaný. Možno budete musieť manuálne upraviť kopírovaný text slovom.