Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Ako extrahovať text z PDF dokumentu

To môže byť veľmi frustrujúce , aby sa pokúsili extrahovať text z PDF súboru pre použitie v inej aplikácii . To nie je nezvyčajné pre grafiku dostať do cesty , alebo pre rozloženie dokumentu , aby bolo ťažké pre skúšky, ktoré majú byť prevedené do zmysluplných viet . Aj keď to nie je možné extrahovať text s prístupom copy - and - paste , to môže byť časovo náročné a neumožňuje textový súbor PDF exportovať ako iný formát . Existuje však niekoľko spôsobov , ako extrahovať text zo súboru PDF . Veci , ktoré budete potrebovať klipart súbor PDF klipart účte Adobe Acrobat Reader
Gmail ( voliteľne )
PDF do textu konverzný softvér ( voliteľne )
Zobraziť ďalšie inštrukcie
extrahovať text pomocou Acrobat Reader
1

Otvorte súbor v programe Acrobat Reader . V systéme Windows , vyberte možnosť . " Súbor - > Exportovať dokument do textu , " pomenovala dokument a uložiť ho
2

Odpíšte text na Mac alebo Linux OS prístupom na ponuku Zobraziť a výberom " continuous " alebo " Continuous - čelia . " ( Bývalý vám poskytne textu v jednom stĺpci , zatiaľ čo druhý bude formátovať text ako stránky side - by - side ) . Choď na " Edit - > Vybrať všetko " a potom na " Úpravy - > Kopírovať . "
3

ak si len chcete extrahovať časť textu , použite nástroj pre výber . Kliknite na " Text Select " nástroj a vyberte informácie , ktoré chcete . V dokumente formátovaný vo viacerých stĺpcoch , budete musieť najprv použiť " stĺpci vyberte " nástroj . Prejdite na " Edit - . > Kopírovať "
Prevod PDF do HTML
4

používať Gmail ako skratku . Pripojte súbor PDF do e - mailu a poslať ich do svojho účtu Gmail . Keď otvoríte e - mail uvidíte rad možností vedľa prílohu . Zvoľte " Zobraziť ako HTML " a uložte súbor , ktorý sa otvorí v samostatnom okne . Aj keď nebudete môcť zobraziť žiadnu grafiku , bude súbor HTML zachovať formátovanie textu v dokumente .
5

extrahovať a konvertovať súbory na príkazovom riadku . Používatelia Linuxu môžu použiť základné príkaz prevodu , ktorý zmení súbor pdf do txt súboru : .. " . Pdftotext filename.pdf " Uistite sa , že nahradiť názov súboru s názvom súboru PDF .
6

Stiahnuť PDF do textu konverzný program . Existuje celý rad open source a freeware programy , ako napr PDFBox a Easy PDF to Text Converter ( pozri nižšie uvedené zdroje ) . Mnohé z týchto programov možno tiež previesť súbory PDF do HTML rovnako .

Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené