Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky
Otvorte okno terminálu a napíšte príkaz " python - v " v riadku skontrolovať prítomnosť a verziu Pythonu na vašom počítači . Prejsť na domovskú stránku NLTK a stiahnite NLTK inštalačný balíček určený pre váš operačný systém . Skontrolujte , či je správne nainštalovaný NLTK zadaním príkazu " >>> import nltk " na riadku Python .
2 Typ
" >>> nltk.download ( ) " na otvoriť okno . Vyberte riadok s nápisom " všetko " a kliknite na tlačidlo Prevziať . Tým sa stiahnu rad textov pre NLTK pracovať , medzi nimi Shakespeare " Kupec benátsky " naformátovaná pomocou špeciálnych XML tagov pre hry .
3
Dovoz Kupec benátsky označené v XML pomocou nasledujúceho príkazu na príkazovom riadku Python :
>>> merchant_file = nltk.data.find ( ' corpora /Shakespeare /merchant.xml " )
Priradiť súbor variabilný , takže môžete manipulovať s Python príkazy: .
>>> raw = open ( merchant_file ) čítať
( )
Len aby sa ubezpečil , že je to tam , zadajte nasledujúci príkaz pre zobrazenie prvých 168 znakov :
>>> print raw [ 0:168 ]
Uvidíte hlavičky tagy XML a špeciálnych XML prehrávanie tagy < br . > Stránka 4
zadajte nasledujúci príkaz na príkazovom riadku Python :
>>> z nltk.etree.ElementTree dovoz ElementTree
a stlačte tlačidlo " Return " , potom zadajte nasledujúce príkazového riadku Python : .
>>> obchodníka = ElementTree ( ) analyzovať ( merchant_file )
Príkaz parse umožňuje užívateľovi zobraziť XML tagy a ich obsah . Ak chcete vytvoriť hierarchický pohľad na správne vnorených XML tagov , zadajte nasledujúci príkaz na príkazovom riadku Python :
>>> merchant.getchildren
( ) Tento ukáže všetky špeciálne XML hrať tagy v ich hierarchickom poradí . Výstupom tohto príkazu by mal vyzerať takto :
[