Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky
stiahnuť a nainštalovať Python modulu prirodzený jazyk toolkit z webových stránok ntlk.org projektu . Možno budete musieť nainštalovať ďalšie moduly na podporu NLTK .
2
Otvorte okno terminálu a začať Python relácii zadaním Python v režime príkazového riadku . Keď Python je hore a beh , vyvolať NLTK modul pomocou príkazu import NLTK . Na výzvy a príkazy vyzerať takto na Mac OS X :
My - MacBook - Pro : ~ pna1 $ python
Python 2.6.1 ( R261 : 67515 , 24 jún 2010 , 21:47 : 49 )
[ GCC 4.2.1 ( Apple Inc zostavenie 5646 ) ] na Darwin
typu " pomoc " , " copyright " , " úvery " alebo " licencia " pre viac informácií .
>>> import nltk
>>>
3
Vyvolať časť reči Tagger a zadajte vetu ktoré chcete zistiť podstatné mená zadaním nasledujúcich príkazov a dát na riadku Python :
>>> text = nltk.word_tokenize ( " . človek prechádza ulici predávať kríža " )
>>> nltk.pos_tag ( text )
4
stlačte klávesu Enter po >>> nltk.pos_tag ( text )
[ ,"( " " , " DT " ) , ( " muž " , " NN " ) , ( " kríža " , " VBZ " ) , ( " " , " DT " ) , ( " ulica " , " NN " ) , ( " k " , " TO " ) , ( " sell " , " VB " ) , ( " kríža " , " NNS " ) , ( ' . ' , ' . ' ) ]
>> >
NLTK správne označil každé slovo vo vete . Najmä zistil podstatné mená a označené im ako singulárne substantíva s NN ( muž , ulice ) a množného čísla podstatných mien s NNS ( kríža ) a správne označil prvý výskyt krížov ako sloveso s tag VBZ .