Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Ako rozpoznať podstatné mená v jazyku Python

Detekcia podstatné mená v Pythone požaduje zručností programátora a lingvista . Anglický jazyk sám stanovuje pasce pre neohrozeného výpočtovej lingvista s bohatou morfologické nejednoznačnosti . Napríklad slovo " kríža " môže byť množné podstatné meno , alebo tretia osoba , prítomný čas - sloveso . Našťastie tvorcovia Natural Language Toolkit Python modulu vyvinuli part - of - speech Tagger , ktorý zodpovedá za týchto ťažkostí a slová anglických viet je značka s ich časťami prejavu , vrátane podstatných mien . Veci , ktoré budete potrebovať
Python 2.4 , 2.5 , alebo 2.6
Natural Language Toolkit Python modul
Zobraziť ďalšie inštrukcie
1

stiahnuť a nainštalovať Python modulu prirodzený jazyk toolkit z webových stránok ntlk.org projektu . Možno budete musieť nainštalovať ďalšie moduly na podporu NLTK .
2

Otvorte okno terminálu a začať Python relácii zadaním Python v režime príkazového riadku . Keď Python je hore a beh , vyvolať NLTK modul pomocou príkazu import NLTK . Na výzvy a príkazy vyzerať takto na Mac OS X :

My - MacBook - Pro : ~ pna1 $ python

Python 2.6.1 ( R261 : 67515 , 24 jún 2010 , 21:47 : 49 )

[ GCC 4.2.1 ( Apple Inc zostavenie 5646 ) ] na Darwin

typu " pomoc " , " copyright " , " úvery " alebo " licencia " pre viac informácií .

>>> import nltk

>>>
3

Vyvolať časť reči Tagger a zadajte vetu ktoré chcete zistiť podstatné mená zadaním nasledujúcich príkazov a dát na riadku Python :

>>> text = nltk.word_tokenize ( " . človek prechádza ulici predávať kríža " )

>>> nltk.pos_tag ( text )
4

stlačte klávesu Enter po >>> nltk.pos_tag ( text )

[ ,"( " " , " DT " ) , ( " muž " , " NN " ) , ( " kríža " , " VBZ " ) , ( " " , " DT " ) , ( " ulica " , " NN " ) , ( " k " , " TO " ) , ( " sell " , " VB " ) , ( " kríža " , " NNS " ) , ( ' . ' , ' . ' ) ]

>> >

NLTK správne označil každé slovo vo vete . Najmä zistil podstatné mená a označené im ako singulárne substantíva s NN ( muž , ulice ) a množného čísla podstatných mien s NNS ( kríža ) a správne označil prvý výskyt krížov ako sloveso s tag VBZ .


Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené