Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky
Otvorte terminálové relácie a zadajte python - v na riadku skontrolujte , či máte Python 2.6 alebo vyšší , ale nie 3.0 alebo vyšší . Verzia 2.6 alebo 2,7 ar ideálne , pretože sú kompatibilné s NLTK a PyYAML . Navštívte stránku Python balíky index , nájsť a stiahnuť PyYAML a NLTK balíčkov . Rozbaľte /untar nich . Zmeňte adresár na adresár PyYAML . Na príkazovom riadku typ riadku v : sudo python setup.py nainštalovať . Malo by to vyzerať takto :
My - počítač : PyYAML - 3.2.0 Me $ sudo python setup.py nainštalovať
Budete vyzvaní na zadanie hesla . Zadajte ho a stlačte tlačidlo return . Dodržujte tento postup pre každý balíček Pythone inštaláciu
2
k stiahnutiu e - mailových správ pre analýzu s nasledujúce riadky kódu : . !
# /Usr /local /bin /python
import poplib , getpass , sys , mailconfig
mailserver = mailconfig.popservername
MailUser = mailconfig.popusername
mailpasswd = getpass.getpass ( ' Heslo pre % s ? ' % mailserver )
server = msgBytes = server.stat ( )
print ( " Existuje " , msgCount , ' mailové správy v ' , msgBytes , " bajtov " )
tlače ( server.list ( ) )
print ( ' - ' * 80 )
input ( ' [ Press Enter ] ' )
for i in range ( msgCount ) :
hdr , správy , oktety = server.retr ( i 1 )
na riadku správy : print ( line.decode ( ) )
čítanie ( " - " * 80 )
ak i < msgCount - 1 :
Tento skript sa pripojiť k POP3 e - mailového servera , vyzve vás na zadanie užívateľského mena a hesla , spočítať počet správ na serveri a prečítať si ich do pamäte < br . >
3
Mine vaše e - mailové správy tým , že zmení každú správu na reťazec , natívny dátový typ v jazyku Python , ktorý možno vyhľadávať pomocou metód v Pythone reťazec regulárneho výrazu motora a prirodzeného jazyka Toolkit :
m = msgCount [ 1 ]
s = str ( m )
z email.parser dovozu Parser
importovať nltk klipart
import re
4
moja prvá správa pre akékoľvek zaujímavé informácie . Objavte , koľko slov je v tejto správe zadaním nasledujúceho príkazu :
>>>> ľan ( s )
vráti celočíselnú hodnotu pre počet slov . Ak chcete nájsť každú vetu so slovom hypotéky , zadajte nasledujúci príkaz NLTK :
>>>> s.concordance ( " hypotéka " )
vráti každú vetu s slovo hypotéka v ňom veľmi užitočné pre detektívi vyšetrujúci hypotekárnych podvodov
.