Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Ako napísať e - mailovú Miner pre Python

Ťažba e - mail je prostriedkom na získavanie informácií , ako je napríklad počet slov , viet , alebo bohatosť slovnej zásoby volaného , z textu v e - maile . Písanie e - mailovú baník s Python vyžaduje veľa " pohyblivých častí " v podobe rozšírenia Pythone , tzv balíčky , že sťahovanie e - mailových správ vypnutie serverov . Správy sú prevedené na reťazce , takže ďalšie balíčky Python možno analyzovať ich a zobrazenie toho , čo nájdu . Jedná sa o veľmi zložitú úlohu , ktorý vyžaduje viac ako stretávacie bežné znalosti programovania v jazyku Python . Preto , postupovať s opatrnosťou a trpezlivosťou . Veci , ktoré budete potrebovať pripojenie k internetu klipart Python 2.6 alebo vyšší
NLTK Python Package
Zobraziť ďalšie inštrukcie Cestuj 1

Otvorte terminálové relácie a zadajte python - v na riadku skontrolujte , či máte Python 2.6 alebo vyšší , ale nie 3.0 alebo vyšší . Verzia 2.6 alebo 2,7 ar ideálne , pretože sú kompatibilné s NLTK a PyYAML . Navštívte stránku Python balíky index , nájsť a stiahnuť PyYAML a NLTK balíčkov . Rozbaľte /untar nich . Zmeňte adresár na adresár PyYAML . Na príkazovom riadku typ riadku v : sudo python setup.py nainštalovať . Malo by to vyzerať takto :

My - počítač : PyYAML - 3.2.0 Me $ sudo python setup.py nainštalovať

Budete vyzvaní na zadanie hesla . Zadajte ho a stlačte tlačidlo return . Dodržujte tento postup pre každý balíček Pythone inštaláciu
2

k stiahnutiu e - mailových správ pre analýzu s nasledujúce riadky kódu : . !

# /Usr /local /bin /python

import poplib , getpass , sys , mailconfig

mailserver = mailconfig.popservername

MailUser = mailconfig.popusername

mailpasswd = getpass.getpass ( ' Heslo pre % s ? ' % mailserver )

server = msgBytes = server.stat ( )

print ( " Existuje " , msgCount , ' mailové správy v ' , msgBytes , " bajtov " )

tlače ( server.list ( ) )

print ( ' - ' * 80 )

input ( ' [ Press Enter ] ' )

for i in range ( msgCount ) :

hdr , správy , oktety = server.retr ( i 1 )

na riadku správy : print ( line.decode ( ) )

čítanie ( " - " * 80 )

ak i < msgCount - 1 :

Tento skript sa pripojiť k POP3 e - mailového servera , vyzve vás na zadanie užívateľského mena a hesla , spočítať počet správ na serveri a prečítať si ich do pamäte < br . >
3

Mine vaše e - mailové správy tým , že zmení každú správu na reťazec , natívny dátový typ v jazyku Python , ktorý možno vyhľadávať pomocou metód v Pythone reťazec regulárneho výrazu motora a prirodzeného jazyka Toolkit :

m = msgCount [ 1 ]

s = str ( m )

z email.parser dovozu Parser

importovať nltk klipart

import re
4

moja prvá správa pre akékoľvek zaujímavé informácie . Objavte , koľko slov je v tejto správe zadaním nasledujúceho príkazu :

>>>> ľan ( s )

vráti celočíselnú hodnotu pre počet slov . Ak chcete nájsť každú vetu so slovom hypotéky , zadajte nasledujúci príkaz NLTK :

>>>> s.concordance ( " hypotéka " )

vráti každú vetu s slovo hypotéka v ňom veľmi užitočné pre detektívi vyšetrujúci hypotekárnych podvodov
.

Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené