Vitajte na [www.pocitac.win] Pripojiť k domovskej stránke Obľúbené stránky

Domáce Hardware Siete Programovanie Softvér Otázka Systémy

Ako Scrape a analyzovať adries

Škrabanie a parsovanie sú dve úzko súvisiace webové stránky dolovania dát praktiky . Všeobecnejšie , analýzy , odkazuje sa poškodí dáta do jeho súčasťou . Keď vaše stredná škola učiteľ angličtiny vás požiadal , aby ste diagram vety , si analýze slová týchto viet pre ich častí reči . Škrabanie konkrétne odkazuje na analýzu webových stránok pre jednotlivé typy dát , v tomto prípade adresy . Programovací jazyk Python a " BeautifulSoup " rozšírenie umožňujú užívateľovi , oškrabte je a analyzovať webové stránky v niekoľkých málo riadkov kódu . Veci , ktoré budete potrebovať
Python 2.6 alebo vyšší
BeautifulSoup 3.2
Zobraziť ďalšie inštrukcie Cestuj 1

Nainštalujte BeautifulSoup stiahnutím najnovšej verzie z mizernom softvéru a rozbaliť /unzip súbor . Otvorte okno terminálu a zadajte nasledujúci príkaz : Má - iMac : ~ mi $ python Downloads/BeautifulSoup-3.2.0/python setup.py nainštalovať

hovorí interprétereri jazyka Python spustiť BeautifulSoup nainštalovať skript , ktorý môže možno nájsť v priečinku BeautfulSoup , ktorý je v priečinku Downloads
2

Druh Python na riadku hit návrat a dovoz BeautifulSoup : . Môj - iMac : ~ mi $ python >>> import BeautifulSoup
3

spustite nasledujúci skript otvoriť webovú stránku a tlačiť všetky lokátory Univerzálny zdroje ( webovej adresy ) môžete nájsť na stránke : >>> import urllib2 >> ; > page = urllib2.urlopen ( " http://www.THE URL CHCETE škrípanie TU " ) >>> polievka = BeautifulSoup (strana ) >>> soup.findAll ( " ' ) >>> print soup.strip ( ) >>> printThis skript otvorí webovú stránku , analyzovať html , hľadať , v ktorom sa webové adresy budú vložené , odstrániť tagy a nechať text .

Najnovšie články

Copyright © počítačové znalosti Všetky práva vyhradené