Python 06d scrap

 0    6 fiche    swiatangielskiego
ladda ner mp3 skriva ut spela Kontrollera dig själv
 
Fråga Svar
instalacja webscraping
börja lära sig
pip install beautifulsoup4
import webscraping oraz urllib oraz lxml
börja lära sig
import bs4 as bs import urllib. request import lxml
pobranie html z url
börja lära sig
url_content = urllib. request. urlopen('url'). read()
ekstrakcja linków do stron filmów
börja lära sig
find_url = bs. BeautifulSoup(url_content, 'lxml')
wyodrębnić wszystkie wystąpienia określonego tagu
börja lära sig
find_url_tds = find_url. findAll('td', {'class': 'titleColumn'})
jeśli wielokrotnie wyodrębniasz linki, możesz użyć poniższej funkcji:
börja lära sig
base_url + find_url_td. find('a'). attrs['href']

Du måste vara inloggad för att skriva en kommentar.