Web Scraping (Inicio) – Python

En este post aprenderemos a realizar un web scraping, lo cual se puede interpretar como navegar mediante código. Realizaremos web scraping en Python por la facilidad de las librerías y lo simple del código.

1.- Iniciaremos importando la librería beutifulsoup en python para lo cual solo basta copiar el siguiente código en un terminal

pip install beautifulsoup4

2.- Ahora en un hoja nueva de pyton comenzaremos importando la librería requests la cual descargara la pagina web en formato html. Seguidamente empleando la librería importada descargamos la pagina web y la almacenamos en una variable, este caso la variable es page.

import requests

page = requests.get("https://tutorin.net/")

3.- Seguidamente pasamos a importar la libreria BeautifulSoup la cual nos ayudará a leer los datos de las etiquetas del HTML y realizar el web Scraping

from bs4 import BeautifulSoup

soup = BeautifulSoup(page.content, 'html.parser')

4.- Con ello podemos analizar todas las etiquetas del html. En el siguiente tenemos el ejemplo completo

import requests
from bs4 import BeautifulSoup

page = requests.get("http://tutorin.net")

soup = BeautifulSoup(page.content, 'html.parser')

print(soup.prettify())

 

About the Author: admin

2 Comments

  1. table = soup.findAll(‘div’,attrs={“class”:”content-question”})
    for x in table:
    print x.find(‘p’).text

    eso con el atributo id??????

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *