Web Scraping con NodeJS y Cheerio
¿Qué es el Web scraping?
El web scraping es una técnica para extraer la información que necesitemos de una página web de forma automatizada.
Para realizar este ejemplo he usado NodeJS y Cheerio.
NodeJS ya es un gran conocido y realmente lo uso junto a express para realizar una api muy sencilla.
Quien hace la magia en este ejemplo es cheerio.
Cheerio es una implementación rápida, flexible y ligera del core jQuery diseñada específicamente para el servidor.
Pero, ¿que significa esto?. Cheerio analiza el marcado y proporciona una API para atravesar/manipular la estructura de datos resultante.
Con todo este proceso al final conseguimos crear un api de cualquier web del mundo.
A continuación un ejemplo de una api que he creado haciendo web scraping con cheerio, nodejs y express:
- Web scraping de la web https://www.juegosonce.es/ para obtener los resultado del sorteo de superonce:
- Documentación API: API Doc
UPDATE (10/09/2018)
Gracias a un comentario acabo de darme cuenta que no había añadido el código fuente.
Desde aquí puedes acceder al repositorio en Github con la documentación incluida.
buahh se ve facil , pero podrias poner los archivos para probar otras webs, por ejemplo lo mas basico , como entrar en esta web , en este articulo y obtener el titulo, lo agradecria mucho ya que no me aclaro con cheerio, un saludo maestro.
Perfecto, ahora mismo pongo el código