El scraping es una técnica que te permite extraer información de sitios web.
Este tutorial de programación sobre web scraping con Python te permitirá :
- Dar tus primeros pasos en scraping (para comenzar con requests y beautifulsoup)
- Aprender y sortear los mecanismos de protección contra el scraping
- Conocer las reglas legales relacionadas con el scraping
- Crear un proyecto avanzado que te permitirá scrapear cualquier sitio.
- Utilizar la IA (ChatGPT) para ayudarte en la generación del código.
----------------------------------------------------------
Requisitos :
----------------------------------------------------------
Los enlaces :
1️⃣ Este video es en asociación con Brightdata (solución de scraping profesional), que te ofrece 15$ de crédito al pasar por este enlace :
https://brdta.com/CodeAvecJonathan(este enlace no me aporta ninguna comisión, solo te permite seguir este tutorial gratuitamente)
----------------------------------------------------------
El programa :
00:00:00 Introducción
00:01:50 Requisitos
00:02:10 El programa
00:02:31 PARTE 1 - Tus primeros pasos en scraping
00:04:18 Hacer una solicitud HTTP (requests)
00:13:36 Extraer la información (título + descripción)
00:23:33 Recuperar varios elementos (ingredientes)
00:27:40 Ejercicio : Pasos de preparación
00:30:22 Consejos para ir más allá (genera código con ChatGPT / practica con scrapethissite.com)
00:33:16 PARTE 2 - Las protecciones contra el scraping
00:36:34 User-agent : hacerse pasar por un navegador
00:41:28 Problemas relacionados con Javascript
00:44:13 Navegación sin cabeza : sortear los problemas relacionados con Javascript
00:45:42 Soluciones de scraping profesional : Rotaciones de IPs, Proxys, Anti-captcha…
00:48:03 PARTE 3 - ¿Es legal el scraping?
00:50:56 PARTE 4 - Proyecto de scraping avanzado
00:52:23 Sitios protegidos : Límites del script actual
00:55:51 Las etapas del proyecto
00:56:54 Creación de tu cuenta en BrightData.com
00:58:18 Entender : El WebUnlocker y ScrapingBrowser
00:59:37 Uso del Web Unlocker
01:11:44 Uso del Scraping Browser
01:17:39 Bypass del modo scraping
01:21:22 Extracción de la información (título)
01:26:53 Extracción de la información (número de evaluaciones, precio, descripción)
01:37:19 Varias urls, almacenar los datos, programador
01:42:53 Reformular contenido con la API ChatGPT
01:45:57 Conclusión
----------------------------------------------------------
Acerca de :
Desarrollador apasionado con más de 19 años de experiencia profesional, actualmente soy desarrollador freelance especializado en aplicaciones móviles iOS y Android, y servidores WEB. Trabajo a distancia con mis clientes.
En este canal, te propongo descubrir la programación de una manera diferente : te traigo mi pedagogía y mis técnicas profesionales.
¿El objetivo? Permitir que aprendas programación, te conviertas en un mejor desarrollador, te profesionalices, y por qué no, cambies de vida.
Suscríbete al canal para acceder a nuevos videos sobre los siguientes temas:
- Tutorial de programación (Python, C#, .NET, ...)
- Convertirse en desarrollador freelance
- Utilizar IA generativas (ChatGPT, Midjourney...)