InmoData Engine
Dec 2024 - Mar 2025 (4 months)
Como InmoData Engine, diseñé un pipeline de Web Scraping resiliente para la extracción y normalización de datos inmobiliarios. El sistema orquesta workers en paralelo con control de ritmo y reintentos, utilizando Python y Playwright con perfiles antidetención y proxies residenciales rotativos, además de gestionar CAPTCHA DataDome con tareas específicas mientras simula interacción humana. Extrae URL, precio, dirección, m², habitaciones, baños, tipología, texto del anunciante y teléfono. Aplica deduplicación incremental, validaciones de esquema y normalización; persiste en CSV y sincroniza con Google Sheets para control operativo. Registra métricas y logs estructurados para trazabilidad y tuning, integrando un manejo seguro de cookies y crede