Predicción para deserción estudiantil mediante técnicas de Machine Learning
Universidad de Lima
Apr 2024 - Dec 2024 (9 months)
Realicé un pipeline completo de machine learning, desde la carga y limpieza de datos de diferentes fuentes para armar un dataset que pueda ser procesado por los diferentes modelos de ML. Implementé validación cruzada y búsqueda de hiperparámetros para entrenar y comparar diversos modelos (XGBoost, LightGBM, Random Forest, etc.), optimizando métricas como el ROC-AUC (alcanzando hasta 91%). Este proyecto demuestra mi capacidad para orquestar todo el ciclo de vida de los datos, desde la adquisición hasta la generación de insights accionables. Además, implementé técnicas de Machine Learning en un entorno de computación en la nube, utilizando servicios como AWS S3 para el almacenamiento de datos y ejecutando notebooks en una instancia de EC2 con