Omar Becerra

Omar Becerra

About

Detail

Cloud Data Enginner
Antioquia, Colombia

Contact Omar regarding: 
work
Full-time jobs
Starting at USD2K/month

Timeline


work
Job
school
Education
folder
Project (professional or personal)
auto_stories
Publication

Résumé


Jobs verified_user 0% verified
  • g
    Ingeniero de Soluciones en Datos e IA
    globalMVM
    Jan 2024 - Current (1 year 9 months)
    • Diseñé e implementé una arquitectura de datos empresarial basada en Azure Databricks y Delta Lake, estableciendo una plataforma unificada que integra datos de más de 30 fuentes para 5 unidades de negocio, reduciendo silos de información y la duplicación de esfuerzos. • Desarrollé una solución de IA cognitiva utilizando Azure OpenAI y Databricks, que automatiza la extracción y análisis de información contractual, reduciendo el tiempo de procesamiento en un 92 % y aumentando la precisión al 96 %, liberando más de 1,500 horas mensuales de análisis manual. • Lideré la implementación de un framework de DataOps y MLOps con Databricks Workflows, Azure DevOps y Terraform, logrando despliegues continuos sin tiempo de inactividad y reduciendo lo
  • K
    Senior Data &Analytics Engineer public Remote experience
    KeybeAI
    Jan 2022 - May 2025 (3 years 5 months)
    • Diseñé e implementé una plataforma de análisis en tiempo real utilizando Databricks Delta Live Tables, Event Hubs y Spark Structured Streaming, que procesaba más de 3.5 TB diarios con una latencia promedio de 3.8 segundos, habilitando la toma de decisiones inmediata. • Lideré la migración estratégica de un entorno on-premise a Azure Databricks, implementando una arquitectura medallion (bronze/silver/gold) y automatizando más de 180 pipelines de datos críticos con una disponibilidad del 99.98 %. • Diseñé e implementé un framework de observabilidad de datos sobre Azure Monitor y Databricks SQL, que permitía el monitoreo proactivo de la calidad, frescura y linaje de los datos, reduciendo los incidentes en producción en un 78 %. • Realicé
  • D
    Data Engineer
    Jan 2021 - Jan 2022 (1 year 1 month)
    • Lideré proyectos estratégicos de transformación digital integrando soluciones en Microsoft Azure y GCP, utilizando herramientas de Business Intelligence (Power BI, Tableau, Looker) para análisis avanzado. • Implementé soluciones de análisis en Google Cloud y Azure SQL, mejorando la eficiencia operativa en un 15 %. • Desarrollé y gestioné procesos ETL con Apache Airflow y Apache Spark, integrando datos desde múltiples fuentes y bases de datos. • Diseñé dashboards interactivos y segmentaciones de clientes utilizando técnicas de machine learning y frameworks de inteligencia artificial, incrementando la efectividad de campañas en un 25 %. • Optimicé la centralización y análisis de información en el Data Warehouse mediante integraciones c
  • Bonnett Analytics
    Consultor en Ingenieria de Datos public Remote experience
    Bonnett Analytics
    Jan 2021 - Jan 2024 (3 years 1 month)
    • Asesoré a 5 clientes del sector financiero en la modernización de sus plataformas de datos, implementando arquitecturas lakehouse en Azure Databricks que redujeron los costos operativos en un promedio del 35 %. • Desarrollé una solución de ingesta de datos en tiempo real utilizando Kafka, Databricks Structured Streaming y Delta Lake para analítica en subastas, habilitando decisiones de inversión basadas en modelos de Machine Learning. • Implementé soluciones de analítica avanzada y machine learning sobre Databricks, incluyendo modelos de detección de fraude que incrementaron la tasa de detección en un 56 % mientras se reducían los falsos positivos.
  • Éxito
    Practicante en Ciencia de Datos public Remote experience
    Éxito
    Jan 2020 - Jan 2021 (1 year 1 month)
    • Colaboré en proyectos de optimización y ciencia de datos, aplicando técnicas de machine learning y frameworks de inteligencia artificial para mejorar la precisión predictiva. • Apoyé la migración de datos a GCP, integrando soluciones basadas en bases de datos SQL y NoSQL para mejorar la seguridad y accesibilidad de la información. • Desarrollé modelos predictivos con TensorFlow y PyTorch, integrándolos en pipelines ETL mediante Apache Airflow y Azure Data Factory. • Implementé un sistema de recomendación de productos que incrementó las ventas en un 10 %, utilizando técnicas de Business Intelligence y análisis avanzado.
  • U
    Consultor en Ingenieria de Datos
    Universidad Eafit
    Jan 2019 - Jan 2021 (2 years 1 month)
    • Diseñé y desarrollé herramientas analíticas utilizando Python, R y JavaScript, optimizando procesos de toma de decisiones en diversas empresas. • Implementé soluciones de análisis en Azure, gestionando sistemas de almacenamiento con Azure Blob Storage y bases de datos como Azure SQL y MySQL. • Colaboré en proyectos de investigación que resultaron en publicaciones científicas, empleando modelos de machine learning y frameworks de inteligencia artificial.
  • Omdena
    Cientifico de Datos e Ingeniero de Datos
    Omdena
    Jan 2019 - Jan 2020 (1 year 1 month)
    • Desarrollé modelos de procesamiento de lenguaje natural y análisis de tendencias en redes sociales utilizando frameworks como LangChain, LLMs y agentes de IA. • Implementé modelos de machine learning en Azure, gestionando grandes volúmenes de datos con Apache Spark y Apache Airflow. • Desplegué contenedores Docker para la producción de modelos de IA, asegurando portabilidad y escalabilidad mediante herramientas DevOps como Terraform y GitHub. • Diseñé soluciones de análisis en tiempo real con Azure Stream Analytics y Databricks, proporcionando insights inmediatos para la toma de decisiones.
Education verified_user 0% verified
  • U
    Maestria en Matematicas Aplicadas
    Universidad Eafit
    Jan 2022 - Jan 2024 (2 years 1 month)
  • D
    DS4A Correlation One
    Jan 2020 - Jan 2021 (1 year 1 month)
  • U
    Ingenieria Matematica
    Universidad Eafit
    Jan 2017 - Jan 2022 (5 years 1 month)
Projects (professional or personal) verified_user 0% verified
  • P
    Plataforma de IA Generativa Empresarial
    Jan 2025
    • Diseñé y desarrollé una solución end-to-end para el procesamiento inteligente de documentos empresariales utilizando Azure OpenAI, orquestada con Databricks, implementando técnicas de Retrieval Augmented Generation (RAG) para una contextualización específica del negocio. • Implementé un framework de orquestación de workflows de IA con Databricks Workflows, que automatiza todo el ciclo, desde la ingesta hasta la aplicación de modelos, con capacidades de monitoreo y reentrenamiento continuo. • Integré Unity Catalog para el gobierno seguro de datos sensibles, cumpliendo normativas de privacidad y documentando el linaje de datos para modelos de IA, lo que permitió una reducción del 60 % en el tiempo de respuesta y una precisión del 85 % en
  • S
    Sistema de Inteligencia Empresarial en Tiempo Real
    Jan 2024
    • Implementé una solución end-to-end de analítica en tiempo real utilizando Databricks Structured Streaming y Azure Event Hubs, habilitando la visualización inmediata en Power BI. • Optimicé la ingesta y el procesamiento de datos para manejar grandes volúmenes en tiempo real, mejorando la eficiencia del sistema y reduciendo la latencia en la entrega de insights críticos.
  • P
    Plataforma de Lago de Datos Empresarial
    Jan 2024
    • Diseñé e implementé una arquitectura moderna de Data Lakehouse en Azure Databricks, incorporando la arquitectura medallion (bronze, silver, gold) y automatizando los despliegues mediante Infrastructure as Code (IaC) con Terraform. • Desarrollé pipelines incrementales con Delta Live Tables que procesaban más de 10 TB diarios, reduciendo los costos en un 40 % y el tiempo de procesamiento en un 65 %.
Publications verified_user 0% verified
  • O
    On a Stahel-Donoho estimator with skewness-based random projection directions.
    Jan 2024
  • N
    Nonparametric Generation of Synthetic Data Using Copulas.
    Jan 2023
  • A
    A Modified Version of the Stahel-Donoho Multivariate Outlier Detection Method Based on Specific Random Directions
    Jan 2022
  • U
    Un Algoritmo Evolutivo Hıbrido para el Problema de Programacion del Taller de Flujo Permutado con Restricciones.
    Jan 2021