João Victor Fraga Santos

João Victor Fraga Santos

About

Detail

Specialist | Data Engineer | Big Data | Business Intelligence
Belo Horizonte, State of Minas Gerais, Brazil

Contact João regarding: 
work
Full-time jobs

Timeline


work
Job
school
Education

Résumé


Jobs verified_user 0% verified
  • BlueShift Brasil
    Senior Data Engineer
    BlueShift Brasil
    Aug 2024 - Jun 2025 (11 months)
    ✦ Cliente: B3 S.A. – BRASIL, BOLSA, BALCÃO 🧾 Resultados: Migração de processos legados críticos para uma nova arquitetura em nuvem na cadeia de valor de índices, permitindo maior agilidade na criação e evolução de índices financeiros utilizados por investidores e instituições para monitoramento de mercado. 📘 Conhecimentos aplicados: Arquitetura de dados em cloud, modernização de sistemas legados, estruturação de soluções para cálculo e manutenção de índices de mercado. 🛠️ Principais tecnologias e ferramentas: Databricks • Azure Data Factory • Azure Blob Storage • Azure Functions • PySpark • SQL • Git 💡 Habilidades: Engenharia de dados em ambientes financeiros • Otimização de processos analíticos • Integração de sistemas legados com arqu
  • L
    Engenheiro de dados
    Leega
    Jul 2024 - Feb 2025 (8 months)
    ✦ Cliente: Alelo 🧾 Resultados: Estruturação inicial da arquitetura estratégica de dados em cloud para a área de Customer Experience (CX), com ingestão e transformação automatizada dos dados da API IndeCX. Criação de 11 tabelas analíticas derivadas de 4 tabelas raw, habilitando análises avançadas sobre a jornada do cliente. 📘 Conhecimentos aplicados: Integração com APIs RESTful • Arquitetura de Data Lake em camadas (transiente, raw, analytics) • Orquestração de pipelines com dependência lógica e agendamento diário 🛠️ Principais tecnologias e ferramentas: Apache Airflow • PySpark • Python • AWS (S3, Athena, EMR, Glue) • JSON • Azure DevOps 💡 Habilidades: Construção e automação de pipelines em cloud • Modelagem de dados orientada a consumo
  • Jump
    Engenheiro de dados
    Jump
    Apr 2024 - May 2024 (2 months)
    ✦ Cliente: Logicalis (Quod Datatech) 🧾 Resultados: Refinamento de processos e ingestão de dados no Data Lake, garantindo estrutura organizada e acessível para os cientistas de dados, com foco em confiabilidade e performance de leitura. 📘 Conhecimentos aplicados: Otimização de pipelines de ingestão • Preparação de dados para consumo em modelos analíticos • Boas práticas de estruturação em Data Lake 🛠️ Principais tecnologias e ferramentas: Spark • Python • AWS 💡 Habilidades: Integração de dados brutos para camadas analíticas • Comunicação com times de ciência de dados • Eficiência em entregas rápidas com foco técnico
  • Jump
    Especialista em dados
    Jump
    Nov 2023 - Jan 2024 (3 months)
    ✦ Cliente: Logicalis (Banco do Brasil) 🧾 Resultados: Refatoração de modelo de escoragem com 108 variáveis (notebooks) em ambiente Cloudera, resultando em melhoria de performance entre 70–80% por meio de paralelismo e tuning de sessões Spark. 📘 Conhecimentos aplicados: Modernização de pipelines em ambientes Hadoop → CDP • Otimização de workloads Spark • Levantamento e agrupamento de variáveis 🛠️ Principais tecnologias e ferramentas: Cloudera Data Platform (CDP) • Apache Spark • Python • Jupyter Notebook 💡 Habilidades: Refatoração de código legado • Performance tuning em Spark • Execução em clusters distribuídos • Engenharia de dados aplicada a modelos de risco e crédito
  • Jump
    Senior Data Engineer
    Jump
    Apr 2023 - Mar 2024 (1 year)
    ✦ Cliente: Cogna Educação 🧾 Resultados: Desenvolvimento de pipelines para ingestão e transformação de dados relacionados à jornada do aluno, permitindo análise estratégica sobre engajamento acadêmico, situação financeira e performance de rematrícula. 📘 Conhecimentos aplicados: Modelagem de dados educacionais • Mapeamento de regras de negócio com áreas funcionais • Construção de pipelines voltados à visão 360° do aluno 🛠️ Principais tecnologias e ferramentas: Apache Airflow • PySpark • SQL • AWS (S3, Cloud9, Athena) • DevOps 💡 Habilidades: Levantamento de requisitos técnicos com áreas de negócio • Implementação de DAGs de ingestão e transformação • Engenharia de dados para educação e indicadores operacionais
  • Jump
    Senior Data Engineer
    Jump
    Nov 2021 - Mar 2023 (1 year 5 months)
    ✦ Cliente: Grupo Casas Bahia (Via) 🧾 Resultados: • Criação de Data Lake para abastecimento/logística, suportando decisões estratégicas com dados de estoque e previsão de demanda, além de planejamento do abastecimento com o mínimo de perda possível. • Implementação da métrica MAPE (Mean Absolute Percentage Error) no Databricks, contribuindo para medir a acuracidade dos modelos de previsão de vendas. • Entrega do projeto “Flash Ruptura”, com indicadores em tempo real via Power BI, reduzindo riscos operacionais no canal online durante a Black Friday. 📘 Conhecimentos aplicados: Modelagem e ingestão de dados para cadeia de suprimentos • Indicadores preditivos de logística • Métricas estatísticas aplicadas a operações de varejo • Integração com
  • GRUPO LPJ
    Data Engineer
    GRUPO LPJ
    Jan 2020 - Oct 2021 (1 year 10 months)
    ✦ Cliente: MRV Engenharia 🧾 Resultados: Liderança técnica na migração da arquitetura de dados on-premise para a nuvem, estruturando pipelines e camadas de dados no ambiente Azure. Entrega de dados consistentes e padronizados para análise corporativa. 📘 Conhecimentos aplicados: Arquitetura de dados em cloud • Estruturação de Data Lake em camadas • Tratamento de dados inconsistentes • Estratégia de ingestão e transformação com foco em performance e governança 🛠️ Principais tecnologias e ferramentas: Azure Data Factory • Azure Synapse Analytics • Azure Databricks • Apache Spark (Scala/Python) • Apache Hive • Azure Storage 💡 Habilidades: Engenharia de dados em ambiente cloud • Modelagem e padronização de dados brutos • Implantação de pipeli
  • GRUPO LPJ
    Senior Business Intelligence Analyst
    GRUPO LPJ
    Jan 2016 - Dec 2019 (4 years)
    ✦ Cliente: MRV Engenharia 🧾 Resultados: Liderança técnica em demandas de BI com foco nas áreas de Produção (Suprimentos, Engenharia/Custos, Planejamento e Controle) e Comercial, promovendo a consolidação de indicadores estratégicos, melhoria de processos e autonomia analítica por meio de soluções self-service. 📘 Conhecimentos aplicados: Modelagem dimensional • Construção de ETL e cubos OLAP • Integração de dados de SAP e CRM • Governança de dados e estruturação de data marts • Sustentação 🛠️ Principais tecnologias e ferramentas: SQL Server Integration Services (SSIS) • SAP Data Services • SAP Business Objects • SQL Server Reporting Services (SSRS) • SQL • Power BI • Microsoft Dynamics CRM • SAP ERP • SAP HCM 💡 Habilidades: Liderança téc
  • I
    Business Intelligence Consultant
    Impaar - BI Consultants
    Aug 2015 - Sep 2015 (2 months)
    Atuação no projeto do grupo BVL Automotive (Grupo de Concessionárias) utilizando a ferramenta Qlik Sense Desktop, englobando todas as etapas de Business Intelligence, com o objetivo de analisar a solução que melhor atende a necessidade do cliente e do negócio.
  • Stefanini Group
    Business Intelligence Developer
    Stefanini Group
    Dec 2013 - Jan 2015 (1 year 2 months)
    ✦ Principais projetos • Hospital Israelita Albert Einstein - O projeto consistia em reescrever DTSs que foram desenvolvidos no Microsoft SQL Server 2000 para DTSx SQL Server 2008. Meu papel foi desenvolver observando e entendendo as regras de negócios criadas nos pacotes anteriores. • Banco Itaú - Desenvolvimento no DataStage (IBM) de DTSs que foram desenvolvidos em SQL Server 2000, aplicando as melhores práticas. • Grupo Energisa - Desenvolvimento e manutenção de relatórios no SQL Server Reporting Services (SSRS) que visam mensurar indicadores de desempenho, baseado na metodologia BSC (Balanced Scorecard).
  • Stefanini Group
    Estagiário de TI
    Stefanini Group
    Aug 2012 - Nov 2013 (1 year 4 months)
    Programa de Formação de Talentos Desenvolvimento BI atuando com diversas ferramentas, Oracle Business Intelligence Discoverer, Oracle Discoverer Administrator, Oracle Warehouse Builder, Microsoft Business Intelligence, IBM InfoSphere DataStage, IBM Cognos Business Intelligence, Tableau Software, além da oportunidade de trabalhar em projetos de modelagem e análise de dados. ✦ Principais projetos • Gerdau - Atuação com SQL Server na modelagem dos dados e criação da melhor solução de atualizações feitas na base de dados. • MRS Logística S/A - Desenvolvimento de rotinas em SQL Server de procedimentos com o objetivo de inovações e melhorias de sistemas em produção e/ou pré-implantação, contribuindo na parte de implementação evolutiva e corretiva
Education verified_user 0% verified
  • IGTI
    IGTI — Engenheiro de Dados Cloud Bootcamp
    IGTI
    Jan 2022 - Dec 2022 (1 year)
  • IGTI
    IGTI — Engenheiro de Dados Bootcamp
    IGTI
    Jan 2021 - Dec 2021 (1 year)
  • IGTI
    IGTI — Analista de Machine Learning Bootcamp
    IGTI
    Jan 2020 - Dec 2020 (1 year)
  • PUC Minas
    PUC Minas — Pós-graduado em Ciência de Dados e Big Data
    PUC Minas
    Jan 2018 - Dec 2020 (3 years)
  • Centro Universitário UNA
    Centro Universitário UNA — Graduado em Análise e Desenvolvimento de Sistemas
    Centro Universitário UNA
    Jan 2013 - Dec 2016 (4 years)
  • C
    COTEMIG - Colégio e Faculdade — Técnico em Informática Gerencial
    COTEMIG - Colégio e Faculdade
    Jan 2010 - Dec 2012 (3 years)
This is a community-created genome.