
Thiago Baptista
Engenheiro. Construtor. Solucionador.
Engenheiro de Dados & Analytics especializado em Data Lakehouse e soluções de Big Data. Construo soluções analíticas end-to-end com Databricks, Apache Spark, Delta Lake e Microsoft Fabric.
Sobre Mim
Sou Thiago Baptista, Engenheiro de Dados & Analytics com mais de duas décadas de experiência transformando dados brutos em ativos estratégicos. Minha trajetória começou com bancos relacionais e BI em 2000 e evoluiu para arquiteturas modernas de Data Lakehouse com Databricks, Apache Spark e Microsoft Fabric. Projeto e construo soluções analíticas end-to-end: de pipelines de ingestão a produtos de dados Gold-layer que alimentam dashboards executivos e decisões de negócio.
Resumo
Cargo Atual
Senior Analytics Engineer na Natura (via HVAR)
Formação
Universidade Federal do Espírito Santo (UFES), Ciência da Computação
Certificações
- Databricks Certified Data Engineer Associate
- Microsoft Certified: Fabric Data Engineer Associate
- Microsoft Certified: Azure Data Fundamentals
- GitHub Foundations
Idiomas
Competências
Engenharia de dados e analytics end-to-end, do design de Data Lakehouse a produtos de dados governados que orientam decisões de negócio.
Lakehouse Analytics
Data Lakehouse com Databricks e Microsoft Fabric. Arquitetura medallion, Delta Lake, modelagem dimensional, transformações Silver-to-Gold com PySpark e Spark SQL, definição de métricas de negócio e preparação de dados para consumo em Tableau e Power BI.
Pipelines & CI/CD
Pipelines de dados escaláveis com Apache Spark e Delta Lake. Automação CI/CD com Azure DevOps e GitHub Actions para deploy e versionamento de artefatos de dados.
Governança & Qualidade
Unity Catalog e Microsoft Purview. Catalogação, linhagem, controle de acesso, dicionário de métricas. Qualidade de dados com Delta Live Tables expectations, testes unitários e data quality checks.
Liderança & Setores
Liderança de equipes multidisciplinares, definição de padrões de arquitetura e tradução de requisitos de negócio em soluções de dados. Setores: varejo, indústria, agronegócio, cosméticos, logística e governo.
Experiência
De bancos relacionais ao Data Lakehouse moderno, 30 anos construindo soluções de dados que orientam decisões estratégicas.
Natura (via HVAR)
Senior Analytics Engineer
Maior empresa de cosméticos da América Latina, operando em múltiplos países e marcas
Conquistas
- Projeto e construção de produtos de dados Gold-layer em Databricks alimentando dashboards executivos no Tableau
- Transformações Silver-to-Gold com PySpark e Spark SQL: padrões OBT, Star Schema e SCD
- KPIs financeiros e comerciais multi-marca e multi-país: receita, precificação, taxas de aprovação, ciclo de vida do cliente
- Definição e documentação de métricas de negócio alinhadas ao Hub de Dados Natura e Unity Catalog
- Habilitação DataViz: pacotes de consulta com documentação a nível de campo para desenvolvedores Tableau
Natura (via HVAR)
Senior Data Engineer
Projeto de modernização de dados e integração SAP-Databricks
Conquistas
- Liderança técnica na ingestão de dados SAP (ECC, BW) no Databricks via SAP BDC e conectores AecorSoft
- Projeto e evolução de camadas bronze/silver/gold baseadas em Delta Lake
- Otimização de pipelines Spark/PySpark com particionamento avançado e versionamento de dados
- Pipelines CI/CD para deploy de notebooks e workflows via GitHub
- Padrões técnicos: convenções de nomenclatura, versionamento de tabelas, documentação Unity Catalog
Prodesp (via AlmavivA)
Engenheiro de Dados Sênior
GDAP - Gabinete Digital de Administração Pública, atendendo ao Governador do Estado de São Paulo
Conquistas
- Pipelines de dados escaláveis com Databricks e Spark para integração de dados estaduais
- Arquitetura Data Lakehouse para unificar e democratizar acesso aos dados governamentais
- CI/CD com Azure DevOps: pipelines automatizados para ingestão, transformação e deploy
- Modelos semânticos e dashboards Power BI para consumo estratégico do governo
Prodesp (via AlmavivA)
DBA Sênior
Secretaria de Desenvolvimento Econômico do Estado de São Paulo
Conquistas
- SQL Server avançado: views, CTEs, stored procedures, scripts T-SQL para programas governamentais
- Sustentação em produção com monitoramento proativo e gestão de incidentes com SLA
- Scripts Python para extração, análise e integração de dados
Elever Vision
Engenheiro de Dados Sênior
Consultoria de engenharia de dados para varejo, indústria, mídia e entretenimento
Conquistas
- Data Lakes e Data Warehouses com Azure Storage, Azure SQL Database, SQL Server, PostgreSQL
- Orquestração de pipelines ETL com Azure Data Factory, Apache Airflow e SSIS
- Pipelines CI/CD com Azure DevOps e GitHub para governança do ciclo de vida dos dados
- Dashboards Power BI e automação Python (pandas) para processamento de dados em larga escala
Vale / VLI
Engenheiro de Dados
BI e Data Warehousing para operações logísticas de ferrovias e portos
Conquistas
- Liderança técnica de equipe de 15 pessoas construindo Data Warehouse para FP&A
- Modelagem multidimensional em SQL Server: tabelas fato/dimensão, T-SQL complexo
- Orquestração ETL com SSIS integrando SAP, Oracle ERP, Cognos e sistemas operacionais
- Soluções de análise financeira para previsão de demanda e alocação de custos
Fundação Ceciliano Abel de Almeida
Engenheiro de Dados
Organização sem fins lucrativos afiliada à Universidade Federal do Espírito Santo (UFES)
Conquistas
- Camada BI sobre ERP Sapiens com SQL Server para analytics e relatórios gerenciais
- Administração de banco de dados: planejamento de capacidade, backup, disaster recovery
- Automação ETL com Visual Basic e dashboards Crystal Reports
Tech Stack
Tecnologias principais em plataformas de dados, programação, orquestração e visualização.
Big Data & Processamento
Plataformas de Dados
Linguagens
Governança de Dados
Bancos de Dados
Visualização
Cloud & Armazenamento
CI/CD & DevOps
Gestão de Projetos
Vamos Conectar
Envie uma mensagem
Informações de Contato
Quer conversar sobre arquitetura de dados, soluções lakehouse ou oportunidades de colaboração? Vamos conectar.