Portrait of Thiago Baptista
Vitória, Brasil
Olá, eu sou

Thiago Baptista

Engenheiro. Construtor. Solucionador.

Engenheiro de Dados & Analytics especializado em Data Lakehouse e soluções de Big Data. Construo soluções analíticas end-to-end com Databricks, Apache Spark, Delta Lake e Microsoft Fabric.

Sobre Mim

Sou Thiago Baptista, Engenheiro de Dados & Analytics com mais de duas décadas de experiência transformando dados brutos em ativos estratégicos. Minha trajetória começou com bancos relacionais e BI em 2000 e evoluiu para arquiteturas modernas de Data Lakehouse com Databricks, Apache Spark e Microsoft Fabric. Projeto e construo soluções analíticas end-to-end: de pipelines de ingestão a produtos de dados Gold-layer que alimentam dashboards executivos e decisões de negócio.

Resumo

Cargo Atual

Senior Analytics Engineer na Natura (via HVAR)

Formação

Universidade Federal do Espírito Santo (UFES), Ciência da Computação

Certificações

  • Databricks Certified Data Engineer Associate
  • Microsoft Certified: Fabric Data Engineer Associate
  • Microsoft Certified: Azure Data Fundamentals
  • GitHub Foundations

Idiomas

Português (Nativo) Inglês (C1 Avançado)

Competências

Engenharia de dados e analytics end-to-end, do design de Data Lakehouse a produtos de dados governados que orientam decisões de negócio.

Lakehouse Analytics

Data Lakehouse com Databricks e Microsoft Fabric. Arquitetura medallion, Delta Lake, modelagem dimensional, transformações Silver-to-Gold com PySpark e Spark SQL, definição de métricas de negócio e preparação de dados para consumo em Tableau e Power BI.

Pipelines & CI/CD

Pipelines de dados escaláveis com Apache Spark e Delta Lake. Automação CI/CD com Azure DevOps e GitHub Actions para deploy e versionamento de artefatos de dados.

Governança & Qualidade

Unity Catalog e Microsoft Purview. Catalogação, linhagem, controle de acesso, dicionário de métricas. Qualidade de dados com Delta Live Tables expectations, testes unitários e data quality checks.

Liderança & Setores

Liderança de equipes multidisciplinares, definição de padrões de arquitetura e tradução de requisitos de negócio em soluções de dados. Setores: varejo, indústria, agronegócio, cosméticos, logística e governo.

Experiência

De bancos relacionais ao Data Lakehouse moderno, 30 anos construindo soluções de dados que orientam decisões estratégicas.

Jan 2026 - Presente

Natura (via HVAR)

Senior Analytics Engineer

Cosméticos & Bens de Consumo São Paulo, Brasil

Maior empresa de cosméticos da América Latina, operando em múltiplos países e marcas

Conquistas
  • Projeto e construção de produtos de dados Gold-layer em Databricks alimentando dashboards executivos no Tableau
  • Transformações Silver-to-Gold com PySpark e Spark SQL: padrões OBT, Star Schema e SCD
  • KPIs financeiros e comerciais multi-marca e multi-país: receita, precificação, taxas de aprovação, ciclo de vida do cliente
  • Definição e documentação de métricas de negócio alinhadas ao Hub de Dados Natura e Unity Catalog
  • Habilitação DataViz: pacotes de consulta com documentação a nível de campo para desenvolvedores Tableau
Set 2025 - Jan 2026

Natura (via HVAR)

Senior Data Engineer

Cosméticos & Bens de Consumo São Paulo, Brasil

Projeto de modernização de dados e integração SAP-Databricks

Conquistas
  • Liderança técnica na ingestão de dados SAP (ECC, BW) no Databricks via SAP BDC e conectores AecorSoft
  • Projeto e evolução de camadas bronze/silver/gold baseadas em Delta Lake
  • Otimização de pipelines Spark/PySpark com particionamento avançado e versionamento de dados
  • Pipelines CI/CD para deploy de notebooks e workflows via GitHub
  • Padrões técnicos: convenções de nomenclatura, versionamento de tabelas, documentação Unity Catalog
Dez 2024 - Set 2025

Prodesp (via AlmavivA)

Engenheiro de Dados Sênior

Governo São Paulo, Brasil

GDAP - Gabinete Digital de Administração Pública, atendendo ao Governador do Estado de São Paulo

Conquistas
  • Pipelines de dados escaláveis com Databricks e Spark para integração de dados estaduais
  • Arquitetura Data Lakehouse para unificar e democratizar acesso aos dados governamentais
  • CI/CD com Azure DevOps: pipelines automatizados para ingestão, transformação e deploy
  • Modelos semânticos e dashboards Power BI para consumo estratégico do governo
Mar 2024 - Dez 2024

Prodesp (via AlmavivA)

DBA Sênior

Governo São Paulo, Brasil

Secretaria de Desenvolvimento Econômico do Estado de São Paulo

Conquistas
  • SQL Server avançado: views, CTEs, stored procedures, scripts T-SQL para programas governamentais
  • Sustentação em produção com monitoramento proativo e gestão de incidentes com SLA
  • Scripts Python para extração, análise e integração de dados
Abr 2014 - Mar 2024

Elever Vision

Engenheiro de Dados Sênior

Consultoria (Multi-setor) Vitória, Brasil

Consultoria de engenharia de dados para varejo, indústria, mídia e entretenimento

Conquistas
  • Data Lakes e Data Warehouses com Azure Storage, Azure SQL Database, SQL Server, PostgreSQL
  • Orquestração de pipelines ETL com Azure Data Factory, Apache Airflow e SSIS
  • Pipelines CI/CD com Azure DevOps e GitHub para governança do ciclo de vida dos dados
  • Dashboards Power BI e automação Python (pandas) para processamento de dados em larga escala
Mar 2010 - Jan 2014

Vale / VLI

Engenheiro de Dados

Mineração & Logística Belo Horizonte, Brasil

BI e Data Warehousing para operações logísticas de ferrovias e portos

Conquistas
  • Liderança técnica de equipe de 15 pessoas construindo Data Warehouse para FP&A
  • Modelagem multidimensional em SQL Server: tabelas fato/dimensão, T-SQL complexo
  • Orquestração ETL com SSIS integrando SAP, Oracle ERP, Cognos e sistemas operacionais
  • Soluções de análise financeira para previsão de demanda e alocação de custos
Fev 2000 - Mar 2010

Fundação Ceciliano Abel de Almeida

Engenheiro de Dados

Educação / Sem fins lucrativos Vitória, Brasil

Organização sem fins lucrativos afiliada à Universidade Federal do Espírito Santo (UFES)

Conquistas
  • Camada BI sobre ERP Sapiens com SQL Server para analytics e relatórios gerenciais
  • Administração de banco de dados: planejamento de capacidade, backup, disaster recovery
  • Automação ETL com Visual Basic e dashboards Crystal Reports

Tech Stack

Tecnologias principais em plataformas de dados, programação, orquestração e visualização.

Big Data & Processamento

Apache Spark
Apache Spark
Delta Lake
Delta Lake

Plataformas de Dados

Databricks
Databricks
Microsoft Fabric
Microsoft Fabric

Linguagens

Python
Python
PySpark
PySpark
Spark SQL
T-SQL
T-SQL

Governança de Dados

Unity Catalog
Unity Catalog
Microsoft Purview
Microsoft Purview

Bancos de Dados

PostgreSQL
PostgreSQL
SQL Server
SQL Server
Azure SQL Database
Azure SQL Database
DynamoDB
DynamoDB

Visualização

Power BI
Power BI
Tableau
Tableau
Grafana
Grafana

Cloud & Armazenamento

Azure
Azure
OneLake
OneLake
ADLS Gen2
ADLS Gen2
AWS
AWS
Amazon S3
Amazon S3

CI/CD & DevOps

Git
Git
GitHub
GitHub
Azure DevOps
Azure DevOps
GitHub Actions
GitHub Actions

Gestão de Projetos

Azure Boards
Azure Boards
GitHub Projects
GitHub Projects
Jira
Jira
Kanban
Scrum

Vamos Conectar

Envie uma mensagem

Informações de Contato

Quer conversar sobre arquitetura de dados, soluções lakehouse ou oportunidades de colaboração? Vamos conectar.