1. Introdução
  2. Conceitos
  3. 1. Processo de ETL
  4. 2. Extração
    1. 2.1. Web Scraping
      1. 2.1.1. Ética e Legalidade
    2. 2.2. API
      1. 2.2.1. REST
      2. 2.2.2. GraphQL
    3. 2.3. Banco de Dados
    4. 2.4. Arquivos Estruturados
      1. 2.4.1. CSV
      2. 2.4.2. XLS ou XLSX
      3. 2.4.3. JSON
      4. 2.4.4. XML
    5. 2.5. Arquivos Não Estruturados
      1. 2.5.1. PDF
      2. 2.5.2. Texto
  5. 3. Transformação
    1. 3.1. Limpeza de Dados
    2. 3.2. Validação de Dados
    3. 3.3. Enriquecimento de Dados
    4. 3.4. Normalização e Padronização
  6. 4. Carregamento
    1. 4.1. Data Warehouses
    2. 4.2. Data Lakes
    3. 4.3. Ferramentas de BI
  7. Guia de Referência
  8. 5. Definição do Problema
    1. 5.1. Identificação de Necessidades de Negócio
    2. 5.2. Definição de Métricas e KPIs
  9. 6. Extração
    1. 6.1. API Pública
    2. 6.2. Bases de Dados
    3. 6.3. Servidor de Arquivos Estáticos
    4. 6.4. Sites Estáticos
    5. 6.5. Sites Dinâmicos
    6. 6.6. Tratamento dos Dados
  10. 7. Transformação
  11. 8. Carregamento
    1. 8.1. Batch ou Streaming
    2. 8.2. Sincronização Incremental
    3. 8.3. Documentação de Metadados
    4. 8.4. Armazenamento de Dados
      1. 8.4.1. Estratégias de Particionamento
  12. 9. Automação
    1. 9.1. Orquestração de Workflows
    2. 9.2. Pipeline CI/CD
  13. Boas Práticas
  14. 10. Versionamento de Dados
    1. 10.1. Git
      1. 10.1.1. LFS
    2. 10.2. DVC
  15. 11. Monitoramento de Pipelines
  16. 12. Testes de Qualidade de Dados
  17. Exemplos
  18. Contribuidores

Guia do Analista de Dados da SEPLAN/RR

Processo de ETL