ETL - Reunião 007⚓︎
No encontro, revisamos o progresso no repositório "reestimativa_2026" e adicionamos a base "exec_alem_credito" no projeto.
Apresentamos os processos de ETL da SPLOR e discutimos possíveis melhorias1.
Gravação do encontro
Este post tenta fazer um grande resumo do que foi conversado, mas se preferir, pode acompanhar tudo na íntegra!
Discussão⚓︎
Nova integrante⚓︎
No encontro do dia 27/02/2026, foi apresentada a nova integrante "Maria Eduarda" do time, que, inicialmente, irá estudar o repositório do Reestimativa, para auxiliar na refatoração dos códigos em R para scripts em Python.
Atividade realizada⚓︎
Para revisão do progresso, a Laura mostrou os scripts Python criados para processar as bases da AID. A comparação entre a base gerada originalmente com a base atual deu 100% de acerto para os testes.
Dica
Para mais detalhes, veja o comentário.
Consulta no BO⚓︎
Além disso, foi utilizado o BO para criar uma nova consulta sobre o "além crédito", bem como agendar a entrega por e-mail no formado .csv. Assim, foi incluída a nova base "exec_alem_credito" no projeto.
Observações⚓︎
-
Momentanemante, a coluna "uo_sigla" foi adicionada diretamente na consulta do BO, mas isso não é o ideal. Deverá ainda ser analisada qual a melhor solução.
Dica
Para mais detalhes, veja o issue.
-
Durante a consulta no BO, apesar de adicionar o filtro "Ano de Exercício igual a 2026", a consulta retornou os anos 2025 e 2026.
-
Além disso, descobrimos que, ao enviar como .csv (ao invés de .xlsx), o nome das colunas fica correta, não sendo necessário transformá-las (ex.: a "uo_sigla" aparece como "Unidade Orçamentária - Sigla").
Resultados⚓︎
A nova tabela foi testada e inserida no repositório, sendo retornada corretamente. Para isso, foi executado o comando a seguir:
O texto retornado no terminal foi adicionado no "datapackage.yaml" e no novo schema "exec_alem_credito.yaml".
Para validação, foi executado o comando a seugir:
Foi mostrado ainda que os arquivos são salvos em branco, pois eles costumam ser grandes. Então, ao rodar a validação do "datapackage.yaml", adicionando uma regra nos valores, será retornado erro.
🏁 Próximos Passos⚓︎
Para a próxima reunião:
-
O Gabriel irá criar um novo repositório para unificar os Data Packages e ajustar todas as consultas do BO para o novo padrão, servindo como ambiente de testes.
-
A Laura irá finalizar o mapeamento das colunas.
-
Em conjunto, será analisado o comando make copy_exec, que será substituído.
-
Também estamos documentando estas melhorias/simplificações neste Issue. ↩