➡ Você também pode conferir o Dashboard clicando aqui!
1. Resumo do Projeto
- Objetivo: Desenvolver um projeto de dados de ponta a ponta, desde a obtenção dos dados através da API Sports, tratamento no Python, Carga no BigQuery, construção das views com SQL e desenvolvimento do Dashboard no Power BI.
- Contexto: Analisar o desempenho dos times do campeonato inglês na temporada 2023/2024 e o valor de mercado dos jogadores, portanto, é possível visualizar as principais estatísticas do futebol e simular partidas através de técnicas estatísticas.
2. Tecnologias e Ferramentas
- Python
- SQL
- BigQuery
- Power BI
- Figma
3. Passo a Passo do Projeto
- Coleta de dados: API Sports
- Pré-processamento: Python
- Modelagem: Views dentro do BigQuery
- Resultados: Tabelas prontas para consumo em ferramentas de Visualização
4. Destaques do Código
- Link para o GitHub: Visualize o código em Python e SQL no Github, por lá você encontra também os Backgrounds feitos no Figma
5. Visualizações e Resultados
Confira abaixo o vídeo de navegação no Dashboard.
6. Aprendizados e Desafios
- Lições técnicas: Aprendi como obter dados de uma API e fazer a integração direta com Python e Cloud da GCP, então todo meu ambiente de desenvolvimento foi através do VSCode com comunicação entre máquina local e servidor remoto. Aprendi também a como melhorar os design de dashboards utilizando o Figma.
- Desafios superados: Extrair dados da API foi difícil em algum momento, pois os dados de ID de partidas são em dupla o que significa que cada partida possui o time da casa e o time visitante, mas o ID é o mesmo, ou seja, havia duplicação de ID mas isso faz parte do entendimento do negócio do futebol, portanto adequei a modelagem para considerar este caso. outro desafio foi a parte de simular um confronto entre dois times dentro do Power BI.
- Próximos passos: Criar um fluxo que mantenha a extração atualizada dentro da GCP e atualize as tabelas, seria legal fazer essa automatização do fluxo de ETL com campeonatos em curso, assim teria sempre os dados atualizados enquanto o campeonato acontece, uma outra coisa interessante seria aplicar testes e CI/CD no código para torná-lo mais robusto.