[API Sports] – Projeto End-to-end – Premiere League Temporada 2023/2024

➡ Você também pode conferir o Dashboard clicando aqui!


1. Resumo do Projeto

  • Objetivo: Desenvolver um projeto de dados de ponta a ponta, desde a obtenção dos dados através da API Sports, tratamento no Python, Carga no BigQuery, construção das views com SQL e desenvolvimento do Dashboard no Power BI.
  • Contexto: Analisar o desempenho dos times do campeonato inglês na temporada 2023/2024 e o valor de mercado dos jogadores, portanto, é possível visualizar as principais estatísticas do futebol e simular partidas através de técnicas estatísticas.

2. Tecnologias e Ferramentas

  • Python
  • SQL
  • BigQuery
  • Power BI
  • Figma

3. Passo a Passo do Projeto

  • Coleta de dados: API Sports
  • Pré-processamento: Python
  • Modelagem: Views dentro do BigQuery
  • Resultados: Tabelas prontas para consumo em ferramentas de Visualização

4. Destaques do Código

  • Link para o GitHub: Visualize o código em Python e SQL no Github, por lá você encontra também os Backgrounds feitos no Figma

Clique aqui para conferir!


5. Visualizações e Resultados

Confira abaixo o vídeo de navegação no Dashboard.


6. Aprendizados e Desafios

  • Lições técnicas: Aprendi como obter dados de uma API e fazer a integração direta com Python e Cloud da GCP, então todo meu ambiente de desenvolvimento foi através do VSCode com comunicação entre máquina local e servidor remoto. Aprendi também a como melhorar os design de dashboards utilizando o Figma.
  • Desafios superados: Extrair dados da API foi difícil em algum momento, pois os dados de ID de partidas são em dupla o que significa que cada partida possui o time da casa e o time visitante, mas o ID é o mesmo, ou seja, havia duplicação de ID mas isso faz parte do entendimento do negócio do futebol, portanto adequei a modelagem para considerar este caso. outro desafio foi a parte de simular um confronto entre dois times dentro do Power BI.
  • Próximos passos: Criar um fluxo que mantenha a extração atualizada dentro da GCP e atualize as tabelas, seria legal fazer essa automatização do fluxo de ETL com campeonatos em curso, assim teria sempre os dados atualizados enquanto o campeonato acontece, uma outra coisa interessante seria aplicar testes e CI/CD no código para torná-lo mais robusto.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *