Comparateur de Profils de Joueurs (Football)
Projet Personnel de Data Science Interactive
Ce projet personnel est la continuité directe de mon analyse PCA initiale. L’objectif est de rendre cette étude interactive et exploitable grâce à Streamlit : comparer visuellement les joueurs professionnels en fonction de leurs statistiques sur la saison 2022-2023.
Fonctionnalités clés
- Calcul et visualisation de la variance expliquée par chaque composante PCA.
- Affichage des contributions (loadings) des variables sélectionnées sur PC1 et PC2.
- Sélection d’un joueur et affichage des 5 plus proches voisins statistiquement.
- Nuage de points interactif (PC1 vs PC2) avec annotations de zones conceptuelles.
Origine du projet
Lors de mon projet PCA, j’ai observé un nuage de points représentant les joueurs sur un plan 2D (PC1 vs PC2). Chaque point étant une représentation de leurs statistiques, j’ai eu l’idée d’utiliser la distance euclidienne entre deux points pour mesurer leur similarité. C’est ainsi qu’est né ce comparateur, qui met en lien la représentation statistique des joueurs et leur proximité de profil.
Les statistiques sélectionnées pour cette PCA sont les suivantes :
- Shots : Total des tirs (hors penaltys)
- PasTotPrgDist : Distance totale des passes vers l’avant
- Assists : Passes décisives
- SCA : Actions menant à un tir
- Tkl+Int : Tacles + Interceptions
- ToAtt : Tentatives de dribbles
Le projet a été développé sous VS Code en Python avec Streamlit pour l’interface. Il fonctionnait d’abord en local, mais est désormais hébergé en ligne grâce à Render.
Explorer directement le comparateur
👉 Si l’aperçu ne fonctionne pas ou pour une meilleure expérience, ouvrez l'application dans un nouvel onglet.
⏳ L'application peut mettre quelques secondes à se lancer si elle était en veille.
Possibilités d’amélioration
- Proposer une comparaison sans passer par la PCA…
- Ajouter des filtres (âge, championnat…)
- Conserver un historique de comparaisons
Source des données
Les statistiques des joueurs proviennent du dataset "2022/2023 Football Player Stats" sur Kaggle, partagé sous licence CC BY 4.0. J’ai nettoyé, sélectionné et transformé ces données pour les adapter à mon analyse.
Le code complet de l’application est disponible sur GitHub.
Voir le projet sur GitHub