SolidR : outil de diagnostic territorial via Soliguide
Le projet de fin de formation est un projet d’une durée de 2 mois, durant lesquels les élèves continuent leurs études
(Machine Learning avec la librairie python Scikit-Learn, Dashboards grâce aux outils Dash Plotly…)
C’est ainsi que mon collègue Jean-Baptiste Le Friant et moi-même, avons choisi parmi les 4 sujets
le thème complexe qu’est la précarité en France.
Les missions explicites étaient de :
collecter des données publiques via des API (INSEE, France travail, DREES) afin de compiler 4 années de données sociales sur tout le territoire,
Récolter les données de Solinumafin de démontrer que Soliguideétait un outil de diagnostic territorial,
Réaliser au moins un modèle de Machine Learning (nous avons utilisé deux modèles : KNN et une pipeline orientée Logistic Regression).
Concernant les données publiques, nous avons :
récolté 124 variables sociales de 104 départements sur 4 années (2009 à 2022),
réalisé des calculs pour obtenir des KPI sociales telles que le nombre de personnes en situation précaire (fixé à 60% du taux de pauvreté monétaire), la part des familles monoparentales…
Concernant les données Solinum nous avons :
« scrappé » les données 2023 (car les données fournies n’étaient disponibles que jusqu’à 2020) : langue du navigateur, nombre de connexions hebdomadaires…,
réalisé une cartographie des structures listées grâce à la librairie python Folium & Geopandas, triées par catégories…
créé des KPI selon le pourcentage de structures accueillant exclusivement des femmes, des personnes sans papier…
Concernant le Machine Learning, nous avons :
réalisé une cartographie des départements prioritaires dans le développement territorial de Soliguide (en comparaison avec les départements déjà couverts),
créé un modèle prédictif en prenant chaque département en valeur catégorique afin de proposer une prédiction des dépenses sociales selon l’année et les valeurs des variables prises en compte.
Pour ce projet, les outils utilisés ont été :
power BI pour la structuration des données sociales ainsi que celles du site de Soliguide,
Python pour l’EDA (Analyse Exploratoire des Données) avec Pandas et Numpy
Folium pour la création des cartographies (Choroplèthes et marqueurs),
Scikit-Learn pour le Machine Learning,
Dash Plotly pour le Dashboard interacti
Git pour la mise à jour du cod
Vscode pour l’IDE d’écriture de cod
Google Colaboratory pour nos notebooks de tests de code.
Voici l’application consultable en ligne sous « render » :
Si l’application n’apparaît pas, vous pouvez la réactiver sur le lien suivant : application solidr
Recent Portfolios
La Lanterne
Il n’y a pas d’extrait, car cette publication est protégée.
Spotify charts in France
SolidR : outil de diagnostic territorial via Soliguide