Dans le cadre de mes projets appliqués en science géospatiale des données et télédétection, j’ai développé une analyse territoriale à partir de données ouvertes de la région française des Pays de la Loire, en intégrant des techniques de traitement géographique avec Python, GeoPandas et Shapely.
L’objectif du projet était de mettre en œuvre un flux complet d’analyse spatiale afin d’évaluer la répartition géographique de l’offre touristique des restaurants et d’explorer les modèles territoriaux à partir de sources officielles de données publiques ouvertes.
🧩 Données et méthodologie
L’analyse a combiné deux sources principales provenant des sites web officiels de données publiques ouvertes de Nantes Métropole et du Pays de la Loire.
- Base de données touristique des restaurants du Pays de la Loire (≈3375 enregistrements)
- Limites administratives des communes de la région au format GeoJSON.
🧭 Flux de travail
- Intégration et normalisation des données
Les champs clés ont été nettoyés, en ajustant les types de données et les projections spatiales (CRS). - Analyse exploratoire et visualisation
Des représentations visuelles ont été générées, comprenant des cartes, des points géolocalisés et des tampons proportionnels au nombre de restaurants par municipalité. - Synthèse spatiale
Les municipalités présentant la plus forte concentration touristique ont été identifiées, établissant un classement visuel des 10 et 20 premières selon leur densité.
Le jeu de données contenant les informations sur les restaurants (3 375 enregistrements) dans 49 colonnes est une source d’informations très intéressante qui tente de cartographier plusieurs variables ayant un impact sur le secteur de la restauration. Malheureusement, de nombreuses données sont manquantes, ce qui complique parfois la génération d’informations.


Après avoir effectué un décompte unique des communes, dans l’ensemble de données contenant la géométrie des Pays de la Loire, nous constatons qu’il existe 1 232 communes réparties dans cinq départements.

En consultant le nombre unique de communes dans l’ensemble de données sur l’offre touristique des restaurants, nous constatons que nous disposons d’enregistrements pour 566 communes, soit moins de la moitié.

En comptant les valeurs de la colonne « Département », nous vérifions qu’il n’y a pas d’enregistrements pour le département de la Vendée. C’est pourquoi nous verrons plus loin qu’il n’y a aucun restaurant géolocalisé dans la partie inférieure de la carte des Pays de la Loire.

Les deux ensembles ont été intégrés à l’aide du code INSEE afin de construire une infrastructure géospatiale cohérente, ce qui a permis de réaliser des analyses de densité et de répartition.

À partir de ce dataframe, nous créons un regroupement Groupby pour filtrer certaines colonnes dont nous aurons besoin : nom_comm, Commune, Geometry et Département. Nous le convertissons ensuite en Geodataframe.

Après avoir créé notre premier tracé de ce géodatabase, nous avons constaté que :
- De nombreuses communes ne disposent pas de données (registres des restaurants).
- La carte semble disproportionnée car elle n’utilise pas le même système de coordonnées (CRS).
- La partie inférieure de la carte correspondant à la Vendée n’est pas visible, car elle ne dispose pas de registres.

Nous allons attribuer le même CRS au géodatacadre principal des Pays de la Loire, puis recréer le tracé.


Nous créons une colonne contenant le « centroide » de chaque municipalité et une autre calculant la zone tampon de chaque point centroïde.

Nous pouvons désormais générer notre première carte choropléthique indiquant la densité des restaurants par commune.

Et maintenant, une autre carte avec le nombre de restaurants, qui montre les communes sans valeurs ni données, y compris le département de la Vendée en bas.

Sur la carte, nous avons déjà identifié la commune qui présente la plus forte densité. Nous affichons maintenant le top 10 des communes qui comptent le plus de restaurants selon l’ensemble de données.


Nous faisons une copie du dataframe où nous attribuons le point centroïde comme « Géométrie » principale, puis nous le traçons.


Nous pouvons désormais créer une première visualisation avec les centroïdes et leurs tampons croissant de manière logarithmique à partir du nombre de restaurants par commune.

Nous ne voyons pas clairement les différences, nous avons donc créé une autre version avec le mappage de couleurs « Viridis ». Nous conservons tous les points centroïdes, même ceux qui ne comportent pas d’enregistrements de restaurants.

La prochaine étape consistera à visualiser le top 20 et le top 10 des municipalités qui connaissent une croissance dans leur zone tampon en termes de nombre de restaurants. Nous affichons les étiquettes et les valeurs de chaque point.


Nous constatons ici, à gauche, qu’il existe un regroupement de communes en Loire-Atlantique (1527) qui, ensemble, représentent la majorité de l’offre touristique des restaurants dans les Pays de la Loire, ce que nous avons vérifié en effectuant un comptage dans notre base de données.

📊 Principales observations
L’analyse initiale a classé Le Mans comme la commune comptant le plus grand nombre de restaurants touristiques, et la Loire Atlantique comme le département présentant la plus forte densité d’offre touristique en matière de restauration, selon l’ensemble de données. Cependant, l’examen contextuel d’autres sources actuelles a révélé que Nantes concentre une offre plus large, étant donné que l’ensemble de données ne couvre pas l’ensemble de l’univers commercial.
Selon plusieurs portails touristiques et gastronomiques, des informations ont été recueillies auprès de la Chambre de commerce et d’industrie locale de Nantes, qui indique 1 414 restaurants dans son registre. En 2017, 3 737 établissements de restauration (y compris les restaurants de tous types) ont été recensés.
L’ensemble de données que nous utilisons dans cette analyse spatiale est fourni par le réseau e-SPRIT : système électronique des professionnels du réseau d’information touristique. Il nous fournit une liste des restaurants touristiques de la région Pays de la Loire, et ne représente pas nécessairement un recensement exhaustif de tous les restaurants de chaque ville.
La position du Le Mans en tête de classement m’a amené à me poser davantage de questions sur les événements ou les activités qui attirent le plus de visiteurs ou de touristes en France, et qui pourraient donc augmenter l’offre gastronomique ou hôtelière.
Voici une comparaison rapide, d’après les données de Wikipédia :
Événement | Fréquentation approximative | Fréquence | Type |
---|---|---|---|
Tour de Francia | 10 à 12 millions (répartis dans tout le pays) | Annuelle | Sport (cyclisme) |
Braderie de Lille | 2,5 à 3 millions (week-end) | Annuelle | Culturelle/commerciale |
Salon de l’Agriculture (Paris) | 600 000 à 700 000 (une semaine) | Annuelle | Foire |
Hellfest (Clisson) | 400 000 (week-end) | Annuelle | Musique |
24 Heures de Le Mans | 330 000 (week-end) | Annuelle | Automobile |
Finale de la Ligue des champions (Paris) | 75 000 | Occasionnel | Sport (football) |
En termes de concentration de public au même endroit et sur une courte période, Le Mans se classe parmi les 4-5 premiers événements en France.
Des événements tels que la Braderie de Lille et le Tour de France le dépassent en nombre total, mais Le Mans est unique par son caractère international et son prestige dans le monde de l’automobile. Avec plus de 300 000 spectateurs en un seul week-end, Le Mans figure parmi les événements sportifs les plus populaires en France. Ces chiffres montrent qu’il ne s’agit pas seulement d’une « autre course automobile » : c’est un rendez-vous emblématique du sport automobile, avec un poids historique, culturel et médiatique. La fréquentation est en augmentation, ce qui suggère que sa popularité continue de croître.
Cette constatation souligne l’importance d’interpréter les données spatiales dans leur contexte socio-économique, en évitant les conclusions basées uniquement sur la fréquence géographique.
🧠 Conclusions et perspectives
Le projet démontre le potentiel de l’analyse géospatiale appliquée avec Python pour la caractérisation territoriale et la prise de décision basée sur les données. Les outils mis en œuvre permettent de reproduire le flux de travail dans d’autres domaines, tels que l’urbanisme, la gestion environnementale ou le tourisme durable.
« Le territoire est mieux compris lorsque les données racontent son histoire. »
Je vois dans les données spatiales un monde utile et fascinant pour trouver des solutions innovantes et à fort impact qui ajoutent de la valeur à ce qui nous intéresse. Je suis actuellement les cours de Milan Janosov sur l’analyse des données géospatiales, où, grâce à la mise en œuvre de cas réels, nous nous rapprochons du domaine et du goût pour les données spatiales. J’espère pouvoir approfondir et progresser.
#DataScience #GeoPandas #GIS #RemoteSensing #GeospatialAnalysis #Python #DataVisualization #TourismData #PaysDeLaLoire #Nantes #DataDriven