Chercher des données géographiques et se former à leur manipulation

Un panorama partiel des sources de données et de méthodes de traitement de l’information géographique

Robin Cura

Université Paris 1 Panthéon-Sorbonne
UMR PRODIG
Atelier “Méthodologies, Géomatique, Information géographique”

Hugues Pécout

CNRS
UMR Géographie-cités
Transversalité “Données et Protocoles dans les Humanités Numériques”

Qui sommes-nous ?

Hugues & Robin


  • Ingénieur d’Etudes CNRS en sciences de l’information géographique
  • FR CIST (2012-2022), puis UMR Géographie-cités
  • Coordinateur du groupe ElementR et du projet Rzine
  • Veille active sur les enjeux de géomatique avec R
  • Animateur de formations à R, à l’analyse spatiale et aux méthodes reproductibles

  • Maître de conférences à Paris 1 en géomatique et géographie humaine depuis 2022
  • UMR Géographie-cités (2011-2022) puis UMR PRODIG
  • Responsable d’un master de cartographie et géomatique
  • Veille active en analyse spatiale et en données massives
  • Enseignant en SIG, analyse spatiale et développement R & Python

Point de vue et expérience



Quelques biais…

  • Point de vue de géomaticiens SHS plutôt en géographie humaine (plutôt vecteur que raster)

  • usage quasi unique de logiciels libres, et de sources de données libres

  • récupération des données aussi automatisée que possible

  • interêt pour les sources de données massives contemporaines

  • utilisateurs de R avancés, porte d’entrée pour les API et données

Programme et objectifs

Objectifs


Trouver des données

  • Donner un aperçu structuré des sources de données les plus généralistes
  • Recensement de données selon une typologie partiale et discutable
  • Autant que possibles, données harmonisées aux échelles à minima nationales


Se former à leur manipulation

  • Recensement de canaux de formation ESR et d’auto-formation plutôt que de formations professionnelles
  • Large part à la veille méthodologique et technologique : on apprend en cherchant et en essayant
  • Convaincus qu’on apprend des autres, mais aussi en apprenant aux autres

Retours sur cette présentation


Un portrait forcément incomplet

Vos retours et vos idées sont les bienvenus :

  • nous transmettons ici nos propres habitudes et circuits de veille/recherche,
  • il y en a d’autres, au moins aussi valables,
  • et ils nous intéressent… N’hésitez pas à nous les partager !

Sources - ⛁ Données de référence

Données institutionnelles françaises


  • En charge de la production et de la diffusion des données géographiques
  • Un réel effort d’ouverture ces dernières années : il devient de plus en plus facile d’accéder aux données
  • Une plateforme désormais claire : https://geoservices.ign.fr/catalogue

Les catalogues

Catalogue des géoservices de l’IGN

Le catalogue général de l’INSEE

Les données infracommunales de l’INSEE

Données institutionnelles européennes



  • Données statistiques harmonisées européeennes (UE++)

  • Rôle d’agrégateur de données nationales

  • Harmonisation des unités spatiales : les NUTS et LAU

Données statistiques : Eurostat

Avertissement

Assez peu adapté à des recherches de données par niveau géographique

Données spatiales : le GISCO

Copernicus / GMES

Pour les données issues d’imagerie satellite, le programme européen Copernicus met à disposition en accès libre (flux WMS surtout) un large ensemble de produits résultants : occupation du sol, couvert végétal, type de végétation, etc.



Données géo. institutionnelles mondiales

Autres données para-institutionnelles mondiales

Limites administratives

GADM

gadm.org

GeoBoundaries

www.geoboundaries.org

Imagerie

NASA Earth Observation Data

www.earthdata.nasa.gov : GDEM et déclinaisons

Sources - ⛁ Données contributives

OpenStreetMap

GeoNames

www.geonames.org

  • Géocodage
  • Harmonisation de localisations et entités spatiales
  • Statistiques simples

Sources - ⛁ Données ouvertes

data.gouv

data.gouv.fr

data.europa.eu

data.europa.eu

Opendatasoft / Huwise : catalogue de portails opendata

data.opendatasoft.com

Sources - ⛁ Nouvelles données massives

Overture Maps Foundation

overturemaps.org

Source.coop

source.coop

Kaggle Datasets

www.kaggle.com/datasets

Sources - 🔎 Trouver des données ?

Quelques conseils pour la recherche de jeux de données géographiques : entrepôts

  • Entrepôts de données locaux : nous avons ici recensés les grands portails de données “homogènes” offrant les plus grandes couvertures spatiales, mais de nombreux entrepôts de données nationaux et régionaux existent également, et contiennent souvent des sources plus à jour et plus diversifiées.
  • Instituts géographiques et statistiques : tous les pays ne disposent pas d’institutions géographiques, mais à défaut, on trouve souvent des informations de cadrage, y compris spatiales, sur les sites des institutions statistiques de ces différents pays (et régions pour les pays fédéraux).

Quelques conseils pour la recherche de jeux de données géographiques : moteurs de recherche

  • En dehors des données centralisées évoquées jusqu’ici, on trouve énormément de données dispersées via de simples recherches sur internet. Chercher les informations via quelques mots-clés, en anglais, additionnés du terme “geojson” ou “shapefile” ou “geopackage” aide très souvent à trouver directement les liens vers les portails et sources de données.

  • Ne pas avoir peur d’ouvrir systématiquement les liens des quelques premières pages de résultat, et de procéder ensuite de proche en proche en explorant la structure des sites retournés : on finit quasiment toujours par trouver des données géographiques appropriées à nos recherches.

Portails cartographiques en ligne : observer les données

  • Souvent, les jeux de données ne semble pas directement téléchargeable : carte web dynamique par exemple.

  • Penser à regarder ce qui transite dans le navigateur (Outils de développement du navigateur) pour voir si on y repère, simplement, des jeux de données (souvent format json) ou des flux géographiques (WMS entre autre) :

Sources - 🔎 Mener une veille ?

Newsletters et blogs

Méthodes - 🎓 Formations institutionnelles

Les écoles doctorales

Université Paris 1 Panthéon Sorbonne

Message aux enseignants-chercheurs

Trop peu de formations orientées méthodes et outils. Il serait judicieux d’étoffer l’offre de formation sur le taitement et l’analyse de données en SHS

Université Paris cité

Message aux doctorants

Faite remonter vos besoins !

Proposer des formations, car former c’est d’abord apprendre !

Les réseaux métiers (1/4)

Très bon réseau (inclusif) pour s’initier à des méthodes et outils.

Il rassemble tous les les métiers des ingénieurs et techniciens en sciences humaines et sociales (Gestion de base de données, analyse statistique, spatiales, textuelle…)

Très orienté transfert de compétences (JA, école thématique, ANF…)

Il propose des tutoriels vidéo tous les mois !

Ces sont captés est mis à disposition sur Youtube :

www.youtube.com/@tutomate-shs9504

#54 : KoboToolBox

#36 : Magrit

Les réseaux métiers (2/4)

Et bien sûr MATE-SHS condorcet, un des 6 groupes local du réseau MATE-SHS.

Ce réseau local propose des rencontres appelées « ateliers-garage », qui s’organisent autour de thématiques axées sur des méthodes ou outils en SHS.

« Ateliers-garage »

  • Échanger autour de pratiques, méthodes et outils,
  • Partager des questionnements et des ressources entre professionnel·le·s,
  • Amorcer des réflexions communes et faire émerger des pistes de collaboration.

🟰

Veille & formation

Actuellement


➡️ Cycle de trois séances sur les données spatiales


  • 8 décembre : « Qu’est ce que les données géospatiales »
  • 15 janvier : « Quels outils et méthodes pour les SHS »
  • 22 janvier : « Retours d’expérience et cas d’usage »


Campus Condorcet | 10h-12h
Accès libre sur inscription

Les réseaux métiers (3/4)

Le GdR MAGIS a pour mission d’accompagner la recherche sur l’Information Géographique dans toute sa diversité, de fédérer une communauté scientifique pluridisciplinaire en géomatique et de diffuser les connaissances produites.



55 unités membres du GdR MAGIS


➡️ Organise une école thématique tous les ans

Les réseaux métiers (4/4)

L’objectif du projet RésIn est de créer un réseau pluridisciplinaire de professionnel·les des méthodes de recherche au sein du collectif des institutions composant Sciences Po et l’Université Paris Cité… Mais réseau ouvert à tou·te·s


Deux actions régulières :

  • MetSem - Séminaire de méthodologie

  • MetAt - Atelier de méthode ⚠️

Les plateformes

Paris 1

Cellule d’Appui “Systèmes d’Information et Ingénierie Numérique pour la Recherche”

Elles offrent de nombreux services :

  • Formations
  • Accompagnement de projet
  • Accès aux données
  • Accès à des logiciels
  • Prêt de matériel (PC, GPS, drônes…)



Et aussi…

Les ingénieur·es de vos laboratoires et les unités d’appui à la recherche sont également de potentielles ressources

Par exemple, L’UAR RIATE abrite plusieurs spécialistes de l’information géo. 😉

Les écoles thématiques et ANF

Une école thématique est une modalité de formation (5 jours en moyenne) de l’ESR

Une Action Nationale de Formation, c’est pareil mais plus court (3 jours en moyenne)

Exemples d’écoles thématiques sur les données spatiales :

  • Géoviz 2018 (GdR MAGIS) - Géovisualisation
  • SIGR 2021 (UAR RIATE) - Sciences de l’information géographique reproductibles
  • Transcarto 2021 (MATE-SHS) - Transformations Cartographiques

Les meilleurs fomations

Elle sont organisées par des equipes de spécialistes et même parfois coordonnées par des conseils scientifiques. Elle permettent vraiment de s’imprégner de nouvelles méthodes et/ou outils. Il s’agit sans doute du format de formation le plus efficace, aussi bien pour l’aquisition de compéténce que le networking.

➡️ Pas réservé à un statut en particulier. Les doctorant·es sont appréciés.

Les groupes d’utilisateur·rice·s

RUSS - R à l’usage des sciences sociales
ElementR - Pour le traitement de l’information géographique avec R

Bon cadre pour la veille et l’autoformation dans une thématique.


Save the date

Le vendredi 13 février 2026, de 9h30 à 12h et en hybride (salle Sauvy, INED), une séance spéciale RUSS /ElementR est organisée :

« L’autocorrélation spatiale multivariée », le package adespatial par Stéphane Dray.

➡️ Séance ouverte à tou.te.s mais inscription obligatoire



Méthodes - 📚 Formations autonomes

Méthodes - 🔎 Echanger et suivre

Méthodes - 🔎 Mener une veille sur les méthodes et outils ?

Veille méthodo recherche :

Veille technique

Les conférences utilisateurs et développeurs