Par2Vie – Parcours de vie et territoires. Collecte et analyse

Ce projet traite des problématiques liées à la collecte et à l’exploitation (extraction, enrichissement, analyse) de données sur les parcours de vie en lien avec les territoires. Il s’appuie sur une collaboration interdisciplinaire initiée lors du colloque du CIST de 2020. Son ambition est d’apporter des solutions innovantes et opérationnelles, en associant le savoir-faire des chercheur‧es en informatique en matière d’élaboration de modèles et de développement d’applications à l’expertise des chercheur‧es en SHS sur les enquêtes relatives aux parcours de vie.

Depuis les années 1980, les enquêtes biographiques se sont développées dans le panorama des méthodes de collecte des données socio-démographiques. Fondées sur le recueil par questionnaire de parcours individuels, ces enquêtes, notamment celles lancées sous l’égide de l’Ined – Enquêtes Triple biographies 3B (1981), Biographies et Entourage (2000), Histoires de vie (2003) – ont ouvert de nouveaux champs d’analyse pour la compréhension des dynamiques sociales, démographiques et géographiques des populations. Pour autant, depuis quatre décennies, l’élaboration et le traitement de telles enquêtes posent des défis en matière de collecte et d’analyse, auxquels les chercheur‧es en sciences sociales sont confronté‧es encore aujourd’hui. L’objectif du projet « Parcours de vie et territoires. Collecte et analyse » est d’apporter des solutions innovantes et opérationnelles, en associant le savoir-faire des chercheur‧es en informatique dans l’élaboration de modèles, d’algorithmes, d’interfaces utilisateur adaptées, et d’applications numériques, à l’expérience acquise par les chercheur‧es en sciences humaines sur les enquêtes biographiques.

Le projet se donne ainsi comme ambition de lever différents verrous observés lors de la conduite et de l’analyse d’enquêtes portant sur les histoires de vie. Les enjeux portent notamment sur :

Une modélisation dédiée à la représentation informatique de la notion de parcours de vie individuel qui réponde aux besoins d’analyse des chercheurs en SHS

L’objectif est ici de coconstruire des modèles sémantiquement riches, capables de représenter la structure des parcours de vie individuels, autant d’un point de vue descriptif qu’explicatif. Les premiers travaux réalisés conjointement par les membres du projet ont montré que le modèle générique SaLTo (pour Semantic Life Trajectories), proposé par l’équipe STeamer du LIG (Noël, 2019 ; Gensel et al., 2020) et dédié à la représentation de données de trajectoires dans toute leur complexité, est adapté à la représentation des données d’enquêtes biographiques, exploitées par les équipes de ESO et de l’Ined.

Une opérationnalisation des modèles par la mise en relation de technologies et méthodologies issues de thématiques complémentaires

Au-delà de la phase de modélisation, il convient d’implanter ces modèles en structures de stockage adaptées aux données à collecter. À titre d’exemple, l’approche basée sur le modèle SaLTo s’appuie sur des ontologies et le formalisme des graphes de connaissances du web sémantique. Ce choix permet de revisiter les modes d’acquisition de l’information biographique grâce aux possibilités d’enrichissement sémantique automatisé. Il s’agit ici, en exploitant des données disponibles dans le nuage des données ouvertes et liées (Linked Open Data Cloud), de contextualiser spatialement, temporellement et thématiquement les données d’enquêtes sur les parcours de vie.

L’exploitation des données biographiques

Les sciences sociales ont à leur disposition différentes approches et méthodes pour rendre compte des dynamiques sociales et démographiques, à partir de données biographiques (modèles de durée, typologies de trajectoires par des méthodes d’appariement, analyse de risque de survenue d’événements par des modèles de durée, etc.). Le passage de l’échelon des parcours individuels à l’échelon agrégé des dynamiques collectives, en particulier des parcours géographiques individuels aux dynamiques territoriales, rencontre différents obstacles dans la formalisation des modèles d’analyse (incluant, par exemple, la question de la similarité des trajectoires de vie par nature multidimensionnelles et complexes) et dans la restitution des résultats.

Issu de discussions engagées entre démographie, géographie, informatique et statistique lors du colloque du CIST de 2020, le projet réunit une équipe pluridisciplinaire composée de chercheur‧es et ingénieur‧es de recherche en sciences humaines et sociales (géographie, démographie, sociologie) et en sciences et technologies de l’information et de la communication (informatique, géomatique).

Les membres à l’initiative de ce projet sont issus de différentes unités membres du CIST :

  • Espaces et sociétés (ESO, Université Rennes 2-CNRS/InSHS)
  • Mobilité, parcours et territoires (UR12) et service Méthodes et statistiques (SMS) de l’Ined
  • Laboratoire d’Informatique de Grenoble (LIG, Université Grenoble Alpes-CNRS/INS2I).

Bibliographie indicative

fr_FR