Depuis les années 1980, les enquêtes biographiques se sont développées dans le panorama des méthodes de collecte des données socio-démographiques. Fondées sur le recueil par questionnaire de parcours individuels, ces enquêtes, notamment celles lancées sous l’égide de l’Ined – Enquêtes Triple biographies 3B (1981), Biographies et Entourage (2000), Histoires de vie (2003) – ont ouvert de nouveaux champs d’analyse pour la compréhension des dynamiques sociales, démographiques et géographiques des populations. Pour autant, depuis quatre décennies, l’élaboration et le traitement de telles enquêtes posent des défis en matière de collecte et d’analyse, auxquels les chercheur‧es en sciences sociales sont confronté‧es encore aujourd’hui. L’objectif du projet « Parcours de vie et territoires. Collecte et analyse » est d’apporter des solutions innovantes et opérationnelles, en associant le savoir-faire des chercheur‧es en informatique dans l’élaboration de modèles, d’algorithmes, d’interfaces utilisateur adaptées, et d’applications numériques, à l’expérience acquise par les chercheur‧es en sciences humaines sur les enquêtes biographiques.
Le projet se donne ainsi comme ambition de lever différents verrous observés lors de la conduite et de l’analyse d’enquêtes portant sur les histoires de vie. Les enjeux portent notamment sur :
L’objectif est ici de coconstruire des modèles sémantiquement riches, capables de représenter la structure des parcours de vie individuels, autant d’un point de vue descriptif qu’explicatif. Les premiers travaux réalisés conjointement par les membres du projet ont montré que le modèle générique SaLTo (pour Semantic Life Trajectories), proposé par l’équipe STeamer du LIG (Noël, 2019 ; Gensel et al., 2020) et dédié à la représentation de données de trajectoires dans toute leur complexité, est adapté à la représentation des données d’enquêtes biographiques, exploitées par les équipes de ESO et de l’Ined.
Au-delà de la phase de modélisation, il convient d’implanter ces modèles en structures de stockage adaptées aux données à collecter. À titre d’exemple, l’approche basée sur le modèle SaLTo s’appuie sur des ontologies et le formalisme des graphes de connaissances du web sémantique. Ce choix permet de revisiter les modes d’acquisition de l’information biographique grâce aux possibilités d’enrichissement sémantique automatisé. Il s’agit ici, en exploitant des données disponibles dans le nuage des données ouvertes et liées (Linked Open Data Cloud), de contextualiser spatialement, temporellement et thématiquement les données d’enquêtes sur les parcours de vie.
Les sciences sociales ont à leur disposition différentes approches et méthodes pour rendre compte des dynamiques sociales et démographiques, à partir de données biographiques (modèles de durée, typologies de trajectoires par des méthodes d’appariement, analyse de risque de survenue d’événements par des modèles de durée, etc.). Le passage de l’échelon des parcours individuels à l’échelon agrégé des dynamiques collectives, en particulier des parcours géographiques individuels aux dynamiques territoriales, rencontre différents obstacles dans la formalisation des modèles d’analyse (incluant, par exemple, la question de la similarité des trajectoires de vie par nature multidimensionnelles et complexes) et dans la restitution des résultats.
Issu de discussions engagées entre démographie, géographie, informatique et statistique lors du colloque du CIST de 2020, le projet réunit une équipe pluridisciplinaire composée de chercheur‧es et ingénieur‧es de recherche en sciences humaines et sociales (géographie, démographie, sociologie) et en sciences et technologies de l’information et de la communication (informatique, géomatique).
Les membres à l’initiative de ce projet sont issus de différentes unités membres du CIST :
- Espaces et sociétés (ESO, Université Rennes 2-CNRS Sciences humaines et sociales)
- Mobilité, parcours et territoires (UR12) et service Méthodes et statistiques (SMS) de l’Ined
- Laboratoire d’informatique de Grenoble (LIG, Université Grenoble Alpes-CNRS Sciences informatiques).
Indicative Bibliography
- Bonvalet C., Lelièvre E. (dir.), 2012, De la famille à l’entourage. L’enquête Biographies et entourage, Ined, « Grandes enquêtes ».
- Courgeau D., Lelièvre E.,1990, « L’approche biographique en démographie », Revue française de sociologie, 31-1, p. 55-74.
- Gensel J., Villanova-Oliver M., Le Quéau P., Noël D., 2020, « Un modèle multi points de vue pour représenter les trajectoires de vie », CIST2020 - Population, Times, Territories, CIST, Nov 2020, Paris-Aubervilliers, p.173-177.
- GRAB, 2009, Biographies d’enquêtes. Bilan de 14 collectes biographiques. Groupe de réflexion sur l’approche biographique, Ined, « Méthodes et savoirs », n° 3.
- Guérin-Pace F., Samuel O., Ville I. (dir.), 2009, En quête d’appartenances. L’enquête Histoire de vie sur la construction des identités, Ined, « Grandes enquêtes ».
- Noël D., 2019, Une approche basée sur le web sémantique pour l’étude de trajectoires de vie, thèse en informatique, Université Grenoble Alpes.
- Robette N., 2011, « Explorer et décrire les parcours de vie. Les typologies de trajectoires », Les Collections du Ceped, « Les clefs pour ».
- Sebille P., 2014, « Regards croisés sur l’histoire migratoire et familiale de plusieurs générations de mexicains », Migrations Société, n° 153-154, p. 95-116.