compte-rendu INFTER MEDIA

Médias sociaux et territoires

Organisé conjointement par les axes Médias et territoires (Marta Severo) et Information territoriale locale (Marianne Guérois et Malika Madelin) le 16 novembre 2016 à Paris, ce 2e séminaire du projet Grandes métropoles visait à échanger autour de l’information territoriale extraite des médias sociaux numériques. Dans ce vaste ensemble aux contours flous, qui embrasse aussi bien les plates-formes de réseaux sociaux (Facebook, Twitter, Instagram, Pinterest ou Flickr…) que les blogs et wikis de toutes sortes, nous avons fait le choix de nous focaliser sur l’objet « tweet ». L’objectif était tout autant d’explorer l’intérêt et les limites des données Twitter en termes d’information géographique, dans leur composante spatiale et sémantique, que de réfléchir à l’apport original de ces données pour l’analyse des dynamiques métropolitaines. Nous avons ainsi croisé différents retours d’expérience sur leur exploitation, avant une mise en pratique l’après-midi en atelier informatique, à partir, entre autres, des terrains du projet Grandes métropoles (Paris, Chicago, Mexico…).

Intervenants

– Présentations (matin)

Éric Kergosien (GERiiCO, Université Lille 3) – Analyse spatiale des médias sociaux via des approches de fouille de textes (pdf)
Bernard Elissalde, Lény Grassot, Françoise Lucchini (IDEES, Université de Rouen Normandie) – Données géolocalisées et événements urbains (pdf)
Hugues Pecout (CIST), Timothée Giraud (RIATE) – Les données Twitter, un retour sur le projet ESPON Big Data (pdf)

– Ateliers informatiques (après-midi), traitements avec R

Timothée Giraud (RIATE), Hugues Pécout (CIST) – Atelier informatique sur les données Twitter
Lény Grassot, Françoise Lucchini (IDEES, Université de Rouen Normandie) – Pulsations urbaines et tweets

Principaux enseignements des présentations de la matinée

Dans sa présentation, Éric Kergosien aborde les questions que soulève l’analyse du contenu des tweets pour extraire des connaissances sur les territoires à partir de méthodes de traitement automatique du langage : comment identifier de manière univoque les localisations à partir des messages (règles linguistiques pour récupérer des informations sur les unités spatiales) ? Comment extraire les sujets abordés dans les corpus (termes qui reviennent le plus souvent ensemble), au-delà de l’analyse souvent plus limitée des hashtags ? Peut-on détecter des opinions favorables ou défavorables à certaines opérations d’aménagement, en partant de lexiques de mots positifs/négatifs ? À travers différentes familles de texte, les exemples présentés font ressortir les redoutables défis linguistiques que soulèvent ces analyses de contenu, qui renouvellent les techniques d’analyse textuelle classiques. Les perspectives d’amélioration du lien entre contenu spatial et thématique (où parle-t-on le plus de tels événements ?) nécessitent plus que jamais la collaboration étroite d’informaticiens, de linguistes et de géographes.

À partir de jeux de tweets géolocalisés en Ile-de-France et collectés pendant une année entière, Bernard Elissalde, Lény Grassot et Françoise Lucchini s’interrogent sur la manière dont ces données peuvent enrichir l’analyse des temporalités urbaines en général et celle d’événements urbains en particulier (officiels ou imprévus). Dans quelle mesure les tweets peuvent-ils aider à identifier différents types d’usages de la ville à partir des rythmes urbains ? En croisant informations sur l’intensité et la variabilité spatio-temporelle du fonctionnement de la ville, permettent-ils de caractériser des chronotypes urbains (différents types de lieux selon les rythmes de fonctionnement urbains) ? Quelles sont les méthodes les plus adaptées à la détection statistique de ces événements spatio-temporels ? Et quels seraient les agrégats pertinents pour rendre compte de ces « pulsations urbaines » ?

En guise d’introduction aux ateliers de l’après-midi, Hugues Pécout et Timothée Giraud ont extrait de leur participation aux projets ESPON Big data et  Grandes métropoles plusieurs enseignements sur la définition de l’objet Tweet en tant qu’information géographique ainsi que sur l’analyse critique de la qualité de ces données massives : ils abordent ainsi successivement la question de l’accès aux données, de la représentativité des données, de la structure de l’information géographique construite à partir de ces traces numériques, des catégories de localisations identifiables par les tweets. Où l’on apprend aussi qui twitte, quelle est la part des twittos partageant leur localisation, et comment faire la part des « vrais » twittos et des « bots »…


En savoir plus

fr_FR