research team MEDIA

Projet Soft data pour les politiques publiques de la ville (2014)

This project aims to explore the importance and role of soft data in the public decision-making process concerning the planning and management of cities. Soft data, called "soft" as opposed to the traditional "hard" data produced by statistical institutions, are new types of data, mainly from Web 2.0 (Facebook, Twitter, RSS feeds...), which are offered to the public decision-maker as an original and rich source of information on the social phenomena taking place in cities. What makes these data particularly interesting is the fact that they can integrate geographical information into media data (see for example the Facebook check-in). Faced with the abundance of this data, this project aims to take stock of the existing data and to develop a shared reflection on the methodological ("numerical methods") and theoretical (the relationship between digital and physical) issues related to the use of this data in city policies.

State of the art and project assumptions

Ces dernières années, les nouvelles technologies ont radicalement changé plusieurs secteurs de la société tels que l’économie, la santé, le transport. Un des changements les plus révolutionnaires concerne certainement la diffusion des technologies numériques, notamment le réseau Internet (Castells, 2000). Ce qui rend ce changement particulièrement intéressant est le fait qu’il affecte à la fois la société elle-même et la façon de l’étudier et de la gérer (Benkler, 2006).
D’une part, l’invention des médias numériques a transformé les conditions d’accès à la communication par une partie croissante de la population mondiale. En moins de vingt ans, Internet et le World Wide Web ont joué un rôle crucial dans l’extension des limites spatio-temporelles des interactions humaines : à travers la réduction des coûts de communication, en surmontant les frontières entre les différentes formes de communication (écrit/oral, public/privé…) et en accélérant la circulation des idées et des connaissances.
D’autre part (et en même temps), la communication numérique a secoué les conditions de la recherche et de la politique, en multipliant la disponibilité de traces de phénomènes collectifs. L’avantage des médias électroniques est que toutes les interactions qui les traversent laissent des traces numériques qui peuvent être facilement enregistrées, massivement stockées, puis récupérées et analysées. Ainsi, les médias numériques offrent de nouvelles bases de données énormes qui peuvent être utilisées pour améliorer l’analyse des phénomènes sociaux et, par conséquent, le processus de prise de décision qui leur est lié (Rogers, 2013).

Les traces numériques ne sont pas seulement produites de façon automatique par les technologies numériques : aujourd’hui, nous avons aussi de grandes quantités de données provenant de nouveaux fournisseurs de données tels que des membres de réseaux sociaux en ligne et des utilisateurs des plateformes de partage de contenu. Dans le contexte du Web 2.0, le succès des réseaux sociaux n’est plus en doute et leurs taux de diffusion ont atteint des niveaux sans précédent. Des centaines de millions d’utilisateurs sont inscrits, ils échangent via des forums, des blogs, ils maintiennent des pages Facebook, y racontent leurs dernières pensées, leurs humeurs ou leurs activités en quelques mots, ils partagent différents types de contenus… Le développement d’appareils mobiles tels que les smart-phones ou tablettes a favorisé l’émergence de ces nouvelles pratiques. En conséquence, les utilisateurs de réseaux sociaux laissent des traces de leurs activités en ligne et hors ligne qui peuvent devenir de nouvelles sources d’information (données dites « soft ») extrêmement utiles pour des études territoriales et pour les politiques publiques.

Soft data, called "soft" as opposed to the traditional "hard" data produced by statistical institutions, can be defined in a very general way as information freely available on the Internet, not controlled by a public administration. They consist mainly of the new types of data from Web 2.0 (Facebook, Twitter, RSS feeds, etc.) which offer the public decision-maker an original and rich source of information on the social phenomena taking place in cities.
What makes these data particularly interesting is their geo-media nature, i.e. the fact that they integrate geographical information into the media data (see for example the Facebook check-in).
Traditionnellement, la décision publique liée à la gestion de la ville est basée sur la collecte, la transformation, l’analyse et l’interprétation de ce qui peut être qualifié comme données « hard » à savoir les statistiques officielles et plus généralement les données produites par l’administration publique à différents niveaux (local, urbain, régional, national, international). Ces données ont été soigneusement harmonisées et stockées dans des bases de données, soumises à divers contrôles, complétées par l’estimation de valeurs manquantes et de métadonnées. Ces données représentent une valeur ajoutée exceptionnelle pour les personnes intéressées par la politique urbaine et de cohésion territoriale. Néanmoins, ces dernières années les décideurs publics ont révélé certaines lacunes ou des frustrations importantes liées à ces données :
– le trop long délai de publication (les données officielles font l’objet d’un processus technique et parfois politique à long de l’harmonisation et de la validation)
– la couverture insuffisante de certains sujets d’intérêt pour la cohésion territoriale (l’attractivité des lieux, les sentiments des citoyens, la perception des actions des décideurs publics) qui ne sont pas faciles à représenter avec des données territoriales. Ces sujets sont abordés par de grandes enquêtes, mais avec une faible résolution spatiale (pays), ce qui rend difficile leur application à l’échelle des villes
– la définition top-down des données d’intérêt est une caractéristique inhérente des hard data. Pourtant, on a de plus en plus de demandes pour des données participatives, ouvertes et élaborées par les citoyens, les entreprises, les collectivités locales et régionales. L’approche bottom-up pour la définition des données d’intérêt est une dimension qui ne peut pas être ignorée par les décideurs publics engagés dans la gestion de la ville.

Aucune de ces critiques n’était très importante il y a dix ans. Tant que des données « hard » étaient la principale source d’information pour les décideurs et les citoyens, les gens étaient susceptibles d’admettre un certain retard dans le processus de suivi des territoires. Cependant, l’ordre du jour de la cohésion territoriale est fortement modifié par le développement de la crise (économique, démographique, sociale, environnementale) combinée avec la croissance exponentielle de l’information disponible sur Internet. Un grand nombre d’informations concernant le développement territorial des villes est maintenant disponible sur le Web, en introduisant une concurrence claire pour les producteurs classiques de données.

Le défi de ce projet n’est pas de critiquer cette nouvelle source de données, mais plutôt d’examiner son intérêt potentiel pour les politiques publiques de la ville. En effet, les soft data fournissent – au premier coup d’œil – des solutions intéressantes aux lacunes de hard data mentionnées ci-dessus :
– un délai plus court de publication utile pour l’action publique. Un exemple classique de cette réactivité est donné par l’enregistrement des tremblements de terre par les médias sociaux comme Twitter. De nombreux chercheurs ont démontré que les utilisateurs géolocalisés de réseaux sociaux peuvent être considérés comme des capteurs, capables de localiser les événements catastrophiques en temps réel et de suivre leur développement
– la couverture de nouveaux sujets d’intérêt comme les modes de déplacement dans les zones urbaines, la pauvreté et l’exclusion sociale, les sentiments des citoyens vers les politiques de la ville.. Cela est clairement un effet de la traçabilité inhérent aux supports numériques.
– l’élaboration bottom-up d’information sur mesure : les données « soft » peuvent parfois être le résultat d’une élaboration bottom-up, comme le montre l’exemple de Open Street Map, qui offre une alternative aux cartes officielles produites par les instituts géographiques. Ces données participatives peuvent également être utilisées à des fins non prévues par leur créateur pour créer une information sur-mesure utile au décideur public.

Objectives of the project

Given the abundance of these new types of data, this project aims to explore the importance and role of these soft data in the public decision-making process concerning the management of the city. Although several empirical studies have been carried out, a theoretical reflection on the use of these data in public policies is still lacking. Several questions need to be addressed. Considering the limits of time and budget of this project, we propose to start this reflection by addressing mainly two questions.

The methodological issue

Les big data ont soulevé beaucoup d’enthousiasme, mais travailler avec elles est tout sauf simple. Outre les problèmes techniques qui pourraient être soulevés par la masse de données, le chercheur doit également faire face à des problèmes politiques, sociaux et éthiques. En particulier, il faut prendre en compte les questions de représentativité des données (nous ne pouvons pas contrôler l’équivalence entre les traces disponibles sur Internet et la population que nous aimerions étudier), de protection des données (droit à la confidentialité ; droit d’auteur) et celles liées à la nature participative des données. Ce qui rend les données du Web 2.0 intéressantes est le fait qu’elles sont produites par les utilisateurs. Pourtant, leur nature participative doit être soigneusement prise en compte lorsqu’elles sont incluses dans des études territoriales. Ces données sont souvent générées par des sources inconnues, de sorte qu’elles peuvent être fausses ou vraiment hétérogènes.
Toutes ces limites peuvent remettre en cause la qualité de ces données, mais il est important de souligner qu’elles sont également des opportunités. D’un côté, nous devons garder à l’esprit ces questions et, si possible, chercher des solutions pour y faire face. De l’autre côté, en contrepartie, la facette hétérogène, inattendue et parfois ingérable de ces données garantie leur intérêt et leur richesse. Nous travaillons avec ces données parce que nous nous attendons à ce que ces caractéristiques puissent nous aider à trouver de nouvelles idées dans l’analyse territoriale qui peuvent être intégrées aux résultats de l’analyse officielle.
Il est alors important d’avoir des méthodes adéquates pour collecter ces données et les préparer pour l’analyse. Au cours des dernières années, un nouveau groupe de méthodes, appelées « méthodes numériques » (Rogers, 2013), a été développé pour traiter ce type de données. Par « méthodes numériques » nous nous référons à une série de techniques visant à explorer les traces d’interactions en ligne comme source d’information sur les phénomènes sociaux. Dans ce projet, nous visons à construire une réflexion partagée sur les problématiques méthodologiques de ces données, à travers la création d’un groupe de travail de chercheurs français et étrangers (notamment la Digital Media Initiative de l’Université d’Amsterdam, dirigée par Richard Rogers, le groupe qui contribue le plus aujourd’hui au développement des méthodes numériques en Europe).
From a methodological point of view, we will also be able to build on the work already carried out within the framework of the ANR Géomédia project. Les premiers résultats de ce projet suggèrent fortement que l’analyse des flux RSS de journaux quotidiens soigneusement sélectionnés peut fournir une information territoriale très intéressante.

The theoretical challenge of soft data

L’utilisation de ces informations provenant de nouveaux fournisseurs et concernant de nouveaux thèmes doit être fortement encouragées dans le processus de gestion de la ville, pour être intégrée aux données officielles. Cependant, au-delà des enthousiasmes initiaux, l’usage de ces méthodes, et en général des traces numériques aujourd’hui, sollicite plusieurs questions théoriques. Entre autres, un des éléments les plus problématiques dans l’application de ces méthodes est la gestion du rapport entre hors ligne et en ligne. Le succès des traces numériques est notamment du à leur pouvoir de révéler des caractéristiques des phénomènes qui ont lieu dans l’espace physique. En effet, à travers ces traces, le chercheur peut étudier un phénomène urbain qu’il n’aurait pu étudier autrement qu’au prix d’une démarche d’enquête de terrain beaucoup plus coûteuse en termes de ressources et de temps.

Of course, the question of the relationship between online and offline is not new and the distinction itself has been debated on several occasions. Without falling into the excesses which aim to affirm this distinction in an absolute manner or to reject it a priori, we want to question the type of continuity or discontinuity generated today by the digital traces of the city. We find the case of the city particularly intriguing for its essentially physical being, but at the same time for its digital future. The aim of this project is to distance ourselves from empirical experiments related to digital methods in order to reflect on the significance of digital traces in the context of urban studies. When we study an urban phenomenon through the traces that the actors linked to this phenomenon have left on a blog or a social network, are we studying the offline phenomenon that takes place in physical space? Or are we studying the online projection of the phenomenon that takes place offline?
Or should this distinction be completely abandoned in the context of the city? Can digital traces connected to a territorial object such as the city have an 'existence' only online or not?

These issues will be addressed in a study day organised in two parts (workshop and general public conference), to which researchers from other disciplines, including digital philosophers and digital humanities experts, will be invited.

Bibliography

Douay N., Severo M. & Giraud T. (2012), « La carte du sang de l’immobilier chinois, un cas de cyberactivisme », L’information géographique, vol. 76, n° 1, pp. 74-88.
Gautreau P., Severo M., Giraud T. & Noucher M., Formes et fonctions de la « donnée » dans trois webs environnementaux sud-américains (Argentine, Bolivie, Brésil), NETCOM, à paraître.
Giraud T. & Severo M. (2011), « La blogosphère tunisienne », L’espace géographique, n° 2, p. 190.
Giraud T., Grasland C., Lamarche-Perrin R., Demazeau Y. & Vincent J.-M. (2013), « Identification of international media events by spatial and temporal aggregation of newspapers rss flows. Application to the case of the Syrian Civil War between May 2011 and December 2012 », Procceedings ECTQG 2013, Paris.
Grasland C., Giraud T. & Severo M. (2012), « Un capteur géomédiatique d’événements internationaux », Founding Territorial Sciences (dir. Beckouche P. et al), Karthala, Paris.
Rogers R. (2013), Digital methods, MIT Press.
Severo M. (2012), « Media representations of the Solar Mediterranean Plan: a techno-political controversy », PCST Conference 2012, 18-20 avril, Florence.
Severo M., Giraud T. & Douay N. (2012), « The Wukan’s protests: from local activism to global media event », Just-in-time workshop, Social informatics conference, Lausanne.
Severo M. & Zuolo E. (2012), « Egyptian e-diaspora: migrant websites without a network? », Social Science information, n° 51, pp. 521-533.
Vienne F., Douay N., Le Goix R. & Severo, M. (2014), « Lieux et hauts lieux des densités intermédiaires : une analyse par les réseaux sociaux numériques », conférence Aux frontières de l’urbain, Avignon, janvier 2014.

Participating Research Teams

This project is supported by the CIST Media and territories axis through its manager, Marta Severo. This research axis brings together many researchers from different disciplines (communication, geography, planning, political science, computer science) and belonging to several teams interested in the territorial representations generated by media data. Among these, the following will participate in the PEPS project:
– Groupe d’étude et de recherche interdisciplinaire en information et communication (GERiiCO) : Marta Severo (MCF, science de la communication, Université de Lille 3) et Camille Masse (gestionnaire du projet, Université de Lille 3)
– Savoirs, textes, langage (STL) : Christian Berner (PR, philosophie, Université de Lille 3)
Géographie-cités : Claude Grasland (professeur, géographie et analyse spatiale, Université Paris Diderot), Nicolas Douay (MCF, aménagement, Université Paris Diderot) et Renaud Le Goix (MCF, géographie physique, humaine, économique et régionale, Université Paris 1)
– Réseau interdisciplinaire pour l’aménagement du territoire européen (RIATE) : Timothée Giraud (IE, géomatique)
– Collège international des sciences du territoires (CIST) : Hugues Pecout (IE, cartographie) et François Vienne (IE, aménagement)
– Pôle de recherche pour l’organisation et la diffusion de l’information géographique (PRODIG) : Pierre Gautreau (MCF, géographie, Université Paris 1)
– Centre population et développement (CEPED) : Marina Lafay (chercheur associé, sociologie, coordinateur Projet Emergence Minweb)
– Centre de recherche Textes et francophonies (CRTF) : Romain Badouard (MCF, sciences de la communication, Université de Cergy-Pontoise)
– Aménagement, développement, environnement, santé et sociétés (ADESS) : Marina Duféal (MCF, géographie, Université de Bordeaux 3)
Digital Methods Initiative : Richard Rogers (PR, media studies, Université de Amsterdam)

Project Phases

This PEPS funding is thought in connection with ESPON-ORATE funding (European Agency for Spatial Planning) that our team has just received to work on the same subject (call for tender « Tools (2011-2014). Feasibility Study on Analytical Tool based on Big Data »). The ESPON funding aims at the empirical exploration of soft data for planning. In particular, the project aims to develop two cases of soft data use for the study of a group of European cities.
Nous pensons qu’il est fondamental pour la bonne réalisation du projet d’accompagner l’étude empirique d’une réflexion théorique et que l’axe de recherche Médias et territoires du CIST fournit le contexte idéal pour cette recherche. Par conséquent, nous présentons cette demande de financement PEPS pour pouvoir développer les trois actions suivantes

1. Development of the state of the art and theoretical thinking (March-July 2014)
Organisation of several meetings with the project participants in order to develop a shared reflection on the use of soft data for the city's public policies. Participation of 3 or 4 people in the Summer School of the Digital Methods Initiative "On Geolocation: Remote Event Analysis".

2. Study day on soft data for city management, open to public decision-makers, organised in two parts (October 2014)
Methodological workshop on data and tools with external guests on an international level and a closing lecture for the general public on the theoretical issues of digital traces as a representation of the city.

3. Scientific publication (October-December 2014)
Production of a publication with the theoretical and empirical results of the project. The publication could be produced as a book in the collection "Le débat du numérique" at the Presses des Mines or in the "Collection du CIST" at Karthala (preliminary agreements have been made with both partners).

en_GB