Des informations spatiales à leurs représentations cartographiques, les chemins ne sont pas tout tracés...
Ou trouver les informations? Lesquelles sélectionner et sous quelles formes / formats ? Comment les organiser et quels outils privilégier pour visualiser ses données ? L’objectif de ce cours sera de fournir quelques réponses et conseils à ces différents questionnements, afin que chacun -du non initié aux données géonumériques au géomaticien en herbe- puisse disposer de bases théoriques et pratiques par la suite.
Avancées technologiques et révolution numérique ont récemment bouleversé non seulement l’accès aux données, mais aussi les capacités de les traiter. Ce ne sont pas seulement les sciences environnementales qui doivent faire face à la massification des données numériques (voir l’essor des capteurs de toutes sortes, les progrés de la télédétection, etc.) ; les sciences humaines et sociales, simultanément au spatial turn, sont elles aussi gagnées par l’apparition et la prise en compte de données géonumériques toujours plus variées et nombreuses.
Si au sein des sciences humaines et sociales, le big data divise (« Révolution méthodologique » pour certains, « appauvrissement théorique » pour d’autres), il importe d’être au moins en mesure de différencier les types de données spatiales et les opportunités de géovisualisation, apportant autant de lectures géographiques diverses, en amont de toute interprétation et analyse pouvant faire débat.
Différentes sources de données seront mises en avant ici (formats SIG, portails de données en open data, données personnelles, ...)
L’ambition n’est pas ici de donner les clés d’une pratique approfondie des SIG (Systèmes d’Information Géographique). La prise en main logicielle et la variété des opérations désormais possibles dans les SIG demande un investissement plus important, surtout dès lors que l’on souhaite combiner/interfacer les données entre elles. Le logiciel QGIS (www.qgis.org/ ) sera en conséquence avant tout utilisé ici comme un visualiseur.
On insistera davantage sur la chaîne de traitement allant de la récupération d’un jeu de données à sa géovisualisation. L’accent sera donc mis sur l’acquisition de données dans ses multiples dimensions, et à terme sur les différentes options de leur affichage selon les règles de la sémiologie graphique. Pour donner un exemple, la démarche correspond aux types de réutilisations de jeux de données proposés sur la plateforme ouverte des données publiques françaises (https://www.data.gouv.fr/), notamment lorsque ces réutilisations consistent à mettre en cartes des données initialement « muettes ».
La mise en œuvre de ces cartographies pourra aller jusqu’à leur publication Web, en s’appuyant sur l’éditeur/visualiseur de données en ligne CARTO (https://carto.com/), abondamment utilisé tant par les data scientists que le data journalism.