Aller au contenu

Spatial, R, code et communauté : retour sur les rencontres R#

📆 Date de publication initiale : 10 novembre 2023

Introduction#

Pastille hexagonale de R aux couleurs jaune coquille d'oeuf et bleu azur d'Avignon

En juin dernier, Avignon a accueilli les Rencontres R, le plus grand événement français dédié au célèbre logiciel libre de statistiques. Il y avait un invité spécial : le spatial. Ce qui tombe bien, car si je ne suis plus débutante sur ce logiciel, j'ai encore des marches de progression à passer.

C'est de ce point de vue que je propose ce retour sur trois jours de présentations et de discussions.

Commenter cet article


Découvrir le spatial et R : l'atelier pratique#

Le premier jour des rencontres commence officiellement l'après-midi, le temps que tout le monde arrive sur le site. L'organisation (je reviendrai sur son magnifique travail plus bas) a donc banalisé la matinée avec des tutoriels. Si le machine learning était proposé, si Quarto était également au menu...

Adorable image d'un hérisson frileux tricotant HTML, Word, PDF, LATEX, sites internet etc... Comme le fait Quarto

Illustration par Alison Hill and Allison Horst, pour RStudio, tirée de la présentation de Christophe Dervieux.
La session Quarto avait l'air très chouette.

... j'étais bien évidemment inscrite à l'atelier d'analyse spatiale avec R proposé par Kim Antunez (INSEE) et Etienne Côme (Université Gustave Eiffel). Au programme, carte statistiques, cartes interactives et analyse spatiale avec les deux. D'abord on parle des cartes statiques, avec la révolution de "sf" et sa déclinaison spatiale "sfg", soit simple feature geometry, qui a l'avantage d'être composé d'autre chose que de 0 et 1, ce qui le rend compréhensible par un être humain.

Tableau de données avec des exemples de simple feature

Le package mapsf a pris le pas sur d'autres, comme cartography. J'y ai notamment appris l'existence du geoparquet pour traiter les gros volumes de données spatiales... Et que différentes versions de R peuvent bloquer dans des exercices sans que l'on n'est aucun message d'erreur (sinon ce n'est pas drôle). Je n'ai pas eu le temps de tout explorer pour la partie carte interactive, les deux heures étant très denses pour tout le programme prévu. C'est un atelier parfait pour les géographes, mais les personnes extérieures à cette thématique sont restées bloquées sur les tenants et aboutissants de termes comme les zones tampons ou polygones de Voronoï.


Aurélie Vache : combattre le sentiment d'imposture#

Le choix d'une conférence d'ouverture est un exercice d'équilibriste. Il faut offrir un contenu riche, tout en étant accessible et percutant. Avec ce cahier des charges en tête, le choix d'Aurélie Vache (OVHcloud) était plus que brillant.

Après avoir rappelé que c'est un problème de comparaison, que l'on trouve donc beaucoup dans le milieu de la tech' et particulièrement dans l'informatique, que les femmes sont assez touchées (mais pas uniquement), elle a donné de bonnes astuces :

  1. Être dans une communauté ;
  2. Rédiger des articles sur son blog perso, puis sur d'autres (Géotribu par exemple), dans des journaux, faire des conférences et aller dans des écoles ;
  3. Ne pas copier les autres, avoir confiance en ses idées et son style ;
  4. Tooter ce que l'on a appris aujourd'hui, pour les autres comme pour soi ;
  5. Faire du pair programming ;
  6. Face aux haters, s'appuyer sur ses personnes proches (cercle amical, famille, collègues de confiance) ;
  7. Demander des retours et non pas de la validation.

Au passage, elle a égratigné avec un mordant libérateur l'obligation d'avoir le bon cursus, voire la passion des recrutements avec obligatoirement LE diplôme de LA bonne école.

Elle a rappelé le validisme ambiant, dont nos milieux ne sont pas épargnés, avec le talent de quelqu'un capable de présenter avec humour des horreurs. Bonne nouvelle, pour la voir changer de la boue en or, sa présentation a été filmée et je ne peux que vous la conseiller.


Les paillettes de Lise Vaudor (épisode 1)#

logo glitteR

Le package GlitteR explore le web sémantique, comprenez des données qui sont elles-mêmes reliées à d'autres données, ce qui donne par exemple Wikidata. J'ai appris que l'on y accède grâce à des points d'accès, les endpoint. Lise Vaudor (CNRS) rappelle fort justement que l'inconvénient des graphes de connaissance, c'est que l'on ne peut pas avoir une vision d'ensemble comme avec un tableau... D'où l'importance de connaître son terrain ou de partir d'un terrain connu afin de pouvoir couper les branches inutiles du graphe. Et GLitteR dans tout cela ? Il permet d'accéder aux données de Wikidata avec R, sans avoir à passer par le SPARQL. Une grosse avancée pour les personnes pas du tout à l'aise avec ce langage. Il est vrai que tout le monde n'a pas encore eu de wikimédien ou wikimédienne en résidence (patience).


Shiny selon Enedis#

Chez Enedis, l'application Shiny est traitée de manière très originale : comme un prototype de futures potentielles applications. Par exemple, peut-on ajouter une borne de recharge électrique sans faire de surcharge sur le réseau ? Avec Shiny, on peut modéliser l'ajout d'une borne et voir ce qui se passe.

Copie d'écran d'une carte modélisant une nouvelle borne et ses conséquences sur l'approvisionnement

Les données sont factices

Ce qui m'a intéressée, c'est leur méthode : Shiny est pensé pour avoir des retours et des améliorations continues durant 3 ans.

Ça marche ? Enedis développe une application dédiée hors Shiny.

Ça ne marche pas ? Abandon de ce test, sans avoir eu à avancer trop de moyens coûteux.


L'INSEE passe à R#

logo INSEE

C'est LA grande annonce du colloque. L'institution publique de la statistique française passe sur LE logiciel libre des statistiques. Un changement pareil ne se fait pas naturellement dans une institution aussi ancienne. Alors comment a-t-elle procédé ?

  1. C'est un choix institutionnel, et donc impulsé en tant que tel ;
  2. Montrer ce que l'on peut faire de plus avec R par rapport à SAS ;
  3. Beaucoup de formations et de supports partagés en interne ;
  4. Mobilisation de Quarto et de RMarkdown.

Comment impulser de bonnes pratiques de codage, comme la documentation ? L'INSEE en a listé plusieurs ici, dont :

  • Le code est plus lu qu'écrit ;
  • La maintenance du code est coûteuse ;
  • Aller vers Git permet de l'améliorer rien que par l'idée d'avoir un potentiel regard extérieur (Foucault ne pourrait être que d'accord) ; (même si, attention, il faut une bonne journée de formation sur Git pour le prendre en main)
  • Faire de l'amélioration graduelle du code, peu à peu.

Les RLadies françaises#

logo RLadies

Depuis 2016, il existe un groupe des Rladies en France qui regroupe plus de 500 personnes. Beaucoup de leurs événements parisiens sont aussi disponibles en ligne, comme les rediffusions de leurs réunions.


Publier ses réalisations sur R#

Logo de Rzine

Faire du code R, ui. Faire de magnifique réalisations, ui à nouveau. Les documenter (un motif récurrent de ces conférences, vous l'aurez noté), c'est encore mieux.

Face à la dispersion des ressources sur R en sciences humaines et sociales, Hugues Pecout (Géographie-cités) nous a fait la présentation de Rzine. Ce site internet centralise la documentation existante, mais aussi et surtout, il permet de publier des fiches techniques inédites. Avec un DOI bien sûr ! Idéal pour valoriser son travail, notamment dans les environnements de recherche.


L'informatique partage ses bonnes pratiques pour R#

C'est une présentation si dense et riche qu'il vaut mieux renvoyer à la vidéo pour en picorer tous les (nombreux) éléments intéressants relatifs à son niveau.
Mais pour une non-informaticienne comme moi, en voici quelques uns :

  • Documenter sur quoi tourne le code (Windows, version de R...) ;
  • Documenter à quoi sert le code, comment l'utiliser, les pistes abandonnées et les expérimentations ;
  • La configuration (URL externes, coefficients etc.) doit être écrite dans un fichier annexe ;
  • Utiliser des styles guides qui listent toutes les erreurs et tous les bugs les plus courants (ex : nommer ses variables autrement que a1 et a2) ;
  • Utiliser Git (encore un motif récurrent) ;
  • Les correctifs de données font partie des sources de données. On ne corrige pas les données après les avoir importées, on importe des correctifs comme des sources de données.

Data visualisation et R#

Yan Holtz (Datadog) est revenu durant cette plénière sur la présentation des données avec R et sur les outils utilisés en fonction du public. Par exemple, si des collègues ont du mal sur R, leur proposer datawrapper.

Il a rappelé que ggplot2 a été en 2007 une révolution en faisant passer R d'un outil exploratoire à un outil explicatif qui permet de faire de la dataviz avec R. Une révolution qui a infusé jusqu'à Python et JavaScript. Il a également mentionné Rtutor pour faire du Shiny aidé par chatGPT.


L'IGN en mode happi#

Logo de happign

Paul CARTERON a présenté LE package qui permet d'accéder à toutes ses données, Lidar compris : ⭐ happign ⭐. C'est un des éléments qui me fait aimer R et me pousse à m'y former : la facilité d'accès aux données avec le logiciel.


Un package spatial : Timothée Giraud et mapsf#

Logo de mapsf

On l'a indiqué, ces journées R portaient spécialement sur le spatial. Timothée Giraud (UAR RIATE) est donc venu présenter le travail autour de ce package phare.

Il a commencé par un historique rappelant la généalogie des différents packages qui intègrent la géographie et qui petit à petit a permis l'émergence de ⭐ mapsf ⭐.

On l'a dit plus haut, mapsf s'appuie sur le standard simple feature (aussi mobilisé par PostGIS) pour importer, exporter et faire les géotraitements de données géographiques. Il est également revenu sur la mise à la retraite d'un package, exemplaire selon lui de ce qu'il faut bien faire dans la communauté.

Il est revenu sur les possibilités de package, avec des exemples avignonnais évidemment.

J'ai appris que la communauté R avait une passion pour les palettes de couleur. Avec par exemple paletteer et l'appli shiny cols4all qui permet de tester le rendu pour les personnes daltoniennes... Du moins si les fantastiques palettes ColorBrewer, déjà incluses dans mapsf, ne suffisent pas.


Les paillettes de Lise Vaudor (épisode 2)#

C'est au tour de la présentation de Lise Vaudor qui nous propose un retour sur son parcours et ses réalisations.

Ingénieure agronome, elle a été recrutée au CNRS après sa thèse en écologie/statistiques, notamment grâce à ses compétences en R. Son travail au quotidien s'articule autour du soutien à la recherche et elle propose beaucoup de formation continue... Notamment auprès d'un public doctorant tRaumatisé.

C'est de cette expérience de terrain qu'est né son blog Ratique et la création de contenus visant à démocratiser R. Un contenu qu'elle a voulu illustré, avec ses propres dessins (tant qu'à faire), avec des couleurs pastels, des GlitteR paillettes et des blagues. Elle propose des antisèche illustrées et soignées (devinez les couleurs ? pastels, bravo) et des métaphores visuelles accessibles qui piochent dans la dataviz. Du contenu créé sur son temps de travail (et valorisé comme tel par le CNRS).

Grimoire étrange et poussiéreux dont s'échappent des paillettes - Crédits : Lise Vaudor

Qui n'a pas envie de faire des paillettes de la géomaRgie ?

Comment parler à tout le monde quelle que soit la discipline ? Lise Vaudor transporte son public dans le monde de la magie grâce à ses "grimoires". Mais elle travaille moins sur ce contenu ces temps-ci.

Car elle est revenue sur son parcours personnel, notamment sa double maternité qui a quelque peu chamboulé sa vie. Elle a donc rejoint les RLadies, "seulement maintenant" car elle n'en ressentait pas le besoin. Elle indique ne pas avoir eu à souffrir de sexisme dans la communauté R.

Les raisons ?

Pour elle, c'est l'ouverture de la communauté. Une ouverture qui se retrouve aussi dans l'équipe du programme de ces journées, qui a voulu mettre à égalité les différents genres, mélanger secteur privé/public, universitaire et non-universitaire etc.

C'est une communauté capable de valoriser ses paillettes, ses dessins, ses couleurs pastels et tout le contenu de ses formations, par exemple par cette invitation à une intervention dans une plénière. Une intervention au même niveau que celle présentant un gros package, comme celui de Timothée Giraud.


Quelles bonnes idées à piquer à l'organisation ?#

Tour de cou en carton, aux couleurs de R avec une invite de commande indiquant le nom et prénom de la personne

Ce n'est bien entendu pas visible dans ce compte-rendu : les Rencontres R étaient mûrement réfléchies en termes d'inclusion et d'environnement. C'est la première fois que je viens à un événement professionnel avec un code de conduite. Cette charte est à signer lors de l'inscription, rappelée en plénière, à chaque moment collectif et nous avons eu une présentation des personnes à qui s'adresser en cas de problème. C'était bienvenu.

L'engagement était aussi écologique : les goodies venaient des environs. La bière, brassée spécialement pour l'occasion, était locale, tout comme le jus de fruit. Nous avions de la verrerie aux couleurs des rencontres, produite elle aussi tout proche, et que l'on utilisait donc pour les pauses cafés. Le tour de cou, avec un clin d'oeil malin à R, rappelait toutes les informatiques pratiques, dont le programme numérique, le programme papier étant limité aux rares personnes sans téléphone. Enfin, pour garder un ultime souvenir de ces journées, le tour de cou ensemencé peut se planter afin d'obtenir de délicieuses plantes aromatiques.


En savoir plus#

Plusieurs sessions étaient en parallèle : ce billet présente à peine la moitié des interventions. Il y en a bien d'autres, que vous pouvez aller découvrir ici :

Merci à l'organisation pour ces journées !


Auteur·ice#

Delphine Montagne#

Portrait Delphine Montagne

Cartographe et géomaticienne, je participe à plusieurs projets libres, comme OpenStreetMap et Wikipédia. J'aime autant les cartes que la biodiversité, passions que je partage toujours avec enthousiasme.

Licence #

Ce contenu est sous licence Creative Commons International 4.0 BY-NC-SA, avec attribution et partage dans les mêmes conditions, sauf dans le cadre d'une utilisation commerciale.
Les médias d'illustration sont potentiellement soumis à d'autres conditions d'utilisation.

Réutiliser, citer l'article

Vous êtes autorisé(e) à :

  • Partager : copier, distribuer et communiquer le matériel par tous moyens et sous tous formats
  • Adapter : remixer, transformer et créer à partir du matériel pour toute utilisation, exceptée commerciale.

Citer cet article :

"Retour sur les Rencontres R d'Avignon" publié par Delphine Montagne sur Geotribu sous CC BY-NC-SA - Source : https://geotribu.fr/articles/2023/2023-11-10_retour-conference-journees-R-2023/

Commentaires

Afin de favoriser les échanges constructifs, merci de préférer le pseudonymat à l'anonymat. Pour rappel, l'adresse mail n'est pas exposée publiquement et sert principalement aux notifications de réponse. Les commentaires sont automatiquement republiés sur nos réseaux sociaux pour favoriser la discussion. Consulter la page sur la confidentialité et les données personnelles.
Une version minimale de la syntaxe markdown est acceptée pour la mise en forme des commentaires.
Propulsé par Isso.

Ce contenu est sous licence Creative Commons BY-NC-SA 4.0 International Pictogramme Creative Commons Pictogramme Creative Commons BY Pictogramme Creative Commons NC Pictogramme Creative Commons SA