geOcom 2024#
Date de publication initiale : 6 août 2024
La communauté des développeurs et des utilisateurs de geOrchestra s'est réunie du 17 juin au 21 juin 2024 à Lille dans les locaux de la Métropole Européenne de Lille pour l'édition 2024 du geOcom. Dans un esprit similaire à la Journée annuelle Prodige qui a eu lieu un peu plus tôt au mois de juin, elle a accueilli des représentants d'autres communautés logicielles : notamment la plateforme OPenIG et la Géoplateforme de l'IGN. Comme les années précédentes, les représentants d'organismes de recherche (CIRAD, INRAE et IRD) étaient présents au côté des plateformes de données territoriales et d'acteurs privés (prestataires de services et utilisateurs).
Cet article met en avant quelques points remarquables de cette journée. Il ne prétend pas être exhaustif ni dénué de biais. Je l'ai rédigé à l'occasion de mon intervention à propos du collectif CICCLO1 dans le cadre des missions d'animation que l'Afigéo2 m'a confiées pour dynamiser l'écosystème technique des plateformes de données géographiques (l'objet et les travaux de CICCLO1 sont rapidement décrits plus bas dans la section de l'article consacrée à l'interopérabilité).
Pour ceux qui ne connaissent pas geOrchestra
Il s'agit d'un projet lancé en 2009 visant à développer une solution logicielle libre, interopérable et modulaire pour répondre aux exigences de catalogage et diffusion des données géographiques de la directive INSPIRE. L'interopérabilité est l'un des axes prioritaires de geOrchestra (en particulier avec le support de standards internationaux comme WMS, WFS et WMTS). geOrchestra s'appuie sur des briques logicielles de référence dans le domaine de l'information géographique numérique : GeoNetwork pour le catalogage, GeoServer pour la diffusion des données géographiques, PostgreSQL/PostGIS pour le stockage et MapStore.
Évolutions de geOrchestra#
La version 24 de geOrchestra, finalisée en juin, a été présentée :
- Mise à jour des composants : comme à l'accoutumée, cette version intègre des révisions des briques logicielles qui composent son cœur : GeoNetwork, GeoServer et CAS notamment ;
- Gateway : avec cette version, il sera possible de déployer un nouveau module, la gateway, utilisable à la place du security proxy. Ce dernier peut néanmoins être conservé conjointement avec la gateway pour les plateformes qui ont développé des modules complémentaires exploitant les capacités techniques du security proxy. La gateway apporte des fonctionnalités très intéressantes en matière d'authentification : support de fournisseurs d'identité externes via OAuth 2.0 et OpenID Connect (tels que FranceConnect, Renater et Google). Notons également l'intégration d'un message broker (en l'occurrence RabbitMQ) pour assurer un couplage faible entre la gateway et la console de geOrchestra (le module d'administration des utilisateurs et de leurs droits) pour des questions de modularité et d'évolutivité de geOrchestra ;
- Data API : développement d'une implémentation de l'API Features de l'OGC pour se brancher directement sur PostgreSQL pour publier des données géo ou non géo (sans passer par GeoServer) afin de pouvoir consommer un large panel de données et une grande variété d'applications (clients cartographiques et tableaux de bord notamment). Cette API avait fait l'objet d'une présentation en début d'année lors des rencontres Plateformes et Innovation de l'Afigéo2. Camptocamp compte s'investir dans les travaux de spécification de l'API Features afin de pouvoir y intégrer l'ensemble des éléments dont ont besoin les plateformes de données (filtres, capacités d'agrégation et de calcul). Autre élément important restant à développer : la prise en compte des droits des utilisateurs dans le cas où l'accès aux données est restreint ;
- Petites évolutions diverses :
- Header : ce bandeau au haut de la page ne sera plus basé sur un iframe. Il pourra intégrer des menus se déroulant sur la partie principale de la page du navigateur sans être tronqués,
- Capacité à imposer la force du mot de passe de l'utilisateur,
- Capacité à forcer les utilisateurs à changer périodiquement leurs mots de passe,
- Capacité de renommer des attributs des données vecteur (nouvelle capacité de GeoServer),
- GeoServer ACL qui peut devenir le remplaçant de GeoFence pour la gestion fine des droits d'accès aux données servies par GeoServer ;
- Amélioration du support des métadonnées en DCAT dans GeoNetwork en vue d'une meilleure interopérabilité avec data.gouv.fr.
Geonetwork-ui#
geonetwork-ui est un projet gravitant autour de GeoNetwork et dans lequel la communauté geOrchestra est largement investie, en particulier au travers de 3 mises en application :
- Le DataHub : interface de recherche et de découverte des données référencées dans un catalogue GeoNetwork ;
- Le Datafeeder : assistant de publication de données pour geOrchestra (gère à la fois la publication de la couche de données dans GeoServer et le renseignement de métadonnées) ;
- gn-editor : un éditeur de métadonnées simple en cours de développement. Les promesses de cet outil : rendre les métadonnées accessibles à tous, s'abstraire des contraintes de chacun des modèles de métadonnées et adaptable au profil des utilisateurs. Son développement (toujours en cours) a fait l'objet d'un travail important en matière d'expérience utilisateur. Le premier déploiement opérationnel est prévu pour septembre 2024 à la Métropole Européenne de Lille.
Le DataHub bénéficie d'une adoption de plus en plus large (y compris au-delà de geOrchestra puisqu'il est question de le déployer au sein de Prodige, la Géoplateforme, Swisstopo). Parmi les nouvelles plateformes : Métropole Européenne de Lille et l'INRAE. Outre son ergonomie appréciée, le DataHub est personnalisable à la fois en matière de charte graphique mais aussi de fonctionnalités. Ce sujet a fait l'objet d'une présentation de la part de Camptocamp qui a été illustrée avec le travail accompli pour le portail data de la Métropole Européenne de Lille avec une interface parfaitement intégrée au site internet de la collectivité ainsi que des fonctionnalités adaptées aux spécificités de l'infrastructure de données qui se cache derrière.
MapStore#
MapStore est le client cartographique intégré à geOrchestra depuis quelques années. Plusieurs présentations ont permis d'illustrer les capacités de cet outil très riche développé par GeoSolutions : création d'applications métier (avec saisie collaborative par exemple), développement de plugins, gestion de la 3D. Malgré ces démonstrations techniques intéressantes, MapStore n'est pas le seul outil cartographique utilisé au sein de la communauté geOrchestra. Pour certains cas d'usage, d'autres outils cartographiques peuvent être déployés : mviewer et GéoContrib ont été cités plusieurs fois.
En marge de la présentation des capacités 3D de MapStore, GeoSolutions a présenté son Digital Twin Toolbox basé sur des composants open source et dont l'objectif est de fournir une boîte à outils permettant de créer des modèles 3D (3DTiles) à partir de données géographiques (shapefiles et nuages de points LIDAR notamment).
Processus de publication des données#
La publication des données dans geOrchestra n'est pas un processus très guidé comme cela peut l'être sur d'autres solutions équivalentes. L'administrateur de données doit maitriser GeoServer et GeoNetwork, voire l'API de GeoServer, pour être efficace. L'application DataFeeder propose un processus pas-à-pas de publication de données sans nécessiter d'être un administrateur chevronné de ces outils. Mais ses capacités ne sont pas encore à la hauteur des attentes des administrateurs, que ce soit en termes de types de données supportées, d'organisation des données dans les entrepôts ou de renseignement des métadonnées produites.
Au-delà du DataFeeder et de l'intégration des données, il a aussi été question de la difficulté à intégrer des styles évolués conçus avec QGIS dans GeoServer. L'IGN en a profité pour signaler la tenue d'un code sprint autour du projet Geostyler se tenant au Géoroom dont l'un des objets est de développer un plugin pour QGIS basé sur les capacités de Geostyler pour exporter les styles en SLD (l'un des formats supportés par GeoServer) notamment.
Il a aussi été évoqué le besoin de disposer d'un tableau de bord des données afin que les administrateurs disposent d'une vision d'ensemble de leurs données.
Outil de suivi des usages de la plateforme#
L'outil actuel de geOrchestra dédié au suivi de la consommation des services OGC est maintenant très ancien et mériterait d'être revu. Jean Pommier (Pi-geosolutions) a proposé à la communauté geOrchestra une architecture basée sur des composants logiciels qui pourraient bénéficier à d'autres usages :
Timescale : un PostgreSQL enrichi de capacités à traiter des séries temporelles ; ce qui, par exemple, permettrait de facilement consolider des indicateurs par agrégation de données sur des périodes glissantes ;
Apache Superset pour exploiter les données collectées et produire des indicateurs et des tableaux de bord.
La refonte de cet outil de suivi serait aussi l'occasion d'enregistrer l'ensemble des requêtes reçues par geOrchestra et non simplement les requêtes adressées aux services OGC.
Fédération d'identités#
Depuis des années, la communauté geOrchestra évoque l'opportunité d'exploiter des fournisseurs d'identité externes. On n'a jamais été aussi proche du but avec deux évènements proches :
- l'arrivée de la version 24 de geOrchestra qui intègre le nouveau module gateway qui supporte des fédérations d'identités à base d'Oauth2 et d'OpenID Connect ;
- le travail actuel du collectif CICCLO1 (dans lequel se retrouvent la Géoplateforme ainsi que les communautés Prodige, Onegeo et geOrchestra) autour de l'implémentation d'AgentConnect. Exemple parlant et opportun : la page d'authentification du portail data de la Métropole Européenne de Lille qui propose de s'identifier via FranceConnect.
Intelligence artificielle générative#
Dans une approche prospective très intéressante, Camptocamp a partagé les résultats d'expérimentations qu'ils ont réalisées autour d'intelligence artificielle génératives basées sur des grands modèles de langage (LLM) à l'image de ce que sont ChatGPT et Llama par exemple. Trois types d'usages ont été illustrés avec des démonstrations convaincantes :
- Identifier les jeux de données d'un catalogue qui se rapproche le plus d'une description textuelle fournie par l'utilisateur. L'intérêt ici est de proposer une recherche bien plus souple que les moteurs de recherche intégrés à nos catalogues. En effet, les LLM, de par leur conception et leur entrainement, gèrent nativement la proximité sémantique d'un vocabulaire considérable et ainsi que le multilinguisme. Camptocamp a publié une vidéo sur LinkedIn pour illustrer ce cas d'usage.
- Interpréter une demande exprimée en langage naturel pour créer de manière automatique une requête sur un entrepôt de données et ajouter le résultat de la recherche à une carte. La démonstration a été réalisée avec l'API Overpass d'OpenStreetMap ;
- Réaliser un calcul à partir des bases de données, par exemple, un indice de végétation à partir d'images d'observation de la Terre. Cette présentation très didactique et démonstrative a été aussi l'occasion de présenter le contexte technologique associé et de présenter les concepts en jeu de manière simple. Elle fait écho à l'expérimentation réalisée par Neogeo Technologies et présentée lors des GeoDataDays de l'année dernière qui visait à exploiter Llama pour faciliter la recherche dans un catalogue de données.
Interopérabilité#
Les questions d'interopérabilité ont été souvent abordées au cours de cet évènement comme pour la journée annuelle de la communauté Prodige :
- CICCLO1 : en tant que co-animateur de ce collectif (au nom de l'Afigéo2) j'en ai fait une présentation et j'ai précisé les objectifs des travaux actuels portant sur l'intégration de l'API Features et d'AgentConnect aux différentes solutions des parties prenantes (Géoplateforme, geOrchestra, Onegeo et Prodige) ;
- Standards de l'OGC :
- API Features : intégration de ce type de service via GeoServer ou via la Data API qui se branche directement sur PostgreSQL. À noter que le support de ce standard n'est pas dans la feuille de route de MapStore ;
- 3DTiles : création d'une couverture 3D territoriale à partir des MNT de l'IGN, consommation de ce genre de données dans MapStore et Cesium (CRAIG et GéoSolutions)
- API Environmental Data Retrieval : diffusion et exploitation de données scientifiques (données spatio-temporelles) au travers d'un développement réalisé à l'Agrocampus Ouest implémentant l'API Environmental Data Retrieval de l'OGC. Cette expérimentation évoque aussi un précédent travail d'intégration du support de SensorThings dans mviewer.
- Fédération d'identités : interventions déjà évoquées sur CICCLO1 et le nouveau module Gateway de geOrchestra ;
- Moissonnage par data.gouv.fr : présentation réalisée par le CRAIG sur les bonnes pratiques pour passer tous les tests d'évaluation de la qualité des métadonnées par data.gouv.fr ;
- MapStore et vues immersives : interopérabilité avec ArcGIS, avec Mapillary et Cyclomedia. Panoramax n'a pas été cité ;
- Amélioration du support du format COG avec des images multibandes dans MapStore.
Pour en savoir plus, n'hésitez pas à consulter les supports des présentations de l'évènement.
Un grand merci aux organisateurs (le comité de pilotage de geOrchestra), aux auteurs et interprètes des présentations, au sponsor du repas du 2e jour (Camptocamp) et aux hôtes (Métropole Européenne de Lille).
Auteur·ice#
Benjamin Chartier#
Consultant indépendant, géomaticien de formation. Domaines d'expertise : publication de données, interopérabilité, traitement de données. Expérience notable autour des standards de l'information géographique et des plateformes de données publiques.
J'interviens entre autres auprès de l'Afigéo sur des actions d'animation de l'écosystème technique des grandes plateformes de données géographiques françaises (plateformes régionales et nationales). Certaines contributions à Geotribu sont liées à ces actions pour l'Afigéo.
Licence Beerware #
Ce contenu est sous licence Beerware (Révision 42).
Les médias d'illustration sont potentiellement soumis à d'autres conditions d'utilisation.
Réutiliser, citer l'article
Tant que vous conservez cette licence :
- vous pouvez faire ce que vous voulez de ce contenu
- si vous rencontrez l'auteur/e un jour et que vous pensez que ce contenu vaut le coup, vous pouvez lui payer un coup en retour
Citer cet article :
"geOcom 2024" publié par Benjamin Chartier sur Geotribu - Source : https://geotribu.fr/articles/2024/2024-08-06_geocom_2024/
-
CICCLO signifie Collectif Interopérabilité et mise en Commun de Composants Logiciels pour les plateformes de données. Ce collectif porté par le CNIG et animé par l'Afigéo2. Son but : favoriser le développement collaboratif de composants ou modules, la mise en œuvre commune des standards et recommandations, la réutilisation efficace des logiciels existants et la création d’écosystèmes de données plus cohérents et interconnectés. ↩↩↩↩↩
-
Afigéo signifie Association pour l'information géographique. Il s'agit de l'association professionnelle nationale française dédiée au secteur de l'information géographique. ↩↩↩↩
Commentaires
Une version minimale de la syntaxe markdown est acceptée pour la mise en forme des commentaires.
Propulsé par Isso.
Ce contenu est sous licence Beerware