Hello,
Camille Renard et Yohann Schatt, élèves ingénieur à Polytech Montpellier, viennent de réaliser un stage dans le cadre du projet, porté par l’Union Internationale de Spéléologie, de constitution d’une bibliothèque mondiale, numérique, sur le Karst et le milieu souterrain.
Camille Renard and Yohann Schatt, engineering students at Polytech Montpellier, have just completed an internship as part of the project, led by the International Union of Speleology, to create a global digital library on Karst and the underground environment.
Les premiers partenaires de ce projet sont, outre l’UIS et ses commissions, la Société Italienne de Spéléologie (SSI) les organisations Belge de spéléologie (UBS, Maison de la Spéléologie, Spéléo J), la SCNAT à travers la commission scientifique de la Société Suisse de Spéléologie et l’association Wikicaves, qui ont organisé ces stages et participé à leur financement. Merci à tous.
The first partners of this project are, in addition to the UIS and its commissions, the Italian Speleological Society (SSI), the Belgian speleological organizations (UBS, Maison de la Speleologie, Spéléo J), the SCNAT through the scientific commission of the Swiss Speleological Society and the Wikicaves association, which organized these courses and participated in their financing. Thank you all.
Camille à fait son stage à Namur auprès de Nathalie Gouffiol, bibliothécaire de la Maison de la Spéléologie.
Elle a développé un serveur OAI-PMH qui est entièrement fonctionnel et qui a permis à Nathalie de récupérer les analyses pour les articles de la revue Regards et de les intégrer dans sa base de données.
Pour cela Camille s’est appuyée sur la norme OAI mais également sur les recommandations fournies par la Bibliothèque Nationale Française (BNF). Elle à été particulièrement attentive à ce que les réponses soient rapides et qu’il soit facile de récupérer les données recherchées.
Le serveur est accessible à l’adresse oai.grottocenter.org
Camille completed her internship in Namur with Nathalie Gouffiol, librarian at the Maison de la Spéléologie. She developed a fully functional OAI-PMH server that allowed Nathalie to retrieve analyses for articles from the journal Regards and integrate them into her database.
To achieve this, Camille relied on the OAI standard as well as the recommendations provided by the Bibliothèque Nationale Française (BNF). She paid particular attention to ensuring that responses were quick and that it was easy to retrieve the desired data.
The server is accessible at oai.grottocenter.org
[image: Une image contenant texte, Police, logiciel, Page web Le contenu généré par l’IA peut être incorrect.]
Yohann à fait son stage à Bologne auprès de Luca Pisani, responsable de la bibliothèque Anelli.
Il a développé un serveur Z39-50 qui correspond à un protocole d’échange de données bibliographiques ancien mais encore très utilisé par certains logiciels documentaires.
Travailler avec cette norme ancienne a été un vrai challenge puisque les échanges ne se font pas à travers le protocole HTTP comme habituellement aujourd’hui mais en FTP. L’application est écrite en Perl et il a fallu beaucoup d’ingéniosité pour limiter les sollicitations du serveur…et le coût du service.
Le serveur est accessible à l’adresse z3950.grottocenter.org/
Yohann completed his internship in Bologna with Luca Pisani, head of the Anelli Library.
He developed a Z39-50 server, which corresponds to an old bibliographic data exchange protocol still widely used by some documentary software. Working with this old standard was a real challenge since the exchanges are not carried out via the HTTP protocol as is customary today, but rather via FTP. The application is written in Perl, and it took a lot of ingenuity to limit server load...and the cost of the service.
The server can be accessed at z3950.grottocenter.org/
[image: Une image contenant texte, Police, logiciel, Page web Le contenu généré par l’IA peut être incorrect.]
Ces services ont besoin d’accéder aux données archivées dans la base de données de Grottocenter. Pour cela, ensemble, ils ont développé les apis dont ils avaient besoin et qui sont désormais en place, fonctionnelles et parfaitement documentées
grottocenter.org/ui/api/1
These services need to access the data stored in the Grottocenter database. To do this, they developed the APIs they needed, which are now in place, functional, and fully documented.
grottocenter.org/ui/api/1
[image: Une image contenant texte, capture d’écran, nombre, Police Le contenu généré par l’IA peut être incorrect.]
Ces serveurs sont désormais accessibles à tous, Camille et Yohann ont mis en place une documentation qui explique comment les utiliser
https://wiki.grottocenter.org/wiki/GrottoCenter:En/OAI_and_Z39.50_servers
These servers are now accessible to everyone. Camille and Yohann have created documentation explaining how to use them.
https://wiki.grottocenter.org/wiki/GrottoCenter:En/OAI_and_Z39.50_servers
[image: Une image contenant texte, capture d’écran, Police, nombre Le contenu généré par l’IA peut être incorrect.]
Ce résultat est déjà de très grande qualité et montre la maîtrise technique de Camille et Yohann mais pour qu’un service soit utilisé il ne suffit pas de le mettre en place, il faut également être attentif à toutes les questions qui entourent le projet.
Ainsi ils ont dû communiquer sur leur travail, les possibilités offertes et les perspectives, auprès des responsables des Fédération de Spéléologie Belge et Italienne ainsi qu’auprès des commissions Bibliographie et Informatique et du Bureau de l’UIS.
Grâce à Yohann le BBS est désormais une bibliothèque reconnue au niveau international et enregistré sous la référence FR-740335301 BERNEX-BBS/SA
Camille a travaillé avec Nathalie Gouffiol et Loran Haesen pour solliciter toutes les structures spéléologiques de Belgique afin de leur demander leur accord pour archiver leurs publications sous une licence libre. Aujourd’hui 13 organisations ont signé une autorisation d’archivage pour une vingtaine de publications (1 autorisation sous licence CC-BY-NC-SA, les autres sous licence CC-BY)
Camille à mis au point un protocole pour numériser les documents qui ne le sont pas encore, Nathalie prend en charge cette numérisation et 12 collections sont disponibles prêtes à être intégrées dans le BBS sur Grottocenter
https://wiki.grottocenter.org/wiki/GrottoCenter:Fr/Numeriser_des_documents
This result is already of very high quality and demonstrates Camille and Yohann's technical mastery. However, for a service to be used, simply implementing it is not enough; it is also necessary to be attentive to all the issues surrounding the project.
Thus, they had to communicate their work, the possibilities offered, and the prospects to the leaders of the Belgian and Italian Speleology Federations, as well as to the Bibliography and IT Commissions and the UIS Bureau.
Thanks to Yohann, the BBS is now an internationally recognized library and registered under the reference FR-740335301 BERNEX-BBS/SA.
Camille worked with Nathalie Gouffiol and Loran Haesen to contact all the speleological organizations in Belgium to request their agreement to archive their publications under a free license. Today, 13 organizations have signed an archiving authorization for around twenty publications (one authorization under CC-BY-NC-SA license, the others under CC-BY license).
Camille has developed a protocol for digitizing documents that have not yet been digitized. Nathalie is taking charge of this digitization, and 12 collections are available, ready to be integrated into the BBS on Grottocenter.
https://wiki.grottocenter.org/wiki/GrottoCenter:Fr/Numeriser_des_documents
[image: Une image contenant texte, capture d’écran, Police, nombre Le contenu généré par l’IA peut être incorrect.]
Pour que les bases de données puissent échanges des données automatiquement il est nécessaire que ces bases de données soient sous des licences compatibles. C’est le cas puisque les bases de données de Grottocenter, de la Maison de la Spéléologie de Namur et de la Bibliothèque Anelli sont sous licence ODbL
For databases to be able to exchange data automatically, they must be under compatible licenses. This is the case since the databases of Grottocenter, the Maison de la Speleologie de Namur and the Anelli Library are under ODbL license.
Rendre les données du BBS sur Grottocenter accessibles est parfait mais il est nécessaire que ces données soient de qualité. Les données historiques du BBS ont été importées il y a 5 ans dans Grottocenter, elles étaient pour l’essentiel constituées d’analyses d’articles. Pour que ces données soient parfaitement utilisable un travail avait déjà été réalisé pour attacher ces articles à leur revue et les revues à leur collection.
Mais il était nécessaire de mettre en forme le nom des revues. Yohann a réalisé un script Python qui a été utilisé pour mettre en forme le nom des revues pour les 2000 collections actuellement présentes dans Grottocenter.
Making BBS data accessible on Grottocenter is ideal, but it is essential that this data be of high quality. Historical BBS data was imported into Grottocenter five years ago; it consisted mainly of article analyses. To make this data fully usable, work had already been done to link these articles to their journals and the journals to their collections.
But it was necessary to format the journal names. Yohann created a Python script that was used to format the journal names for the 2,000 collections currently present in Grottocenter.
[image: Une image contenant texte, capture d’écran, logiciel, Logiciel multimédia Le contenu généré par l’IA peut être incorrect.]
Nous avions également besoin que les informations attachées à une collection soient également indiquées dans les revues et les articles attachés à cette collection. Pour cela Camille a créé une application qui permet de mettre à jour les informations concernant l’éditeur, la langue, la licence et l’autorisation d’archiver. Cette application à été utilisée sur une centaine de collection et sera utilisée régulièrement de manière que les choix de licence et l’autorisation d’archiver fournie soient appliquées à tous les documents d’une collection.
We also needed the information attached to a collection to be reflected in the journals and articles attached to that collection. To do this, Camille created an application that allows for updating information regarding the publisher, language, license, and archiving authorization. This application has been used on about a hundred collections and will be used regularly so that the license choices and archiving authorization provided are applied to all documents in a collection.
[image: Une image contenant texte, capture d’écran, logiciel, Page web Le contenu généré par l’IA peut être incorrect.]
Il semblait également nécessaire que les analyses ne soient plus uniquement réalisées par des volontaires à travers le monde mais que l’IA soit utilisée pour proposer des analyses automatiques.
Camille a créé un serveur IA qui va permettre, à partir d’un document, PDF de générer des métadonnées qui seront associées au document
It also seemed necessary that analyses should no longer be carried out solely by volunteers around the world, but that AI should be used to provide automated analyses.
Camille created an AI server that will generate metadata from a PDF document that will be associated with it.
[image: Une image contenant texte, capture d’écran, Police, conception Le contenu généré par l’IA peut être incorrect.]
Yohann de son côté travaillé pour que depuis le BBS sur Grottocenter vous puissiez utiliser ce serveur.
Son premier travail a consisté à faire en sorte que le document, que vous êtes en train de créer puisse récupérer automatiquement toutes les données déjà existantes. Ainsi si vous créez une nouvelle revue et que vous indiquez qu’elle fait partie d’une collection (par exemple vous créez la revue Spélé’Oc n°163 et que vous indiquez qu’elle fait partie de la Collection Spélé’Oc) votre document, sera directement associé avec l’éditeur, la langue, la licence et l’autorisation d’archiver qui ont été déterminés par l’éditeur du document
Yohann, for his part, has been working to ensure that you can use this server from the BBS on Grottocenter.
His first task was to ensure that the document you are creating can automatically retrieve all existing data. So, if you create a new journal and indicate that it is part of a collection (for example, you create the journal Spélé'Oc No. 163 and indicate that it is part of the Spélé'Oc Collection), your document will be directly associated with the publisher, language, license, and archiving authorization that were determined by the document's publisher.
[image: Une image contenant texte, capture d’écran, logiciel, Page web Le contenu généré par l’IA peut être incorrect.]
Tout ce travail, remarquable, à été rendu possible grâce à Benjamin Soufflet qui a assuré le suivi technique des développements, tout au long du stage et à Vincent Marsegerra qui a mis en place l’infrastructure technique.
All this remarkable work was made possible thanks to Benjamin Soufflet, who ensured the technical monitoring of the developments throughout the internship, and to Vincent Marsegerra, who set up the technical infrastructure.
Beaucoup a été réalisé grâce à l’implication, l’assiduité, l’engagement et les compétences nombreuses de Camille Renard et Yohann Schatt. Merci beaucoup a tous les deux.
Much has been achieved thanks to the dedication, diligence, commitment, and extensive skills of Camille Renard and Yohann Schatt. Many thanks to both of them.
Le projet de constitution d’une bibliothèque mondiale, numérique, sur le Karst et le milieu souterrain est désormais en bonne voie. Quelles sont les prochaines étapes ?
Grâce au financement de la SCNat apporté par la commission scientifique de la Société Suisse de Spéléologie un nouveau moteur de recherche va être mis en place sur Grottocenter : il sera plus performant et permettra de réaliser des recherches beaucoup plus fines
Nous envisageons de proposer à un groupe d’étudiant de Polytech Montpellier de développer le service IA à partir de l’infrastructure mise en place par Camille et Yohann. Il s’agira de produire l’ensemble des métadonnées associées à un document, mais également de produire une analyse pour chaque article et d’associer ces articles à des cavités et à leur fiche sur Grottocenter.
The project to create a global digital library on karst and the underground environment is now well underway. What are the next steps?
Thanks to funding from the SCNat provided by the scientific committee of the Swiss Speleological Society, a new search engine will be implemented on Grottocenter. It will be more powerful and allow for much more detailed searches.
We plan to ask a group of students from Polytech Montpellier to develop the AI service based on the infrastructure set up by Camille and Yohann. This will involve producing all the metadata associated with a document, but also producing an analysis for each article and associating these articles with cavities and their Grottocenter record.
Suite à la réunion de la commission Bibliographie de l’UIS l’équipe de pilotage qui était présidée par Jean Marc Mattlet et qui comprenait Anamaria Häuselmann et moi-même à été rejointe par Luca Pisani.
La commission Bibliographie de l’UIS à entrepris de relancer la coopération entre centres documentaires de l’UIS.
Un travail est également en cours pour faire évoluer la manière d’associer les documents à des sujets en s’appuyant sur la nomenclature utilisée par le bibliothèque Anelli
Following the meeting of the UIS Bibliography Committee, the steering team, chaired by Jean-Marc Mattlet and including Anamaria Häuselmann and myself, was joined by Luca Pisani.
The UIS Bibliography Committee has undertaken to relaunch cooperation between UIS documentation centers.
Work is also underway to develop the way documents are associated with subjects, based on the nomenclature used by the Anelli Library.
Ce travail vous intéresse ? Vous souhaitez participer au projet ? Vous êtes d’accord pour archiver des documents et les rendre librement et durablement accessibles ?
Je vous invite à me contacter pour en parler
Are you interested in this work? Would you like to participate in the project? Would you agree to archive documents and make them freely and permanently accessible?
I invite you to contact me to discuss this.
A bientôt
Frédéric Urien