Le DFC met en place un outil collaboratif pour faciliter la gestion communautaire de ses thésaurus

La création d’un standard d’interopérabilité comme celui du Data Food Consortium implique de définir un ensemble de concepts partagé entre les plateformes numériques qui veulent collaborer. Ces concepts communs définissent une « ontologie ». Cette dernière permet aux plateformes qui l’utilisent de se comprendre, de « parler » la même langue. Ainsi quand une plateforme fait référence au concept d’entreprise, de produit, ou encore d’unité lors d’un échange d’informations, les plateformes destinataires savent comment traiter la demande.

Le thésaurus, un vocabulaire contrôlé complémentaire à l’ontologie

Certains concepts d’une ontologie sont dits « génériques » dans le sens où ils peuvent être créés à l’infini. Par exemple, le concept d’entreprise dans notre ontologie permet de représenter n’importe quelle entreprise du monde : il n’est pas limité à l’entreprise A, B ou Z.

A l’inverse, il existe des concepts qu’il est préférable de « fermer » ou plutôt de « contrôler ». C’est par exemple le cas des unités. En effet, dans le domaine des circuits courts, nous utilisons un ensemble d’unités fini et connu à l’avance qui contient le gramme, le litre ou encore la pièce. Ce type de vocabulaire contrôlé s’appelle un « thésaurus ».

Thésaurus :
1. Nom donné à des lexiques de philologie ou d’archéologie, notamment à des dictionnaires exhaustifs, comprenant le vocabulaire complet d’une langue.
2. Liste alphabétique de mots standards utilisés pour le classement de la documentation.

Dictionnaire Larousse

Les thésaurus simplifient l’utilisation d’un standard

Un thésaurus peut être vu comme une ressource partagée entre toutes les plateformes qui respectent un même standard. Au lieu de récréer les mêmes éléments chacune de leur côté, ces plateformes vont directement utiliser ceux du thésaurus. Il est par exemple inutile que chaque plateforme recréée et maintienne les unités, les labels alimentaires ou encore les types de produit. L’utilisation de thésaurus est un gain de temps et une économie de ressource au niveau des plateformes.

Utiliser des thésaurus permet également de limiter le besoin de « réconcilier » les données. La « réconciliation » consiste à faire correspondre des données similaires issues de plusieurs plateformes différentes. Notre prototype permet par exemple de dire que l’entreprise « E1 » de la plateforme A est la même que l’entreprise « E5 » de la plateforme B. Lorsque des plateformes partagent des thésaurus, il n’y a pas besoin de réconcilier les données de ces thésaurus puisqu’elles référencent exactement la même chose ! C’est là encore un gain de temps et une économie de ressource.

DFC héberge sa propre instance de VocBench pour faciliter les contributions aux thésaurus

Au Data Food Consortium, nous cherchions à simplifier la contribution aux différents thésaurus que nous publions. Jusqu’alors cette gestion était réservée à des profils avancés puisqu’il fallait modifier des fichiers RDF manuellement sur notre dépôt de code public. Nous souhaitions proposer une expérience plus pratique et plus inclusive.

VocBench est une solution open-source d’édition en ligne de vocabulaires comme les thésaurus. Il propose une interface graphique facile d’utilisation pour ajouter, modifier et supprimer facilement des éléments. Avec cet outil, plus besoin de maîtriser le RDF, quelques clics suffisent. Nous espérons que VocBench facilitera les contributions aux thésaurus pour qu’ils restent toujours adaptés aux besoins de la communauté !


Pour accéder au VocBench DFC : https://vocbench.datafoodconsortium.org/vocbench3/. Vous pouvez utiliser le compte visiteur (lecture uniquement) avec comme login « hello [at] datafoodconsortium [POINT] org » et comme mot de passe « guest ». Sinon vous pouvez également créer votre compte qui sera validé par un administrateur.

Les thésaurus actuels sont disponibles au format SKOS ici :

  • Les mesures – unités, dimensions… (RDF, JSON-LD)
  • Les facettes – certifications, labels, origines… (RDF, JSON-LD)
  • Les types de produit (RDF, JSON-LD)

Laissez un commentaire

Votre adresse e-mail ne sera pas publiée.