skip to main content
Newsroom

Overview    News

Pourquoi devrais-je partager des données dans l'Espace Européen des Données Linguistiques (LDS) ?

Découvrez comment les entreprises européennes peuvent bénéficier de l'écosystème de l'Espace européen de données linguistiques (LDS).

date:  13/11/2023

Au cours des dernières années, l'importance des outils basés sur l'IA a considérablement augmenté, entraînant des changements significatifs dans notre vie quotidienne et contribuant à de nouvelles tendances ainsi qu'à une plus grande disponibilité et adoption de l'IA centrée sur le langage en général (par exemple, chatGPT, Bing, ou la reconnaissance vocale comme dans Siri ou Alexa).

Les données linguistiques jouent un rôle crucial dans la création d'applications de technologie linguistique (LT) de pointe. De nombreuses organisations sont toutefois confrontées à des difficultés pour collecter la quantité nécessaire de données linguistiques requises pour le développement d'une IA compétitive centrée sur la langue. Le partage des données peut donc être une solution et est de plus en plus considéré comme le meilleur moyen de parvenir à une gestion véritablement durable des données linguistiques, favorisant à la fois la recherche et l'innovation.

Dans ce contexte, les Espaces de Données Européens communs deviennent de plus en plus pertinents, car ils peuvent garantir que davantage de données deviennent disponibles pour une utilisation dans l'économie, la société et la recherche, tout en permettant aux entreprises et aux individus générant les données de conserver le contrôle sur celles-ci.

Un marché pour les données linguistiques

L'Espace Européen des Données Linguistiques (LDS) a pour objectif de créer un véritable marché unique européen pour les ressources linguistiques. Contrairement à des initiatives passées telles que ELRC, le LDS n'offrira pas seulement une plateforme de partage et d'échange gratuite pour la recherche, mais offrira également aux parties prenantes un accès facile à des données de haute qualité (gratuites ou commerciales). De plus, il leur permettra de monétiser leurs propres données, de faciliter l'échange de bonnes pratiques et d'informations avec d'autres parties prenantes, et de soutenir la recherche de nouveaux partenaires ou opportunités de collaboration grâce à une plateforme unique conforme à l'UE.

Mais pourquoi les parties prenantes, telles que celles du secteur de l'édition, des technologies de la langue ou de la presse, devraient-elles partager des données commerciales avec des concurrents potentiels ?

Souvent, les entreprises ne réalisent pas la valeur des ressources linguistiques qu'elles produisent au quotidien (par exemple, des traductions de fiction et de non-fiction), surtout si elles ne font pas partie de leur cœur de métier. En partageant les données dans le LDS, les propriétaires de données peuvent maximiser les revenus de ces ressources, tout en continuant à les contrôler. Ainsi, le LDS n'interférera pas avec l'activité principale des entreprises, mais donnera plutôt une nouvelle vie à de tels ensembles de données et récompensera les efforts investis dans leur création en donnant aux propriétaires la possibilité de les revendre sous différentes conditions.

Le LDS marquera un véritable tournant dans l'approche de la collecte des ressources linguistiques. La disponibilité accrue de données de haute qualité permettra aux entreprises européennes de rivaliser au niveau mondial avec les services linguistiques basés sur les données fournis par les entreprises américaines ou chinoises, en favorisant la confiance tout au long du processus de partage des données linguistiques.