12 Monate LDS Country Workshops

Datum: 09/04/2025
Die Events hatten einen sensibilisierenden und investigativen Charakter und ermöglichten den nationalen/regionalen Teilnehmenden einen Austausch über den Stand der Sprachtechnologien, über die Arbeit an LLMs und generativer KI sowie über die Nutzung und Bereitstellung von Daten in ihren jeweiligen Ländern.
Herausforderungen und Chancen
Die teilnehmenden Vertreter aus Industrie, Wissenschaft und öffentlichem Sektor waren sich einig, dass die Probleme im Zusammenhang mit Sprachdaten im Kontext der generativen KI in der Tat erheblich sind, aber auch Chancen für Verbesserungen und Innovationen bieten. Zu den wichtigsten Themen gehören:
- Desinformation und Bias: Während die anfängliche Begeisterung für generative KI durch Bedenken über Desinformation und Bias gedämpft wird – insbesondere bei ressourcenärmeren Sprachen – hilft der LDS, indem er einen inklusiveren Datenaustausch fördert und ausgewogene, repräsentative Datensätze sicherstellt, die Biases minimieren und die Modellgenauigkeit in allen Sprachen verbessern.
- Datenqualität vs. -quantität: Die Interessenvertreter der Industrie weisen auf die Diskrepanz zwischen großen Datenmengen und hochwertigen, fachlich relevanten Sprachdaten hin, was wiederum für ressourcenärmere Sprachen besonders wichtig ist. LDS fördert die Zusammenarbeit bei der Beschaffung maßgeschneiderter, relevanter Daten, insbesondere für unterrepräsentierte Sprachen, und verbessert so die Wirksamkeit der Modelle.
- Rechtliche und IP-bezogene Herausforderungen: Rechtliche Aspekte, insbesondere Datenschutzgesetze und Fragen des geistigen Eigentums, haben die Datenbeschaffung zu einem komplexen Prozess gemacht. Der LDS geht dieses Problem an, indem er einen sicheren, transparenten Datenaustausch unter Einhaltung der geltenden Vorschriften fördert und dabei die Privatsphäre und die Rechte an geistigem Eigentum schützt.
Auch für Privatunternehmen sind einige der oben genannten Elemente oft ein Hindernis für die gemeinsame Nutzung von Daten, zusätzlich zu den mit der Datenverwaltung verbundenen Kosten, möglicherweise restriktiven Vereinbarungen mit Dritten und dem natürlichen Zögern, geschäftskritische Daten zu teilen. LDS bietet jedoch einen sicheren Rahmen, der einen kontrollierten Datenaustausch ermöglicht, ohne die Vertraulichkeit der Unternehmensdaten zu gefährden. Durch die Förderung von Vertrauen und Transparenz schafft LDS ein Umfeld, das die Zusammenarbeit begünstigt und den Wettbewerbscharakter von Unternehmen berücksichtigt.
Synergien und Kooperationen
Die LDS Country Workshops haben auch eine Vielzahl von Rahmenbedingungen in der Sprachdatenindustrie aufgezeigt, mit nationalen Kontexten, die es den LT-Entwicklern teilweise ermöglichen, ihre Daten durch nationale Kooperationen z. B. mit nationalen Bibliotheken oder Rundfunkmedienanstalten zu erhalten. Solche Partnerschaften werden unter den Bedingungen gemeinsamen Interesses und Vertrauens aufgebaut, was Teil der Aufgabe des LDS ist, auf solche Allianzen auf europäischer Ebene abzuzielen.
In diesem Zusammenhang sammelt der LDS derzeit Anforderungen von ihren potenziellen Nutzern und baut gleichzeitig Synergien mit solchen Einrichtungen auf, um eine breitere gemeinsame Nutzung ihrer Sprachdaten unter rechtskonformen und transparenten Vertrauensbedingungen zu fördern.
Die Bedeutung von Data Spaces wurde in den Workshops ebenfalls hervorgehoben, wobei in den letzten Veranstaltungen ihre Schlüsselrolle bei der Sicherstellung der Datenverfügbarkeit für die verschiedenen Gemeinschaften und der Gewährleistung, dass die Dateninhaber und -produzenten die Kontrolle über ihre Daten behalten, betont wurde. Der LDS spielt sowohl für die Datennutzer als auch für die Datenanbieter eine entscheidende Rolle und ist innerhalb des Ökosystems der Data Spaces sehr aktiv.
Erkenntnisse und Einblicke
In den letzten Monaten hat sich das Wissen über den LDS vergrößert; die Arbeit der Initiative und ihr erster Prototyp sind nun besser bekannt und die Beteiligten sind zuversichtlich, dass der LDS einen vertrauenswürdigen und rechtskonformen Marktplatz für Datennutzer und -anbieter bieten wird.
Darüber hinaus gab es in diesen Workshops auch lebhafte Diskussionen über eine breite Palette von Themen, darunter die Verwendung synthetischer Daten, die Bedeutung der Erhaltung der europäischen kulturellen Identität durch Daten, die Notwendigkeit, Sensibilisierungsarbeit zu leisten, um Unternehmen von der gemeinsamen Nutzung ihrer Daten zu überzeugen und sie dabei zu unterstützen, die Notwendigkeit klarer rechtlicher Unterstützung und bewährter Praktiken für eine rechtskonforme gemeinsame Nutzung von Daten, auch unter Berücksichtigung von Anonymisierung und datenschutzfreundlichen Ansätzen. All diese Themen werden sicherlich in den kommenden Country Workshops weiter diskutiert werden.
Ein großes Dankeschön an alle Organisatoren der Country Workshops für die großartige Arbeit, die sie geleistet haben!