21 von 30 Sprachen Europas vom digitalen Aussterben bedroht

  • Der Wortschatz des ersten Spracherkennungssystems (1962) war noch sehr begrenzt: Die "Shoebox" von IBM erkannte gerade einmal 16 Worte, die Zahlen von Null bis Neun und außerdem die mathematischen Anweisungen "minus", "plus", "subtotal", "total", "false" und "of".
    foto: apa/dpa/ibm

    Der Wortschatz des ersten Spracherkennungssystems (1962) war noch sehr begrenzt: Die "Shoebox" von IBM erkannte gerade einmal 16 Worte, die Zahlen von Null bis Neun und außerdem die mathematischen Anweisungen "minus", "plus", "subtotal", "total", "false" und "of".

Nur Englisch wird technologisch gut unterstützt, Deutsch und Spanisch hingegen mittelmäßig - Isländisch und Litauisch im digitalen Abseits

Seit wenigen Jahren wird Sprachtechnologie als eines der zentralen Wachstumsgebiete innerhalb der Informationstechnologie betrachtet. Sie hat das Potenzial, Sprachgrenzen mit Hilfe moderner maschineller Übersetzungsmethoden zu überwinden. Eine neue Studie zeigt jedoch klar, dass viele europäische Sprachen dafür noch nicht hinreichend ausgestattet sind. Mehr noch: Die meisten europäischen Sprachen würden in der digitalen Welt unter Umständen nicht überleben, warnt die Studie "Europe's Languages in the Digital Age" europäischer Sprachtechnologie-Experten von "Meta-Net".

Mehrheit komplett vernachlässigt

"Die Ergebnisse unserer Studie sind äußerst alarmierend. Der Mehrheit der europäischen Sprachen mangelt es in gravierendem Maße an technologischer Unterstützung, und einige werden fast komplett vernachlässigt", betont Hans Uszkoreit, Koordinator von Meta-Net, wissenschaftlicher Direktor am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) und Mitherausgeber der Studie.

"Es gibt dramatische Unterschiede bei der Unterstützung der verschiedenen europäischen Sprachen und Technologiebereiche durch Sprachtechnologie. Die Schere zwischen 'großen' und 'kleinen' Sprachen geht immer weiter auf", sagt Georg Rehm (DFKI), ebenfalls Mitherausgeber. "Wir müssen sicherstellen, dass wir alle kleineren und unterversorgten Sprachen mit den nötigen Basistechnologien ausstatten, denn sonst sind diese Sprachen zum digitalen Aussterben verdammt."

Englisch dominiert

Für die Untersuchung haben Wissenschaftler den Stand der Sprachtechnologie für 30 der ca. 80 europäischen Sprachen bewertet. Sie kommen zu dem Schluss, dass bei 21 der 30 untersuchten Sprachen ein digitaler Rückhalt nicht existiert oder bestenfalls schwach ist. Die technologischen Lücken seien signifikant und entstünden vor allem durch die Fokussierung auf die englische Sprache in Forschung und Entwicklung, mangelndes Engagement und geringe finanzielle Ressourcen sowie nicht zuletzt durch fehlende klare Forschungs- und Technologievisionen.

Hochrisikosprachen mit "fragmentarischer Unterstützung"

Die Studie dokumentiert und beurteilt für jede der untersuchten Sprachen die sprachtechnologische Unterstützung in vier Anwendungsgebieten: automatische Übersetzung, Erkennung und Generierung gesprochener Sprache sowie Textanalyse und Verfügbarkeit von Sprachressourcen. Insgesamt 21 der 30 Sprachen (70 Prozent) wurden von den Experten mindestens einmal in die schlechteste Kategorie "Unterstützung ist schwach oder nicht existent" eingeordnet. Mehrere Sprachen, zum Beispiel Isländisch, Litauisch und Maltesisch, erhalten diese Bewertung in allen vier Gebieten.

Nur das Englische wurde mit "guter Unterstützung" bewertet, gefolgt von Sprachen wie Niederländisch, Französisch, Deutsch, Italienisch und Spanisch mit "moderater Unterstützung". Sprachen wie Baskisch, Bulgarisch, Katalanisch, Griechisch, Ungarisch und Polnisch zeigen nur "fragmentarische Unterstützung", womit auch sie in die Gruppe von Hochrisiko-Sprachen eingeordnet werden müssen.

Europäischer Tag der Sprachen

Europa müsse Maßnahmen ergreifen, um seine Sprachen auf das digitale Zeitalter vorzubereiten, schließen die Forscher. Sie seien "ein wertvoller Bestandteil unseres kulturellen Erbes und als solche verdienen sie Zukunftssicherheit".

Am 26. September wird auch dieses Jahr der Europäische Tag der Sprachen stattfinden und an dieses sprachliche und kulturelle Erbe erinnern. (red, derStandard.at, 20.9.2012)

Share if you care