Novités y Publicaziuns
Publicaziuns scientifiches, novités dl proiet y ater...
Bringing Ladin to FLORES+
Wir freuen uns, einen wichtigen Meilenstein unserer gemeinsamen Forschungsarbeit vorstellen zu können. Mit dem Beitrag „Bringing Ladin to FLORES+“ wurde Ladin in den internationalen Evaluationsdatensatz FLORES+ für maschinelle Übersetzung integriert. Unsere Arbeit wurde im Rahmen der Open Language Data Initiative Shared Task 2025 in Suzhou (China) präsentiert.
Samuel beim 8. Forum der Europäischen Minderheitenregionen
Am 26. und 27. November 2024 fand in Donostia/San Sebastián das 8. Forum der Europäischen Minderheitenregionen statt. Organisiert von der Föderalistische Union Europäischer Nationalitäten (FUEN) und dem baskischen Sprachindustrie-Cluster LANGUNE, war die Veranstaltung ein Treffpunkt für Vertreter*innen aus Politik, Wissenschaft, Industrie und Minderheitenregionen. Im Fokus standen die Chancen und Herausforderungen der Digitalisierung für Minderheitensprachen, insbesondere durch den Einsatz von Künstlicher Intelligenz (KI).
Neuronale Maschinelle Übersetzung erstmals für Ladinisch angewendet
Wir berichten über unsere ersten Schritte zur Anwendung moderner neuronaler Übersetzungstechnologien auf das Ladinische. In unserer Publikation „Traduzione automatica ‘neurale’ per il ladino della Val Badia“ haben wir untersucht, wie datengetriebene Ansätze der Neural Machine Translation (NMT) auch für eine Sprache mit begrenzten Ressourcen adaptiert werden können.
Vergleich von Back‑Translation‑Methoden auf dem LoResMT 2024‑Workshop präsentiert
Beim Seventh Workshop on Technologies for Machine Translation of Low‑Resource Languages (LoResMT 2024) in Bangkok, Thailand, wurde unser Beitrag „Rule‑Based, Neural and LLM Back‑Translation: Comparative Insights from a Variant of Ladin“ vorgestellt. Die Arbeit untersucht die Wirkung unterschiedlicher Back‑Translation‑Ansätze auf die maschinelle Übersetzung für das Ladinische (Variante Val Badia) im Kontext sehr begrenzter paralleler Daten (ca. 18 000 Ladinisch‑Italienisch Satzpaare). Neben einem feinabgestimmten neuronalen Modell wurden synthetische Trainingsdaten mithilfe eines regelbasierten Systems sowie eines großen Sprachmodells erzeugt und miteinander verglichen. Die Experimente zeigen, dass alle Ansätze in dieser Low‑Resource‑Situation ähnliche Übersetzungsqualität erreichen
Presentazione al Convegno Lessicografia tradizionale e in rete in una quotidianità plurilingue
Al convegno scientifico “Lessicografia tradizionale e in rete in una quotidianità plurilingue” dedicato a Luca Serianni (30-31 marzo 2023, Eurac Research, Bolzano) abbiamo presentato il nostro contributo “Traduzione automatica per il ladino della Val Badia”. In questa relazione è stato esaminato come la traduzione automatica neurale (NMT) possa essere applicata al ladino, nonostante le risorse di dati limitate e la presenza di diverse varietà regionali. La presentazione ha reso visibili i primi risultati della ricerca e ha mostrato come le moderne tecnologie di traduzione possano essere trasferite a una lingua con risorse limitate.
Erste Experimente und Publikation zur maschinellen Übersetzung für Ladinisch
Erste Untersuchungen im Bereich der maschinellen Übersetzung für Ladinisch wurden erfolgreich durchgeführt. Ziel dieser Experimente war es, die Grundlagen für digitale Sprachressourcen zu schaffen und das Potenzial moderner KI-Methoden für eine Low-Resource-Sprache wie Ladinisch zu evaluieren. Die Ergebnisse dieser Arbeiten wurden in einem ersten Arbeitsbericht in der Ladinia XLVI (2022) veröffentlicht und bilden die Basis für weiterführende Forschung, die den Einsatz von KI-Technologien für das Ladinische voranbringen soll.