Meta AI e il nuovo traduttore da voce a voce: il futuro della traduzione istantanea?

Il sogno del “pesce di Babele” descritto nella celebre guida fantascientifica The Hitchhiker’s Guide to the Galaxy sembra più vicino alla realtà grazie a Meta. Il colosso tecnologico ha sviluppato un sistema di apprendimento automatico in grado di tradurre istantaneamente discorsi pronunciati in 101 lingue in 36 lingue di destinazione, attraverso l’ausilio di un sintetizzatore vocale. Il sistema, denominato SEAMLESSM4T (Massively Multilingual and Multimodal Machine Translation), è stato presentato su Nature il 15 gennaio 2025.

Un sistema versatile

SEAMLESSM4T non si limita alla traduzione da voce a voce. È in grado di tradurre anche da testo a testo, da testo a voce e da voce a testo. Meta ha deciso di rendere il progetto open-source, seguendo la stessa filosofia adottata con il modello linguistico LLaMA, per consentire ai ricercatori di ampliare le potenzialità del sistema.

La sfida dei dati scarsi

I progressi della traduzione automatica sono stati resi possibili dall’introduzione delle reti neurali e dalla disponibilità di enormi quantità di dati. Tuttavia, per molte lingue meno diffuse su internet, la scarsità di dati rappresenta un ostacolo significativo. Allison Koenecke, scienziata informatica presso la Cornell University, evidenzia come questa disuguaglianza limiti le possibilità di addestramento dei sistemi di traduzione. Meta ha affrontato questa sfida basandosi su progetti precedenti, tra cui No Language Left Behind, che puntava a tradurre testi in circa 200 lingue. Per SEAMLESSM4T, il team ha raccolto milioni di ore di file audio e traduzioni generate dall’uomo, provenienti da archivi come quelli delle Nazioni Unite. Inoltre, il sistema è stato addestrato a riconoscere contenuti corrispondenti tra lingue diverse, automatizzando l’abbinamento tra audio e testo.

Traduzione senza testo intermedio

Un aspetto innovativo del sistema è la capacità di tradurre direttamente da voce a voce, senza passare per il testo scritto. Questo approccio, combinato con un sintetizzatore vocale, consente una traduzione fluida in diverse lingue. Al momento, i risultati sono disponibili in 36 lingue, con un tempo di ritardo di pochi secondi, paragonabile a quello di un interprete professionale.

Miglioramenti e limiti

Secondo Marta Costa-jussà, ricercatrice di Meta e co-autrice dell’articolo, l’integrazione di diverse combinazioni tra testo e voce ha contribuito a migliorare le prestazioni del sistema. Inoltre, gli sviluppatori hanno adottato misure per ridurre pregiudizi di genere e traduzioni tossiche, come l’aggiunta di linguaggio offensivo non presente nel testo originale. Ad esempio, il sistema evita di tradurre termini neutri, come “nurse” in inglese, in forme di genere specifico in altre lingue. Tuttavia, Koenecke sottolinea la necessità di una maggiore attenzione ai limiti di accuratezza del sistema e propone che, in caso di incertezza, il modello non fornisca alcuna traduzione.

Un progetto promettente, ma con riserve

Sabine Braun, esperta di traduzione presso l’Università del Surrey, considera il progetto un passo importante, ma invita a una maggiore vigilanza nell’adozione di tali tecnologie. Braun sottolinea l’importanza di educare gli utenti, soprattutto in ambiti critici come quello medico o legale, sui limiti della traduzione automatica. Secondo lei, è necessario un dibattito più approfondito su come valutare queste soluzioni.

Recensione OPPO Find X9 Ultra: è lui il vero “Ultra smartphone”

Recensione Insta360 Flow 2 Pro: il gimbal che ha senso soprattutto per chi usa iPhone, ma con una carta in più grazie all’AI Tracker

Recensione HUAWEI Pura 80 Pro: un camera phone completo (o quasi)

Recensione HUAWEI WATCH GT Runner 2: molto Huawei, molto sport

Recensione realme 16 Pro+: tanta autonomia, buone fotocamere

TUTTI gli smartphone con ricarica rapida oltre 100W

7 APP per NASCONDERE foto, VIDEO E app

7 smartphone con eSIM sotto i 300 euro

7 app per trascrivere audio: pro e contro delle migliori soluzioni

13 smartphone con fotocamera da 200 Mpixel