Traduzione automatica: ecco cosa riserva il futuro


Quello delle intelligenze artificiali al servizio della traduzione automatica è un tema enorme che travalica il trasferimento linguistico in quanto tale e apre scenari futuri sia sulle capacità delle IA sia sul loro ambito di applicazione.

Per capire meglio quali orizzonti ha contribuito ad aprire è opportuno fare un salto indietro nel tempo fino al 2022, quando Yuri Burda e Harri Edwards – ricercatori di OpenAI – hanno pubblicato il paperGrokking: Generalization Beyond Overfitting on Small Algorithmic Datasets”.

Nello specifico i due, alle prese con un Large Language Model (LLM) dedito all’esecuzione di operazioni aritmetiche, si sono resi conto che un addestramento prolungato nel tempo consentiva al modello di risolvere problemi inediti.

Il grokking, di fatto, è un processo mediante il quale si ottiene una generalizzazione vieppiù perfetta del modello, una pagina del deep learning ancora tutta da scrivere. In termini spicci, un modello addestrato per svolgere un compito impara a fare cose inaspettate: ciò non capita solo – come nel caso esposto da Burda ed Edwards – nell’aritmetica elementare ma anche nelle traduzioni. mBERT, NLLB-200 e il più celebre GPT-4 sono LLM che hanno mostrato capacità emergenti imparando a tradurre testi in lingue non incluse nel loro addestramento.

Un fenomeno recente che ha ispirato studi e teorie. Tra le più accreditate figura un’inedita competizione tra memorizzazione e generalizzazione nei modelli: i circuiti di memorizzazione vanno in overfitting (il modello impara molto bene dai dati di addestramento ma non si distingue nella generalizzazione su nuovi dati) ma, con il progredire dell’addestramento, subentrano circuiti di generalizzazione che coprono una maggiore astrazione superando così i processi di memorizzazione.

Indice degli argomenti:

Mutuo 100% per acquisto in asta

assistenza e consulenza per acquisto immobili in asta

 

Che cos’è la traduzione automatica

La traduzione automatica (machine translation, MT) è il processo attraverso il quale una macchina traduce un testo da una lingua a un’altra senza intervento umano, facendo leva su algoritmi e modelli AI al fine di restituire traduzioni precise e il più possibile contestualizzate.

Ci sono diversi approcci alla traduzione automatica e sono da considerare un cantiere aperto perché in costante evoluzione.

Si tratta di modalità di traduzione che fanno leva su tecnologie diverse:

  • regole
  • modelli statistici
  • reti neurali
  • modelli generativi.

Approfondiremo più avanti queste metodologie di traduzione, alcune ormai superate appannaggio di metodi più scalabili e meno costosi. Tuttavia, ognuno di questi ha ancora degli utilizzi verticali che soddisfano le esigenze di ambienti specifici, pure non essendo adottati su vasta scala.

Traduzione basata su regole: un metodo tradizionale

La traduzione basata su regole (RBMT, Rule-based Machine translation) è stata un passo fondamentale nello sviluppo della traduzione automatica. Fa leva su dizionari e su regole linguistiche e grammaticali predefinite finalizzate alla traduzione di un testo.

Le regole descrivono:

  • la morfologia, ossia la sfera della grammatica che studia le parti del discorso e le loro proprietà
  • la sintassi
  • la semantica
  • la pragmatica, l’uso contestuale della lingua.

Queste regole sono funzionali alle fasi sulle quali si erige la traduzione, essenzialmente tre:

  • Analisi del testo originale mediante la quale vengono identificate la struttura grammaticale, le parole e le loro relazioni sintattico-semantiche
  • Trasferimento linguistico, la fase durante la quale il testo originale viene trasformato in base alle regole predefinite
  • Testo tradotto nella lingua di destinazione grazie alle regole sintattiche e morfologiche

La traduzione basata su regole ha fatto da pioniere e ha mostrato dei punti di forza e degli svantaggi.

Microcredito

per le aziende

 

La coerenza e la trasparenza sono tra i punti di forza. Infatti, le regole fisse sono note e consentono di misurare i risultati in modo obiettivo. Non da ultimo, regole e dizionari possono essere modificati per supportare ambiti di applicazione specifici quali, per esempio, la traduzione di testi scientifici oppure legali.

Tuttavia, il costo di sviluppo e la bassa scalabilità si sono palesati come svantaggi. Aggiungere una nuova lingua è macchinoso – richiede la definizione di regole tipiche – e, non da ultimo, le regole in quanto tali mal si sposano con le sfumature e le ambiguità di ogni idioma.

Benché esistano altre metodologie per la traduzione, quella basata su regole ha la sua ragione di essere proprio in virtù delle elevate capacità di personalizzazione che ne consentono l’uso in contesti altamente specifici.

L’evoluzione verso la traduzione automatica statistica

La traduzione automatica statistica (SMT, Statistical machine translation) è un approccio rimasto in voga a cavallo tra gli anni Ottanta e i primissimi anni 2000. Un metodo di traduzione automatica che fa leva sui modelli probabilistici istruiti con dati bilingue per tradurre dall’idioma originale a quello di destinazione.

La SMT funziona su tre principi cardine:

  • il modello di traduzione che si basa su tabelle bilingui
  • il modello linguistico che considera la coerenza del testo tradotto nell’idioma di destinazione
  • l’algoritmo di decodifica che cerca la sequenza più probabile (e più fluida) nella lingua di destinazione. Tra gli algoritmi più usati figura il decoder Beam Search, responsabile di trovare la traduzione più probabile tra le diverse disponibili.

La traduzione automatica statistica ha tenuto banco per circa un ventennio ma ha lasciato tracce tangibili del suo passaggio. Basti pensare che l’algoritmo di ricerca euristica Beam Search è ancora oggi usato per ottimizzare le risposte generate da ChatGPT.

traduzione automatica

Ci sono diverse varianti della SMT, ognuna evoluzione di quella precedente. Ciò significa che, nel corso degli anni, la traduzione automatica assistita è stata presa in seria considerazione nell’ottica degli sviluppi futuri. Tra queste varianti vanno citate:

Sconto crediti fiscali

Finanziamenti e contributi

 

  • Model 1-5, modelli probabilistici sviluppati da IBM per valutare le probabilità di traduzione di ogni singola parola
  • Phrase based SMT (PBSMT), ha introdotto la traduzione basata su frasi (o blocchi di parole) restituendo risultati migliori rispetto alla traduzione incardinata sul modello parola per parola.
  • Hierarchical Phrase based SMT (HPBSMT), usa regole sintattiche per enfatizzare le relazioni tra parole e frasi dando risultati migliori con l’aumentare della complessità delle frasi stesse, ancorché tali risultati si sono dimostrati a tratti fallaci.

Anche in questo caso gli svantaggi si sono contrapposti ai vantaggi. È vero che la SMT richiede meno dati rispetto alla tecnologia successiva (la Neural Machine Translation della quale parleremo sotto) e che, addestrandola su dizionari e frasari specifici, può essere migliorata per aderire fedelmente a contesti verticali. Sull’altro piatto della bilancia ha palesato da subito limiti insormontabili per la traduzione in lingue minori e alcuni ricorrenti errori grammaticali, dimostrandosi peraltro meno efficace nel gestire le ambiguità linguistiche e nel destreggiarsi in contesti complessi.

La SMT ha così ceduto il posto alla traduzione automatica neurale, ossia la Neural Machine Transaltion.

Tipologie di traduzione automatica: un confronto tra presente e futuri sviluppi

Prima di affrontare il discorso del potenziale e degli sviluppi futuri della traduzione automatica, è opportuno ricomporre le fila, perché si tratta di un argomento complicato e che – nonostante sia oggi dato per scontato grazie all’apporto delle AI – è frutto di un lungo e irto percorso.

La traduzione basata su regole (RBMT) usa regole grammaticali e dizionari bilingue per tradurre testi. Si dimostra coerente ma la sua affidabilità diminuisce con l’aumentare della complessità edelle sfumature tipiche di ogni idioma, tuttavia, in contesti specifici come, per esempio, quelli tecnici, legali o medici, si dimostra una soluzione valida e apprezzabile.

A seguire ci si è concentrati sulla traduzione su statistica (SMT) che fa leva sui modelli probabilistici addestrati con grandi quantità di testi bilingue. Alla migliore capacità di apprendere dai dati si contrappone una minore affidabilità con testi tecnici e nella traduzione meno precisa delle strutture grammaticali più complesse.

I risultati restituiti da queste tecnologie, ancorché perfettibili, non sono stati completamente da buttare. Forti delle esperienze acquisite e della necessità di perfezionare la traduzione automatica, i ricercatori hanno convogliato le rispettive attenzioni verso la traduzione neurale.

Finanziamenti personali e aziendali

Prestiti immediati

 

Comprendere la traduzione neurale: il futuro della traduzione automatica

La traduzione automatica neurale (NMT, Neural Machine translation) usa reti neurali profonde per comprendere e generare testi in modo più naturale.

Rappresenta un momento di svolta per l’intero settore perché si è dimostrata capace di apprendere contesti complessi e di migliorare la fluidità e l’affidabilità dei risultati restituiti dai metodi di traduzione precedenti (quelli basati su regole e su statistica).

I modelli di Deep learning utilizzati sono basati su reti neurali ricorrenti, reti neurali convolutive oppure trasformatori.

Il funzionamento della NMT fa leva su un’architettura encoder – decoder con attenzione (attention). Le fasi, descritte a grandi linee, sono tre:

  • l’encoder legge la frase nella lingua originale e la converte in una rappresentazione vettoriale
  • il meccanismo di attenzione (attention mechanism) fa sì che il modello, durante la traduzione, enfatizzi le parti più importanti della frase
  • il decoder genera il testo tradotto sulla scorta della rappresentazione ricevuta dall’encoder.

Oltre alla maggiore affidabilità e la più alta qualità delle traduzioni, la NMT offre anche una velocità di traduzione elevata e, grazie all’addestramento con nuovi dati, consente miglioramenti continui.

Gli svantaggi misurati fino a oggi, così come conviene a qualsiasi ambito in cui le AI giocano un ruolo specifico, sono strettamente legati alla qualità e alla quantità dei dati:

  • la NMT si trova in difficoltà con le lingue meno rappresentate
  • si dimostra perfettibile nei contesti tecnici o astratti che dipendono molto dal contesto culturale
  • soffre dei bias nei dati di addestramento.

Tuttavia, l’architettura basata sui transformer dà risultati più apprezzabili rispetto a quelli ottenuti con le reti neurali ricorrenti e quelle convolutive.

Finanziamenti personali e aziendali

Prestiti immediati

 

traduzione automatica

L’intelligenza artificiale e la sua influenza sulla traduzione automatica

Le AI hanno migliorato la qualità e la velocità delle traduzioni, aumentando anche il tasso di comprensione del contesto.

A godere del benefico influsso delle AI sono stati sia le traduzioni in quanto tale sia l’impiego che se ne può fare.

Le AI sono più adatte all’interpretazione delle sfumature linguistiche (ambiguità, figure retoriche, metafore, …) tipiche dei diversi idiomi e i testi prodotti dai modelli neurali sono meno “pappagalleschi” rispetto a quelli prodotti dai sistemi SMT.

Non di meno, l’integrazione delle capacità di traduzione negli assistenti vocali (quali Alexa o Google Assistant) sarebbe utopica senza il supporto delle AI e, spostandoci in un ambito prettamente aziendale, la traduzione dei documenti o l’assistenza ai clienti multilingue sarebbe molto più dispendiosa e farraginosa.

Applicazioni della traduzione automatica nel mondo aziendale

Gli effetti della traduzione automatica si possono riassumere citando l’efficienza, l’accessibilità e l’inclusività della comunicazione.

Inoltre, le imprese ne fanno uso per localizzare i contenuti con beneficio tanto per il supporto ai clienti quanto per la comunicazione inter-company, laddove un’organizzazione abbia una natura multinazionale.

Le applicazioni più ricorrenti si snodano lungo cinque pilastri, ossia:

Prestito condominio

per lavori di ristrutturazione

 

  • Globalizzazione: la traduzione automatica aiuta le imprese a superare le barriere linguistiche facilitandone l’entrata in nuovi mercati
  • Assistenza ai clienti: fornire assistenza, documentazione o – più in generale – contenuti declinati nell’idioma dei clienti è un atout per ogni tipologia di business
  • Velocità: la traduzione quasi istantanea di grandi quantità di testo rende più snella l’efficienza operativa. Da qui deriva anche un vantaggio per la comunicazione inter-company
  • Personalizzazione: i modelli possono essere addestrati con dati terminologici specifici di ogni singolo settore con il vantaggio di ottenere traduzioni più coerenti
  • Riduzione dei costi: le spese per le traduzioni si comprimono, diventando inoltre costi fissi e non più variabili.

Le applicazioni

Fatti salvi questi capisaldi, le declinazioni nel mondo aziendale sono innumerevoli.

Il primo pensiero corre all’ospitalità e al turismo, laddove non soltanto le lingue ricoprono un ruolo fondamentale ma si sono palesati gli effetti benefici della traduzione automatica. In questo senso è sufficiente pensare ai portali AirBnb, Expedia o Booking che fanno ricorso alla traduzione automatica sia delle descrizioni delle strutture ricettive sia delle recensioni lasciate dai clienti. La traduzione automatica ha aumentato il coinvolgimento degli utenti e ha reso molto più semplice prenotare soggiorni ovunque nel mondo.

Riducendo tutto ciò all’essenziale, ci si trova all’interno della sfera dell’assistenza ai clienti e questa, a sua volta, si dispone orizzontalmente attraverso qualsivoglia tipo di settore: grazie alla traduzione automatica un sito web può essere presentato in diversi idiomi con il minimo sforzo, e questo vale anche per le traduzioni delle descrizioni dei servizi o dei prodotti.

Il beneficio va, di rimbalzo, anche all’ottimizzazione SEO e alle campagne marketing fatte via email.

A corredo, le chatbot e gli assistenti virtuali sono in grado di fornire risposte in tempo reale in diverse lingue, favorendo le fasi di prevendita e di post-vendita, riducendo i costi e rimanendo attivi 24/7.

Beneficiano della traduzione automatica anche quelle aziende che forniscono manuali d’uso e guide tecniche a corredo dei prodotti o dei servizi venduti.

Parallelamente, la traduzione automatica facilita anche la redazione e la piena comprensione di documenti legali e contratti, anche questi parte integrante della letteratura che circola tra aziende e nelle aziende stesse.

Finanziamo agevolati

Contributi per le imprese

 

Soprattutto l’NMT viene usata dalle multinazionali per tradurre report finanziari affinché gli stakeholder possano entrare in possesso di informazioni rilevanti nelle rispettive lingue.

Tutti ambiti nei quali gli errori di traduzione compiuti dall’uomo possono avere conseguenze sensibili e, ancora prima, ambiti nei quali la traduzione automatica concorre all’internazionalizzazione delle organizzazioni.

La traduzione di email e di documenti, così come la localizzazione di piattaforme per la collaborazione sono preziose anche per le imprese multinazionali. Non si tratta soltanto di abbattere le barriere linguistiche ma di migliorare l’inclusione e la produttività.

Gli strumenti per la traduzione automatica

Gli strumenti per la traduzione automatica non sono tutti uguali. Al contrario, ce ne sono di profilati per rispondere meglio ad alcune peculiarità. Citando i più diffusi – e procedendo in modo approssimativo – si può sostenere che:

  • Deepl si dimostra duttile e quindi personalizzabile per entrare nelle aziende ma anche negli ambiti tecnici e legali
  • Google Translate API, grazie alla scalabilità, guarda soprattutto ai siti web (e quindi anche alle piattaforme ecommerce) e alle piattaforme sociali nonché al supporto ai clienti
  • Microsoft Translator è premiato dall’integrazione con le app e i servizi della stessa Microsoft (Microsoft365, Azure, Teams, eccetera) favorendo così lo sviluppo di software e rendendo più fluide e inclusive le riunioni
  • Amazon Translate è ottimizzato per il cloud e quindi per i servizi Software-as-a-Service (SaaS) e le strutture ecommerce in genere.
  • Systran si presta a settori specifici e verticali ed è usato soprattutto nel mondo legale e finanziario, ma fa molto spesso capolino anche in quello della manifattura.

Va da sé che la supervisione dell’uomo non può venire meno. Questo aspetto, spesso annoverato tra gli svantaggi, rappresenta un limite solo davanti a una lettura frettolosa dell’evoluzione attuale del progresso. Il fatto che le attività demandate alle AI siano esenti da responsabilità non ha alcuna logica: ogni settore, processo o flusso aziendale è supervisionato da una o più persone e non si capisce perché i prodotti di un’AI non dovrebbero meritare una supervisione.

Sfide e soluzioni per la traduzione automatica nei contesti aziendali

Le sfide sono molteplici e non tutte, almeno nell’immediato, hanno una soluzione. Se si pensa in termini di contestualizzazione e sicurezza appare evidente che il lavoro da fare sia ancora molto.

Ancora una volta, sarà proprio l’AI a fornire un aiuto sostanziale per superare le difficoltà che possiamo riassumere in alcune macro-famiglie:

  • Contestualizzazione: i modelli per la traduzione automatica tendono ancora a fraintendere intere frasi proprio a causa di una non sempre facile contestualizzazione
  • Le défaillance si espandono alla terminologia settoriale. I dizionari tecnici possono essere male interpretati da modelli IA il cui addestramento risulta perfettibile
  • Qualità e fluidità: le traduzioni possono essere sintatticamente inappuntabili ma poco fluide e naturali
  • Idiomi meno diffusi: la qualità della traduzione dipende dalla qualità e dalla quantità dei dati con i quali i modelli vengono istruiti. Questo binomio tende a penalizzare le lingue meno rappresentate, le cui traduzioni possono essere imprecise o scialbe
  • Errori: gli errori di traduzione, relativi soprattutto ai documenti legali e alla contrattualistica, possono portare a conseguenze di tipi giuridico
  • Conformità e privacy: compliance e privacy sono temi molto delicati e, soprattutto per quanto riguarda l’uso di servizi di traduzione erogati via cloud, sono vere e proprie mine vacanti anche per la sicurezza dei dati aziendali. È opportuno conoscere in quale modo il servizio usato tratta i dati dei propri clienti
  • Integrazione con i sistemi aziendali: tema vastissimo laddove i sistemi e i servizi di traduzione automatica vanno integrati con ERP, CRM e software aziendali in genere.

Questi limiti, le cui soluzioni richiedono dosi di impegno differenti, sono più che mai attuali considerando che un report curato da DeepL disegna uno scenario nel quale, sul brevissimo periodo, il 25% delle imprese useranno soluzioni AI per le traduzioni.

Come detto, le soluzioni sono di diverso tenore.

La mancanza di contestualizzazione può essere lenita addestrando i modelli per la traduzione automatica su dati aziendali. DeepL Pro, Microsoft Custom Translator oppure Google AutoML Translation consentono la creazione di modelli specifici

La qualità e la fluidità delle traduzioni possono essere migliorate con l’intervento dell’uomo che rivede e corregge i testi generati dalle AI. Un post-editing che però deve essere affidato a traduttori competenti e che quindi può rappresentare un costo sensibile se non persino ingente. Il processo di revisione copre anche gli errori che le AI possono compiere durante il processo di traduzione.

La sicurezza e la protezione possono essere garantite facendo ricorso a sistemi di traduzione on-premise che non necessitano l’invio di dati a server terzi. A prescindere, il ricorso alla crittografia end-to-end e a politiche di sicurezza ad hoc per la tutela dei dati più sensibili è da ritenere ineludibile.

I problemi che insorgono in relazione alle lingue meno diffuse possono essere risolti con i modelli Zero-Shot Learning, ossia modelli addestrati a riconoscere concetti senza avere a disposizione esempi del concetto medesimo. In alternativa, anche in questo caso ricorre la necessità di creare un database multilingue per personalizzare il modello AI e, non da ultimo, la necessità di appoggiarsi a traduttori umani.

Le soluzioni ai problemi di integrazione con i sistemi aziendali richiedono un approfondimento.

Integrazione della traduzione automatica con tecnologie digitali avanzate

Affrontare questo argomento richiede una forma di rischio, perché è necessario ipotizzare – sulla falsa riga di ciò che sta accadendo in questi ultimi mesi – ciò che accadrà nel prossimo futuro e le previsioni, per quanto affascinanti, corrono sul filo dell’errore.

Sappiamo che la traduzione automatica migliorerà costantemente, grazie anche al perfezionamento continuo di modelli AI che avrà ricadute positive sulla personalizzazione, sulla contestualizzazione e sulla multimodalità, consentendo quindi traduzioni più rapide e puntuali di video, immagini e audio. Anche l’aspetto etico ne gioverà con una diminuzione dei bias.

Questa trasformazione è già in atto ed è lecito credere – pure correndo il pericolo di cadere in errore – che le tecnologie digitali consentiranno una maggiore integrazione con i sistemi di traduzione automatica.

La scalabilità sarà sempre più garantita dai sistemi di traduzione accessibili in cloud, mentre il miglioramento del machine learning restituirà traduzioni di più elevata qualità e maggiormente aderenti al contesto specifico.

Le API di traduzione automatica favoriranno l’integrazione con un numero sempre maggiore di software aziendali e, parallelamente, il mercato degli ERP e dei CRM (estendiamo questa previsione anche agli assistenti virtuali e ai dispositivi IoT) saranno sempre più votati alla traduzione nei processi aziendali.

Non da ultimo, la protezione dei dati – anche per la tutela delle proprietà intellettuali – sarà garantita dalla blockchain che si farà carico di certificare l’autenticità (e la sicurezza) dei processi di traduzione.

Queste filosofie di integrazione gioveranno anche alla traduzione visiva, anima della realtà aumentata su cui stanno facendo affidamento le Big tech.



Source link

***** l’articolo pubblicato è ritenuto affidabile e di qualità*****

Visita il sito e gli articoli pubblicati cliccando sul seguente link

Source link