in

La traduzione automatica fa un balzo in avanti con Bloom

Più di mille ricercatori, da tutti e quattro gli angoli del mondo, hanno lavorato a “Bloom”. Un totale di 46 lingue vengono prese in considerazione da questo sistema di previsione linguistica automatico. Sviluppato per funzionare ugualmente bene in inglese, francese e basco, il sistema dovrebbe essere in grado di fornire una conoscenza senza precedenti della lingua e il modo in cui parliamo.

Ma per capire appieno come funziona Bloom, devi guardare la sua storia. Per questo bisogna tornare indietro di qualche mese, alla nascita del progetto BigScience. Quest’ultimo è opera di una startup americana, Hugging Face, fondata da due francesi. Ha completato una raccolta fondi da 100 milioni di dollari lo scorso maggio, che ha coinvolto grandi nomi del settore come Airbus, il braccio IA di Meta (ex Facebook) o persino le francesi Orange e Ubisoft.

Perché l’idea dietro Bloom ha qualcosa da sedurre. Come spiega François Yvon, direttore della ricerca al CNRS, esistono già altri modelli linguistici. Microsoft e Nvidia ha unito le forze alcuni mesi fa per costruirne uno. Ma questi programmi, sviluppati da società private, non sono del tutto trasparenti, a differenza di Bloom.

In effetti, i due fondatori di questa idea hanno promesso che Bloom sarebbe diventato al 100% open source. Ad esempio, i ricercatori di tutto il mondo dovrebbero avere una base di lavoro comune.

Un sistema multilingue che ci capisce

Bloom consente agli scienziati di lavorare su 46 lingue contemporaneamente. Il software proverà quindi a indovinare la parola successiva. Un progetto colossale che ha richiesto mesi di calcoli da parte del supercomputer francese Jean Zay. Ma le conseguenze possono essere enormi.

Il nuovo Ministro dell’Istruzione Superiore e della Ricerca è consapevole delle grandi problematiche che il mondo della ricerca deve affrontare. Ha accolto con favore la presenza della lingua francese in questo programma, che è integrato “molto diffuso”.

Perché se l’uso di Bloom è ancora limitato per il momento, la traduzione automatica dovrebbe sperimentare un vero prima/dopo grazie a questo sistema. Ma come spiega François Yvon, questo sistema è principalmente uno strumento per far avanzare la ricerca: “Come un grande telescopio, ci permette di osservare e capire come funzionano questi modelli linguistici. »

Ha sempre analizzato 176 miliardi di parametri

Per perfezionare la sua formazione, Bloom è stato in grado di utilizzare la potenza di calcolo del supercomputer Jean Zay. Il progetto Bloom è in esecuzione al 100% da 4 mesi per ottenere un tale risultato. Dopo aver dedicato così tanto tempo all’apprendimento di lingue diverse e variegate, Bloom è riuscita a comprendere e analizzare 176 miliardi di parametri.

Grazie a questo albero dalle immense possibilità, è in grado di: predire la parola che sarà scritta conoscere solo l’inizio di un testo. Questo sistema dovrebbe essere molto utile per i sistemi di traduzione automatica, ma anche per i generatori di scrittura che possono guadagnare enormemente in affidabilità.

Completamente open source, il progetto dovrebbe essere reso pubblico nelle prossime settimane dalla neonata startup Hugging Face dietro di esso.

più di mille migranti sbarcano in poche ore

“Senza Laeticia Johnny sarebbe…”, confida uno degli amici più cari del rocker che non piacerà a tutti!