La prima cosa che si sente entrando nella stanza è un rumore incessante di processori al lavoro. Stanno analizzando una mole di dati equivalente a 11 milioni di libri, su cui un LLM (un Modello linguistico di grandi dimensioni) si sta allenando a capire e “parlare” in italiano.
NeXXt AI Factory è il più potente supercomputer disponibile in Italia per l’intelligenza artificiale di proprietà di un’azienda privata. Si chiama Factory, cioè fabbrica, perché le fabbriche del futuro produrranno idee, immagini, testi. E la novità di questa nuova supermacchina è che lo farà interamente nella nostra lingua.
Come funziona l’addestramento
Ma come si addestra un modello linguistico che permetta poi di ottenere un’AI generativa? L’analisi di migliaia o milioni di testi è necessaria per categorizzare ciascuna parola all’interno di una frase e ciascuna frase all’interno di un periodo. Ogni blocco viene taggato, cioè etichettato per descriverne struttura, funzione e significato anche in relazione al contesto in cui è inserito. MIIA, il Modello Italiano Intelligenza artificiale sviluppato da Fastweb, ha avuto a disposizione un database di testi di alta qualità su cui si è allenato per settimane. Ne ha estratto un miliardo e mezzo di token, ovvero blocchi di testo categorizzati, che hanno composto il più grande e affidabile dataset di lingua italiana esistente.
Su quali testi si è allenato
Ad “alimentarlo” sono stati i testi forniti da Istat, Edizioni Bignami e Gruppo Mondadori, che ha messo a disposizione articoli estratti dalle principali testate di Mondadori Media. In questa fase Focus, che fa parte del gruppo Mondadori, non è stato utilizzato, ma presto anche una parte degli archivi della nostra rivista saranno utilizzati per addestrare l’AI.
«L’intelligenza artificiale si basa sulle parole, che sono il fondamento della nostra cultura e hanno un potere immenso», ha commentato Andrea Santagata, Amministratore delegato di Mondadori Media, «Possono informarci, farci cambiare opinione. Se l’AI non è addestrata sulla nostra lingua, rimane uno strumento in parte diverso da noi. Per un modello linguistico nazionale con questi presupposti è anche fondamentale un ambiente sicuro a cui consegnare i propri dati e che rispetti i diritti di copyright e privacy, due principi che per le più diffuse piattaforme internazionali sembrano rimanere secondari agli obiettivi di business».
Lavorare su una quantità enorme ma pur sempre finita di dati consente di fornire un contesto e porre dei limiti, riducendo così il rischio delle cosiddette allucinazioni: gli errori.
La tecnologia
NeXXt AI Factory si basa sulla tecnologia NVIDIA DGX SuperPOD ed è frutto di un accordo per l’acquisto di 31 nodi NVIDIA DGX H100. È risultato 10 volte più efficiente nell’addestramento di modelli di AI generativa rispetto alla generazione precedente di supercomputer e 30 volte più efficace nell’inferenza, cioè nell’applicazione di quei modelli a nuovi dati mai analizzati prima. Ma il training non si esaurisce in poche settimane e il prossimo materiale su cui studiare saranno dataset pubblici di conversazioni tra chatbot ed esseri umani, chat e domande a risposte multiple. Entro la fine dell’anno si prevede il rilascio di una nuova versione di MIIA.
Come verrà utilizzato
Questo sistema è pensato per supportare le pubbliche amministrazioni, ma anche aziende e start up nei settori più diversi, dall’istruzione alla finanza, dalla sanità alle industrie. La sicurezza e la tutela dei dati è garantita dall’integrazione del supercomputer con quattro Security Operation Center che forniscono massimi livelli di affidabilità e protezione.
I modelli italiani di intelligenza artificiale
È importante lavorare a modelli italiani di intelligenza artificiale e poter fare ricerca su quelli perché «quando il supercomputer è arrivato, nessuno era in grado di farlo funzionare: nel nostro paese non abbiamo una cultura tecnologica adeguata», ha dichiarato Gianluigi Greco del Comitato di Coordinamento sull’AI presso la Presidenza del Consiglio del Ministri e Professore di Informatica all’Università della Calabria. Greco è anche alla guida dell’Advisory Board che monitora l’addestramento di MIIA e garantisce il rispetto di un approccio etico che mette al centro l’essere umano. Per puntare su ricerca e innovazione, altre partnership sono state strette con l’Università Bicocca di Milano e La Sapienza di Roma. «Abbiamo creato da zero delle competenze e delle risorse umane che saranno cruciali per lo sviluppo futuro. L’Italia ha una grande tradizione nell’innovazione industriale e non possiamo lasciare che il treno dell’AI passi senza salirci».
Per competenze non si intendono solo matematici, fisici o informatici. Un sistema che ha le sue radici nelle parole ha bisogno di letterati, umanisti, filosofi. Ha bisogno di essere controllato e indirizzato, affinché sia davvero utile ai nostri scopi.
Fotogallery 15 opere più creative secondo il computer
Fonte Focus.it