Intervista a Carlo Boselli. Primo ricercatore all’Istat, responsabile per la gestione dei contenuti statistici del corporate data warehouse per la diffusione dei dati aggregati e del Single Exit Point per l’accesso ai dati machine to machine. Ha coordinato per l’Istituto il progetto IstatData. Lavora da anni nel servizio Diffusione, presso la Direzione centrale per la comunicazione, informazione e servizi ai cittadini e agli utenti, all’interno del Dipartimento per lo sviluppo di metodi e tecnologie.
Dott. Boselli, chi ha avuto l’intuizione? Chi ha sviluppato il progetto?
L’Istituto si è mosso a vari livelli per portare soluzioni IA sulle proprie piattaforme. Per quanto riguarda IstatData, in particolare, i vertici hanno colto immediatamente la sfida di un’innovazione che anche altre organizzazioni a livello nazionale e internazionale stavano tentando di sviluppare su sistemi basati sulla stessa tecnologia. I ricercatori Istat, d’altronde, studiano da tempo soluzioni di Intelligenza artificiale per migliorare l’accesso ai dati aggregati messi a disposizione nel data warehouse. La soluzione realizzata è il risultato di una intensa sinergia fra le direzioni, a cominciare da quelle della diffusione e dell’informatica. In fase di collaudo, poi, sono intervenute anche le direzioni tematiche, l’ufficio legale e la metodologia. Il progetto è stato sviluppato in collaborazione con la società Deda.Next, che è riuscita ad integrare le soluzioni proposte dall’Istat all’interno della piattaforma di diffusione.
Come funziona AI-Istat Data? Perché è così innovativo?
Su IstatData sono ora presenti due assistenti basati su intelligenza artificiale. Il primo consente di ricercare le tavole mediante richieste in linguaggio naturale, ottenere anteprime dei dati, accedere alle informazioni del glossario d’Istituto e a una guida interattiva. Il secondo consente di modellare e costruire tavole, grafici e mappe, e descriverli in linguaggio naturale senza alterare il contenuto dei dati. E’ uno dei primi sistemi di ricerca e modellazione basato su IA proposto da un Istituto nazionale di statistica a livello mondiale. Il progetto rappresenta un benchmark per l’intero sistema pubblico italiano; grazie all’uso dell’intelligenza artificiale generativa si migliora l’accessibilità e la fruibilità dei dati, mantenendo certezza e veridicità dell’informazione.
Quale tecnologia sottende la piattaforma?
La piattaforma di IstatData è open source ed è stata sviluppata dall’Istat sullo standard internazionale di trasferimento dati SDMX. La soluzione di IA in essa integrata vede: da un lato, un modulo di interfaccia utente per la ricerca e la modellazione delle tavole sviluppato ad hoc; dall’altro, una componente sistemistica e architetturale per la gestione dei servizi di intelligenza artificiale. I servizi sottostanti sono quelli di Open AI, gli stessi alla base di Chat Gpt, resa disponibile da Microsoft Italia.
ISTAT - Istituto Nazionale di Statistica. Ente pubblico italiano responsabile della produzione e diffusione delle statistiche ufficiali. Fu fondato nel 1926 con la legge n. 1162, come Istituto Centrale di Statistica, sostituendo di fatto la Divisione di statistica generale del Ministero dell’Agricoltura
Il primo direttore fu Corrado Gini, noto statistico italiano (in immagine - N.d.R.)
I dati che restituisce subiscono alterazioni o interpretazioni?
No, Direttore. I dati vengono presentati così come sono, senza manipolazioni o interventi generativi. Il sistema aiuta a reperire le informazioni e modella grafici e tabelle secondo le indicazioni dell’utente. Il risultato è sempre confinato all’interno di dati e oggetti che non modificano le relazioni tra le informazioni già presenti nel data warehouse. L’utente può inoltre affinare la ricerca e la modellazione degli oggetti mediante l’utilizzo degli strumenti tradizionali, mantenendo sempre il controllo della piattaforma.
Questo primo progetto avrà un seguito? Se sì, proseguirà contando sulle stesse collaborazioni?
La collaborazione con Deda Next e Microsoft Italia è attiva. L’obiettivo è quello di consolidare il rilascio della piattaforma anche in versione IA a tutti, inclusi privati, istituzioni o organizzazioni nazionali o internazionali.
La Piattaforma consente quindi di accedere a dati riferibili anche ai privati. In questo caso, è ben tutelato il progetto in termini di privacy?
Istat diffonde dati aggregati provenienti da tutte le indagini, sia a carattere economico che sociale. Ad esempio sui risultati delle imprese, sui conti nazionali, sulle abitudini dei cittadini, sui prezzi e sulla Pubblica Amministrazione. Le informazioni sono sempre aggregate e quindi diffondibili nel rispetto di tutti i vincoli di privacy fissati dalle normative nazionali e internazionali. L’Assistente IA rende solo più semplice individuare queste informazioni.
Per concludere, dott. Boselli, quanta energia e quanto tempo dedicati?
Il progetto ha richiesto in tutto circa nove mesi per essere completato, ed un impegno notevole. Uno sforzo particolare è stato profuso nella fase di validazione del sistema di ricerca, che ha coinvolto i settori di produzione e metodologico. La componente legale e di comunicazione legata al progetto è stata a sua volta molto impegnativa, a seguito di aspetti del tutto nuovi da gestire e condividere.
dir. Alessia Lupoi
Redazione redigo.info