Il ruolo del Catalogo Nazionale Dati nell’evoluzione dell’IA

Compatibilità
Salva(0)
Condividi

Dalla qualità dei dati all’innovazione: il ruolo strategico del Catalogo Nazionale Dati nell’evoluzione dell’IA pubblica

Home PA Digitale Governance Dalla qualità dei dati all’innovazione: il ruolo strategico del Catalogo Nazionale Dati nell’evoluzione dell’IA pubblica

L’ultimo ciclo di incontri sul Catalogo Nazionale Dati (CND), organizzato da FPA e Istat, ha confermato il CND come il perno strategico per lo sviluppo di sistemi di Intelligenza Artificiale (IA) affidabili nella Pubblica Amministrazione. Poiché l’efficacia dell’IA dipende interamente dalla qualità del dato (evitando distorsioni e inefficienze), il Catalogo si propone come l’abilitatore di un ciclo virtuoso: attraverso l’interoperabilità, la governance condivisa e il coinvolgimento culturale, garantisce dati migliori che si traducono in servizi pubblici innovativi, trasparenti e più efficaci

27 Novembre 2025

O

Paola Orecchia

Giornalista

Foto di Luis Benito su Unsplash - https://unsplash.com/it/foto/un-gruppo-di-persone-in-piedi-allinterno-di-un-edificio-PO4ATjlp-fg

Il 12 novembre 2025 si è concluso a Roma il ciclo di appuntamenti “digital talk” sul Catalogo Nazionale Dati (CND), evento organizzato da FPA in collaborazione con Istat. L’ultimo dei tre incontri ha posto l’accento sulla funzione strategica del CND per lo sviluppo di sistemi di Intelligenza Artificiale (IA) affidabili nella Pubblica Amministrazione (PA).

I dibattiti precedenti avevano già identificato il nodo cruciale di questa fase amministrativa: la qualità del dato. Il potere trasformativo dell’IA nella PA dipende interamente dalla disponibilità di informazioni inappuntabili. La Pubblica Amministrazione sta lavorando per elevare lo standard qualitativo dei propri dati, ma questo deficit, a cascata, rende l’adozione di soluzioni di IA meno efficace e, in alcuni contesti, potenzialmente rischiosa.

Dopo aver approfondito nei due appuntamenti precedenti i temi dell’interoperabilità e degli standard tecnici, l’incontro finale ha illustrato come il Catalogo Nazionale Dati possa essere la soluzione abilitante per colmare questo divario, agendo come infrastruttura portante per l’accesso a informazioni certificate.

Qualità del dato, la base imprescindibile per l’IA

Nel primo giro del tavolo si è convenuto che l’intelligenza artificiale può rappresentare una opportunità senza precedenti per innovare e migliorare i servizi pubblici, ma a una condizione irrinunciabile: deve basarsi su dati certificati, semanticamente standardizzati e interoperabili. Il concetto si è rivelato il comune denominatore degli interventi dei relatori – esponenti di Istat, Dipartimento per la Trasformazione Digitale, Camera dei deputati e Senato – che hanno condiviso esperienze concrete, sfide operative e visioni strategiche.

Riprendendo i temi discussi nel secondo workshop – interoperabilità e semantica del dato –Massimo Fedeli, direttore del Dipartimento per lo sviluppo di metodi e tecnologie per la produzione e diffusione dell’informazione statistica di Istat, ha evidenziato che il Catalogo Nazionale Dati ha adottato un approccio federato che guida ogni amministrazione a gestire la qualità, semantica e tecnica, dei propri dati in un’ottica di condivisione. Il lavoro che ogni amministrazione compie sui propri dati, dunque, consente di creare dati di qualità utilizzabili non solo internamente, ma anche da chiunque ne abbia la necessità. Per questa ragione, ha fatto notare Fedeli, il CND è lo strumento principe per i progetti di innovazione di ogni ente.

Il Catalogo come hub e certificatore di dati di qualità

Il Catalogo svolge un ruolo fondamentale soprattutto nella dimensione semantica del dato. Non basta infatti che i dati tecnicamente “comunichino” tra sistemi diversi, serve che abbiano significati condivisi e comprensibili. Fedeli ha spiegato che il Catalogo raccoglie asset come ontologie, vocabolari controllati e schemi dati, strumenti indispensabili per dare un contesto univoco agli elementi informativi. Il catalogo, nato nel 2022, quindi, è diventato nel tempo un “certificatore” essenziale della materia prima su cui si nutrono i sistemi AI, ovvero i dati.

Un aspetto cruciale della questione è di mitigare la polisemia, ossia l’ambiguità delle parole e dei concetti, e di considerare esplicitamente la loro evoluzione nel tempo. Come fa notare Fabrizio Davide dirigente di ricerca di Istat, “se diciamo la parola ‘comune’, nel linguaggio corrente può avere diversi significati, ma nel Catalogo questa parola è sempre riferita a una definizione ufficiale e precisa, garantendo uniformità”. Tuttavia, le leggi cambiano e mentre il Catalogo assicura che le definizioni dei dati si aggiornino nel tempo, i modelli IA potrebbero utilizzare informazioni obsolete o inconsistenti se non si alimentassero continuamente dal Catalogo, quale fonte autorevole. Il Catalogo, tuttavia, è costituito da complesse strutture di metadati che vanno tradotte in forme interpretabili dai sistemi di GenAI, che al contrario sono sistemi abili nella gestione del linguaggio.  Fabrizio Davide ha presentato Schema-Assistant, l’IA che assiste la ricerca nel Catalogo, che ha risolto il problema attraverso soluzioni dedicate di embedding in Vector Data Base. È già possibile, quindi, riutilizzare la soluzione Istat per interfacciare la semantica contenuta nel Catalogo e realizzare altri assistenti IA di servizio pubblico, capaci di rispondere correttamente alle domande sull’enorme patrimonio informativo pubblico, riducendo errori e “allucinazioni” tipiche di dati incompleti o mal interpretati,

Soluzioni AI a supporto delle PA: sperimentazioni e buone pratiche

L’importanza della qualità si traduce, come ricorda Fedeli, anche in ricadute pratiche: “Noi di Istat abbiamo sviluppato, ad esempio, una soluzione di intelligenza artificiale che aiuta i cittadini a navigare i dati pubblicati sul portale Istat Data, grazie all’uso di glossari e vocabolari controllati che descrivono in modo coerente i dataset. Questo elemento di qualità semantica si traduce concretamente in servizi più accessibili e trasparenti e illustra come IA e Catalogo si alimentino a vicenda, in un circolo virtuoso”.

Claudia Di Andrea, vicesegretario generale della Camera dei deputati, ha raccontato le esperienze della grande istituzione parlamentare che rappresenta: “Gestiamo un immenso ecosistema informativo storico e attuale basato su un’ontologia proprietaria, che è stato reso pubblico attraverso Open Data nel 2011. Oggi, la sfida è garantire qualità e interoperabilità semantica estesa, anche al di fuori del contesto Camera. La collaborazione con Istat e il Senato per definire un’ontologia unitaria è stata decisiva”.

Giampaolo Araco, direttore organizzazione innovazione del Senato della Repubblica, ha confermato il valore strategico dell’IA applicata ai processi decisionali e di analisi delle politiche: “Abbiamo utilizzato algoritmi di machine learning per valutare politiche su lavoro e violenza di genere in collaborazione con l’Università La Sapienza, per esempio.
Il Catalogo Nazionale Dati è prezioso anche per la ricerca e per la valutazione delle politiche, ma potremmo ampliare lo scopo del Catalogo anche ai dati di interesse pubblico in possesso del settore privato: un esempio è la collaborazione tra la Provincia di Bolzano e BMW, che ha fornito i dati anonimizzati delle centraline delle auto per monitorare lo stato delle strade”. Il dialogo pubblico-privato emerge così come frontiera futura di innovazione condivisa.

Rocco Affinito, referente area piattaforme digitali del Dipartimento per la Trasformazione Digitale, ha illustrato applicazioni sperimentali in diversi enti, tra cui sistemi per profilare i cittadini e suggerire bonus, classificati come sistemi a rischio alto secondo l’AI Act, e strumenti per supportare le stazioni appaltanti.

A questo proposito Fabrizio Davide è ritornato. su Schema-Assistant, in quanto applicazione di Agentic AI, tra le prime nell’Unione Europea dedicate ai problemi dell’interoperabilità semantica tra pubbliche amministrazioni. Questo agente è un ottimo banco di prova per dimostrare come l’apprendimento basato su ontologie e vocabolari sia superiore a quello generico adottato dai servizi commerciali come ChatGPT. In particolare, Davide ha fatto l’esempio del vocabolario ATECO 2025, che è la base per il trattamento delle attività economiche in Italia, sul quale l’agente ha ampliamento dimostrato la sua superiorità, sia nei benchmark che rispondendo a domande di cittadini. Per questi motivi Schema-Assistant farà parte della sperimentazione europea di interoperabilità denominata EU Semantic Registry.

Oltre il fattore tecnologico: cambiamento culturale e formazione per l’IA pubblica

Come affermato da Rocco Affinito, il Catalogo orienta le amministrazioni verso una gestione responsabile e interoperabile del dato, che costituisce la vera base per sviluppare sistemi di intelligenza artificiale di valore. Il percorso è sì tecnico, ma anche culturale. A concordare con Affinito è stata Claudia Di Andrea, che ha evidenziato come l’introduzione dell’IA non sia solo un tema di tecnologia: “È indispensabile un cambiamento culturale nelle PA, passando da una gestione autoreferenziale a una modalità altruistica dei dati, investendo sulle persone con progetti di formazione e introduzione di nuove competenze, ma anche ripensando i processi e la stessa organizzazione del lavoro”.

Giampaolo Araco ha approfondito l’argomento introducendo il valore della consapevolezza e del coinvolgimento diffuso: “La formazione non è solo addestramento, ma fattore abilitante del cambiamento organizzativo, indispensabile per introdurre innovazioni in ambienti regolamentati e tradizionali come il Parlamento. Noi abbiamo individuato una funzione di staff che ha la responsabilità dell’introduzione degli strumenti di IA nell’organizzazione, proprio perché questa introduzione possa essere accompagnata, se necessario, da un intervento sugli assetti organizzativi”.

Prospettive future: un ecosistema federato europeo e un circolo virtuoso di dati-per l’AI

Fabrizio Davide ha concluso il dibattito ricordando che: “Il nostro Catalogo dovrà crescere e includere dei domini pubblici che non sono ancora coperti. Infatti, secondo una stima europea, le 300 risorse che abbiamo attualmente rappresentano meno del 16% dei domini di interesse dell’amministrazione pubblica.Tuttavia, la sostenibilità e la rapidità di crescita sono una sfida. L’elemento catalizzatore potrebbe essere costituito da agenti IA federati, anche a livello europeo, che traducano formati, lingue e semantiche, facilitando l’integrazione e il riuso delle risorse. Questo approccio aiuterebbe a superare anche le frammentazioni tecnologiche dei vari paesi”.

Ha inoltre ricordato l’importanza di etica e governance, ispirandosi a ricerche innovative sulla costruzione di modelli AI responsabili fin dalla loro origine. Ciò è fondamentale, sottolinea Davide, per superare i limiti degli attuali sistemi di IA sviluppati dalle big corporation estere.

A tirare le somme e dare uno spunto pratico alle PA presenti è stato Massimo Fedeli: “Il dato di qualità è la base per l’intelligenza artificiale. La capacità di governare il dato in modo condiviso sarà la chiave per costruire servizi pubblici più efficienti e trasparenti, capaci di rispondere alle nuove esigenze di una società digitale in rapida evoluzione. Suggerisco un mantra: diamoci un metodo! Il primo passaggio da compiere è guardare al vostro interno. Quindi datevi un metodo, mappate, standardizzate e poi condividete dati, infrastrutture e applicazioni”.

Recapiti
di Paola Orecchia