Publications Office of the EU
Appalti pubblici - visualizzazione delle procedure di appalto : Informativa sulla spiegabilità - A proposito dell’Ufficio delle pubblicazioni
DisplayCustomHeader
Dockbar
ARRICCHIMENTO DEL VOCABOLARIO COMUNE PER GLI APPALTI PUBBLICI (CPV) TRAMITE L'USO DI UN MOTORE INFERENZIALE

Appalti pubblici - visualizzazione delle procedure di appalto

Informativa sulla spiegabilità

GLOSSARIO

Termine Definizione
Intelligenza artificiale (IA) L'intelligenza artificiale (IA) è una tecnologia che consente ai computer e alle macchine di simulare o di imitare l'intelligenza umana e le capacità di risoluzione dei problemi.
Modello di classificazione Un modello di classificazione è un tipo di modello di apprendimento automatico che classifica i dati in categorie o classi predefinite. Prende i dati di input e prevede a quale categoria o classe appartengono.
CPV (vocabolario comune per gli appalti pubblici) Il CPV (vocabolario comune per gli appalti pubblici) (1) è un sistema strutturato di codici di classificazione utilizzato in tutta l'Unione europea per gli appalti pubblici. Contribuisce a classificare e descrivere l'oggetto degli appalti di forniture, servizi e opere ai fini della gara. Il sistema di classificazione CPV è concepito per facilitare la pubblicazione e il confronto dei bandi o avvisi di gara, consentendo ai fornitori e alle amministrazioni appaltanti di trovare più facilmente le opportunità di appalto.
eTranslation (2) eTranslation è un servizio di traduzione automatica neurale fornito dalla Commissione europea.
Apprendimento automatico (ML) L'apprendimento automatico (ML) è un tipo di intelligenza artificiale (IA) che consente alle applicazioni software di "imparare" dalle pratiche e dai riscontri passati, diventando così più precise nel prevedere i risultati, pur senza essere esplicitamente programmate a tal fine.
Inferenza del modello L'inferenza del modello è la fase in cui un modello addestrato di apprendimento automatico viene utilizzato per formulare previsioni su nuovi dati.
Addestramento del modello L'addestramento del modello è una fase fondamentale dello sviluppo di un modello di apprendimento automatico in cui il modello impara a formulare previsioni basate sui dati.
Elaborazione del linguaggio naturale (NLP) L'elaborazione del linguaggio naturale (NLP) è un settore dell'intelligenza artificiale (IA) che consente ai computer di analizzare e comprendere il linguaggio umano, sia scritto che parlato.
Visualizzazione delle procedure di appalto pubblico Una "visualizzazione delle procedure di appalto pubblico" aggrega le informazioni provenienti da tutti gli avvisi TED appartenenti alla stessa procedura (avvisi correlati) e le presenta in una visione unica, semplificata e di facile utilizzo. Si tratta di un nuovo modo per presentare i dati sugli appalti pubblici disponibili negli avvisi TED.
scikit-learn scikit-learn è una libreria open source di apprendimento automatico per il linguaggio di programmazione Python. Fornisce vari algoritmi di apprendimento automatico, compresi quelli per costruire modelli di classificazione.
TED TED-tender electronic daily è il sito web (https://ted.europa.eu) gestito dall'Ufficio delle pubblicazioni dell'Unione europea in cui viene pubblicata la Gazzetta ufficiale S (supplemento della Gazzetta ufficiale dell'Unione europea o GU S). L'accesso a TED è gratuito.

 

Tutte le gare d'appalto che superano un determinato valore contrattuale devono essere pubblicate nella GU S.

(1) https://op.europa.eu/it/web/eu-vocabularies/dataset/-/resource?uri=http://publications.europa.eu/resource/dataset/cpv

(2) https://language-tools.ec.europa.eu/

1. Visualizzazione delle procedure di appalto pubblico

La visualizzazione delle procedure di appalto pubblico, disponibile sul portale OP, aggrega le informazioni provenienti da tutti gli avvisi TED appartenenti alla stessa procedura (avvisi correlati) e le presenta in una visione unica e di facile utilizzo. Si tratta di un nuovo modo per presentare i dati sugli appalti pubblici disponibili negli avvisi TED (3).

La visione semplificata è concepita per essere facilmente compresa e consultabile da utenti privi di conoscenze specialistiche in materia di appalti, rendendola accessibile a un pubblico più vasto.

(3) https://ted.europa.eu/it/

Figura 1 - Procedura di appalto pubblico: aggregazione dei dati.

La pagina di visualizzazione contiene una rappresentazione grafica dello stato e dei tempi della procedura di appalto, unitamente a una rappresentazione geografica dei luoghi di esecuzione. I dettagli della procedura comprendono gli attributi chiave sia per l'intera procedura che per ogni singolo lotto. Inoltre, la visualizzazione fornisce link diretti a tutti gli avvisi TED correlati, garantendo un facile accesso alla fonte primaria di informazioni utilizzata per aggregare i dati per la visualizzazione della procedura di appalto.

2. Cos'è l'arricchimento del CPV?

L'arricchimento del CPV è una funzionalità che punta ad accrescere la reperibilità delle procedure di appalto pubblico, in modo da migliorare l'esperienza degli utenti del portale OP e la qualità dei risultati delle ricerche. A tal fine, il sistema combina diverse tecniche di intelligenza artificiale (IA), quali l'elaborazione del linguaggio naturale (NLP) e l'apprendimento automatico (ML), al fine di ricavare nuovi codici CPV per tutte le procedure pubblicate, sulla base del loro contenuto.

I nuovi codici CPV ricavati dal sistema appaiono accanto ai codici CPV originali sulla pagina relativa ai dettagli della procedura. La pagina opera una chiara distinzione tra i CPV originali della procedura e quelli inferiti, in modo da segnalare all'utente che questi ultimi sono stati generati con l'ausilio dell'IA. Inoltre, i codici CPV inferiti sono integrati nei facet della ricerca per renderla più agevole, consentendo agli utenti di filtrare la procedura con codici rafforzati.

Ad esempio, se consideriamo la procedura dal titolo "Lussemburgo - Lussemburgo: servizi di trasporto mediante furgone e mini-furgone con autista dedicato" e con la descrizione "Servizi di trasporto mediante furgone e mini-furgone con autista dedicato", il CPV originale dell'avviso TED è "60100000 - Servizi di trasporto su strada", mentre sulla base del modello addestrato, il motore di arricchimento ne ha ricavato un ulteriore, più specifico: "60170000 - Noleggio di veicoli adibiti al trasporto di persone con conducente".

 

 

3. Come funziona l'arricchimento del CPV?

Il sistema di arricchimento del CPV si basa su un modello di classificazione addestrato con la libreria scikit-learn. Il modello prende come input il contenuto testuale di una procedura e produce il punteggio di attendibilità di tutti i codici CPV supportati. Per una determinata procedura vengono seguite le seguenti fasi per ottenere i codici CPV previsti:

  • estrazione: vengono estratti dalla procedura i contenuti pertinenti, come il titolo e la descrizione, che aiutano a ricavare i codici CPV
  • traduzione: se il testo dell'avviso non è disponibile in inglese, il contenuto della procedura viene tradotto in questa lingua utilizzando il servizio eTranslation
  • pretrattamento: il contenuto estratto può contenere parti irrilevanti, come simboli, articoli, congiunzioni, ecc. Queste informazioni non aiutano a prevedere i codici CPV e possono influire negativamente sulla qualità dell'inferenza, per cui vengono rimosse dal contenuto della procedura
  • classificazione: il contenuto estratto viene passato al modello di classificazione per prevedere un punteggio di attendibilità per ciascun codice CPV di classi predefinite
  • filtraggio: per determinare quali codici CPV conservare per la procedura, i punteggi di attendibilità ottenuti vengono confrontati con un valore soglia determinato durante l'addestramento del modello. Se il punteggio di attendibilità di un codice CPV è superiore alla soglia, il codice è considerato pertinente alla procedura. Ad esempio, se il modello prevede un punteggio di attendibilità di 0,7 per il codice CPV 85000000 e la soglia è 0,6, il sistema considera il codice CPV inferito correlato alla procedura.

Per imparare a inferire i codici CPV, il modello è stato addestrato tenendo conto dell'intera serie di procedure pubblicate sul portale. Diverse configurazioni del modello vengono addestrate sull'80% dei dati e valutate per scegliere quello con la migliore qualità di previsione. Il restante 20% dei dati è utilizzato per testare la qualità del modello su dati non utilizzati durante l'addestramento. Tutti i codici CPV inferiti con un punteggio di attendibilità inferiore alla soglia configurata vengono disattivati per evitare che siano previsti o utilizzati in modo errato dal sistema; errori od omissioni di inferenza del CPV possono comunque verificarsi.

Il modello di classificazione viene addestrato e perfezionato manualmente e quello con la migliore qualità di previsione è utilizzato per inferire automaticamente ulteriori CPV da nuove procedure di appalto.

4. Quali dati vengono utilizzati per l'arricchimento del CPV?

Il sistema di arricchimento del CPV utilizza le procedure pubblicamente disponibili sul portale OP per imparare a inferire i codici CPV. Il sistema attuale è stato addestrato su 2,5 milioni di procedure pubblicate dal 2011 ad oggi.

Da tutte le procedure utilizzate dal sistema per addestrare il modello di inferenza vengono estratte le seguenti informazioni:

  • denominazione della procedura
  • breve descrizione della procedura
  • denominazione dei lotti (se la procedura ne contiene)
  • breve descrizione dei lotti (se la procedura ne contiene)
  • i codici CPV principali e supplementari già inclusi nella procedura
  • i codici CPV principali e supplementari dei lotti (se la procedura ne contiene).

Tali informazioni vengono pubblicate in base al principio di trasparenza applicabile a tutte le politiche e normative dell'UE. Per addestrare e perfezionare il sistema di arricchimento del CPV non vengono utilizzati dati personali.

5. Limiti nella fase attuale

  • Il sistema può inferire codici CPV fino a 5 cifre (divisioni, gruppi, classi e categorie). Non supporta livelli più bassi.
  • Il sistema supporta soltanto codici CPV la cui qualità di inferenza sia stata convalidata; questi corrispondono al 61% dei possibili codici CPV fino a 5 cifre.
  • Il sistema consente di operare soltanto sulle procedure pubblicate dal 2011 ad oggi.

6. Clausola di esclusione della responsabilità

Si segnala che il portale OP presenta contenuti creati dall'IA o da altre tecnologie automatizzate. Tali contenuti sono forniti esclusivamente a titolo informativo e non vanno utilizzati per finalità specifiche senza verificarne l'esattezza o la completezza.

La visualizzazione delle procedure di appalto pubblico combina diverse tecniche di IA per raccogliere dati al fine di migliorare la reperibilità dei bandi o avvisi di gara pubblicati su TED in modo da facilitare e assistere i metodi di ricerca.

La funzionalità di arricchimento del CPV e il risultante output generato dall'IA, vale a dire i codici CPV inferiti, sono del tutto automatizzati. In alcuni casi possono verificarsi errori a causa della complessità del sistema o dei dati. La visualizzazione delle procedure di appalto pubblico utilizza esclusivamente i dati disponibili nella GU S pubblicata su TED, Tenders Electronic Daily (https://ted.europa.eu).

Ciononostante, le uniche informazioni ufficiali relative alle gare d'appalto e agli avvisi o bandi corrispondenti sono quelle pubblicate nel supplemento della Gazzetta ufficiale dell'Unione europea (GU S). Sebbene siano state adottate tutte le misure necessarie per garantire che i contenuti prodotti dalla tecnologia di IA siano della massima qualità possibile, la loro esattezza non può, tuttavia, essere garantita.

È pertanto esclusa qualsiasi responsabilità dell'Ufficio delle pubblicazioni e delle istituzioni dell'UE per eventuali errori od omissioni nei risultati derivanti dall'applicazione di tecniche di IA. Non può essere assunta alcuna responsabilità per le conseguenze dovute all'uso di tali contenuti generati dall'IA. Si consiglia agli utenti di utilizzarli con cautela e si raccomanda di farlo con la massima diligenza.