Vyn över upphandlingsförfaranden
Meddelande om förklarbarhet
Innehåll
ORDLISTA
Begrepp | Definition |
---|---|
Artificiell intelligens (AI) | Artificiell intelligens (AI) är en teknik där datorer och maskiner simulerar eller imiterar människans intelligens och förmåga till problemlösning. |
Klassificeringsmodell | En klassificeringsmodell är en typ av maskinlärningsmodell som kategoriserar eller klassificerar data i fördefinierade klasser eller etiketter. Den tar inputdata och förutsäger i vilken kategori eller klass datan ingår. |
CPV (gemensam terminologi för offentlig upphandling) | CPV (gemensam terminologi för offentlig upphandling) (1) är ett strukturerat system med klassificeringskoder som används för offentlig upphandling i EU. Terminologin hjälper till att kategorisera och beskriva vilka varor, tjänster och arbeten som ska upphandlas. CPV-systemet gör det lättare att publicera och jämföra upphandlingsmeddelanden och leverantörer och upphandlande myndigheter kan lättare hitta rätt upphandlingsmöjligheter. |
eTranslation (2) | eTranslation är EU-kommissionens avancerade verktyg för neural maskinöversättning. |
Maskininlärning | Maskininlärning är en typ av artificiell intelligens (AI) som gör att program kan ”lära sig” från tidigare användning och återkoppling. De blir därmed bättre på att mer exakt förutspå utfall utan att uttryckligen programmeras för det ändamålet. |
Modellinferens | Modellinferens är en fas där en tränad maskininlärningsmodell används för att göra prediktioner om ny data. |
Modellträning | Modellträning är en kritisk fas i utveckligen av en maskininlärningsmodell där modellen lär sig att göra prediktioner utifrån data. |
Bearbetning av naturligt språk | Bearbetning av naturligt språk är ett AI-område som gör att datorer kan analysera och förstå mänskligt språk, både skrivet och talat. |
Vyn över upphandlingsförfaranden | En ”vy över upphandlingsförfaranden” aggregerar information från alla TED-meddelanden som hör till samma förfarande (relaterade meddelanden) och presenterar dem i ett enda, användarvänligt perspektiv. Det är ett nytt sätt att presentera de upphandlingsdata som finns i TED-meddelandena. |
scikit-learn | scikit-learn är ett bibliotek för maskinlärning med öppen källkod för programmeringsspråket Python. Det innehåller olika maskininlärningsalgoritmer, bland annat algoritmer för att bygga klassificeringsmodeller. |
TED | TED – förkortning av Tender Electronic Daily – är en webbplats (https://ted.europa.eu) som drivs av EU:s publikationsbyrå. I TED publiceras tillägget till Europeiska unionens officiella tidning (EUT S). Det är gratis att använda TED.
Alla offentliga upphandlingar som gäller avtal som överstiger vissa tröskelvärden måste publiceras i EUT S. |
(2) https://language-tools.ec.europa.eu/
1. Vyn över upphandlingsförfaranden
Vyn över upphandlingsförfaranden, som finns i Publikationsbyråns portal, aggregerar information från alla TED-meddelanden som hör till samma förfarande (relaterade meddelanden) och sammanställer dem i en tydlig och överskådlig vy. Den är ett nytt sätt att presentera de upphandlingsdata som finns i TED-meddelandena (3).
Tack vare den förenklade vyn kan även användare utan specialkunskaper om upphandling enkelt hitta och förstå informationen.
Figur 1 – Aggregering av förfarandet för offentlig upphandling.
Sidan med vyn över upphandlingsförfaranden visar förfarandets status och tidslinje, tillsammans med en geografisk representation av leveransplatserna. Uppgifterna om förfarandet omfattar viktiga attribut för både det totala förfarandet och varje enskilt delkontrakt. Dessutom finns det direktlänkar till alla relaterade TED-meddelanden, vilket ger enkel tillgång till den primära informationskälla som använts för att sammanställa vyn över upphandlingsförfaranden.
2. Vad är CPV-berikning?
CPV-berikning är en funktion som ska göra det enklare att hitta offentliga upphandlingar och förbättrar sökträffarna. I systemet kombineras flera olika AI-tekniker, till exempel bearbetning av naturligt språk och maskininlärning, för att föreslå nya CPV-koder genom inferens för alla publicerade förfaranden, baserat på deras innehåll.
De nya CPV-koder som systemet generar visas intill de ursprungliga CPV-koderna på förfarandets egen sida. På sidan görs tydlig skillnad mellan förfarandets ursprungliga CPV-koderna och inferenskoderna, så att användarna förstår att de senare är genererade med hjälp av AI. Dessutom är inferenskoderna integrerade i sökfiltren så att användarna kan söka förfaranden på basis av dessa koder.
Om vi till exempel tittar på ett förfarande med titeln ”Luxemburg-Luxemburg: Transporttjänster med buss och minibuss med förare” med beskrivningen ”Transporttjänster med buss och minibuss med förare” är den ursprungliga CPV-koden i TED-meddelandet ”60100000 – Vägtransporter”. På basis av den tränade modellen föreslog inferensmotorn en mer precis kod: ”60170000 – Uthyrning av fordon med förare för passagerartransport”.
3. Hur fungerar CPV-berikning?
Systemet för CPV-berikning bygger på en klassificeringsmodell som tränats med scikit-learns bibliotek. Modellen använder förfarandes textinnehåll som input och ger en konfidenspoäng för alla CPV-koder som stöds. För ett visst förfarande utförs följande steg för att få de CPV-koder som förutsägs:
- Extrahering: relevant innehåll som titeln och beskrivningen av förfarandet och som hjälper till att föreslå CPV-koderna extraheras från förfarandet.
- Översättning: om ett meddelande inte finns på engelska översätts innehållet med hjälp av eTranslation.
- Förbehandling: det extraherade innehållet kan innehålla irrelevanta delar som symboler, artiklar och konjunktioner. Den informationen rensas bort eftersom den inte hjälper till att generera koder och kan inverka på inferensens kvalitet.
- Klassificering: det extraherade innehållet skickas till klassificeringsmodellen för att förutsäga en konfidenspoäng för varje CPV-kod i fördefinierade klasser.
- Filtrering: för att avgöra vilka CPV-koder som ska finnas med jämförs konfidenspoängen med ett tröskelvärde som bestäms i samband med att modellen tränas. Om konfidenspoängen för en CPV-kod är högre än tröskelvärdet anses koden vara relevant för förfarandet. Om modellen till exempel förutsäger en konfidenspoäng på 0,7 för CPV-koden 85000000 och tröskelvärdet är 0,6 så anser systemet att koden är relaterad till förfarandet.
För att modellen ska kunna föreslå CPV-koder har den tränats på alla förfaranden som har publicerats i portalen. Flera olika konfigureringar av modellen hat tränats på 80 procent av datan och utvärderats för att välja ut den som har bäst prediktionskvalitet. Återstående 20 procent av datan används för att testa modellen på data som inte använts under träningen. Alla genererade CPV-koder med en konfidenspoäng under tröskelvärdet avaktiveras så att de inte genereras felaktigt eller används av systemet. Det kan dock fortfarande förekomma inferensfel eller utelämnanden.
Klassificeringsmodellen tränas och förfinas manuellt och den modell som har bäst prediktionskvalitet används för att automatiskt generera ytterligare CPV-koder på nyligen behandlade upphandlingsförfaranden.
4. Vilka data används för CPV-berikning?
Systemet för CPV-berikning använder de förfaranden som är publicerade i Publikationsbyråns portal så att det kan lära sig att genera CPV-koder genom inferens. Det nuvarande systemet har tränats på 2,5 miljoner förfaranden från 2011 och fram till i dag.
Följande information har extraherats från alla de förfaranden som systemet har använt för att träna inferensmodellen:
- Förfarandets titel.
- Kort beskrivning av förfarandet.
- Titel på delkontrakten (om förfarandet har delar).
- Kort beskrivning av delkontrakten (om förfarandet har delar).
- Huvudsakliga och ytterligare CPV-koder som redan ingår i förfarandet.
- Huvudsakliga och ytterligare CPV-koder för delkontrakten (om förfarandet har delar).
Denna information publiceras enligt den princip om insyn som gäller för all EU:s politik och lagstiftning. Inga personuppgifter används för att träna och förbättra systemet för CPV-berikning.
5. Begränsningar just nu
- Systemet kan generera CPV-koder med upp till fem siffror (huvudgrupper, grupper, undergrupper och kategorier). Det stöder inte lägre nivåer.
- Systemet stöder bara CPV-koder för vilka inferenskvaliteten har validerats. Det motsvarar 61 procent av möjliga CPV-koder med upp till fem siffror.
- Systemet stöder bara inferens för förfaranden från och med 2011.
6. Ansvarsfriskrivning
Publikationsbyråns portal innehåller AI-genererat innehåll eller innehåll som skapats av annan automatiserad teknik. Sådant innehåll läggs ut enbart i informationssyfte och bör inte användas i något annat syfte utan att man kontrollerar att innehållet är korrekt och fullständigt.
Vyn över upphandlingsförfaranden kombinerar flera olika AI-tekniker för att göra det enklare att hitta relevanta upphandlingsmeddelanden och för att underlätta och förbättra sökmetoderna.
Funktionen för CPV-berikning och det AI-genererade resultatet, dvs. CPV-koder som skapats genom inferens, är helt automatiserad. Det kan i vissa fall inträffa fel på grund av datans och systemets komplexitet. Vyn över upphandlingsförfaranden använder enbart data från EUT S som publicerats i TED, Tenders Electronic Daily (https://ted.europa.eu).
Den enda officiella informationen om upphandlingar och tillhörande meddelanden är den som publiceras i tillägget till Europeiska unionens officiella tidning (EUT S). Trots att alla nödvändiga åtgärder har vidtagits för att säkerställa att det innehåll som produceras med AI-teknik är av högsta möjliga kvalitet kan dess riktighet inte garanteras.
Därför frånsäger sig Publikationsbyrån och EU-institutionerna allt ansvar för fel eller utelämnanden i den output som är resultatet av att AI-teknik har använts. Inget ansvar tas för konsekvenser till följd av sådant AI-genererat innehåll. Användarna rekommenderas att använda innehållet med försiktighet och iaktta tillbörlig aktsamhet.