Publications Office of the EU
Riigihankemenetluse vaade : Selgitav teatis - Väljaannete Talitus
DisplayCustomHeader
Dockbar
CPV RIKASTAMINE JÄRELDUSMOOTORI ABIL

Riigihankemenetluse vaade

Selgitav teatis

SÕNASTIK

Mõiste Määratlus
Tehisintellekt Tehisintellekt on tehnoloogia, mis võimaldab arvutitel ja masinatel simuleerida või jäljendada inimintellekti ja probleemide lahendamise oskust.
Klassifitseerimismudel Klassifitseerimismudel on masinõppemudel, mis liigitab või klassifitseerib andmed eelnevalt kindlaks määratud klasside või märgiste alla. See võtab sisendandmed ja prognoosib, millisesse kategooriasse või klassi andmed kuuluvad.
CPV (ühtne riigihangete klassifikaator) CPV (ühtne riigihangete klassifikaator) (1) on kõikjal Euroopa Liidus riigihangetes kasutatavate klassifitseerimiskoodide struktureeritud süsteem. See aitab liigitada ja kirjeldada asjade, teenuste ja ehitustööde hankelepingute eset. CPV klassifitseerimissüsteem on loodud selleks, et hõlbustada hanketeadete avaldamist ja võrdlemist ning lihtsustada tarnijate ja hankijate jaoks asjakohaste hankevõimaluste leidmist.
eTranslation (2) eTranslation on neuromasintõlke teenus, mida pakub Euroopa Komisjon.
Masinõpe Masinõpe on tehisintellekti liik, mis võimaldab tarkvararakendustel „õppida“ varasemast praktikast ja tagasisidest ning muuta seeläbi tulemuste prognoosimise täpsemaks, ilma et rakendusi oleks selle jaoks otseselt programmeeritud.
Mudeljäreldus Mudeljäreldus on etapp, kus uute andmete kohta prognooside tegemiseks kasutatakse treenitud masinõppemudelit.
Mudeli treenimine Mudeli treenimine on masinõppemudeli väljatöötamise kriitilise tähtsusega etapp, kus mudel õpib tegema andmetel põhinevaid prognoose.
Loomuliku keele töötlus (NLP) Loomuliku keele töötlus on tehisintellekti valdkond, mis võimaldab arvutitel analüüsida ja mõista kirjalikku ja suulist inimkeelt.
Riigihankemenetluse vaade Riigihankemenetluse vaade koondab teavet kõigist TEDi teadetest, mis kuuluvad samasse menetlusse (seotud teated), ning esitab selle ühtses, lihtsustatud ja kasutajasõbralikus vormis. Riigihankemenetluse vaade on TEDi teadetes kättesaadav uus hankeandmete esitamise viis.
scikit-learn scikit-learn on Pythoni programmeerimiskeele avatud lähtekoodiga masinõppekogu. See pakub mitmesuguseid masinõppe algoritme, sealhulgas algoritme klassifitseerimismudelite loomiseks.
TED TED (Tenders Electronic Daily) on Euroopa Liidu Väljaannete Talituse hallatav veebisait (https://ted.europa.eu), kus avaldatakse Euroopa Liidu Teataja S-seeria (Euroopa Liidu Teataja kaasanne, ELT S). TEDi kasutamine on tasuta.

 

Kõik riigihanked, mis ületavad teatavat lepingu maksumust, tuleb avaldada ELT S-seerias.

(1) https://op.europa.eu/en/web/eu-vocabularies/dataset/-/resource?uri=http://publications.europa.eu/resource/dataset/cpv

(2) https://language-tools.ec.europa.eu/

1. Riigihankemenetluse vaade

Riigihankemenetluse vaade väljaannete talituse portaalis koondab teavet kõigist TEDi teadetest, mis kuuluvad samasse menetlusse (seotud teated), ning esitab selle ühtses ja kasutajasõbralikus vormis. Riigihankemenetluse vaade on TEDi teadetes (3) kättesaadav uus hankeandmete esitamise viis.

See lihtsustatud vaade peaks olema kasutajatele ilma hankealaste eriteadmisteta kergesti arusaadav ja navigeeritav, mis muudab selle kättesaadavaks laiemale publikule.

(3) https://ted.europa.eu/et/

Joonis 1. Riigihankemenetluste kokkuvõte.

Riigihankemenetluse vaate leht annab visuaalse ülevaate menetluse staatusest ja ajakavast ning geograafilise ülevaate lepingu täitmise kohtadest. Menetluse üksikasjad sisaldavad nii üldise menetluse kui ka iga üksiku osa põhitunnuseid. Lisaks on olemas otselingid kõigile seotud TEDi teadetele. See tagab lihtsa juurdepääsu peamisele teabeallikale, mida kasutati riigihankemenetluse vaate koostamiseks.

2. Mis on CPV rikastamine?

CPV rikastamine on funktsioon, mille eesmärk on parandada riigihankemenetluste leitavust, et täiustada väljaannete talituse portaali kasutajakogemust otsingutulemuste kvaliteedi parandamise abil. Selleks kombineeritakse süsteemis mitut tehisintellekti tehnikat, nagu loomuliku keele töötlus ja masinõpe, et tuletada kõigi avaldatud menetluste jaoks nende sisu põhjal uued CPV koodid.

Süsteemi poolt tuletatud uued CPV koodid asuvad menetluse üksikasjade lehel algsete CPV koodide lähedal. Lehel eristatakse selgelt menetluse algseid ja tuletatud CPVsid ning kasutajat teavitatakse sellest, et viimane on loodud tehisintellekti abil. Lisaks on tuletatud CPV koodid integreeritud otsingufassettidesse, mis parandab kasutaja otsingukogemust, võimaldades filtreerida menetlusi täiustatud koodide põhjal.

Näiteks menetlusel pealkirjaga „Luksemburg-Luxembourg: Kaubiku ja väikekaubikuga veoteenused koos vedude jaoks alaliselt töötava autojuhiga“ ja kirjeldusega „Kaubiku ja väikekaubikuga veoteenused koos vedude jaoks alaliselt töötava autojuhiga“, on TEDi teadete CPV originaal „60100000 – Maanteetransporditeenused“ ning treenitud mudeli põhjal tuletas rikastamismootor täiendava ja konkreetsema: „60170000 – Juhiga sõidukite rentimine reisijateveoks“.

 

 

3. Kuidas CPV rikastamine toimib?

CPV rikastamise süsteem põhineb klassifitseerimismudelil, mis on treenitud scikit-learni masinõppekogu abil. Mudeli sisendiks on menetluse tekstiline sisu ja väljundiks kõigi toetatud CPV koodide usaldusskoor. Konkreetse menetluse puhul läbitakse prognoositud CPV koodide saamiseks järgmised etapid:

  • Ekstraheerimine: menetlusest ektraheeritakse asjakohane sisu, näiteks menetluste pealkirjad ja kirjeldus, mis aitavad tuletada CPV koode.
  • Tõlge: kui menetluse sisu ei ole inglise keeles kättesaadav, tõlgitakse see eTranslationi teenuse abil inglise keelde.
  • Eeltöötlus: ektraheeritud sisu võib hõlmata ebaolulisi osi, nagu sümbolid, artiklid, sidesõnad jne. See info ei aita CPV koode prognoosida ja võib mõjutada järelduste kvaliteeti, nii et see eemaldatakse menetluse sisust.
  • Klassifitseerimine: ekstraheeritud sisu edastatakse klassifitseerimismudelile, et prognoosida usaldusskoor eelnevalt kindlaks määratud klasside iga CPV koodi kohta.
  • Filtreerimine: selleks et määrata kindlaks, millised CPV koodid tuleks menetluse jaoks säilitada, võrreldakse saadud usaldusskoore mudeli treenimise käigus kindlaks määratud künnisväärtusega. Kui CPV koodi usaldusskoor on künnisväärtusest suurem, peetakse koodi menetluse puhul oluliseks. Näiteks kui mudeli kohaselt on CPV koodi 85000000 usaldusskoor 0,7 ja künnis on 0,6, peab süsteem tuletatud CPV koodi menetlusega seotuks.

Selleks et mudel õpiks CPV koode tuletama, on seda treenitud kõigi portaalis avaldatud menetluste abil. Mudeli mitut konfiguratsiooni koolitatakse 80 % andmete põhjal ja seejärel neid hinnatakse, et jätta alles parima prognoosikvaliteediga mudel. Ülejäänud 20 % andmetest kasutatakse selleks, et testida mudeli kvaliteeti andmetega, mida treenimisel ei kasutatud. Kõik tuletatud CPV koodid, mille usaldusskoor jääb allapoole määratud künnist, on blokeeritud, et vältida nende koodide ebaõiget prognoosimist või kasutamist süsteemis; Siiski võib CPV koodide tuletamisel esineda vigu või väljajätmisi.

Klassifitseerimismudelit treenitakse ja häälestatakse käsitsi ning parima prognoosikvaliteediga mudelit kasutatakse uute töödeldud hankemenetluste täiendavate CPVde automaatseks tuletamiseks.

4. Milliseid andmeid CPV rikastamiseks kasutatakse?

Et õppida CPV koode tuletama, kasutab CPV rikastamise süsteem väljaannete talituse portaalis avalikult kättesaadavaid menetlusi. Praegust süsteemi on treenitud 2,5 miljoni menetluse abil, mis on avaldatud alates 2011. aastast kuni praeguseni.

Kõigist menetlustest, mida süsteem kasutab järeldusmudeli treenimiseks, võetakse järgmised andmed.

  • Menetluse nimi.
  • Menetluse lühikirjeldus.
  • Osade nimed (kui menetlus sisaldab osi).
  • Osade lühikirjeldus (kui menetlus sisaldab osi).
  • Menetlusega juba seotud peamised ja täiendavad CPV koodid.
  • Osade peamised ja täiendavad CPV koodid (kui menetlus sisaldab osi).

See teave avaldatakse kõigi ELi poliitikavaldkondade ja õigusaktide suhtes kohaldatava läbipaistvuse põhimõtte alusel. CPV rikastamise süsteemi treenimiseks ja täiustamiseks ei kasutata isikuandmeid.

5. Piirangud praegusel ajahetkel

  • Süsteem võib tuletada CPV koode kuni 5 numbrini (osad, rühmad, klassid ja kategooriad). See ei toeta madalamaid tasemeid.
  • Süsteem toetab ainult CPV koode, mille puhul on valideeritud järelduse hea kvaliteet ja mis moodustavad 61 % võimalikest kuni viiekohalistest CPV koodidest.
  • Süsteem toetab järelduste tegemist alates 2011. aastast kuni tänaseni avaldatud menetluste kohta.

6. Vastutuse välistamine – vastutuse aspektid

Väljaannete talituse portaal sisaldab tehisintellekti või muu automatiseeritud tehnoloogia abil loodud sisu. Selline sisu esitatakse üksnes teavitamise eesmärgil ja sellele ei tohiks tugineda ühelgi konkreetsel eesmärgil, ilma et oleks kontrollitud selle täpsust ja täielikkust.

Riigihankemenetluse vaates kombineeritakse mitut tehisintellektitehnikat, et koguda andmeid ja parandada TEDis avaldatud asjakohaste pakkumiskutsete teadete leitavust, mis hõlbustab otsingumeetodite kasutamist.

CPV rikastamise funktsioon ja sellest tulenev tehisintellekti loodud väljund, st tuletatud CPV koodid, on täielikult automatiseeritud. Mõnel juhul võib süsteemi või andmete keerukuse tõttu vigu esineda. Riigihankemenetluse vaates kasutatakse üksnes TEDis (Tenders Electronic Daily, https://ted.europa.eu) avaldatud ELT S andmeid.

Siiski on ainus pakkumiskutsete ja vastavate teadetega seotud ametlik teave avaldatud Euroopa Liidu Teataja kaasandes (ELT S). Kuigi võetakse kõik vajalikud meetmed, et tagada tehisintellekti abil loodud sisu võimalikult kõrge kvaliteet, ei ole selle täpsust võimalik garanteerida.

Seetõttu välistatakse käesolevaga Euroopa Liidu Väljaannete Talituse ja ELi institutsioonide vastutus tehisintellektimeetodite rakendamisest tulenevate vigade või väljajätmiste eest. Vastutust ei võeta ka sellisele tehisintellekti loodud sisule tuginemise tagajärgede eest. Kasutajatel soovitatakse kasutada sellist sisu ettevaatlikult.