Publications Office of the EU
Prikaz postupka javne nabave : Objašnjenje o korištenju UI-ja - O Uredu za publikacije
DisplayCustomHeader
Dockbar
OBOGAĆIVANJE CPV-ima NA TEMELJU INFERENCIJE

Prikaz postupka javne nabave

Obavijest s objašnjenjem

POJMOVNIK

Pojam Definicija
Umjetna inteligencija (UI) Umjetna inteligencija je tehnologija koja omogućuje računalima i strojevima da simuliraju ili ljudsku inteligenciju i ljudsko rješavanje problema.
Klasifikacijski model Klasifikacijski model je tip modela strojnog učenja u kojem se podaci kategoriziraju ili razvrstavaju pod unaprijed definirane razrede ili oznake. U model se unose ulazni podaci, a dobiva se njihova predviđena kategorija ili razred.
CPV (Jedinstveni rječnik javne nabave) CPV (Jedinstveni rječnik javne nabave) (1) je strukturirani sustav klasifikacijskih oznaka koji se koristi u javnoj nabavi u cijeloj Europskoj uniji. Služi za kategorizaciju i opisivanje predmeta ugovora o nabavi robe, usluga i radova. Klasifikacijski sustav CPV-a osmišljen je radi lakšeg objavljivanja i uspoređivanja poziva na nadmetanje kako bi dobavljači i javni naručitelji lakše pronalazili prilike za sudjelovanje u javnoj nabavi.
eTranslation (2) eTranslation je neuronski sustav strojnog prevođenja koji je razvila Europska komisija.
Strojno učenje Strojno učenje je vrsta umjetne inteligencije koja softverskim aplikacijama omogućuje da „uče” iz prijašnjih radnji i povratnih informacija, čime preciznije predviđaju ishode, a da nisu izričito programirane za to.
Inferencija iz modela Inferencija iz modela je faza u kojoj trenirani model strojnog učenja služi za predviđanje iz novih podataka.
Učenje modela Učenje modela je ključna faza u razvoju modela strojnog učenja, u kojoj model uči predviđati na temelju podataka.
Obrada prirodnog jezika Obrada prirodnog jezika je područje umjetne inteligencije koje računalima omogućuje da analiziraju i razumiju ljudski govor u pisanom i usmenom obliku.
Prikaz postupka javne nabave Prikaz postupka javne nabave objedinjuje informacije iz svih obavijesti TED-a koje pripadaju istom postupku (povezane obavijesti) i predstavlja ih u jedinstvenoj, pojednostavnjenoj perspektivi prilagođenoj korisnicima. To je novi koncept prikazivanja podataka o javnoj nabavi iz obavijesti TED-a.
scikit-learn scikit-learn je biblioteka otvorenog koda za strojno učenje za programski jezik Python. Sadrži različite algoritme strojnog učenja, uključujući algoritme za izradu klasifikacijskih modela.
TED TED – Dnevnik elektroničkih natječaja su internetske stranice (https://ted.europa.eu) Ureda za publikacije Europske unije na kojima se objavljuje Službeni list S (Dodatak Službenom listu Europske unije, ili SL S). Pristup TED-u je besplatan.

 

Svi javni natječaji iznad određenih pragova vrijednosti ugovora moraju se objaviti u SL S-u.

(1) https://op.europa.eu/en/web/eu-vocabularies/dataset/-/resource?uri=http://publications.europa.eu/resource/dataset/cpv

(2) https://language-tools.ec.europa.eu/

1. Prikaz postupka javne nabave

Prikaz postupka javne nabave, dostupan na portalu Ureda za publikacije, objedinjuje informacije iz svih obavijesti TED-a koje pripadaju istom postupku (povezane obavijesti) i prikazuje ih na jednom mjestu na jednostavan način. Prikaz postupka javne nabave je novi način za vizualizaciju podataka o javnoj nabavi iz obavijesti TED-a(3).

Pojednostavnjeni prikaz oblikovan je tako da ga korisnici mogu lako razumjeti bez specijaliziranog znanja o nabavi, što ga čini pristupačnim široj publici.

(3) https://ted.europa.eu/hr/

Slika 1. – Objedinjavanje postupka javne nabave.

Na stranici s prikazom postupka javne nabave grafički su prikazani status, datumi i geografska mjesta izvršenja tog postupka. Među detaljnim su podacima postupka ključni elementi za cijeli postupak i za svaku pojedinu grupu. Vide se i izravne poveznice na sve povezane obavijesti TED-a, što omogućava jednostavan pristup primarnom izvoru informacija iz kojih je dobiven ovaj novi prikaz postupka javne nabave.

2. Što je obogaćivanje CPV-ima?

Obogaćivanje CPV-ima je funkcija čiji je cilj olakšati pronalaženje postupaka javne nabave. Kvalitetniji rezultati pretraživanja pak znače da će korisnicima biti lakše korištenje portala Ureda za publikacije. Kako bi se to postiglo, sustav kombinira nekoliko tehnika umjetne inteligencije, kao što su obrada prirodnog jezika (NLP) i strojno učenje (ML) kako bi se na temelju sadržaja postupaka otkrile nove CPV oznake za sve objavljene postupke.

Nove CPV oznake koje je izveo sustav pojavljuju se blizu prvobitnih CPV oznaka na stranici s pojedinostima o postupku. Ti prvobitni CPV-ovi postupka uvijek se jasno razlikuju od izvedenih CPV-ova kako bi korisniku bilo jasno da su potonji dobiveni korištenjem umjetne inteligencije. Osim toga, izvedeni CPV kodovi integrirani su u elemente pretraživanja, što korisnicima olakšava pretraživanje jer mogu filtrirati postupke na temelju poboljšanih kodova.

Na primjer, ako gledamo postupak pod naslovom „Luxembourg-Luksemburg: usluge prijevoza kombijima i mini-kombijima s posebnim vozačem” i s opisom „Usluge prijevoza kombijima i mini-kombijima s posebnim vozačem”, pvobitni CPV iz obavijesti TED-a je „60100000 – Usluge cestovnog prijevoza”, a na temelju ovog modela sustav je izveo dodatni, precizniji CPV: „60170000 – Najam vozila za prijevoz putnika s vozačem”.

 

 

3. Kako funkcionira obogaćivanje CPV-ima?

Sustav obogaćivanja CPV-ima temelji se na klasifikacijskom modelu koji je treniran s bibliotekom scikit-learn. Ulazni podaci modela su tekstualni sadržaji postupka, a rezultat je ocjena pouzdanosti svih podržanih CPV oznaka. Da bi se predvidjele CPV oznake za neki postupak, rade se sljedeće radnje:

  • Ekstrakcija: iz postupka se ekstrahira relevantni sadržaj koji služi u izvođenju CPV oznaka, kao što su nazivi i opis postupaka.
  • Prevođenje: ako sadržaj obavijesti nije dostupan na engleskom, sadržaj postupka prevodi se na taj jezik u eTranslationu.
  • Predobrada: ekstrahirani sadržaj mogao bi sadržavati nebitne dijelove, npr. specijalni znakovi, članovi, veznici i slično. Budući da te informacije ne pomažu u predviđanju CPV oznaka i da bi mogle utjecati na kvalitetu inferencije, uklanja ih se iz teksta.
  • Klasifikacija: ekstrahirani sadržaj unosi se u klasifikacijski model koji predviđa ocjenu pouzdanosti za svaku CPV oznaku unaprijed definiranih razreda.
  • Filtriranje: kako bi se utvrdilo koje bi CPV oznake trebalo zadržati za postupak, dobivene ocjene pouzdanosti uspoređuju se s pragom utvrđenim u treniranju modela. Ako je ocjena pouzdanosti CPV oznake iznad tog praga, ta se oznaka smatra relevantnom za postupak. Na primjer, ako je model predvidio ocjenu pouzdanosti od 0,7 za CPV oznaku 85000000, a prag iznosi 0,6, sustav smatra da je izvedena CPV oznaka povezana s postupkom.

Kako bi naučio izvoditi CPV oznake, model je treniran na cijelom skupu postupaka objavljenih na portalu. Na temelju 80 % podataka trenira se više konfiguracija modela. Potom se ocjenjuju pa se zadržava ona koja je postigla najkvalitetnija predviđanja. Preostalih 20 % podataka služi za ocjenjivanje kvalitete modela na temelju podataka koji nisu iskorišteni za učenje. Sve izvedene CPV oznake s ocjenom pouzdanosti nižom od konfiguriranog praga uklanjaju se kako bi se izbjeglo da sustav pogrešno predvidi ili uzme te oznake, ali i dalje je moguće da bude pogrešaka ili propusta kod izvođenja CPV-ova.

Klasifikacijski model trenira se i ručno prilagođava. Model s najboljom kvalitetom predviđanja upotrebljava se za automatsko izvođenje dodatnih CPV-ova o nedavno obrađenim postupcima nabave.

4. Iz kojih se podataka obogaćuje CPV-ima?

Sustav obogaćivanja CPV-ima upotrebljava postupke koji su javno dostupni na portalu Ureda za publikacije kako bi naučio kako izvesti CPV oznake. Trenutačni sustav treniran je na 2,5 milijuna postupaka objavljenih od 2011. do danas.

Iz svih postupaka koje sustav koristi za treniranje inferencijskog modela izvlače se sljedeće informacije:

  • Naziv postupka
  • Kratak opis postupka
  • Nazivi grupa (ako u postupku ima grupa)
  • Kratki opisi grupa (ako u postupku ima grupa)
  • Glavne i dodatne CPV oznake koje su već uključene u postupak
  • Glavne i dodatne CPV oznake za grupe (ako u postupku ima grupa).

Te informacije objavljuju se u skladu s načelom transparentnosti koje se primjenjuje na sve politike i akte EU-a. Za treniranje i poboljšanje sustava obogaćivanja CPV-ima ne koriste se osobni podaci.

5. Trenutačna ograničenja

  • Sustav može izvesti CPV oznake do 5 znamenki (podjele, skupine, razredi i kategorije). Detaljnija podjela nije podržana.
  • Sustav podržava samo CPV oznake za koje je potvrđena dobra kvaliteta izvođenja, što čini 61 % mogućih CPV oznaka do 5 znamenki.
  • Sustav podržava inferenciju samo za postupke objavljene od 2011. do danas.

6. Izjava o odricanju od odgovornosti – aspekti odgovornosti

Na portalu Ureda za publikacije nalazi se sadržaj koji su stvorili umjetna inteligencija ili druge automatizacijske tehnike. Takav sadržaj pruža se samo informativno. Na njega se ne bi trebalo oslanjati ni za kakvu svrhu prije nego što se provjere njegova točnost i potpunost.

U prikazu postupka javne nabave kombinira se nekoliko tehnika umjetne inteligencije za prikupljanje podataka kako bi se poboljšala mogućnost pronalaženja relevantnih obavijesti o pozivima na podnošenje ponuda objavljenih na TED-u i time olakšalo pretraživanje.

Funkcija obogaćivanja CPV-ima i izvedeni izlazni rezultat umjetne inteligencije, tj. izvedene CPV oznake, funkcioniraju potpuno automatski. Do pogreške ponekad može doći zbog složenosti sustava ili podataka. U prikazu postupka javne nabave upotrebljavaju se isključivo podaci dostupni u SL S-u objavljenom na TED-u, Dnevniku elektroničkih natječaja (https://ted.europa.eu).

Međutim, jedine informacije o pozivima za nadmetanje i s njima povezanim obavijestima koje su službene su one objavljene u Dodatku Službenom listu EU-a (SL S). Iako su poduzete sve potrebne mjere kako bi sadržaj koji proizvodi tehnologija umjetne inteligencije bio najkvalitetniji mogući, njegova se točnost ne može jamčiti.

Stoga se Ured za publikacije i institucije EU-a odriču svake odgovornosti za pogreške ili propuste proizašle iz primjene tehnika umjetne inteligencije. Ne može se preuzeti nikakva odgovornost za bilo kakve posljedice oslanjanja na takav sadržaj generiran umjetnom inteligencijom. Korisnicima se savjetuje da ga koriste s oprezom i preporučuje dodatna dužna pažnja.