Publications Office of the EU
Wykaz procedur udzielania zamówień publicznych : Informacja o wytłumaczalności - O Urzędzie Publikacji
DisplayCustomHeader
Dockbar
WZBOGACANIE CPV PRZY UŻYCIU SILNIKA WNIOSKOWANIA

Wykaz procedur udzielania zamówień publicznych

Informacja o wyjaśnialności

SŁOWNICZEK

Termin Definicja
Sztuczna inteligencja (AI) Sztuczna inteligencja (AI) to technologia, która umożliwia komputerom i maszynom naśladowanie lub imitowanie ludzkiej inteligencji i zdolności rozwiązywania problemów.
Model klasyfikacji Model klasyfikacji to rodzaj modelu uczenia maszynowego, który dokonuje kategoryzacji lub klasyfikacji danych według wcześniej zdefiniowanych klas lub etykiet. Przewiduje on, do jakiej kategorii lub klasy należą dane wejściowe.
CPV (Wspólny Słownik Zamówień) CPV (Wspólny Słownik Zamówień) (1) to ustrukturyzowany system kodów klasyfikacji stosowanych w zamówieniach publicznych w całej Unii Europejskiej. Pomaga on w kategoryzacji i opisie przedmiotu zamówień publicznych na dostawy, usługi i roboty budowlane. System klasyfikacji CPV ma za zadanie ułatwić publikację i porównywanie ogłoszeń o zamówieniach, umożliwiając dostawcom i instytucjom zamawiającym łatwiejsze znalezienie odpowiednich informacji o zamówieniach publicznych.
eTranslation (2) eTranslation to usługa neuronowego tłumaczenia maszynowego, którą oferuje Komisja Europejska.
Uczenie maszynowe Uczenie maszynowe to rodzaj sztucznej inteligencji (AI), który umożliwia aplikacjom „uczenie się” na podstawie wcześniejszych doświadczeń i informacji zwrotnych, a tym samym uzyskanie większej poprawności w przewidywaniu wyników bez konieczności zaprogramowania konkretnie do tego celu.
Wnioskowanie modelu Wnioskowanie modelu to faza, w której wykorzystuje się wytrenowany model uczenia maszynowego do generowania przewidywań w odniesieniu do nowych danych.
Trenowanie modelu Trenowanie to kluczowa faza prac nad modelem uczenia maszynowego, podczas której uczy się on generować przewidywania na podstawie danych.
Przetwarzanie języka naturalnego (PJN) Przetwarzanie języka naturalnego (PJN) to dziedzina sztucznej inteligencji (AI), dzięki której komputery mogą analizować i rozumieć język ludzki, zarówno pismo, jak i mowę.
Wykaz procedur udzielania zamówień publicznych Wykaz procedur udzielania zamówień publicznych to zestawienie informacji ze wszystkich opublikowanych w bazie TED ogłoszeń objętych tą samą procedurą (powiązane ogłoszenia), w którym te informacje przedstawia się w jednolitej, uproszczonej i przyjaznej dla użytkownika formie. Jest to nowa koncepcja prezentowania informacji dotyczących zamówień publicznych dostępnych w ogłoszeniach w bazie TED.
scikit-learn scikit-learn to biblioteka typu open source do uczenia maszynowego dostępna dla języka programowania Python. Zawiera ona różne algorytmy uczenia maszynowego, w tym algorytmy do tworzenia modeli klasyfikacji.
TED TED — Tenders Electronic Daily — to strona internetowa (https://ted.europa.eu), którą zarządza Urząd Publikacji Unii Europejskiej. Publikuje się na niej Dziennik Urzędowy S (Suplement do Dziennika Urzędowego Unii Europejskiej, czyli Dz.U. S). Dostęp do bazy TED jest bezpłatny.

 

Wszystkie przetargi publiczne, w przypadku których dokładna wartość zamówienia przekracza określoną kwotę, należy opublikować w Dz.U. S.

(1) https://op.europa.eu/pl/web/eu-vocabularies/dataset/-/resource?uri=http://publications.europa.eu/resource/dataset/cpv

(2) https://language-tools.ec.europa.eu/

1. Wykaz procedur udzielania zamówień publicznych

Wykaz procedur udzielania zamówień publicznych, dostępny w portalu Urzędu Publikacji, zawiera informacje ze wszystkich opublikowanych w TED ogłoszeń objętych tą samą procedurą (powiązane ogłoszenia) i prezentuje te informacje w jednolitej i przyjaznej dla użytkownika formie. Jest to nowa koncepcja przedstawiania informacji dotyczących zamówień publicznych dostępnych w ogłoszeniach w bazie TED (3).

Uproszczony wykaz zaprojektowano tak, aby był łatwo zrozumiały i czytelny dla osób nieposiadających specjalistycznej wiedzy na temat zamówień publicznych, dzięki czemu może z niego korzystać szerokie grono użytkowników.

(3) https://ted.europa.eu/pl/

Rys. 1 – Wykaz procedur udzielania zamówień publicznych.

Na stronie z wykazem procedur udzielania zamówień publicznych można znaleźć status i harmonogram procedury, a także oznaczenie geograficzne miejsc realizacji. Szczegółowe dane na temat procedury obejmują najważniejsze informacje dotyczące zarówno całej procedury, jak i poszczególnych części zamówienia. Ponadto bezpośrednie linki do wszystkich powiązanych ogłoszeń TED zapewniają łatwy dostęp do pierwotnego źródła informacji, które wykorzystano do stworzenia wykazu procedur udzielania zamówień publicznych.

2. Na czym polega wzbogacanie CPV?

Wzbogacanie CPV to funkcja, która ma poprawić znajdowalność procedur udzielania zamówień publicznych. Wzrośnie dzięki temu jakość wyników wyszukiwania, co sprawi, że korzystanie z portalu Urzędu Publikacji będzie wygodniejsze. W tym celu system wykorzystuje kilka technik sztucznej inteligencji (AI) — jak np. przetwarzanie języka naturalnego (NLP) i uczenie maszynowe (ML) — do wnioskowania nowych kodów CPV dla wszystkich publikowanych procedur, na podstawie ich treści.

Na stronie ze szczegółowymi informacjami na temat procedury nowe kody CPV wywnioskowane przez system pojawiają się obok oryginalnych kodów CPV. Strona wyraźnie rozróżnia te dwa rodzaje kodów, tak aby użytkownik był świadomy, że kody wywnioskowane przez system są generowane za pomocą sztucznej inteligencji. Ponadto wywnioskowane kody CPV są zintegrowane z filtrami wyszukiwania, co umożliwia użytkownikom filtrowanie procedur na podstawie dokładniejszych kodów i w ten sposób usprawnia proces wyszukiwania.

Przykładowo, w przypadku procedury o nazwie „Luksemburg–Luksemburg: Usługi transportowe za pomocą vana i minivana z kierowcą” z opisem „Usługi transportowe za pomocą vana i minivana z kierowcą” oryginalny kod CPV z ogłoszenia TED to „60100000 — Usługi w zakresie transportu drogowego”, a silnik wzbogacający dane, bazujący na wytrenowanym modelu, wywnioskował dodatkowy, bardziej szczegółowy kod: „60170000 – Wynajem pojazdów przeznaczonych do transportu osób wraz z kierowcą”.

 

 

3. Jak przebiega wzbogacanie CPV?

System wzbogacania CPV opiera się na modelu klasyfikacji wytrenowanym z wykorzystaniem biblioteki scikit-learn. Dane wejściowe modelu to tekstowa treść procedury, a wyjściowe — współczynniki ufności dla wszystkich obsługiwanych kodów CPV. Dla danej procedury wykonuje się następujące kroki, aby uzyskać przewidywane kody CPV:

  • Ekstrakcja: z procedury wyodrębnia się istotne treści, takie jak jej nazwa i opis, które pomagają systemowi wywnioskować kody CPV.
  • Tłumaczenie: jeżeli treść procedury nie jest dostępna po angielsku, tłumaczy się ją na ten język za pomocą usługi eTranslation.
  • Przygotowanie danych: wyodrębniona treść może zawierać nieistotne elementy, takie jak symbole, przedimki, spójniki itp. Informacje te nie pomagają przewidywać kodów CPV i mogą mieć wpływ na jakość wnioskowania, w związku z czym usuwa się je z treści procedury.
  • Klasyfikacja: wyodrębniona treść jest przekazywana do modelu klasyfikacji, aby uzyskać przewidywane współczynniki ufności dla poszczególnych kodów CPV wcześniej zdefiniowanych klas.
  • Filtrowanie: aby ustalić, które kody CPV należy zachować w odniesieniu do danej procedury, uzyskane współczynniki ufności porównuje się z wartością progową określoną podczas trenowania modelu. Jeżeli współczynnik ufności dla kodu CPV jest wyższy niż wartość progowa, wówczas kod uznaje się za pasujący do procedury. Przykładowo, jeśli model przewiduje dla kodu CPV 85000000 współczynnik ufności na poziomie 0,7, a wartość progowa wynosi 0,6, to system uznaje ten kod CPV za pasujący do procedury.

Model trenuje się na pełnym zbiorze procedur opublikowanych na portalu, aby nauczył się wnioskować kody CPV. Wiele różnych konfiguracji modelu trenuje się z wykorzystaniem 80% tych danych i poddaje ocenie, tak aby zachować tę konfigurację, która zapewnia najlepszą jakość prognoz. Pozostałe 20% danych służy do sprawdzenia jakości modelu z użyciem danych, których nie wykorzystano podczas trenowania. Wszystkie wywnioskowane kody CPV ze współczynnikiem ufności poniżej ustawionej wartości progowej odrzuca się, aby uniknąć nieprawidłowego przewidywania lub wykorzystywania tych kodów przez system. Mimo wszystko mogą wystąpić błędy lub pominięcia.

Model klasyfikacji trenuje się i dopracowuje ręcznie, a model o najlepszej jakości prognozowania wykorzystuje się do automatycznego wnioskowania dodatkowych kodów CPV dla nowych procedur udzielania zamówień publicznych.

4. Jakie dane wykorzystuje się do wzbogacania CPV?

System wzbogacania CPV wykorzystuje procedury publicznie dostępne na portalu Urzędu Publikacji, aby nauczyć się, jak wnioskować kody CPV. Obecny system wytrenowano na bazie 2,5 mln procedur opublikowanych od 2011 r. do dzisiaj.

Ze wszystkich procedur, które system wykorzystuje do trenowania modelu wnioskowania, wyodrębnia się następujące informacje:

  • nazwę procedury,
  • krótki opis zamówienia,
  • nazwy części zamówienia (jeżeli procedura jest podzielona na części),
  • krótki opis części zamówienia (jeżeli procedura jest podzielona na części),
  • główny kod CPV i dodatkowe kody CPV uwzględnione już w procedurze,
  • główne i dodatkowe kody CPV części zamówienia (jeżeli procedura jest podzielona na części).

Te informacje publikuje się zgodnie z zasadą przejrzystości, która ma zastosowanie do wszystkich polityk i całego prawodawstwa UE. Do trenowania i doskonalenia systemu wzbogacania CPV nie wykorzystuje się żadnych danych osobowych.

5. Aktualne ograniczenia

  • System może wnioskować kody CPV składające się z maksymalnie 5 cyfr (działy, grupy, klasy i kategorie). Nie obsługuje on niższych poziomów.
  • System obsługuje wyłącznie kody CPV, w przypadku których potwierdzono dobrą jakość wnioskowania, czyli 61% możliwych kodów CPV składających się z maksymalnie 5 cyfr.
  • System pozwala na wnioskowanie jedynie w odniesieniu do procedur opublikowanych od 2011 r. dziś.

6. Zastrzeżenie prawne — kwestie dotyczące odpowiedzialności

Należy zauważyć, że portal Urzędu Publikacji zawiera treści tworzone przez sztuczną inteligencję lub inne zautomatyzowane technologie. Takie treści są udostępniane wyłącznie do celów informacyjnych i nie należy na nich bazować w żadnym celu bez weryfikacji ich poprawności i kompletności.

W wykazie procedur udzielania zamówień publicznych wykorzystuje się kilka technik AI, aby poprawić znajdowalność odpowiednich ogłoszeń o zaproszeniu do składania ofert publikowanych w bazie TED, co ma usprawnić i wspomóc metody wyszukiwania.

Funkcja wzbogacania CPV i wygenerowane przez sztuczną inteligencję dane wyjściowe, tj. wywnioskowane kody CPV, są w pełni zautomatyzowane. Czasem mogą wystąpić błędy wynikające ze złożoności systemu lub danych. W wykazie procedur udzielania zamówień publicznych wykorzystuje się wyłącznie dane dostępne w Dz.U. S publikowanym na stronie TED — Tenders Electronic Daily (https://ted.europa.eu).

Niezależnie od tego, jedyne oficjalne informacje dotyczące zaproszeń do składania ofert i odpowiadających im ogłoszeń publikuje się w Suplemencie do Dziennika Urzędowego UE (Dz.U. S). Chociaż zastosowano wszelkie niezbędne środki, aby zapewnić możliwie najwyższą jakość treści tworzonych przez technologię sztucznej inteligencji, nie można zagwarantować poprawności tych treści.

W związku z tym Urząd Publikacji i instytucje UE nie ponoszą odpowiedzialności za jakiekolwiek błędy i braki w treściach powstających z wykorzystaniem technik sztucznej inteligencji. Nie ponoszą też żadnej odpowiedzialności za jakiekolwiek skutki bazowania na takich treściach generowanych przez AI. Użytkownicy powinni korzystać z tych treści z ostrożnością i zachować należytą staranność.