Преглед на процедура за възлагане на обществена поръчка
Обяснително известие
Съдържание
РЕЧНИК НА ТЕРМИНИТЕ
Термин | Определение |
---|---|
Изкуствен интелект (ИИ) | Изкуственият интелект (ИИ) е технология, която дава възможност на компютри и машини да симулират или имитират човешки интелект и способности за решаване на проблеми. |
Класификационен модел | Класификационният модел е вид модел за машинно самообучение, който категоризира или класифицира данни в предварително определени класове или етикети. Той приема входни данни и прогнозира към коя категория или клас принадлежат данните. |
CPV (Общ терминологичен речник, свързан с обществените поръчки) | CPV (Общ терминологичен речник, свързан с обществените поръчки) (1) е структурирана система от класификационни кодове, използвани в областта на обществените поръчки в целия Европейски съюз. Той помага за категоризиране и описване на предмета на обществените поръчките за доставки, услуги и строителство. Системата за класификация по CPV има за цел да подпомогне публикуването и сравняването на обявления за обществени поръчки, като по този начин улеснява доставчиците и възлагащите органи да намират подходящи възможности за обществени поръчки. |
eTranslation (2) | eTranslation е услуга за невромашинен превод, предоставяна от Европейската комисия. |
Машинно самообучение | Машинното самообучение (ML) е вид изкуствен интелект (ИИ), който позволява на софтуерните приложения да „се учат“ от минали практики и обратна връзка и по този начин да стават по-точни при прогнозирането на резултати, без да са изрично програмирани за това. |
Извеждане на данни чрез модел | Това е етапът, при който обучен модел за машинно самообучение се използва, за да се правят прогнози относно нови данни. |
Обучение на модел | Това е критичен етап от разработването на модел за машинно самообучение, при който моделът се обучава да прави прогнози въз основа на данни. |
Обработка на естествен език | Обработката на естествен език (NLP) е област на изкуствения интелект (ИИ), която дава възможност на компютрите да анализират и разбират човешки език, както писмен, така и говорим. |
Преглед на процедура за възлагане на обществена поръчка | В рамките на „преглед на процедура за възлагане на обществени поръчки“ информация от всички обявления в TED, принадлежащи към една и съща процедура (свързани обявления), се обединява и се представя в унифициран, опростен и лесен за ползване вид. Прегледът на процедура за възлагане на обществена поръчка е нов начин за представяне на данни за обществени поръчки, налични в обявленията в TED. |
scikit-learn | scikit-learn е библиотека за машинно самообучение с отворен код за езика за програмиране Python. Тя съдържа различни алгоритми за машинно самообучение, включително алгоритми за създаване на класификационни модели. |
TED | TED (Електронен ежедневник за поръчките) е уебсайтът (https://ted.europa.eu), управляван от Службата за публикации на Европейския съюз, на който се публикува серия S на Официален вестник (притурка към Официален вестник на Европейския съюз). Достъпът до TED е безплатен.
В серия S на Официален вестник трябва да се публикуват обявления за всички обществени поръчки на стойност, надвишаваща определени прагове. |
(2) https://language-tools.ec.europa.eu/
1. Преглед на процедура за възлагане на обществена поръчка
Чрез функцията за преглед на процедура за възлагане на обществена поръчка, достъпна на портала на СП, информация от всички обявления в TED, принадлежащи към една и съща процедура (свързани обявления), се обединява и се представя в унифициран, опростен и лесен за ползване вид. Прегледът на процедура за възлагане на обществена поръчка е нов начин за представяне на данни за обществени поръчки, налични в обявленията в TED (3).
Този опростен преглед е разработен така, че потребителите без специализирани познания в областта на обществените поръчки лесно да го разбират и да се ориентират, което го прави достъпен за по-широка аудитория.
Фигура 1 — Обединяване на данни за процедура за възлагане на обществена поръчка
Прегледът на процедура за възлагане на обществена поръчка съдържа визуално представяне на статуса и времевия график на процедурата, както и географско представяне на местата на изпълнение. Данните за процедурата включват ключови атрибути както за цялата процедура, така и за всяка отделна обособена позиция. Освен това се посочват преки връзки към всички свързани обявления в TED, с което се осигурява лесен достъп до първичния източник на информация, използван за съставянето на прегледа на процедурата за възлагане на обществена поръчка.
2. Какво представлява CPV обогатяването?
CPV обогатяването е функция, която има за цел улесняване на намирането на процедури за възлагане на обществени поръчки и повишаване на качеството на резултатите от търсенията, за да се подобри потребителското изживяване при ползването на портала на СП. За целта системата съчетава няколко техники за изкуствен интелект (ИИ), като например обработка на естествен език (NLP) и машинно самообучение (ML), за да се изведат нови CPV кодове за всички публикувани процедури въз основа на тяхното съдържание.
Новите кодове по CPV, изведени от системата, се показват близо до оригиналните кодове по CPV на страницата с данни за процедурата. На страницата се прави ясно разграничение между оригиналните и изведените кодове по CPV на процедурата, за да се информира потребителят, че последните са генерирани с помощта на ИИ. Освен това изведените кодове по CPV са включени във филтрите за търсене, с което се подобряват възможностите за търсене от страна на потребителите.
Например ако разгледаме процедурата с наименование „Люксембург-Люксембург: Транспортни услуги с микробус и миниван със специален шофьор” и описанието „Транспортни услуги с микробус и миниван със специален шофьор“, оригиналният CPV код от обявлението в TED е „60100000 — Пътни транспортни услуги“, а чрез обучения модел се извежда допълнителен, по-конкретен код: „60170000 — Услуги по даване под наем на автомобили с водач“.
3. Как функционира CPV обогатяването?
Системата за CPV обогатяване се основава на класификационен модел, обучен с библиотеката scikit-learn. Моделът приема като входни данни текстовото съдържание за дадена процедура и дава като резултат доверителната оценка на всички поддържани кодове по CPV. За дадена процедура се изпълняват следните стъпки за получаване на прогнозираните кодове по CPV:
- извличане: от данните за процедурата се извлича съответното съдържание, като например заглавията и описанията на процедури, което помага да се изведат кодовете по CPV;
- превод: съдържанието относно процедурата се превежда на английски език чрез услугата eTranslation, ако съдържанието на обявлението не е достъпно на английски език;
- предварителна обработка: извлеченото съдържание може да съдържа елементи, които не са от значение, като например символи, членове, съюзи и др. Тази информация не помага при прогнозирането на кодовете по CPV и може да се отрази неблагоприятно върху извеждането им, затова се премахва от съдържанието относно процедурата;
- класифициране: извлеченото съдържание се подава към класификационния модел, за да се прогнозира доверителна оценка за всеки код по CPV от предварително определени класове;
- филтриране: за да се определи кои кодове по CPV да бъдат запазени за процедурата, получените доверителни оценки се сравняват с прагова стойност, определена по време на обучението на модела. Ако доверителната оценка на даден код по CPV е по-висока от прага, тогава кодът се счита за подходящ за процедурата. Например, ако моделът прогнозира доверителна оценка от 0,7 за кода по CPV 85000000 и прагът е 0,6, тогава системата счита, че изведеният код по CPV е свързан с процедурата.
За да се обучи моделът да извежда кодове по CPV, е използван пълният набор от данни за процедури, публикувани на портала. Различни конфигурации на модела се обучават с 80 % от данните и се оценяват, за да се запази тази с най-добро качество на прогнозиране. Останалите 20 % от данните се използват за изпитване на качеството на модела въз основа на данни, които не са използвани по време на обучението. Всички изведени кодове по CPV с доверителна оценка под зададения праг се дезактивират, за да се избегне погрешно прогнозиране или използване на тези кодове от системата. Въпреки това е възможно да възникнат грешки или пропуски, свързани с извеждането на кодове по CPV.
Класификационният модел се обучава и настройва ръчно и моделът с най-добро качество на прогнозиране се използва за автоматично извеждане на допълнителни кодове по CPV при ново обработване на данни за процедури за възлагане на обществени поръчки.
4. Какви данни се използват при CPV обогатяването?
За обучаване на системата за CPV обогатяване да извежда кодове по CPV се използват данните за процедури, които са публично достъпни на портала на СП. Настоящата система е обучена въз основа на данните за 2,5 милиона процедури, публикувани от 2011 г. досега.
Следната информация се извлича от данните за всички процедури, използвани от системата за обучение на модела за извеждане на CPV кодове:
- наименование на процедурата
- кратко описание на процедурата
- наименование на обособените позиции (ако в рамките на процедурата има обособени позиции)
- кратко описание на обособените позиции (ако в рамките на процедурата има обособени позиции)
- основните и допълнителните кодове по CPV, които вече са посочени за процедурата
- основните и допълнителните кодове по CPV за обособените позиции (ако в рамките на процедурата има обособени позиции).
Тази информация се публикува въз основа на принципа на прозрачност, който се прилага за всички политики и цялото законодателство на ЕС. При обучението и усъвършенстването на системата за CPV обогатяване не се използват лични данни.
5. Настоящи ограничения
- Системата може да извежда кодове по CPV до първите 5 цифри (раздели, групи, класове и категории). Тя не поддържа по-долните нива.
- Системата поддържа само кодове по CPV, за които е валидирано добро качество на извеждането. Това представлява 61 % от възможните кодове по CPV до първите 5 цифри.
- Системата поддържа извеждане на данни само за процедурите, за които е публикувана информация от 2011 г. досега.
6. Отказ от отговорност — аспекти на отговорността
Следва да се отбележи, че на портала на СП има съдържание, създадено чрез ИИ или други автоматизирани технологии. Такова съдържание се предоставя само за информационни цели и не следва да се използва за каквато и да било конкретна цел, без да се провери неговата точност или пълнота.
При прегледа на процедура за възлагане на обществена поръчка се съчетават няколко техники за ИИ, чрез които се събират данни, за да се подпомогнат методите за търсене с цел улесняване на намирането на подходящи обявления за обществени поръчки, публикувани в TED.
Функцията за CPV обогатяване и резултатът от нея, т.е. извеждането на кодове по CPV, са напълно автоматизирани. В някои случаи могат да възникнат грешки поради сложността на системата или данните.
При прегледа на процедура за възлагане на обществена поръчка се използват само данни, налични в серия S на Официален вестник, публикувана в TED, Електронния ежедневник за поръчките (https://ted.europa.eu). Независимо от това за официална информация се счита само информацията относно обществените поръчки и съответните обявления, която е публикувана в притурката към Официален вестник на ЕС (серия S на Официален вестник).
Въпреки че са предприети всички необходими мерки за осигуряване на възможно най-високо качество на съдържанието, създадено чрез технологии с ИИ, неговата точност не може да бъде гарантирана. Поради това с настоящото се декларира, че Службата за публикации и институциите на ЕС не носят никаква отговорност за каквито и да е грешки или пропуски в резултат от прилагането на техники за ИИ.
Не се поема отговорност за каквито и да е последици от използването на такова генерирано от ИИ съдържание. Съветваме потребителите да го използват с повишено внимание и препоръчваме допълнителна надлежна проверка.