Ansicht des Verfahrens zur Vergabe öffentlicher Aufträge
Hinweis zur Erklärbarkeit
Inhaltsverzeichnis
GLOSSAR
Begriff | Definition |
---|---|
Künstliche Intelligenz (KI) | Künstliche Intelligenz (KI) ist eine Technologie, mit der Computer und Maschinen die menschliche Intelligenz und Problemlösungsfähigkeit simulieren oder nachahmen können. |
Klassifizierungsmodell | Ein Klassifizierungsmodell ist ein Modell für maschinelles Lernen, mit dem Daten in vorab definierte Klassen oder Labels kategorisiert oder eingeordnet werden. Es verarbeitet Eingabedaten und prognostiziert, zu welcher Kategorie oder Klasse die Daten gehören. |
Gemeinsames Vokabular für öffentliche Aufträge (CPV) | Das Gemeinsame Vokabular für öffentliche Aufträge (Common Procurement Vocabulary – CPV) (1) ist ein strukturiertes System von Klassifizierungscodes, die bei der Vergabe öffentlicher Aufträge in der gesamten Europäischen Union verwendet werden. Damit lässt sich der Gegenstand von Liefer‑, Dienstleistungs‑ und Bauaufträgen für die Auftragsvergabe leichter kategorisieren und beschreiben. Das CPV-Klassifikationssystem ist so konzipiert, dass es einfacher wird, Auftragsbekanntmachungen zu veröffentlichen und zu vergleichen. Anbieter und öffentliche Auftraggeber können somit relevante Beschaffungsmöglichkeiten leichter finden. |
eTranslation (2) | eTranslation ist der neuronale maschinelle Übersetzungsdienst der Europäischen Kommission. |
Maschinelles Lernen (ML) | Maschinelles Lernen (ML) ist eine Art von künstlicher Intelligenz (KI), durch die Softwareanwendungen aus der bisherigen Praxis und aus Rückmeldungen „lernen“ und somit Ergebnisse präziser vorhersagen können, ohne explizit dafür programmiert zu sein. |
Modellinferenz | Modellinferenz ist die Phase, in der mit einem trainierten Modell für maschinelles Lernen Vorhersagen über neue Daten erstellt werden. |
Modelltraining | Modelltraining ist eine kritische Phase in der Entwicklung eines Modells für maschinelles Lernen, in der das Modell lernt, Vorhersagen auf der Grundlage von Daten zu treffen. |
Maschinelle Sprachverarbeitung (NLP) | Die maschinelle Sprachverarbeitung (Natural Language Processing – NLP), ein Teilgebiet der künstlichen Intelligenz (KI), ermöglicht es Computern, menschliche Sprache sowohl in schriftlicher als auch in gesprochener Form zu analysieren und zu verstehen. |
Ansicht des Verfahrens zur Vergabe öffentlicher Aufträge | Mit der Ansicht des Verfahrens zur Vergabe öffentlicher Aufträge werden Informationen aus allen TED-Bekanntmachungen, die sich auf dasselbe Verfahren beziehen (diesbezügliche Bekanntmachungen), zusammengestellt und einheitlich, vereinfacht und benutzerfreundlich zusammengestellt und präsentiert. Es handelt sich um ein neues Konzept zur Darstellung von in TED-Bekanntmachungen enthaltenen Beschaffungsdaten. |
scikit-learn | scikit-learn ist eine quelloffene Software-Bibliothek zum maschinellen Lernen für die Programmiersprache Python mit verschiedenen Algorithmen für maschinelles Lernen, unter anderem Algorithmen zur Entwicklung von Klassifizierungsmodellen. |
TED | „Tenders Electronic Daily“ – TED (https://ted.europa.eu/de/) ist die vom Amt für Veröffentlichungen der Europäischen Union verwaltete Website, auf der das Amtsblatt S (Supplement zum Amtsblatt der Europäischen Union oder ABl. S) veröffentlicht wird. Der Zugang zu TED ist kostenlos.
Alle öffentlichen Ausschreibungen, bei denen ein bestimmter Auftragswert überschritten wird, müssen im Amtsblatt S veröffentlicht werden. |
(2) https://language-tools.ec.europa.eu/.
1. Ansicht des Verfahrens zur Vergabe öffentlicher Aufträge
Mit der auf dem OP-Portal verfügbaren Ansicht des Verfahrens zur Vergabe öffentlicher Aufträge werden Informationen aus allen TED-Bekanntmachungen, die sich auf dasselbe Verfahren beziehen (diesbezügliche Bekanntmachungen), einheitlich und benutzerfreundlich zusammengestellt und präsentiert. Es handelt sich um ein neues Konzept zur Darstellung von in TED-Bekanntmachungen (3) enthaltenen Beschaffungsdaten.
Die vereinfachte Ansicht ist so gestaltet, dass sich die Nutzer*innen ohne spezielles einschlägiges Wissen beim Navigieren leicht zurechtfinden, und somit für ein breiteres Publikum zugänglich.
(3) https://ted.europa.eu/de/.
Abbildung 1 – Öffentliches Vergabeverfahren – Gesamtübersicht
Auf der Seite mit der Ansicht des Verfahrens zur Vergabe öffentlicher Aufträge werden Status und Zeitplan des Verfahrens visuell dargestellt. Parallel dazu werden die Erfüllungsorte angezeigt. Die Detailangaben zum Verfahren geben über wichtige Merkmale des gesamten Verfahrens und der einzelnen Lose Aufschluss. Zusätzlich sind alle diesbezüglichen TED-Bekanntmachungen dort direkt verlinkt, sodass die primäre Quelle der Informationen, die für die Zusammenstellung der Ansicht des Verfahrens zur Vergabe öffentlicher Aufträge herangezogen wurden, einfach zugänglich ist.
2. Was ist die Ergänzung von CPV-Codes?
Die Ergänzung von CPV-Codes ist eine Funktion, mit der die Auffindbarkeit öffentlicher Vergabeverfahren optimiert werden soll, damit das OP-Portal durch bessere Suchergebnisse noch nutzerfreundlicher wird. Hierfür kombiniert das System mehrere Techniken der künstlichen Intelligenz (KI) wie maschinelle Sprachverarbeitung (NLP) und maschinelles Lernen (ML), um für alle veröffentlichten Verfahren neue, auf deren Inhalt basierende CPV-Codes zu inferieren (= abzuleiten).
Die vom System inferierten neuen CPV-Codes erscheinen in der Nähe der ursprünglichen CPV-Codes auf der Seite „Angaben zum Verfahren“. Dort wird klar zwischen den ursprünglichen CPV-Codes des Verfahrens und den inferierten Codes unterschieden. So sind die Nutzer*innen darüber informiert, dass letztere KI-generiert sind. Darüber hinaus werden die inferierten CPV-Codes in die Suchfilter integriert. Die Nutzer*innen erhalten bessere Ergebnisse, weil sie verfahrensbasiert nach ergänzten Codes filtern können.
Betrachten wir beispielsweise das Verfahren „Luxemburg-Luxemburg: Beförderungsdienste mit Van und Mini-Van mit eigenem Fahrer“ mit der Beschreibung „Beförderungsdienste mit Van und Mini-Van mit eigenem Fahrer“. Der ursprünglich in der TED-Bekanntmachung verwendete CPV-Code lautet „60100000 – Straßentransport/-beförderung“. Durch das trainierte Modell hat die Inferenzmaschine einen zusätzlichen und spezifischeren Code – nämlich „60170000 – Vermietung von Fahrzeugen zur Personenbeförderung mit Fahrer“ – inferiert.
3. Wie funktioniert die Ergänzung von CPV-Codes?
Das CPV-Ergänzungssystem beruht auf einem Klassifizierungsmodell, das mit der scikit-learn-Bibliothek trainiert wurde. Das Modell verarbeitet als Input den Textinhalt eines Verfahrens und gibt als Output den Grad der Zuverlässigkeit aller unterstützten CPV-Codes an. Bei einem konkreten Verfahren werden folgende Schritte durchlaufen, bis man die vorhergesagten CPV-Codes erhält:
- Extraktion: Relevante Inhalte wie Verfahrenstitel und Beschreibungen, die dazu beitragen, die CPV-Codes zu inferieren, werden aus dem Verfahren extrahiert.
- Übersetzung: Ist der Inhalt der Bekanntmachung nicht in englischer Sprache verfügbar, wird er mithilfe von eTranslation ins Englische übersetzt.
- Vorverarbeitung: Die extrahierten Inhalte enthalten unter Umständen irrelevante Elemente, wie Symbole, Artikel, Konjunktionen usw. Diese Informationen sind für die Vorhersage von CPV-Codes nicht hilfreich. Da sie die Qualität der Inferenz beeinträchtigen könnten, werden sie aus dem Inhalt des Verfahrens entfernt.
- Klassifizierung: Die extrahierten Inhalte werden an das Klassifizierungsmodell weitergeleitet, um für jeden CPV-Code der vordefinierten Klassen einen Zuverlässigkeitsgrad vorherzusagen.
- Filtern: Die ermittelten Zuverlässigkeitsgrade werden mit einem während des Trainings des Modells festgelegten Schwellenwert verglichen, um zu bestimmen, welche CPV-Codes für das Verfahren beibehalten werden sollten. Liegt der Zuverlässigkeitsgrad eines CPV-Codes über dem Schwellenwert, gilt der Code als für das Verfahren relevant. Prognostiziert das Modell beispielsweise einen Zuverlässigkeitsgrad von 0,7 für den CPV-Code 85000000 und beträgt der Schwellenwert 0,6, wertet das System den inferierten CPV-Code als Code mit Bezug zu dem Verfahren.
Damit das Modell die Ableitung von CPV-Codes erlernt, wurde es mit sämtlichen im Portal veröffentlichten Verfahren trainiert. Mehrere Konfigurationen des Modells werden mit 80 % der Daten trainiert und bewertet, um die Konfiguration mit den zutreffendsten Vorhersagen beizubehalten. Die restlichen 20 % der Daten werden verwendet, um die Qualität des Modells an Daten, die im Training nicht verwendet wurden, zu testen. Alle inferierten CPV-Codes mit einem Zuverlässigkeitsgrad unterhalb des konfigurierten Schwellenwerts werden deaktiviert, damit diese Codes nicht vom System falsch vorhergesagt oder verwendet werden. Es kann dennoch zu Fehlern oder Auslassungen bei der CPV-Inferenz kommen.
Das Klassifizierungsmodell wird manuell trainiert und justiert. Das Modell mit den treffendsten Vorhersagen wird verwendet, um automatisch zusätzliche CPV-Codes aus neu bearbeiteten Vergabeverfahren zu inferieren.
4. Welche Daten werden für die Ergänzung von CPV-Codes verwendet?
Das CPV-Ergänzungssystem nutzt die auf dem OP-Portal öffentlich zugänglichen Verfahren, um zu lernen, wie CPV-Codes inferiert werden. Das derzeitige System wurde mithilfe von 2,5 Millionen Verfahren trainiert, die zwischen 2011 und heute veröffentlicht wurden.
Aus allen Verfahren, die das System verwendet, um das Inferenzmodell zu trainieren, werden folgende Informationen extrahiert:
- Titel des Verfahrens
- Kurze Beschreibung des Verfahrens
- Titel der Lose (sofern das Verfahren Lose umfasst)
- Kurze Beschreibung der Lose (sofern das Verfahren Lose umfasst)
- Die wichtigsten zusätzlichen CPV-Codes, die bereits im Verfahren enthalten sind
- Die wichtigsten zusätzlichen CPV-Codes der Lose (sofern das Verfahren Lose umfasst)
Diese Informationen werden nach dem Grundsatz der Transparenz veröffentlicht, der allen politischen Maßnahmen und Rechtsvorschriften der EU zugrunde liegt. Es werden keine personenbezogenen Daten verwendet, um das CPV-Ergänzungssystem zu trainieren oder zu verbessern.
5. Derzeitige Einschränkungen
- Das System kann CPV-Codes mit bis zu fünf Ziffern (Abteilungen, Gruppen, Klassen und Kategorien) inferieren, bei niedrigeren Ebenen ist dies nicht möglich.
- Das System unterstützt nur CPV-Codes, deren gute Inferenzqualität validiert wurde. Dies sind 61 % der möglichen CPV-Codes mit bis zu fünf Ziffern.
- Das System erlaubt nur die Inferenz aus Verfahren, die zwischen 2011 bis heute veröffentlicht wurden.
6. Haftungsausschluss – Haftungsfragen
Hinweis: Das OP-Portal enthält Inhalte, die durch KI oder andere automatisierte Technologien generiert wurden. Diese Inhalte werden nur zu Informationszwecken zur Verfügung gestellt und sind ohne Überprüfung ihrer Richtigkeit oder Vollständigkeit für einen bestimmten Zweck nicht zuverlässig.
Für die Ansicht des Verfahrens zur Vergabe öffentlicher Aufträge werden verschiedene KI-Techniken kombiniert, um Daten zu sammeln, mit denen die Auffindbarkeit relevanter, auf TED veröffentlichter Ausschreibungsbekanntmachungen verbessert wird, um die Suchmethoden zu vereinfachen und entsprechende Hilfestellung zu bieten.
Die Funktion der Ergänzung von CPV-Codes und der daraus resultierende KI-Output, also die inferierten CPV-Codes, sind vollständig automatisiert. In einigen Fällen können aufgrund der Komplexität des Systems oder der Daten Fehler auftreten. Für die Ansicht des Verfahrens zur Vergabe öffentlicher Aufträge werden ausschließlich Daten aus dem Amtsblatt S verwendet, die auf TED – Tenders Electronic Daily (https://ted.europa.eu), veröffentlicht werden.
Ungeachtet dessen handelt es sich lediglich bei den im Supplement zum EU-Amtsblatt (ABl. S) veröffentlichten Informationen über Ausschreibungen und diesbezügliche Bekanntmachungen um amtliche Informationen. Obwohl mit allen erforderlichen Maßnahmen sichergestellt wurde, dass die mithilfe von KI-Technologie erstellten Inhalte von höchstmöglicher Qualität sind, kann deren Richtigkeit nicht garantiert werden.
Daher übernehmen das Amt für Veröffentlichungen und die EU-Institutionen keine Haftung dafür, dass mithilfe von KI-Techniken generierte Ergebnisse fehlerhaft oder unvollständig sein können. Es kann keine Verantwortung für etwaige Folgen übernommen werden, die darauf zurückzuführen sind, dass auf derartige KI-generierte Inhalte zurückgegriffen wurde. Den Nutzer*innen wird geraten, diese mit Vorsicht zu verwenden, und es wird empfohlen, zusätzliche Sorgfalt walten zu lassen.