Publications Office of the EU
Procédures de passation de marchés publics : Avis sur l’explicabilité - À propos de l'Office des publications
DisplayCustomHeader
Dockbar
ENRICHISSEMENT CPV GRÂCE AU MOTEUR D’INFÉRENCE

Affichage de la procédure de passation de marchés publics

Avis sur l’explicabilité

GLOSSAIRE

Terme Définition
Intelligence artificielle (IA) L’intelligence artificielle (IA) est une technologie qui permet aux ordinateurs et aux machines de simuler ou d’imiter l’intelligence humaine et des capacités de résolution de problèmes.
Modèle de classification Un modèle de classification est un type de modèle d’apprentissage automatique qui catégorise ou classe les données au moyen de classes ou d’étiquettes prédéfinies. Il analyse les données fournies et prédit à quelle catégorie ou classe elles appartiennent.
CPV (Common Procurement Vocabulary) Le vocabulaire commun pour les marchés publics ou CPV (Common Procurement Vocabulary)(1) est un système structuré de codes de classification utilisé pour les marchés publics dans l’ensemble de l’Union européenne. Il aide à catégoriser et décrire le domaine des marchés de fournitures, de services et de travaux à des fins de passation de marchés publics. Le système de classification du CPV est conçu pour faciliter la publication et la comparaison des avis de marché, et permettre ainsi aux fournisseurs et aux pouvoirs adjudicateurs de trouver plus facilement les possibilités qu’ils recherchent en matière de marchés publics.
eTranslation (2) eTranslation est un service de traduction automatique neuronale fourni par la Commission européenne.
Apprentissage automatique L’apprentissage automatique est un type d’IA qui permet à des applications logicielles d’«apprendre» de pratiques et d’informations antérieures et de gagner ainsi en exactitude pour prédire des résultats sans être explicitement programmées à cet effet.
Inférence du modèle L’inférence du modèle est la phase au cours de laquelle un modèle d’apprentissage automatique entraîné est utilisé pour faire des prédictions concernant de nouvelles données.
Entraînement du modèle L’entraînement du modèle est une phase critique dans l’élaboration d’un modèle d’apprentissage automatique dans laquelle celui-ci apprend à faire des prédictions sur la base de données.
Traitement du langage naturel Le traitement du langage naturel est un domaine de l’intelligence artificielle (IA) qui permet aux ordinateurs d’analyser et de comprendre le langage humain, tant à l’écrit qu’à l’oral.
Affichage de la procédure de passation de marchés publics L’«Affichage de la procédure de passation de marchés publics» regroupe les informations provenant de tous les avis TED appartenant à la même procédure (avis connexes) et les présente sous une forme unique, simplifiée et conviviale. Il s’agit d’une nouvelle façon de présenter les données relatives aux marchés publics disponibles dans les avis TED.
scikit-learn scikit-learn est une bibliothèque d’apprentissage automatique à code source libre pour le langage de programmation Python. Elle fournit divers algorithmes d’apprentissage automatique, y compris des algorithmes permettant d’élaborer des modèles de classification.
TED TED (Tender Electronic Daily) est le site web (https://ted.europa.eu), géré par l’Office des publications de l’Union européenne, sur lequel est publié le Journal officiel S (le supplément au Journal officiel de l’Union européenne, ou JO S). L’accès à TED est gratuit.

 

Tous les marchés publics dépassant une certaine valeur doivent être publiés au JO S.

(1) https://op.europa.eu/en/web/eu-vocabularies/dataset/-/resource?uri=http://publications.europa.eu/resource/dataset/cpv

(2) https://language-tools.ec.europa.eu/

1. Affichage de la procédure de passation de marchés publics

L’«Affichage de la procédure de passation de marchés publics» regroupe les informations provenant de tous les avis TED appartenant à la même procédure (avis connexes) et les présente sous une forme unique et conviviale. Il s’agit d’une nouvelle façon de présenter les données relatives aux marchés publics disponibles dans les avis TED (3).

L’affichage simplifié est conçu pour être facilement compris et utilisable par les utilisateurs qui ne disposent pas de connaissances spécialisées en matière de marchés publics, afin qu’il soit accessible à un large public.

(3) https://ted.europa.eu/en/

Figure 1 – Affichage de la procédure de passation de marchés publics.

La page «Affichage de la procédure de passation de marchés publics » comporte une représentation visuelle du statut et de la chronologie de la procédure, ainsi qu’une représentation géographique des lieux d’exécution. Les informations relatives à la procédure comprennent les principaux attributs pour l’ensemble de la procédure et pour chaque lot. En outre, l’affichage fournit des liens directs vers tous les avis TED connexes, ce qui permet d’accéder facilement à la source d’information initiale utilisée pour constituer l’affichage de la procédure de passation de marchés publics.

2. Qu’est-ce que l’enrichissement CPV?

L’enrichissement CPV est une fonctionnalité qui vise à permettre aux utilisateurs de trouver plus facilement ce qu’ils recherchent dans le cadre des procédures de passation de marchés publics, afin d’améliorer leur expérience sur le portail de l’OP grâce à une meilleure qualité des résultats de recherche. Pour ce faire, le système combine plusieurs techniques d’intelligence artificielle (IA), telles que le traitement du langage naturel et l’apprentissage automatique, pour déduire de nouveaux codes CPV pour toutes les procédures publiées, en fonction de leur contenu.

Les nouveaux codes CPV déduits par le système apparaissent près des codes CPV initiaux sur la page des informations relatives à la procédure. Sur cette page, une distinction claire est établie entre les CPV initiaux de la procédure et les CPV déduits, de sorte que l’utilisateur est informé que ces derniers sont générés à l’aide de l’IA. En outre, les codes CPV déduits sont intégrés dans les facettes de recherche, ce qui améliore les possibilités de recherche de l’utilisateur en lui permettant de filtrer la procédure sur la base de codes améliorés.

Prenons, par exemple, une procédure dont le titre est «Luxembourg-Luxembourg: Services de transport par camionnette et monospace avec chauffeur» et la description «Services de transport par camionnette et monospace avec chauffeur». Le CPV initial de l’avis TED est «60100000 - Services de transport routier», tandis que, sur la base du modèle entraîné, le moteur d’enrichissement a déduit le code CPV supplémentaire, plus précis, suivant: «60170000 - Location de véhicules de transport de personnes avec chauffeur».

 

 

3. Comment l’enrichissement CPV fonctionne-t-il?

Le système d’enrichissement CPV repose sur un modèle de classification entraîné au moyen de la bibliothèque scikit-learn. Ce modèle extrait le contenu textuel d’une procédure et fournit le score de confiance de tous les codes CPV pris en charge. Pour une procédure donnée, le système passe par les étapes suivantes pour obtenir les codes CPV prédits:

  • Extraction: le contenu utile, tel que les titres et la description des procédures, qui permet de déduire les codes CPV est extrait de la procédure.
  • Traduction: si le contenu de l’avis n’est pas disponible en anglais, le contenu de la procédure est traduit en anglais à l’aide du service eTranslation.
  • Prétraitement: le contenu extrait peut comporter des parties inutiles: symboles, articles, conjonctions, etc. Ces informations ne contribuent pas à prédire les codes CPV, et elles peuvent nuire à la qualité de la prédiction, si bien qu’elles sont retirées du contenu de la procédure.
  • Classification: le contenu extrait est transmis au modèle de classification afin de prédire un score de confiance pour chaque code CPV de classes prédéfinies.
  • Filtrage: pour déterminer quels codes CPV doivent être conservés pour la procédure, les scores de confiance obtenus sont comparés à une valeur seuil déterminée au cours de l’entraînement du modèle. Si le score de confiance d’un code CPV est supérieur au seuil, le code est considéré comme utile pour la procédure. Par exemple: si le modèle prédit un score de confiance de 0,7 pour le code CPV 85000000 et que le seuil est de 0,6, le système considère que le code CPV déduit est lié à la procédure.

Pour apprendre à déduire les codes CPV, le modèle a été entraîné au moyen de l’ensemble des procédures publiées sur le portail. Plusieurs configurations du modèle sont entraînées sur 80 % des données et évaluées pour conserver celle dont la qualité des prédictions est la meilleure. Les 20 % restants des données sont utilisées pour tester la qualité du modèle sur les données non utilisées pour l’entraînement. Tous les codes CPV déduits dont le score de confiance est inférieur au seuil configuré sont désactivés pour éviter que ces codes ne soient prédits ou utilisés de manière incorrecte par le système — à cet égard, des erreurs de prédiction ou des omissions sont toujours possibles.

Le modèle de classification est entraîné et affiné manuellement, et le modèle présentant la meilleure qualité de prédiction est utilisé pour déduire automatiquement des CPV supplémentaires dans les procédures de passation de marchés nouvellement traitées.

4. Quelles sont les données utilisées pour l’enrichissement CPV?

Le système d’enrichissement CPV utilise les procédures publiées sur le portail de l’OP pour apprendre à déduire les codes CPV. Le système actuel a été entraîné au moyen de 2,5 millions de procédures publiées de 2011 à ce jour.

Les informations suivantes sont extraites de toutes les procédures utilisées par le système pour entraîner le modèle d’inférence:

  • Titre de la procédure.
  • Description succincte de la procédure.
  • Titre des lots (si la procédure comporte des lots).
  • Description succincte des lots (si la procédure comporte des lots).
  • Codes CPV principaux et supplémentaires déjà inclus dans la procédure.
  • Codes CPV principaux et supplémentaires des lots (si la procédure comporte des lots).

Ces informations sont publiées sur la base du principe de transparence applicable à l’ensemble des politiques et de la législation de l’UE. Aucune donnée à caractère personnel n’est utilisée pour entraîner et améliorer le système d’enrichissement CPV.

5. Limites actuelles

  • Le système peut déduire des codes CPV jusqu’à 5 chiffres (divisions, groupes, classes et catégories). Il ne prend pas en charge les niveaux inférieurs.
  • Le système ne prend en charge que les codes CPV pour lesquels une bonne qualité d’inférence a été validée, ce qui représente 61 % des codes CPV possibles jusqu’à 5 chiffres.
  • Le système prend seulement en charge l’inférence pour les procédures publiées de 2011 à ce jour.

6. Clause de non-responsabilité

Il convient de noter que le portail de l’OP contient du contenu créé par l’IA ou d’autres technologies automatisées. Ce contenu est fourni seulement à des fins d’information et ne devrait pas être utilisé à des fins spécifiques sans vérification de son exactitude ou de son exhaustivité.

L’Affichage de la procédure de passation de marchés publics combine plusieurs techniques d’IA pour recueillir des données en vue de permettre aux utilisateurs de trouver plus facilement les avis de marchés utiles publiés sur TED et en faciliter la recherche.

La fonctionnalité d’enrichissement CPV et les résultats générés par l’IA qui en résultent, c’est-à-dire les codes CPV déduits, sont entièrement automatisés. Dans certains cas, des erreurs peuvent survenir en raison de la complexité du système ou des données. L’Affichage de la procédure de passation de marchés publics utilise exclusivement des données disponibles dans le JO S publié sur TED (https://ted.europa.eu).

Néanmoins, les seules informations officielles relatives aux appels d’offres et aux avis correspondants sont celles publiées dans le supplément du Journal officiel de l’UE (JO S). Bien que toutes les mesures nécessaires aient été prises pour faire en sorte que le contenu produit par la technologie de l’IA soit de la plus haute qualité possible, son exactitude ne peut être garantie.

Par conséquent, l’Office des publications et les institutions de l’UE déclinent toute responsabilité pour toute erreur ou omission dans les résultats fournis qui résulterait de l’application de techniques d’IA. Ils déclinent également toute responsabilité en ce qui concerne les conséquences du recours à ce type de contenu généré par l’IA. Les utilisateurs qui en font usage sont invités à faire preuve de prudence et de vigilance.