Publications Office of the EU
Visualización de los procedimientos de contratación pública : Declaración de explicabilidad - Sobre la Oficina de Publicaciones
DisplayCustomHeader
Dockbar
ENRIQUECIMIENTO DEL CPV MEDIANTE UN MOTOR DE INFERENCIA

Visualización de los procedimientos de contratación pública

Declaración de explicabilidad

GLOSARIO

Término Definición
Inteligencia artificial (IA) La IA es una tecnología que permite a ordenadores y máquinas simular o imitar la inteligencia humana y sus capacidades de resolución de problemas.
Modelo de clasificación Un modelo de clasificación es un tipo de modelo de aprendizaje automático que categoriza o clasifica los datos en clases o etiquetas predefinidas. Toma los datos de entrada y predice a qué categoría o clase pertenecen.
Vocabulario común de contratos públicos (CPV) El CPV (1) es un sistema estructurado de códigos de clasificación utilizados en la contratación pública en toda la Unión Europea. Ayuda a clasificar y a describir el objeto de los contratos de suministro, servicios y obras con fines de contratación. El sistema de clasificación CPV está diseñado para facilitar la publicación y la comparación de los anuncios de licitación, lo que hace que la búsqueda de oportunidades de contratación pertinentes sea más sencilla para los proveedores y las entidades adjudicadoras.
eTranslation (2) eTranslation es un servicio de traducción automática neuronal ofrecido por la Comisión Europea.
Aprendizaje automático El aprendizaje automático es un tipo de IA que permite que las aplicaciones informáticas «aprendan» de la experiencia y las observaciones previas y, de ese modo, sean más precisas al predecir los resultados sin estar programadas explícitamente para hacerlo.
Inferencia del modelo La inferencia es la fase en la que un modelo de aprendizaje automático entrenado se usa para hacer predicciones sobre nuevos datos.
Entrenamiento del modelo El entrenamiento es una fase crítica en el desarrollo de un modelo de aprendizaje automático en la que el modelo aprende a hacer predicciones basadas en datos.
Procesamiento del lenguaje natural (PLN) El PLN es un campo de la IA que permite que los ordenadores analicen y comprendan el lenguaje humano, tanto escrito como hablado.
Visualización de los procedimientos de contratación pública En la visualización de los procedimientos de contratación pública se agrega la información procedente de todos los anuncios de TED que forman parte de un mismo procedimiento (anuncios relacionados). Esta información se presenta de forma unificada, simplificada e intuitiva. El procedimiento de contratación pública es una nueva forma de presentar los datos de contratación disponibles en los anuncios de TED.
scikit-learn scikit-learn es una biblioteca de aprendizaje automático de código abierto para el lenguaje de programación Python. Proporciona diversos algoritmos de aprendizaje automático, incluidos algoritmos para construir modelos de clasificación.
TED TED, el diario electrónico de licitaciones, es el sitio web (https://ted.europa.eu) gestionado por la Oficina de Publicaciones de la Unión Europea donde se publica el Diario Oficial S (Suplemento del Diario Oficial de la Unión Europea, o DO S). El acceso a TED es gratuito.

 

Todas las licitaciones públicas con contratos por encima de un valor determinado deben publicarse en el DO S.

(1) https://op.europa.eu/es/web/eu-vocabularies/dataset/-/resource?uri=http://publications.europa.eu/resource/dataset/cpv

(2) https://language-tools.ec.europa.eu/

1. Visualización de los procedimientos de contratación pública

En la visualización de los procedimientos de contratación pública, disponible en el portal de la Oficina de Publicaciones, se agrega la información procedente de todos los anuncios de TED que forman parte del mismo procedimiento (anuncios relacionados). Esta información se presenta de forma unificada e intuitiva. La visualización de los procedimientos de contratación pública es una nueva forma de presentar los datos de contratación disponibles en los anuncios de TED (3).

La visualización simplificada está diseñada para que los usuarios sin conocimientos especializados sobre contratación puedan entenderla y usarla fácilmente, lo que la hace accesible para un público más amplio.

(3) https://ted.europa.eu/es/

Figura 1 — Agregación de un procedimiento de contratación pública.

La página de visualización del procedimiento de contratación pública contiene una representación visual del estado y el calendario del procedimiento, así como una representación geográfica de los lugares de ejecución. Los detalles del procedimiento incluyen atributos clave tanto del procedimiento general como de cada lote concreto. Además, la visualización ofrece enlaces directos a todos los anuncios de TED relacionados, lo que garantiza un acceso fácil a la fuente principal de información que se usó para agregar la vista del procedimiento de contratación pública.

2. ¿Qué es el enriquecimiento del CPV?

El enriquecimiento del CPV es una funcionalidad pensada para hacer que sea más fácil encontrar los procedimientos de contratación pública y mejorar la calidad de los resultados de búsqueda, lo que permite optimizar la experiencia del usuario en el portal de la Oficina de Publicaciones. Para ello, el sistema combina varias técnicas de IA, como el PLN y el aprendizaje automático, para inferir nuevos códigos CPV para todos los procedimientos publicados en función de su contenido.

Los nuevos códigos CPV inferidos por el sistema aparecen junto a los originales en la página de detalles del procedimiento. La página distingue claramente entre los códigos CPV originales del procedimiento y los inferidos para que el usuario sepa que los segundos se han generado con ayuda de la IA. Además, los códigos CPV inferidos se integran en los filtros de búsqueda, lo que mejora la experiencia de búsqueda de los usuarios al permitirles filtrar los procedimientos empleando códigos mejorados.

Por ejemplo, en el procedimiento con el título «Luxembourg-Luxembourg: Transport services by van and mini-van with dedicated driver» y la descripción «Transport services by van and mini-van with dedicated driver», el CPV original del anuncio de TED es «60100000» y, basándose en el modelo entrenado, el motor enriquecido ha inferido otro más particular: «60170000 - Hire of passenger transport vehicles with driver».

 

 

3. ¿Cómo funciona el enriquecimiento del CPV?

El sistema de enriquecimiento del CPV se basa en un modelo de clasificación entrenado con la biblioteca scikit-learn. El modelo toma como entrada el contenido de texto de un procedimiento y proporciona como resultado la puntuación de confianza de todos los códigos CPV admitidos. Para obtener las predicciones de los códigos CVP, se ejecutan los siguientes pasos en cada procedimiento:

  • Extracción: se extraen los datos pertinentes del procedimiento, como los títulos y la descripción, que ayudan a inferir los códigos CPV.
  • Traducción: si el contenido del anuncio no está disponible en inglés, el contenido del procedimiento se traduce a dicho idioma mediante el servicio eTranslation.
  • Pretratamiento: el contenido extraído puede contener partes irrelevantes, como símbolos, artículos, conjunciones, etc. Esta información se elimina del contenido del procedimiento porque no ayuda a predecir códigos CPV y puede repercutir en la calidad de la inferencia.
  • Clasificación: el contenido extraído se transmite al modelo de clasificación para predecir la puntuación de confianza de cada código CPV de las clases predefinidas.
  • Filtrado: para determinar qué códigos CVP deben conservarse para el procedimiento, las puntuaciones de confianza obtenidas se comparan con un valor umbral que se determina en la fase de entrenamiento del modelo. Si la puntuación de confianza de un código CPV es superior al umbral, se considera pertinente para el procedimiento. Por ejemplo, si el modelo predice una puntuación de confianza de 0,7 para el código CPV 85000000 y el umbral es 0,6, el sistema considera que el código CPV está relacionado con el procedimiento.

El modelo se ha entrenado con todo el conjunto de procedimientos publicados en el portal para aprender a inferir códigos CPV. Se entrenan distintas configuraciones del modelo con el 80 % de los datos y se evalúan para escoger la que ofrece la mejor calidad de predicción. El 20 % restante de los datos se utiliza para probar la calidad del modelo con datos que no se han usado durante el entrenamiento. Todos los códigos CPV inferidos con una puntuación de confianza inferior al umbral configurado se desactivan para evitar que el sistema los prediga o los use de forma incorrecta, aunque es posible que se produzcan errores u omisiones en la inferencia del CPV de todos modos.

El modelo de clasificación se entrena y ajusta manualmente, y el modelo con la mejor calidad de predicción se usa para inferir automáticamente CPV adicionales en procedimientos de contratación que acaban de procesarse.

4. ¿Qué datos se utilizan para el enriquecimiento del CPV?

El sistema de enriquecimiento del CPV usa los procedimientos disponibles públicamente en el portal de la Oficina de Publicaciones para aprender a inferir códigos CPV. El sistema actual se ha entrenado con 2,5 millones de procedimientos publicados desde 2011 hasta la fecha.

Se extrae la siguiente información de todos los procedimientos utilizados por el sistema para entrenar el modelo de inferencia:

  • Título del procedimiento
  • Breve descripción del procedimiento
  • Título de los lotes (si el procedimiento contiene lotes)
  • Breve descripción de los lotes (si el procedimiento contiene lotes)
  • Los códigos CPV principales y adicionales ya incluidos en el procedimiento
  • Los códigos CPV principales y adicionales de los lotes (si el procedimiento contiene lotes)

Esta información se publica sobre la base del principio de transparencia aplicable a todas las políticas y a la legislación de la UE. No se utilizan datos personales para entrenar y mejorar el sistema de enriquecimiento del CPV.

5. Limitaciones actuales

  • El sistema puede inferir códigos CPV de hasta cinco dígitos (divisiones, grupos, clases y categorías). Sin embargo, no admite niveles inferiores.
  • El sistema solo admite códigos CPV para los que se haya validado una buena calidad de inferencia, una condición que se cumple en el 61 % de los códigos CPV de hasta cinco dígitos.
  • El sistema solo permite aplicar la inferencia en los procedimientos publicados desde 2011.

6. Exención de responsabilidad

Cabe señalar que el portal de la Oficina de Publicaciones incluye contenido creado con IA u otras tecnologías automáticas. Dicho contenido se proporciona únicamente con fines informativos y no debe utilizarse para ningún propósito específico sin verificar su exactitud o integridad.

La vista de los procedimientos de contratación pública combina distintas técnicas de IA para recoger datos y hacer que sea más fácil encontrar anuncios de licitaciones pertinentes publicados en TED con el objetivo de simplificar los métodos de búsqueda y ayudar a emplearlos.

La función del enriquecimiento del CPV y sus resultados generados por IA (es decir, los códigos CPV inferidos) están completamente automatizados. En algunos casos, pueden producirse errores debido a la complejidad del sistema o de los datos.

La vista de los procedimientos de contratación pública usa únicamente datos disponibles en el DO S publicados en TED, el diario electrónico de licitaciones(https://ted.europa.eu/es/). No obstante, la única información oficial relativa a las licitaciones y los anuncios correspondientes es la publicada en el Suplemento del Diario Oficial de la UE (DO S).

Aunque se han adoptado todas las medidas necesarias para asegurar que el contenido producido por tecnología de IA sea de la mayor calidad posible, no puede garantizarse su exactitud. Por consiguiente, la Oficina de Publicaciones y las instituciones de la UE renuncian a toda responsabilidad por cualquier error u omisión derivados de aplicar tecnologías de IA.

No puede asumirse responsabilidad alguna por las consecuencias de confiar en dicho contenido generado por IA. Se aconseja a los usuarios que lo utilicen con cautela y se recomienda aplicar una mayor diligencia debida.