Visualização dos procedimentos de contratação pública
Nota informativa sobre a explicabilidade
Índice
GLOSSÁRIO
Termo ou expressão | Definição |
---|---|
Inteligência artificial (IA) | A inteligência artificial (IA) é uma tecnologia que permite aos computadores e às máquinas simular ou imitar a inteligência e as capacidades de resolução de problemas humanas. |
Modelo de classificação | Um modelo de classificação é um tipo de modelo de aprendizagem automática que categoriza ou classifica dados em classes predefinidas ou com etiquetas predefinidas. O modelo recebe dados de entrada e faz uma previsão da categoria ou classe a que estes dados pertencem. |
CPV (Vocabulário Comum para os Contratos Públicos) | O CPV (Vocabulário Comum para os Contratos Públicos) (1) é um sistema estruturado de códigos de classificação utilizados nos contratos públicos em toda a União Europeia. Este sistema ajuda a classificar e descrever o objeto dos contratos de fornecimento, de prestação de serviços e de empreitadas para efeitos de contratação pública. O sistema de classificação CPV foi concebido para facilitar a publicação e a comparação dos anúncios de concurso, tornando a procura de oportunidades de contratação pertinentes mais fácil para os fornecedores e para as entidades adjudicantes. |
eTranslation (2) | O eTranslation é um serviço de tradução automática neuronal disponibilizado pela Comissão Europeia. |
Aprendizagem automática | A aprendizagem automática é um tipo de inteligência artificial (IA) que permite às aplicações informáticas «aprender» com base em experiências e reações anteriores, tornando assim a previsão de resultados mais correta sem serem explicitamente programadas para o efeito. |
Inferência do modelo | A inferência do modelo é a fase em que um modelo de aprendizagem automática previamente treinado é utilizado para realizar previsões face a novos dados. |
Treino do modelo | O treino do modelo é uma fase crítica no desenvolvimento de um modelo de aprendizagem automática, na qual o modelo aprende a realizar previsões com base em dados. |
Processamento de Linguagem Natural (PLN) | O processamento de linguagem natural (PLN) é um domínio da inteligência artificial (IA) que permite aos computadores analisar e compreender a linguagem humana, tanto escrita como falada. |
Visualização dos procedimentos de contratação pública | A «Visualização dos procedimentos de contratação pública» agrega as informações de todos os anúncios TED pertencentes ao mesmo procedimento (anúncios conexos) e apresenta-as de forma unificada, simplificada e de fácil utilização. O procedimento de contratação pública é um novo conceito de apresentação dos dados relativos aos contratos públicos disponíveis nos anúncios do TED. |
scikit-learn | A «scikit-learn» é uma biblioteca de aprendizagem automática de código-fonte aberto para a linguagem de programação Python. Esta biblioteca contém vários algoritmos de aprendizagem automática, incluindo algoritmos para construir modelos de classificação. |
TED | O TED — «Diário eletrónico dos concursos» é o sítio Web (https://ted.europa.eu) gerido pelo Serviço das Publicações da União Europeia no qual é publicado o Jornal Oficial S (o Suplemento do Jornal Oficial da União Europeia, ou JO S). O acesso ao TED é gratuito.
Todos os concursos públicos que ultrapassem determinados valores contratuais devem ser publicados no JO S. |
(2) https://language-tools.ec.europa.eu/
1. Visualização dos procedimentos de contratação pública
A visualização dos procedimentos de contratação pública, disponível no portal do Serviço das Publicações, agrega informações de todos os anúncios TED pertencentes ao mesmo procedimento (anúncios conexos) e apresenta-as numa visualização única e de intuitiva. A visualização dos procedimentos de contratação pública é uma nova forma de apresentar os dados relativo a contratos públicos disponível nos anúncios do TED (3).
Esta visualização simplificada foi concebida para ser facilmente compreendida e navegável pelos utilizadores sem conhecimentos especializados em matéria de contratos públicos, tornando-a acessível a um público mais vasto.
Figura 1 — Agregação dos procedimentos de contratação pública.
A página de visualização dos procedimentos de contratação pública contém uma representação gráfica do estado e uma linha cronológica do procedimento, bem como uma representação geográfica dos locais de execução. As informações pormenorizadas do procedimento incluem atributos-chave tanto do procedimento geral como de cada lote individual. Além disso, esta visualização disponibiliza ligações diretas para todos os anúncios conexos do TED, assegurando um acesso fácil à fonte primária de informação que foi utilizada para criar a visualização agregada dos procedimentos de contratação pública.
2. O que é o enriquecimento com códigos CPV?
O enriquecimento com códigos CPV é uma funcionalidade que visa melhorar a visibilidade dos procedimentos de contratação pública para aperfeiçoar a experiência de utilizador do portal do Serviço das Publicações, aumentando a qualidade dos resultados da pesquisa. Para o conseguir, o sistema combina várias técnicas de inteligência artificial (IA), como o processamento de linguagem natural (PLN) e a aprendizagem automática, para inferir novos códigos CPV para todos os procedimentos publicados, com base no seu conteúdo.
Os novos códigos CPV inferidos pelo sistema aparecem ao lado dos códigos CPV originais na página de detalhes do procedimento. A página estabelece uma distinção clara entre os CPV originais do procedimento e os CPV inferidos, de modo a informar o utilizador de que estes últimos são gerados com a ajuda de IA. Além disso, os códigos CPV inferidos são integrados nas facetas de pesquisa, melhorando a experiência de pesquisa do utilizador ao permitir-lhe filtrar os procedimentos com base em códigos melhorados.
Por exemplo, se considerarmos o procedimento com o título «Luxemburgo-Luxemburgo: Serviços de transporte por carrinha e monovolume com motorista dedicado» e a descrição «Serviços de transporte por carrinha e monovolume com motorista dedicado», o CPV original do anúncio do TED é «60100000 — Serviços de transporte rodoviário» e, com base no modelo treinado, o motor de enriquecimento inferiu outro código mais específico: «60170000 — Aluguer de veículos para transporte de passageiros com condutor».
3. Como funciona o enriquecimento com códigos CPV?
O sistema de enriquecimento com códigos CPV baseia-se num modelo de classificação treinado com a biblioteca «scikit-learn». O modelo recebe como dados de entrada o conteúdo textual de um procedimento e produz uma classificação de confiança para todos os códigos CPV suportados. Em cada procedimento são executados os seguintes passos para obter a previsão dos códigos CPV:
- Extração: é extraído do procedimento o conteúdo relevante, como os títulos e a descrição dos procedimentos, que ajudam a inferir os códigos CPV.
- Tradução: se o conteúdo do anúncio não estiver disponível em inglês, este conteúdo é traduzido para inglês através do serviço eTranslation.
- Pré-processamento: o conteúdo extraído pode conter partes irrelevantes, tais como símbolos, artigos, conjunções, etc. Estas informações não ajudam a realizar uma previsão de códigos CPV e podem afetar a qualidade da inferência, pelo que esta parte do conteúdo do procedimento é ignorada.
- Classificação: o conteúdo extraído é enviado ao modelo de classificação para que realize uma previsão de um valor de confiança para cada código CPV das classes predefinidas.
- Filtros: para determinar que códigos CPV devem ser mantidos para o procedimento, as classificações de confiança obtidas são comparadas com um limiar determinado durante a fase de treino do modelo. Se a classificação de confiança de um código CPV for superior ao limiar, o código é considerado relevante para o procedimento. Por exemplo, se o modelo realiza uma previsão com um valor de confiança de 0,7 para o código CPV 85000000 e o limiar for 0,6, o sistema considera que o código CPV inferido está relacionado com o procedimento.
Para aprender a inferir códigos CPV, o modelo foi treinado com base no conjunto total de procedimentos publicados no Portal. O modelo foi treinado e avaliado com várias configurações utilizando 80 % dos dados para conservar a configuração com maior qualidade de previsão. Os restantes 20 % dos dados foram utilizados para testar a qualidade do modelo com dados não usados durante o treino. Todos os códigos CPV inferidos com um valor de confiança inferior ao limiar configurado são desativados para evitar que estes códigos sejam incorretamente incluídos nas previsões ou utilizados pelo sistema, mas ainda assim podem ocorrer erros ou omissões de inferência dos códigos CPV.
O modelo de classificação é treinado e ajustado manualmente e o modelo cuja previsão atingir maior qualidade é utilizado para inferir automaticamente códigos CPV adicionais em procedimentos de contratação pública recentes.
4. Que dados são utilizados para o enriquecimento com códigos CPV?
O sistema de enriquecimento com códigos CPV utiliza os procedimentos publicamente disponíveis no portal do Serviço das Publicações para aprender a inferir códigos CPV. O sistema atual foi treinado com base em 2,5 milhões de procedimentos publicados desde 2011.
Para treinar o modelo de inferência são extraídas de todos os procedimentos utilizados pelo sistema as seguintes informações:
- Título do procedimento;
- Breve descrição do procedimento;
- Designação dos lotes (se o procedimento estiver dividido em lotes);
- Breve descrição dos lotes (se o procedimento estiver dividido em lotes);
- Os códigos CPV principal e adicionais já incluídos no procedimento.
- Os códigos CPV principais e adicionais dos lotes (se o procedimento estiver dividido em lotes).
Estas informações são publicadas com base no princípio da transparência aplicável a todas as políticas e a toda a legislação da UE. Não são utilizados dados pessoais para treinar e melhorar o sistema de enriquecimento com códigos CPV.
5. Limitações atuais
- O sistema pode inferir códigos CPV até 5 algarismos (divisões, grupos, classes e categorias). Os níveis inferiores não são suportados.
- O sistema apenas indica os códigos CPV para os quais foi validada uma inferência de boa qualidade, o que representa 61 % dos potenciais códigos CPV até 5 dígitos.
- O sistema apenas suporta inferências para os procedimentos publicados a partir de 2011.
6. Declaração de exoneração de responsabilidade
Informamos que o Portal do Serviço das Publicações contém conteúdos criados por IA ou outras tecnologias automatizadas. Esses conteúdos são fornecidos apenas a título informativo e não devem ser utilizados para qualquer efeito específico sem que a sua exatidão ou exaustividade sejam verificadas.
A visualização dos procedimentos de contratação pública combina várias técnicas de IA para recolher dados, a fim de melhorar a facilidade de localização dos anúncios de concursos conexos publicados no TED, com o objetivo de simplificar e prestar assistência na pesquisa.
A funcionalidade de enriquecimento com códigos CPV e os resultados gerados pela IA dela resultante, ou seja, os códigos CPV inferidos, são totalmente automatizados. Em alguns casos, podem ocorrer erros devido à complexidade do sistema ou dos dados. A visualização dos procedimentos de contratação pública utiliza exclusivamente os dados disponíveis nos suplementos do JO publicados no TED, Diário Eletrónico dos Concursos (https://ted.europa.eu).
Não obstante, as únicas informações oficiais relativas aos convites à apresentação de propostas e aos anúncios correspondentes são as publicadas no Suplemento do Jornal Oficial da UE (JO S). Embora tenham sido tomadas todas as medidas necessárias para garantir que os conteúdos produzidos pela tecnologia de IA sejam da maior qualidade possível, não é possível garantir a sua exatidão.
Por conseguinte, o Serviço das Publicações e as instituições da UE rejeitam toda e qualquer responsabilidade decorrente de eventuais erros ou omissões nos resultados resultantes da aplicação de técnicas de IA. Não se pode assumir qualquer responsabilidade por eventuais consequências decorrentes do recurso a estes conteúdos gerados por IA. Aconselhamos os utilizadores a utilizá-los com precaução e recomendamos uma vigilância redobrada.