Publications Office of the EU
Legal notices: Virtual assistant, the explainability notice - A Kiadóhivatal
DisplayCustomHeader
Dockbar
Tájékoztatás

Virtuális asszisztens: Tájékoztatás

Publio – Az Európai Unió Kiadóhivatala portáljának (Kiadóhivatali portál) intelligens asszisztense

Utolsó frissítés: 2023/05/16

Az Európai Unió Kiadóhivatala portáljának intelligens asszisztense, a Publio a mesterséges intelligencia (MI) olyan eszköze, amely interaktív kapcsolatban áll természetes személyekkel, és a Kiadóhivatali portálon nyilvánosan elérhető információk alapján, kulcsszavakkal végez kereséseket.
E dokumentum tájékoztatást nyújt a felhasználóknak a mesterséges intelligenciára vonatkozó szabályozási keretről és ebben az összefüggésben a Publio működésére vonatkozó elvekről. Az Európai Unió Kiadóhivatala elkötelezett az átláthatóság, valamint a megbízható és megmagyarázható mesterséges intelligencia iránt.

A mesterséges intelligenciával (MI) kapcsolatos átláthatóság – általános elvek

Az uniós intézmények tevékenységének átláthatósága és nyitottsága központi jelentőséggel bír a jó kormányzás és a civil társadalom részvétele tekintetében, ahogy azt az Európai Unió működéséről szóló szerződés (EUMSZ) 15. cikke rögzíti. E cikk az alábbiakról rendelkezik:

„1. A jó kormányzás előmozdítása és a civil társadalom részvételének biztosítása céljából az Unió intézményei, szervei és hivatalai munkájuk során a nyitottság elvének lehető legnagyobb mértékű tiszteletben tartásával járnak el.”

Az Európai Unió Alapjogi Chartájának 41. cikke (a megfelelő ügyintézéshez való jog) rögzíti, hogy a közigazgatási szervek kötelesek megindokolni döntéseiket.

Az Európai Bizottság által létrehozott, mesterséges intelligenciával foglalkozó magas szintű szakértői csoport által 2019-ben készített, a megbízható mesterséges intelligenciára vonatkozó etikai iránymutatások (1. függelék) című dokumentum az átláthatóságot azon hét követelmény egyikeként sorolja fel (2. függelék), amelyeknek az MI-rendszereknek meg kell felelniük. Ezen iránymutatások rögzítik továbbá, hogy az átláthatóság a megmagyarázhatóság elvének egyik eleme, amely megköveteli az érintett adatkészletek és technikai folyamatok átláthatóságát, valamint az MI-rendszerek képességeire és céljaira vonatkozó nyílt tájékoztatást. Ezért az adatkészleteknek és a technikai folyamatoknak dokumentálhatónak, nyomon követhetőnek, megmagyarázhatónak és értelmezhetőnek kell lenniük.

A fent felsorolt elveket a mesterséges intelligencián alapuló megoldások és eszközök uniós intézmények, hivatalok, szervek és ügynökségek általi fejlesztésére, bevezetésére és használatára kell alkalmazni.

Ezen általános elvek alapján az emberek MI-rendszerrel fennálló interaktív kapcsolatuk során előzetesen tájékoztatni kell őket e kapcsolat tényéről. Ez lehetővé teszi a felhasználók számára, hogy megalapozott döntést hozzanak az interaktív kapcsolat folytatásáról, vagy az eszköz használatának befejezéséről.

Az átláthatóságra vonatkozó szabályokkal összhangban a felhasználók számára biztosítani kell továbbá a szükséges információkat, hogy segítséget kapjanak a rendszer eredményeinek értelmezésében és azok megfelelő felhasználásában.

Megbízható, megmagyarázható mesterséges intelligencia

A megbízható és megmagyarázható mesterséges intelligencia az EU egyik kulcsfontosságú célkitűzése. Az EU a mesterséges intelligenciára vonatkozó szabályozási keret kialakításán dolgozik. A mesterséges intelligenciára vonatkozó harmonizált szabályok megállapításáról szóló rendeletre (a továbbiakban: a mesterséges intelligenciáról szóló jogszabály) irányuló, 2021. április 21-i európai bizottsági javaslat (3. függelék) két fő kötelezettségvállalást vezet be a mesterséges intelligencián alapuló megoldások és eszközök szolgáltatói részére: az átláthatóságot és az információszolgáltatást.

Az MI-rendszerek felhasználóinak joguk van információkhoz jutni. Ez a jog együtt jár a megfelelő kötelezettségekkel, például azzal a kötelezettséggel, hogy a rendszert az utasításoknak megfelelően kell használni és ellenőrizni kell az érintett MI-eszköz teljesítményét. E szabályok betartása valamennyi érintett szereplő elszámoltathatóságát eredményezi.

A mesterséges intelligenciáról szóló jogszabályjavaslat 52. cikke (Egyes MI-rendszerekre vonatkozó átláthatósági kötelezettségek) rögzíti, hogy: „1. A szolgáltatók biztosítják, hogy a természetes személyekkel fennálló interaktív kapcsolatot szolgáló MI-rendszereket úgy tervezzék meg és fejlesszék ki, hogy a természetes személyek tájékoztatást kapjanak arról, hogy valamely MI-rendszerrel állnak interaktív kapcsolatban, kivéve, ha ez a feltételek, illetve a használat körülményei alapján nyilvánvaló. […] “

A mesterséges intelligenciáról szóló jogszabályjavaslat kockázatalapú megközelítést alkalmaz, és megkülönbözteti a mesterséges intelligencia-rendszereket aszerint, hogy használatuk i. elfogadhatatlan kockázattal, ii. magas kockázattal, vagy iii. alacsony vagy minimális kockázattal jár-e.

A Publio, a Kiadóhivatal portáljának intelligens asszisztense interaktív kapcsolatban áll természetes személyekkel, és a Kiadóhivatal portálján nyilvánosan elérhető információk alapján, kulcsszavakkal végez kereséseket. Ezen információk a valamennyi uniós szakpolitika és jogszabály alapjául szolgáló átláthatóság elve alapján kerülnek közzétételre. Az intelligens asszisztens nem hoz létre új tartalmakat és nem manipulálja, illetve nem befolyásolja a felhasználók döntéseit azon túl, hogy lehetséges szűrési lehetőségeket javasol a felhasználók kereséséhez. Ezért a Publio-t a mesterséges intelligenciáról szóló jogszabálytervezetben meghatározott „alacsony kockázatú” iii. kategóriába tartozónak tekinthető.

A mesterséges intelligenciáról szóló jogszabálytervezet IV. címe (Átláthatóság) rögzíti, hogy az MI-rendszerek tervezése és működése során figyelembe kell venni 1) a tudatalatti technikákon keresztüli manipulációval, azaz a felhasználók tudatán túli technikákkal, illetve 2) a veszélyeztetett csoportok olyan, a valószínűséggel pszichológiai, illetve fizikai sérelmet okozó kizsákmányolásával összefügésben esetleg felmerülő konkrét kockázatokat. Szigorúbb átláthatósági kötelezettségek vonatkoznak azokra a rendszerekre, amelyek i. emberekkel állnak interaktív kapcsolatban, ii. biometrikus adatok alapján az érzelmek felismerésére vagy a (társadalmi) kategóriákkal való összefüggések meghatározására kerülnek felhasználásra, vagy iii. tartalmakat generálnak vagy manipulálnak („mélykamuk”). Bár a Publio interaktív kapcsolatban áll természetes személyekkel, az intelligens asszisztenst nem arra tervezték, hogy manipuláció céljából felismerje az érzelmeket, és az eszköz nem tartalmaz olyan elemeket sem, amelyek véletlenül ilyen eredményhez vezethetnek. Ezért a Publio nem felel meg a fent említett kritériumoknak.

A mesterséges intelligencia és a felelősség

Az Európai Parlament határozatának az EUMSZ 225. cikke (5. függelék) alapján történő elfogadása után az Európai Bizottság mesterséges intelligenciáról szóló jogszabályjavaslata 2022. szeptember 28-án kiegészítésre került a mesterséges intelligenciára vonatkozó polgári jogi felelősségi rendszerre – a mesterséges intelligenciával kapcsolatos felelősségről szóló irányelv (4. függelék) (a továbbiakban: a mesterséges intelligenciával összefüggő felelősségről szóló irányelv) – irányuló javaslattal.

A mesterséges intelligenciával kapcsolatos felelősségről szóló irányelvjavaslat alapján a vétkességen alapuló, meglévő felelősségi szabályok nem alkalmasak a mesterséges intelligencián alapuló termékek és szolgáltatások által okozott károkkal kapcsolatos kártérítési igények kezelésére. A felelősségre vonatkozó hatályos szabályok értelmében a károsultaknak bizonyítaniuk kell, hogy jogellenes cselekményre vagy mulasztásra került sor, azonosítaniuk kell a kárt okozó személyt, és meg kell állapítaniuk az okozati összefüggést. A mesterséges intelligencia sajátos jellemzői, többek között összetettsége, autonómiája és átláthatatlansága (az úgynevezett feketedoboz-hatás) megnehezíti a mesterséges intelligencia használatából eredő károkért felelős személy azonosítását. Az ilyen kárt elszenvedő károsultakat ezért vonakodhatnak attól, hogy kártérítési igénnyel éljenek. Tekintettel a bizonyítási teher kérdésének jellegére, a mesterséges intelligenciával kapcsolatos felelősségről szóló irányelvjavaslat innovatív megoldásokat kínál azáltal, hogy a közzétételek és a meg nem felelés megdönthető vélelme révén enyhíti a fent leírt követelményeket.

A mesterséges intelligenciával kapcsolatos felelősségről szóló irányelvjavaslat hatékony eszközöket biztosít a potenciálisan felelős személyek azonosításához és a releváns bizonyítékok feltárásához. Az irányelvjavaslat rögzíti például, hogy a nemzeti bíróság elrendelheti a konkrét, feltételezetten kárt okozó, nagy kockázatú MI-rendszerekre vonatkozó releváns bizonyítékok bemutatását (és azok megőrzését) (6. függelék). Ezen túlmenően, a javasolt irányelv 4. cikkében meghatározott követelményekre figyelemmel, a nemzeti bíróságoknak vélelmezniük kell [...] az alperes vétkessége és az MI-rendszer által előállított eredmény (vagy az MI-rendszer eredményének hiánya) közötti okozati összefüggést.

Ahogy az a mesterséges intelligenciával kapcsolatos felelősségről szóló irányelvjavaslat indokolásában is szerepel, „[a]z ilyen hatékony polgári jogi felelősségi szabályok azzal a további előnnyel járnak, hogy a mesterségesintelligencia-rendszerekkel kapcsolatos tevékenységekben részt vevő valamennyi szereplő számára további ösztönzést nyújtanak arra, hogy eleget tegyenek az elvárható magatartással kapcsolatos kötelezettségeiknek”.

A Publio-ról

Kifejezések és fogalommeghatározások

Kifejezés Fogalommeghatározás
Egységes besorolási jegyzékek A különböző környezetben (webplatformok, rendszerek és alkalmazások) használt kódok és kapcsolódó címkék harmonizálására és szabványosítására, valamint az uniós intézmények közötti adatcsere megkönnyítésére – például a döntéshozatali folyamatok keretében – az egységes besorolási jegyzékek (más néven Named Authority Lists vagy NAL) szolgálnak. Ilyen egységes besorolási jegyzékek például a nyelvek, országok, szervezeti egységek kodifikált jegyzékei...
Csevegőrobot A csevegőrobot olyan mesterségesintelligencia-rendszer, amelyet arra terveztek, hogy szimulálja az emberi beszélgetést, és szöveg vagy beszéd útján kommunikáljon a felhasználókkal. Természetes nyelvfeldolgozási (NLP) módszereket alkalmaz a felhasználói bevitel megértésére és az azokra való reagálásra, automatizált segítségnyújtásra, tájékoztatásra, illetve előre meghatározott szabályok, illetve algoritmusok alapján meghatározott feladatok elvégzésére. A csevegőrobotokat gyakran használják különböző alkalmazásokban, például ügyféltámogatáshoz, virtuális asszisztensekhez és online üzenetküldő platformokon, hogy megkönnyítsék a kommunikációt és azonnali választ adjanak a felhasználói érdeklődésre.
Beszélgetésen alapuló mesterséges intelligencia A beszélgetésen alapuló mesterséges intelligencia a mesterséges intelligencia olyan formája, amely megkönnyíti az ember és a számítógép közötti valós idejű, emberszerű beszélgetést.
Beszélgetésfolyam A „beszélgetésfolyam” kifejezés a csevegőrobot és a felhasználó közötti beszélgetés (felhasználói út) zökkenőmentes és logikus előrehaladását jelenti. A kifejezés arra utal, ahogyan a csevegőrobot értelmezi a felhasználó szándékát, megfelelő válaszokat ad és a beszélgetést a felhasználó kinyilvánított céljainak, illetve szándékának eléréséhez, illetve végrehajtásához vezeti.
Adategyed Ebben az összefüggésben az „adategyed” kifejezés olyan információra utal, amely kinyerhető a felhasználó által bevitt, a felhasználó célja szempontjából releváns információból, azaz lehetővé teszi annak megértését, hogy mi a felhasználó célja. Ezeket az információkat azonosítják és tárolják, hogy pontosan kinyerjék a felhasználó által keresett információkat. Az adategyedre példa lehet egy adott cikk szerzője.
EU Vocabularies vagy EuroVoc Az Eurovoc (EU Vocabularies) a Kiadóhivatal által kezelt, az EU tevékenységeit lefedő többnyelvű, multidiszciplináris egységes besorolási jegyzékek egyedi állománya. Az EU 24 hivatalos nyelvén, valamint az EU tagjelölt országainak három nyelvén tartalmaz kifejezéseket: albán, macedón és szerb.
Szándék Ebben az összefüggésben a „szándék” kifejezés arra a célra utal, amelyre a felhasználó gondol, amikor egy kérdést vagy megjegyzést ír le, illetve mond be (érdeklődés). A szándék olyan elképzelést, illetve koncepciót jelent, amelyet a felhasználó által küldött üzenet (kijelentés) tartalmazhat. Szándék például az, ha egy felhasználó egy adott témára, egy adott kiadványra vagy személyre kíván keresni.
Nyelvi modell A nyelvi modell a mesterséges intelligencia (MI) olyan típusú programja, amelynek célja a természetes nyelv elemzése és megértése. A modell statisztikai és valószínűségszámítási módszereket használ, hogy előre jelezze egy adott mondatban vagy szövegsorban a valószínűleg következő szavakat, illetve mondatokat. Más szóval a nyelvi modell olyan eszköz, amely a bevitel szövegkörnyezetén és tartalmán alapuló teljes mondatok generálására, illetve kiegészítésére használható.
Language Understanding (nyelvértés) (LUIS) Felhőalapú beszélgetésen alapuló MI-szolgáltatás, amely egyedi gépi tanuláson alapuló intelligenciát alkalmaz a felhasználó beszélgetésen alapuló, természetes nyelvű szövegére az általános jelentés előrejelzése és a releváns, részletes információk kiszűrése érdekében.
Nagy nyelvi modell (LLM) A nagy nyelvi modell (LLM) a mesterséges intelligencia egy fejlett típusa, amelyet nagy nyelvi korpuszon tanítanak be, hogy megértse az emberi nyelvet és maga is generáljon szöveget. Az LLM-ek mélytanulási technikák segítségével elemzik a kontextust, értelmezik a különféle jelentésárnyalatokat és azonosítják be a nyelvi mintákat. Ennek segítségével összetett kifejezéseket dolgoznak fel, és koherens, kontextuálisan megfelelő válaszokat adnak.
Gépi tanulás (ML) A gépi tanulás (ML) a mesterséges intelligencia egyik típusa, amely lehetővé teszi a szoftveralkalmazások számára, hogy „tanuljanak” a múltbeli gyakorlatból és visszajelzésekből, és ezáltal pontosabbak legyenek az eredmények előrejelzésében anélkül, hogy erre konkrétan programoznák őket.
Természetes nyelvi feldolgozás (NLP) A természetes nyelvi feldolgozás (NLP) a mesterséges intelligencia (MI) egyik területe, amely lehetővé teszi a számítógépek számára, hogy mind írásban, mind szóban elemezzék és megértsék az emberi nyelvet.
Keresési út A „keresési út” kifejezés azon interaktív kapcsolatok sorozatára utal, amelyen a felhasználó konkrét információk keresésekor végighalad. E folyamat során a felhasználó kérdéseken és válaszokon keresztül történő eligazításával kerül a keresési szándéka azonosításra és végrehajtásra. A csevegőrobottal végzett keresés magában foglalja a felhasználó érdeklődésének megértését, a releváns információk adatbázisból vagy tudásbázisból való lekérését, valamint az információknak a felhasználó számára könnyen érthető és a felhasználó igényei szempontjából releváns módon történő bemutatását.
Felhasználói út Egy adott személynek egy weboldal vagy alkalmazás használata során szerzett tapasztalata, amely az adott weboldalon vagy alkalmazásban egy adott cél elérése érdekében végrehajtott cselekvéssorozatból áll.
Kijelentés Felhasználó általi bevitel, amely lehet beszélgetés során gépelt vagy mondott bármely üzenet. Egy kijelentés állhat egyetlen szóból vagy több szóból, például egy kérdésből vagy egy mondatból.

Mi az a Publio?

A Publio, a Kiadóhivatali portál intelligens asszisztense olyan mesterségesintelligencia-eszköz, amely természetes személyekkel áll interaktív kapcsolatban, és a Kiadóhivatali portálon nyilvánosan elérhető információk alapján, kulcsszavakkal végez kereséseket. A Publio interaktív hangfelismerő és hagyományos keresőrendszerekkel ötvözi a mesterséges intelligencia (MI) beszélgetésen alapuló módszereit, például a természetes nyelvi feldolgozást (NLP) és a gépi tanulást (ML) annak érdekében, hogy segítse a felhasználókat abban, hogy megtalálják az uniós kiadványokat, az uniós jogszabályokat és az európai intézmények kapcsolattartóit.

Az intelligens asszisztens konkrétan lehetővé teszi a végfelhasználók és a Kiadóhivatali portál közötti szóbeli, illetve gépelt beszélgetéseket. Az intelligens asszisztens jelenleg angol, francia és spanyol nyelven áll rendelkezésre. Bár az intelligens asszisztens mindenki által használható, az olvasási nehézségekkel küzdők igényeihez igazított megoldást is kínál, ezáltal növelve az akadálymentes hozzáférést. Lehetővé teszi továbbá a keresés új módjának számító beszélgetésen alapuló keresést, amely lehetővé teszi a felhasználók számára, hogy a szokásos beszélgetéshez hasonlóan teljes mondatokat mondjanak egy mesterséges intelligencián alapuló hangasszisztensnek, amely visszaküldi a válaszokat, így a felhasználó és az intelligens asszisztens közötti információcsere beszélgetés formájában valósul meg.

Milyen típusú adatokat használ fel a Publio?

A Publio a Kiadóhivatali portálon nyilvánosan elérhető információkat használja fel. Ezen információk az összes uniós szakpolitikára és jogszabályra alkalmazandó átláthatóság elve alapján kerülnek közzétételre. E korpusz alapján a Publio a Kiadóhivatali portálon elérhető osztályozásokat és kategóriákat – például Eurovoc tantárgyakat, szerzőket, illetve formátumot – használ a beszélgetés irányítására és finomítására annak érdekében, hogy segítse a felhasználót a Kiadóhivatali portál három fő gyűjteményében való keresésben: uniós kiadványok, uniós jogszabályok és az EU hivatalos név- és címjegyzéke (EU Whoiswho).

A Publio egy meglévő nyelvi modellt használ a felhasználók által feltett kérdések megértésére és arra, hogy a felhasználókat végig eligazítsa a keresési útjuk során. A felhasználók visszajelzései alapján a Publio nyelvi modellt folyamatosan továbbfejlesztik és tanítják, hogy megfeleljen a felhasználói elvárásoknak és képes legyen kezelni a felhasználói bevitel sokféleségét a támogatott három nyelven.

E tanítás a Publio mögöttes rendszerének több alkotóelemére terjed ki:

  • A szándék különböző lehetséges formáihoz kapcsolódó kijelentések előre meghatározott sorozata, amely lehetővé teszi a Publio számára, hogy először is megértse a felhasználó végcélját, másodszor pedig lépésről lépésre eligazítsa a felhasználót e cél elérése felé.
  • Előre meghatározott kérdések sorozata, amelyeket a Publio „megért” és amelyekre előre meghatározott választ adhat a felhasználóknak. Példa: Hogyan rendelhetek kiadványokat?
  • Gépi tanulási adategyedek, amelyeket a Publio azonosítani tud és háttérfolyamataiban fel tud használni arra, hogy észlelje a keresési paramétereket, pontosabb találatokat adjon vagy szűkítse a keresést. Ezek az adategyedek az adatok meglévő osztályozásán és adatkategóriáin alapulnak, mint például az Eurovoc tezauruszok vagy az EuroVoc által kezelt egyéb egységes besorolási jegyzékek: szerzők, formátumok, nyelvek, uniós szervek (szervezetek), funkcionális szerepkörök az uniós közszolgáltatásban stb. Ennek alapján a Publio például a felhasználó érdeklődése alapján megértheti, hogy a felhasználó egy adott témájú vagy egy adott szerző által szerzett kiadványt keres-e.

Hogyan működik a Publio?

A Publio a Microsoft Language Understanding (LUIS) szolgáltatást használja (7. függelék), amit egy adategyed-kinyerő rendszeren alapuló nagy nyelvi modellel (LLM) ötvöz, hogy pontosan és hatékonyan dolgozza fel a felhasználói inputot (írásbeli vagy szóbeli közlést). A LUIS először is felméri a felhasználó szándékát és a rendelkezésre bocsátott adategyedeket. Az összetettebb lekérdezések esetében az LLM-összetevő finomhangolja az információk felismerését, ami az árnyalt kifejezések vagy összetett kérések esetében jobb eredményeket nyújt. A felismert szándék és adategyedek alapján a Publio személyre szabott beszélgetést kezdeményez, hogy a felhasználók néhány egyszerű lépésben választ kapjanak kérdésükre.

A Publio jelenleg 4 fő beszélgetésfolyamot hajt végre:

  • Dokumentumkeresés, amelynek segítségével a felhasználók uniós kiadványokra vagy uniós jogi dokumentumokra kereshetnek
  • Személykeresés, amely segíti a felhasználókat az uniós intézményeknél dolgozó köztisztviselők keresésében
  • Szervezeti keresési folyamat, amely segíti a felhasználókat az uniós szervek (szervezetek) keresésében
  • Kérdések és válaszok (QnA) folyama a gyakori kérdések előre meghatározott válasszal történő megválaszolására.

A „keresési” folyam felismerése esetén a virtuális asszisztens eligazítja a felhasználót a releváns dokumentumok, személyek vagy szervezetek keresése során azáltal, hogy egyszerű kérdéseket tesz fel a felhasználónak és a felhasználó válasza alapján szűrési lehetőségeket javasol.

A kérdések és válaszok folyamához a Kiadóhivatal személyzete egy listát vezet párosított, gyakran feltett kérdésekről és az előre meghatározott válaszokról. Amennyiben a kérdésekre és válaszokra irányuló szándék felismerésre kerül, és nagy mértékű hasonlóság áll fenn a felhasználó által feltett konkrét kérdés és a rendszerben tárolt valamely kérdés között, a megfelelő válasz közvetlenül visszaküldésre kerül a felhasználónak. Például:

– ha a kérdésekre és válaszokra irányuló szándék olyan kérdés útján kerül felismerésre, mint a „Hol a megrendelésem?”, az asszisztens a következőt válaszolja: „A megrendelésének státuszát a profiljának ’Megrendeléseim’ részében ellenőrizheti”.

– ha a kérdésekre és válaszokra irányuló szándék olyan kérdés alapján kerül felismerésre mint a „Hol találhatok dokumentumokat gyermekek számára”, az asszisztens válaszában közli, hogy „A gyermekeknek szóló kiadványok a Gyereksarokban találhatók”.

A felhasználók írásban vagy szóbeli kérdéseket tehetnek fel. A csevegőrobot rögzíti a hangbevitelt (a felhasználó szóbeli kérdéseit) és elküldi azt egy beszédfelismerő motornak, amely a beszédet szövegre alakítja át. A hangbevitelt a Microsoft Azure beszédfelismerő szolgáltatása dolgozza fel (8. függelék). A Publio ezután a hangbevitelt a beszédfelismerő motor által értelmezett szavakkal jeleníti meg, mielőtt a választ megjeleníti mind írásban, mind pedig szóbeli szavakkal szintetizált hang használatával. Ez az információcsere azonnali (azonnal megtörténik) és ideiglenes (nem hagy semmilyen nyomot).

Hogyan elemzi a Publio a kérdést és javasol eredményeket?

A Publio nem használ LLM-et vagy más generatív MI-technológiát arra, hogy választ generáljon a felhasználóknak. Minden Publio-üzenet egy előre elkészített sablonon alapul. A Publio olyan gépi tanulást alkalmazó nyelvi modellt használ, amelyet arra tanítanak (betanított nyelvi modell), hogy felismerje a felhasználói bevitelt és arra reagáljon. E modell feladata a felhasználó üzenetének vagy érdeklődésének feldolgozása, az üzenet céljának felismerése és a megfelelő válasz biztosítása. A Publio tanítási folyamata magában foglalja a gépi tanulási modell nagy mennyiségű, címkézett tanítási adattal való ellátását, amely példákat tartalmaz a felhasználói bevitelre és az ahhoz kapcsolódó szándékra, valamint a valószerű válaszokra.

A Publio a természetes nyelvi feldolgozást, a betanított nyelvi modellt és az LLM-et a felhasználói szándék megértésére és arra használja, hogy a felhasználó kérdéséből kinyerje a felismert adategyedeket (keresőkifejezés, tárgy, szerző, dokumentum dátuma, dokumentumformátum stb.). A Publio ezeket az adategyedeket használja a keresés elvégzéséhez és a keresés eredményének megjelenítéséhez.





Ha a keresés eredménye túlságosan általános, a Publio folytatja a beszélgetést azáltal, hogy további kérdéseket tesz fel a felhasználónak, majd leszűkíti a keresési találatot más adategyedekre való szűréssel.

A Publio által megfogalmazott kérdések a felhasználó szándékának felismerésére, a céljának meghatározására és a Kiadóhivatali portálon közzétett tartalom szövegére vonatkozó megfelelő keresési lekérdezés megfogalmazására korlátozódnak. A Publio által javasolt eredmények teljes egészében ebből a korpuszból származnak.

Felhasználói visszajelzések



A végfelhasználó a beszélgetés során bármikor pozitív, semleges vagy negatív visszajelzést adhat a Publio használatával kapcsolatos tapasztalatairól. Ez lehet a felhasználó által bármikor adott manuális visszajelzés, vagy a néhány másodpercnyi inaktivitás után megjelenő, a felhasználótól visszajelzést kérő, automatikus felugró ablakra adott válasz. Ezenfelül a Publio által pontatlanul „értelmezett” kérdéseket a Kiadóhivatal munkatársai automatikusan naplózzák és időszakosan feldolgozzák. Mind a felhasználói visszajelzések, mind a Publio által pontatlanul „értelmezett” kérdések elemzése a nyelvi modell újra történő betanítására szolgál azzal a céllal, hogy folyamatosan javuljanak a végfelhasználóknak nyújtott szolgáltatások.

Személyes adatok kezelése

A Kiadóhivatali portálon elérhető adatok kezelése az EU általános adatvédelmi rendeletével (GDPR) és a személyes adatok uniós intézmények, ügynökségek és szervek által történő feldolgozásáról szóló rendelettel összhangban történik (9. függelék).

A Publio nem tárol, őriz meg, illetve nem archivál semmilyen elemet, sem a felhasználó által bevitt, sem pedig a Publio válaszaiban megadott adatokat.

Az összegyűjtött visszajelzések anonimizálása nem teszi lehetővé a visszajelzés összekapcsolását azon felhasználóval, akitől azt gyűjtötték.

A személyes adatok semmilyen módon nem kerülnek felhasználásra automatizált döntéshozatalhoz, nyomon követéshez vagy profilalkotáshoz. Amikor az információk kinyerésére nagy nyelvi modelleket (LLM) használ, a Publio csak a felhasználó kérdését és a LUIS által generált előzetes adatkinyerés eredményét közli az LLM-mel. Személyes felhasználói adatokat nem oszt meg és nem továbbít. A Publio által használt valamennyi szolgáltatást az európai adatközpontok tárolják, és minden adatkezelés megfelel az uniós adatvédelmi szabályoknak. .

Jelenlegi korlátozások

  • Nevek leírása hang alapján: bár a legtöbb név „felismerése” sikeres és azok helyesen kerülnek leírásra, a nevek kinyerése gépi tanuláson alapul és nem 100 %-ban pontos. A LUIS korlátai miatt egyes nevek kinyerése még a modellnek az adatkészletből származó konkrét példákkal való betanítását követően sem történik megfelelően.
  • Dátumok francia és spanyol nyelven: összetettebb szövegkörnyezetben a dátumok „értelmezése” spanyol és francia nyelven kevésbé pontos. Például spanyolul az év az „entre 2016 y 2017” használatával felismerhető további szövegkörnyezet nélkül, míg az „entre el año 2019 y 2020” használatával nem ismerhető fel. Angolul a „2 years ago” felismerhető, míg franciául az „il y a 2 ans” nem ismerhető fel.
  • A beszédfelismerés egyszerre csak egy nyelven működik.
  • A beszédfelismerésnek nincs helyesíráson alapuló működési módja, ami azt jelenti, hogy nem rendelkezik olyan funkcióval, amely lehetővé tenné a felhasználók számára, hogy a pontos leirat biztosítása érdekében betűzzék a szavakat.
  • A név adategyedének felismerése a „Mrs”/„Miss” kifejezésekkel kombinálva nem működik jól a hosszabb mondatokban.

Az Európai Unió Kiadóhivatala, 2023. május 16.

1 Elérhető a következő internetcímen: https://ec.europa.eu/futurium/en/ai-alliance-consultation.1.html

2 A megbízható mesterséges intelligenciának a következő hét követelménynek kell megfelelnie: 1) emberi cselekvőképesség és felügyelet; 2) szoftverek műszaki megbízhatósága és biztonsága; 3) adatvédelem és jó adatkormányzás; 4) átláthatóság; 5) sokszínűség, megkülönböztetésmentesség és méltányosság; 6) társadalmi és környezeti jólét; 7) elszámoltathatóság és felelősség.

3 Az Európai Parlament és a Tanács rendelete a mesterséges intelligenciára vonatkozó harmonizált szabályok megállapításáról, valamint egyes uniós jogalkotási aktusok módosításáról (a mesterséges intelligenciáról szóló rendelet). Az elfogadott és aláírt jogszabály itt található.

4 A szerződésen kívüli polgári jogi felelősségre vonatkozó szabályoknak a mesterséges intelligenciához való hozzáigazításáról (a továbbiakban: a mesterséges intelligenciával kapcsolatos felelősségről szóló irányelv) szóló európai parlamenti és tanácsi irányelvre irányuló javaslat, Brüsszel, 2022.9.28., COM (2022) 496 final.

5 Az Európai Parlament 2020. október 20-i állásfoglalása a Bizottságnak szóló ajánlásokkal a mesterséges intelligenciára vonatkozó polgári jogi felelősségi rendszerről (2020/2014(INL)).

6 Lásd a 3. cikket.

7 https://www.luis.ai/

8 https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE5cCGB

9 Az (EU) 2016/679 rendelet (HL L 119., 2016.5.4., 1–88. o.) és az (EU) 2018/1725 rendelet (HL L 295., 2018.11.21., 39–98. o.).