Fizessen elő a Magyar Jogi Nyelvre!
ElőfizetésA jogi szövegek természetükből adódóan olyan magatartási normákat határoznak meg, amelyek betartása mindenkire nézve kötelező, és amelyek ismeretét és megértését a jogalkotó minden állampolgár részéről feltételezi és elvárja. Ennek ellenére az ilyen szövegek megalkotása során legtöbbször csak a szaknyelvet ismerők szempontjai érvényesülnek, a laikusok nézőpontja csak alig-alig. A problémára megoldást jelenthet, ha a közérthető fogalmazás automatizációs lehetőségeit vizsgáljuk.
A kérdést többféleképpen is megközelíthetjük, bevetve akár a modern természetesnyelv-feldolgozás eszköztárát is. Egy lehetőség például olyan szoftver készítése, amely egyfajta helyesírás-ellenőrzőként segít a fogalmazónak könnyebben érthetővé tenni a szöveget. A doktori értekezés, amely alapján a jelen cikk készült, a jogi és nyelvészeti szakirodalomra támaszkodva kereste a választ arra a kérdésre, hogy mely nyelvi, nyelvhasználati jegyek megváltoztatása segítheti a jogi szövegek közérthetővé tételét. Ennek során a kutatás nagyban támaszkodott a Plain Language Movement által meghatározott alapelvekre és javaslatokra. Egyszersmind felügyelt és felügyelet nélküli gépi tanulási megoldásokkal vizsgálta a közérthetőséget, mint klasszifikációs problémát.
A kutatás eredményképpen elkészített szoftver egyfajta prototípusként hivatott szolgálni, amely segítheti a témával foglalkozók munkáját, ha saját megoldás elkészítése mellett döntenek. Egyúttal a megfelelő környezetben alkalmazva segítséget nyújthat a közérthető nyelvhasználatot pártolók számára, gyorsítva főként a funkcionális jogi szövegek (pl. hivatali tájékoztatók) közérthető átiratainak elkészítését.
Kulcsszavak: joghoz való hozzáférés, közérthetőség, nagy nyelv modellek, számítógépes nyelvészet
Legal texts, by their very nature, lay down standards of behavior which are binding on all, and which the legislator presupposes and expects all citizens to know and understand. Nevertheless, in most cases, such texts are drafted from the point of view of those who know the technical language, with little or no consideration of the layman's point of view. A solution to this problem could be found by exploring the possibilities for automating the drafting of Plain Language.
There are several ways of approaching the issue, including the use of modern Natural Language Processing tools. For example, one possibility is to create software that acts as a kind of spell-checker, helping the author to make the text easier to understand. The thesis on which this article is based drew on legal and linguistic literature to answer the question of which linguistic features can be changed to make legal texts more readable. In doing so, the research drew heavily on the principles and proposals set out by the Plain Language Movement. At the same time, supervised and unsupervised machine learning solutions have been used to investigate comprehensibility as a classification problem.
The software produced during this research is intended to serve as a kind of prototype, which can help those working in the field if they decide to develop their own solution. At the same time, it can, if used in the right environment, help those who advocate the use of plain language, by speeding up the production of plain transcripts of functional legal texts (e.g. administrative information).
Keywords: access to justice, comprehensibility, large language models, computational linguistics
A jelen tanulmány a Közérthetőség és automatizáció - kísérletek a jog, természetesnyelv-feldolgozás és informatika határán c. doktori értekezésbe kíván betekintést nyújtani (Üveges 2024). Az értekezést 2023 áprilisában nyújtottam be a Szegedi Tudományegyetem Nyelvtudományi Doktori Iskolájának, majd 2024 nyarán védtem meg sikeren. A tanulmányban a kutatás során elvégzett munkámat foglaltam össze, különös tekintettel a közérthetőséggel kapcsolatos automatizációs lehetőségek bemutatására, azok megismert előnyeinek, hátrányainak és korlátainak ismertetésére.
- 33/34 -
A jogi szövegek természetükből adódóan olyan magatartási normákat határoznak meg, amelyek betartása mindenkire nézve kötelező, és amelyek ismeretét és megértését a jogalkotó minden állampolgár részéről feltételezi és elvárja. Ennek ellenére az ilyen szövegek megalkotása során legtöbbször csak a szaknyelvet ismerők szempontjai érvényesülnek, a laikusok nézőpontja nem. Ez sok esetben még ma is tetten érhető, akár azon funkcionális szövegek esetében is, amelyek konkrétan a laikus célközönségnek íródnak, és céljuk a tájékoztatás vagy valamilyen cselekmény megtételére való felhívás (pl. hivatali tájékoztatók).
Az, hogy pontosan miben is áll egy szöveg közérthetősége, immár szó szerint évszázados kérdés, amelyre számos tudományterület számos válasszal állt elő. A teljesség igénye nélkül a pszicholingvisztika (Pléh-Lukács 2014, Kas-Lukács 2012, Pléh 2013 stb.), a főként angolszász területen népszerű olvashatósági formulák (Mesmer 2008, Dale-Chall 1948, Tekfi 1987), valamint a Plain Language Movementhez kötődő szakirodalom (pl. Garner 2001, Murawski 1999, Charrow-Erhardt-Charrow 2007) mind nyelvi jellemzőket kerestek, amelyek befolyással bírnak az átlagos olvasó szövegértésére. Nemrégen ISO standard[1] is megjelent, amely egységes keretbe foglalja a Plain Language Movement által javasolt elveket, melyek követése a szöveget könnyebben befogadhatóvá teheti (Vinnai 2023).
A modern megközelítések közül többen próbálkoztak gépi tanulási módszerekkel is, amelyek a szabályok helyett sokkal inkább a gépi tanuló modellek mintázatfelismerő és általánosítási képességeire alapoznak (Zhang-Lapata 2017, Mallinson-Lapata 2019, Nishihara et al. 2019, Dong et al. 2019). Ezen próbálkozások, noha számos módszert felvonultattak (nyelven belüli átfordítás, komplex mondatok több különálló mondatokra bontása stb.), mind arra irányultak, hogy hátrányos helyzetű csoportok számára könnyebben érthető változatot készítsenek szövegekből. Ilyenek lehetnek például a nyelvtanulók, a diszlexiában vagy afáziában szenvedők, esetleg az adott nyelven kevéssé olvasottak.
Ennek megfelelően a kiindulási adathalmazuk is rendkívül megszorított volt, legtöbb esetben a Simple Wikipédia képében. Az itteni szócikkek jelentős megkötések mellett készülnek, például csak a leggyakoribb 1000 angol szó használata javasolt. A Plain Language esetében a cél sokkal inkább az átlagos nyelvhasználó számára érthetőbbé tenni egy adott szöveget. Míg előbbi esetben a nyelvi kompetencia elmaradottságával kell számolnunk, utóbbi esetben a gondot inkább a szükségtelen nyelvi komplexitás jelenléte okozza. Ez utóbbira vonatkozó kísérleteknek azonban mind az angol, mind pedig különösen a magyar szakirodalom mindeddig híján volt.
A téma szoros kapcsolatban áll a joghoz/igazságszolgáltatáshoz való hozzáférés (access to justice) kérdésével is, amely a jogszociológiában ugyancsak több mint fél évszázados múltra tekint vissza (Gomes 2019). A jogi információkhoz való hozzáférés több dimenziót is magában foglal. Idetartozik az elsődleges jogi forrásokhoz, például törvényekhez, rendeletekhez és bírósági ítéletekhez való hozzáférés. A digitalizációnak köszönhetően az európai kontinentális jogrendszerekben az ilyen jellegű információkhoz való hozzáférés elsősorban ingyenes és online, ezért ez ma már nem okoz jelentős problémát. A jogi információk feldolgozásának képessége azonban egyre fontosabbá vált (Vági et al. 2024). A jog átláthatósága és kiszámíthatósága a jogállamiság alapvető követelménye is, a felesleges nyelvi bonyolultság és a homályosság pedig megnehezíti a szöveg értelmezését, jogi kontextusban akadályozva a demokratikus érdekérvényesítő képességet is (Tóth 2023).
A Jogkódex-előfizetéséhez tartozó felhasználónévvel és jelszóval is be tud jelentkezni.
Az ORAC Kiadó előfizetéses folyóiratainak „valós idejű” (a nyomtatott lapszámok megjelenésével egyidejű) eléréséhez kérjen ajánlatot a Szakcikk Adatbázis Plusz-ra!
Visszaugrás