Üveges István: Szabályalapú és gépi tanulásra alapozott megoldások a közérthető fogalmazás elősegítése érdekében (MJNY, 2023/1., 12-20. o.)

Absztrakt

A közérthető fogalmazás az állami szervek részéről régóta ismerten hozzájárul a jogbiztonság, valamint a joghoz való hozzáférés elősegítéséhez, továbbá támogatja az állampolgárokat demokratikus érdekérvényesítő képességük kiteljesítésében. Habár a jogtudományi és nyelvészeti szakirodalom régóta foglalkozik a jogi szövegek közérthetőbbé tételének kérdésével, a probléma mindezidáig híján van olyan (félig) automatikus megoldásoknak, amelyek a szakértői munkát érdemben támogatni képesek lennének, ezzel csökkentve a kapcsolódó intralingvális átfordítás idő- és munkaigényét. A tanulmány ennek megfelelően számba veszi azokat a kézzel írt szabályokat, amelyek segítségével a jogi doménhez tartozó szövegek szükségtelen nyelvi komplexitása esetlegesen redukálható, egyszersmind számot ad arról, hogy a jelenleg elérhető gépi tanulási megoldások hogyan és milyen mértékben alkalmazhatók a közérthető kommunikáció elősegítése érdekében.

Kulcsszavak: Plain Language, gépi tanulás, szabályalapú megközelítések, jogbiztonság, joghoz való hozzáférés.

Abstract

It has long been recognized that clear drafting by public authorities contributes to legal certainty and access to justice and helps citizens to exercise their democratic voice. Although the issue of improving the clarity of legal texts has long been addressed in the legal and linguistic literature, the problem has so far lacked (semi-)automatic solutions that could support the work of experts in a meaningful way, thus reducing the time and effort required for the related intralingual translation. The paper will therefore take into account of handwritten rules that could potentially reduce the unnecessary linguistic complexity of legal domain texts and will also report on how and to what extent currently available machine learning solutions can be applied to facilitate communication in plain language.

Keywords: Plain Language, machine learning, rule-based approaches, legal certainty, Access to Justice.

Bevezetés

E tekintetben a kommunikáció említett minőségének egyik kiemelt fokmérője, hogy az állampolgárok mennyit, és mennyire egyszerűen képesek értelmezni a nekik címzett dokumentumokból, például hivatalos tájékoztató szövegekből. A jogi nyelvet számos olyan sztereotípia övezi, amely annak összetettségét, a laikus számára gyakran átláthatatlan voltát hangsúlyozza. Hogy ezek mennyiben tekinthetők a valós helyzetet leíró értékítéletnek, azt korábban már a magyar jogi nyelv(ezet) kapcsán is számos kutatás vizsgálta. Az ilyen kutatások egyik legfontosabb eredménye kétségkívül, hogy segíthetnek betekintést engedni mindazon nyelvi jellegzetességekbe, amelyek egyrészről a jogi nyelvhasználat sajátjaiként írhatók le, másrészről pedig amelyek nehezítik a szövegek megértését az átlagos olvasó szemszögéből.

Ez a megközelítés jellegéből adódóan főként olyan, a (jogász és nyelvész) szakértők által azonosítható jellemzőket keres, amelyek megváltoztatása által, kvázi szabályalapon a szövegeknek az érthetőség szempontjából vett minősége javítható, azok "felesleges" nyelvi komplexitása kigyomlálható, ezáltal pedig egy, a laikusokhoz közelebb álló szövegváltozat előállítása válik lehetségessé.

A modern nyelvtudományban, különösen annak számítógépes szövegfeldolgozással foglalkozó ágában (számítógépes nyelvészet - természetesnyelv-feldolgozás) a vonatkozó technikai eszközök rohamos fejlődésével, egyre inkább elterjedtté váltak a gépi tanulásra alapozott megoldások. Az előzőtől eltérően, ezek nem a szövegek "felszíni jegyei" (pl. szóhasználat, szintaktikai sajátosságok) által direkten működtethetők, hanem a szövegre mint adatra tekintenek. Az ilyen algoritmusok erőssége, hogy képesek lehetnek az adatokban jelen levő olyan mintázatok azonosítására is, amelyek az emberi szem elől alapesetben rejtve maradnának. Nem véletlen, hogy a modern természetesnyelv-feldolgozás (Natural Language Processing - NLP) ma már dominánsan ilyen eljárások alkalmazására épít.

Ez a perspektíva azonban, ha nemzetközileg nem is, hazai viszonylatban szinte teljesen hiányzik a közérthetőséget tárgyaló szakirodalomból. Éppen ezért a jelen tanulmány célja, hogy röviden ismertesse egyrészről azon nyelvi szabályszerűségeket, amelyek a jogi szövegek kapcsán teret adhatnak azok egyszerűsítésére, valamint a szerző azon kísérletét, amelynek célja a gépi tanuló algoritmusok egy csoportjának alkalmazása volt a szövegek automatikus közérthetőségi osztályozására. A vizsgálat fő relevanciája, hogy a gépi tanult modellek alkal-

- 12/13 -

mazásával olyan eszközt kívánt megteremteni, amely a szövegek közérthetőségi minőségfejlesztését végző szakemberek munkáját képes támogatni, ezáltal a lehetőségekhez mérten csökkentve a szükséges idő- és munkaigényt a hasonló feladatok esetében.

A cikkben utolsóként ismertetett huBERT alapú modell huBERTPlain néven szabadon letölthető, vagy a webes felületen is kipróbálható[1] a linken.

Szabályalapú megközelítés

A bevezetésben már említett szabályalapú megközelítés a közérthetőség, valamint az ezzel szorosan összekapcsolódó Plain Language Movement irányzatának kutatásában rendkívül kiterjedt múltra tekint vissza, mind a jogtudomány, mind pedig a nyelvtudomány képviselői körében.

Talán a legjelentősebb, a témához kapcsolódó munka Magyarországon a Miskolci Egyetemhez köthető, ahol is számos projekt és kutatás tárgyalta a jogi szövegek érthetőségének összefüggéseit, például a joghoz való hozzáféréssel és a tisztességes eljáráshoz való joggal kapcsolatban (pl. Vinnai 2014, Vinnai 2017ab, Szabó-Vinnai 2018ab). Ezek közül a jelen írás szempontjából talán a leginkább átfogó képet a kérdésről a 2014 és 2018 között lezajlott "A tisztességes eljárás nyelvi aspektusai. A jogi nyelv hatása a joghoz való hozzáférés érvényesülésére" elnevezésű OTKA-kutatás adja. Ez egyebek mellett vizsgálta:

• a jogi és a laikus nyelvhasználat között fellelhető olyan eltéréseket, amelyek nehezíthetik a laikusok szövegértését jogi helyzetekben,

• annak kérdését, hogy ilyen eltérések azonosíthatósága esetében, azok eredményezhetik-e a tisztességes eljárás követelményének és a joghoz való hozzáférés elvének sérülését,

• továbbá a kutatás célja volt a fenti kettő teljesülése esetén, megoldási javaslatok kidolgozása is (Vinnai 2014: 67).

A gyakorlati munka egyik sarokköve volt tehát azon nyelvi jellegzetességek megtalálása, amelyek a megértésre potenciálisan negatívan hathatnak. A kutatás záró-konferenciájához készült kötet bemutatja például a Miskolc Jogi Korpusz felhasználásával készült elemzéseket a jogi szövegek alanyi és állítmányi szerkezetei, jellemző alá- és mellérendelő szerkezetei révén, valamint a korpusz szövegtípusait doménhasonlósági mérésekkel veti össze pl. köznyelvi szövegekkel (Szabó-Vinnai 2018).

A nyelvtudományban a megértést befolyásoló tényezők kutatása kiterjedt irodalommal rendelkezik például a pszicholingvisztikában (Pléh-Lukács 2014: 82-86, Byrd-Mintz 2010, Friederici 2004, Gordon-Ledoux 2008), ahol a fő hangsúly a szövegek feldolgozásához szükséges (kognitív) ráfordítás gyakorlati mérése által vonnak le következtetéseket a könnyű érthetőséget befolyásoló (nyelvi) tényezők pontos mibenlétéről.

A teljes tartalom megtekintéséhez jogosultság szükséges.

A Jogkódex-előfizetéséhez tartozó felhasználónévvel és jelszóval is be tud jelentkezni.

Az ORAC Kiadó előfizetéses folyóiratainak „valós idejű” (a nyomtatott lapszámok megjelenésével egyidejű) eléréséhez kérjen ajánlatot a Szakcikk Adatbázis Plusz-ra!

Üveges István: Szabályalapú és gépi tanulásra alapozott megoldások a közérthető fogalmazás elősegítése érdekében (MJNY, 2023/1., 12-20. o.)

Absztrakt

Abstract

Bevezetés

Szabályalapú megközelítés

Tartalomjegyzék

Kiadó

Tematikus oldalaink

Jogterületek

Képzések

Folyóiratok

Kapcsos nagykommentárok

Jogkódex

Újdonságok

Akciós termékek

Books in Foreign Languages

ELTE könyvek

NMHH könyvek

Kiadói hírek

Tallózó

Vásárlás