A digitális adatok felhalmozódásának a múlt század második felétől megindult, és jelenleg is fokozódó ütemben zajló folyamata a fizikai környezetünk egyre részletesebb digitális leképeződésével jár. A digitális adatképződésnek ezt a folyamatát a datafikáció (adatosodás) széles körben elterjedt fogalmával jelöljük. Ennek a lendületes digitális adatképződési folyamatnak egy bizonyos szakaszában, a XXI. század első évtizedének végére, amikor az adatokat kezelő intézmények felismerték az ezekben rejlő lehetőségeket, egyúttal az adatok kezelésére és elemzésére szolgáló alkalmazások, az egyre szofisztikáltabb algoritmusok, a neurális hálók, a gépi tanulás (machine learning, deep learning) egyre fejlettebbé váltak, kristályosodott ki a BigData paradigma. A datafikációt a kezdetektől kíséri az adatokkal összefüggő tudás felhalmozódása és rendszerezése, ami egy új tudomány, az adattudomány létrejöttéhez vezetett. Mindezek pedig elvezettek az első általános célú exponenciális technológia[2], a szakzsargon által Mesterséges Intelligenciának nevezett jelenség kialakulásához, ami - ha megszabadítjuk a félrevezető antropomorf megközelítésektől - lényegében nem jelent mást, mint nagyon szofisztikált statisztikai algoritmusok halmazát, amelyeket emberek és algoritmusok közösen irányítanak[3].
Fontos kiemelni, hogy az adatoknak ez a felhalmozódása nem csak kifejezett adatgyűjtési célt és szándékot feltételező folyamat eredménye, hanem ugyanúgy jellemző rá a kifejezett adatgyűjtésre irányuló szándék és cél nélküli adatképződés is, ami egyszerűen a digitalizáció természetéből fakad (ti. az elektronikus eszközök egyszerűen csak rögzítik a bennük zajló folyamatokat, és tárolják a vonatkozó adatokat).[4] Ugyanakkor a Big Data
- 25/26 -
paradigma megjelenését követően a világon mindenütt egyértelműen tapasztalható egy olyan céltudatos adatgyűjtési törekvés, ami nem csupán egy - egy előre meghatározott terület adatait, hanem "minden" elérhető adatot céloz. Vagyis az adatképződés kiterjesztése ma már nem csupán szervezeti, hanem kormányzati szinteken is, európai, sőt globális kiterjedtségű határozott céllá vált. Ebben a megközelítésben pedig már az adattudatos jogi gondolkodás és adatkutatás homlokterében sem az áll kizárólag, hogy meghatározza, milyen területről akar adatokat gyűjteni, hanem az is, hogy megérti, ma már a jog minden területére jellemző a közvetett vagy közvetlen digitális adatképződés, és ennek az adatképződésnek a következményeként a digitális térben a jogrendszer képe is egyre részletesebben bontakozik ki előttünk. Vagyis az adatokat már nem feltétlenül kell gyűjteni, mert egyre valószínűbb, hogy azok már léteznek valahol egy adatbázisban. Ellenben meg kell őket találni. Erre való az adatkutatás. És hogy pontosan meg is értsük, hogy e kutatás során mit találtunk, valamint hogy a talált adatokból helytálló következtetéseket vonhassunk le, szükséges az adatok legszélesebb értelemben vett kontextusainak ismerete, amely ismeretek nyilvánvalóan azokban az intézményekben állnak leginkább rendelkezésre, ahol a vizsgálandó adatok képződnek. Ilyen intézmény a MOKK is. E megközelítések céljairól, előnyeiről és a közjegyzői hivatásrend tekintetében várható hasznáról a dolgozat későbbi részében részletesebben is írok.
A hazai közjegyzőség szervezetében a digitális rendszerek építésének hagyománya egészen 1992-re nyúlik vissza. A közjegyzői eljárásokkal kapcsolatos digitális adatképződés e digitális rendszerek révén lényegében már a közjegyzőség 1992-ben történt újraalakulásával megkezdődött és azóta is tart. Az első lépést ebben az évben a Végrendeletek Országos Nyilvántartása (eredeti nevén Végrendeletek Központi Nyilvántartása) jelentette, amit 1997-ben a Zálogjogok Országos Nyilvántartása, 2004-ben az elektronikus aláírás bevezetése, és az elektronikus okirati archiválás megindulása, 2010-ben az FMH rendszer[5] (Fizetési Meghagyásokat támogató digitális rendszer) felépítése, az ÉNYNY (Élettársi Nyilatkozatok Nyilvántartása)[6] és GKZONY (Gépjárműveket terhelő Zálogjogok Országos Nyilvántartása)[7] létrehozása követtek. A Hitelbiztosítéki Nyilvántartás (HBNY)[8] 2014 márciusában kezdte meg a működését, szinte egy időben a Házassági és Élettársi Vagyonjogi Szerződések Nyilvántartásával (HÉVSZNY)[9] A közjegyzői okiratok elektronikus forgalmazására az elektronikus hivatali aláírás bevezetését követően nyomban lehetőség nyílt, azonban e téren fellendülést az elektronikus ügyintézés és a bizalmi szolgáltatások általános szabályairól szóló 2015. évi CCXXII. törvény 108. § (1) (hatályos: 2018. január 1.) hozott.
- 26/27 -
Nagyon fontos lépést jelentett e téren a közjegyzők új, elektronikus ügyviteli rendszerének kialakítása[10] és 2020. január 01. napjával történt bevezetése, amely rendszer integrálja a közjegyzői eljárásokat támogató digitális rendszereket és nyilvántartásokat és folyamatos fejlesztés alatt áll. Mindemellett ki kell emelni, hogy a 2004. július 1-jétől hatályos, közjegyzőkről szóló 1991. évi XLI. törvény - azóta többször módosított -166/A. §-a[11] kötelezővé tette és teszi a digitális archiválást a közjegyzői okiratok, jegyzőkönyvi ténytanúsítványok, valamint a külön jogszabályban meghatározott nemperes eljárásban hozott jogerős határozatok vonatkozásában. Ki kell emelni, hogy 2020. december 16-a óta az archiválás szolgáltatást a NOTARchiv Kft. végzi, mint minősített archiválási szolgáltatást nyújtó szervezet.[12]
A közjegyzői eljárások jelentős részben támaszkodnak a fent hivatkozott a digitális segédrendszerekre és nyilvántartásokra. A közjegyzői nyilvántartások és támogató rendszerek kommunikációs és irat/adatforgalmazó belső folyamatai ma már jelentős részben elektronikusan zajlanak, külső folyamatok tekintetében pedig az aktuális jogszabályi keretekhez igazodva alkalmaznak a közjegyzők digitális eljárási elemeket.
Ez bizony adat, adat, adat, egyre több adat ... és sosem lesz vége ...
A fent vázolt digitális rendszerek és a rajtuk keresztül zajló folyamatok által generált állandó digitális adatképződés mára oda vezetett, hogy a hazai közjegyzőség által kezelt adatok elérik, és jóval meghaladják azt az adatmennyiséget és adatminőséget, amely mennyiségen és minőségen túl már Big Datáról beszélhetünk. Vagyis amint azt az irat következő részeiben is részletezem, a közjegyzői datafikáció is eljutott arra pontra, ahol indokolttá vált az adattudatos gondolkodás bevezetése és a Big Data paradigma alkalmazása. Itt az ideje tehát annak, hogy éljünk a datafikáció/digitalizáció által kínált előnyökkel[13].
A több adat értelemszerűen pontosabb eredményekhez vezethet. Pusztán a mennyiség azonban nem elég. Az általános megközelítés szerint a Big Data paradigma eredményes alkalmazása szempontjából a mennyiség (több mint 1 terabit) mellett ugyanolyan fontossággal bír néhány további tulajdonság is. Ilyen tulajdonság az adatok változatossága (sokfélesége) és a gyorsaság. Vagyis, hogy az adathalmaz ne csupán nagy mennyiségű, hanem emellett változatos/sokféle adatból, rendezett és rendezetlen adatokból álljon, egyúttal az adatok keletkezése folyamatos és gyors legyen, hozzáférése és elemzése pedig ugyancsak gyorsan, valós időben történjen meg. E tulajdonságok közül valójában a gyorsaság adja a Big Data paradigmát a maga teljességében kibontakoztató valódi értéket, nevezetesen azt, hogy használatának előnye az adatok újdonságából/frissességéből adódik, és azzal a többletinformációval függ össze, amelyhez a közvetlen jelen adatait
- 27/28 -
a múlttal összehasonlítva jutunk[14]. A Big Data fenti hármas ismérvrendszere további két ismérvvel is kiegészül[15],[16] úgy mint a Veracity (valósághűség/megbízhatóság) és a Value (érték) - öt V = volume, variety, velocity, veracity és value.
A MOKK által kezelt adathalmazban valóban nagy mennyiségű adattal van dolgunk, nem csupán a szövegekkel, hanem egyéb, naplózási és kommunikációs adatokkal, hang-és videofile-okkal stb. is, tehát ez az adathalmaz nagyon változatos.
Az adatelemzésben így a jogi adatelemzésben is az adatkutatók által gyakorta hangoztatott probléma, hogy az elemzők sok esetben nem a saját maguk által előállított adatokat elemzik, hanem azokat be kell szerezniük valaki mástól, ami időveszteséggel és egy másik problémával is jár, nevezetesen azzal, hogy az adatelemzés során elvész az adatok eredeti kontextusainak ismeretéből fakadó előny. Valójában az adatok elérhetősége, az adatfeldolgozás sebessége, és a feldolgozás során az eredeti kontextusok figyelembevételének kiesése képezi e kutatások Achilles-sarkát, ami nyilvánvalóan kihat a kutatások értékére. Az adatszerzésnek ez a módja azon kívül rendszerint megakasztja, legtöbbször ki is zárja az adatelemzés folyamatosságát, vagyis folyamatos valós idejű elemzését. Nyilvánvaló tehát, hogy a Big Data paradigma legoptimálisabb kiaknázásához közvetlenül az adatok keletkezésének/előállításának helyén, az adatkezelő intézményeken belül célszerű létrehozni a kutató intézeteket/kutatócsoportokat.
Mindezen tények felismerése vezetett 2020. első felében a MOKK Adatkutató Alintézetének létrehozásához, a közjegyzői, intézményi adatkutatás megindításához, valamint a MOKK adatstratégiájának kialakításához, amely adatstratégia egyben az "MI" alkalmazásának előfeltétele. Az adatok hasznosításával, kezelésével, vagyis az adatmenedzsmenttel foglalkozó szakemberek legnagyobb kihívása az adatkultúra intézményi meghonosítása, aminek kulcsfontosságú eleme az érthető, tömör, technikai nyelvezetet lehetőleg kerülő, hasznos kutatási célokra összpontosító adatstratégia kidolgozása.
- 28/29 -
A digitális adathalmazok növekedésével azok egyre nagyobb értéket képviselnek az adatokat kezelő szervezet számára. Ahhoz, hogy a rendelkezésünkre álló adatokban rejlő lehetőségekkel szervezeti céljaink elérése érdekében éljünk, az adatok hasznosításához, optimális használatához és kezeléséhez szervezeti szintű átfogó adatstratégiára van szükség. Ennek az átfogó adatstratégiának a végrehajtásával és folyamatos aktualizálásával támogathatjuk a MOKK hivatásrendi stratégiáját. Ennek érdekében, és hogy ne halmozzunk fel utóbb nem orvosolható hátrányokat, el kell kezdenünk az adataink kezelését és elemzését. A nem megfelelően kezelt adatok nem csak megszerezhető, későbbiekben részletezett előnyök elmaradását vagy későbbi lemaradást eredményezhetnek, hanem kiemelt veszélyforrást is jelentenek. A pontatlan adatok felhasználása pedig akár kárt is okozhat.
Az adatprojektek nem egy alkalmazás vagy eszköz beszerzésével, hanem rendszerint az adatstratégia kialakításával kezdődnek, ebből következik az is, hogy az adatstratégia, az első, általános célú exponenciális technológia, az MI alkalmazásának ugyancsak alapja és előfeltétele.
A mai, adattudatos szervezetek létrejötte előtti időszakban rendszerint kizárólag a szervezetek IT szektora fejlesztette az adatstratégiát. A tapasztalatok azonban azt mutatják, hogy az adatstratégia kialakítása elsősorban nem informatikai, hanem szervezeti feladat. Ez nem jelenti azt, hogy az informatikai vezetők és szakemberek kihagyhatók a stratégia megalkotásából, de mert az adathalmaz elsődlegesen hivatásrendi nem pedig informatikai vonatkozású, a szervezeti, hivatásrendi oldalnak kell megalkotni az adatstratégiát, továbbá biztosítani annak irányítását, végrehajtását és folyamatos felülvizsgálatát.
A hivatásrendi stratégia és hivatásrendi adatstratégia összehangolásában az IT háttér tehát továbbra is nagyon fontos, önmagában azonban nem elegendő, mert a folyamatba be kell vonni a szervezet céljait és folyamatait kimerítően ismerő vezetőt is. Vagyis az adatstratégia kialakításához és érvényesítéséhez az IT mellett szükséges az adott szervezetre jellemző szakértelem biztosítása a szervezeti célok pontos ismerete, annak érdekében, hogy a rendelkezésre álló adatok felhasználását a lehető legszélesebb körben a szervezeti stratégiai célok elérése érdekében pontosan lehessen koordinálni. A jelenlegi helyzetben a szervezetek céljainak eléréséhez szükséges stratégia és adatstratégia fejlesztése párhuzamosan, fej fej mellett haladva, egymással közvetlen kölcsönhatásban kell, hogy történjen, és a folyamatokba be kell vonnia az adatképződéssel érintett szervezeti egységek vezetőit is annak érdekében, hogy minél több nézőpont és vélemény ismertté váljon, ami hozzájárul az adatokról kialakított kép teljességéhez. Az a szervezet, mely nem ismeri fel ezt a szükségszerűséget, előbb utóbb sikertelenségre ítéltetik.
E szempontokat és feladatokat összességükben a MOKK szervezetén belül az Adatkutató Alintézet képviseli és látja el. Az Alintézet a garancia arra, hogy az adatelemzés az adatok keletkezésének helyén, valós időben történjen, biztosítva ehhez egyúttal a speciális szakterületi szakértelmet és az eredeti adatkontextusok ismeretéből fakadó előnyt, ami külső adatelemzők részére nem adott.
- 29/30 -
Az adatstratégia különféle definíciói megegyeznek abban, hogy annak alapvető célja egy olyan szervezeti szintű stratégia kialakítása, mely biztosítja a rendelkezésre álló adathalmaz védelmét, minőségét, értékét és hasznosítását a szervezet által kezelt adatokhoz kapcsolódó, illetve azoktól függő képességeken keresztül[17]. Az adatoktól függő és azokhoz kapcsolódó képességek közül külön is ki kell emelni az adatkeletkezés környezetére vonatkozó speciális szakismeretet, ami összefügg az adatok szélesebb kontextusainak ismeretével. A PWC idézett tanulmánya szerint a hatékony adatstratégia az alábbi alapfeltételeknek kell, hogy megfeleljen. Konkrét akciótervet kell tartalmaznia, az adott szervezetbe kell integrálódnia, meg kell felelnie az adott szervezet sajátosságainak, és együtt kell fejlődnie az adathalmaz bővülésével, amit össze kell hangolni a hivatásrendi stratégiával. Az adatstratégia sikeres alkalmazása olyan hosszú távú feladat, amelynek érdekében akár a szervezet adatképességét is érdemes megváltoztatni.
Az adatstratégia felépítésénél célszerű több változatot kialakítani, amelynek során törekedni kell egy közös, a szervezetre jellemző szakterületi "nyelv" kialakítására, az adott szervezetre jellemző szakkifejezések használatára a közérthető megfogalmazások érdekében. Ennek megfelelően ahol csak lehetséges a szervezeti stratégia nyelvezetét kell használnia, hogy a szervezeti döntéshozók könnyen felismerjék az összefüggéseket az adatstratégia és a szervezeti stratégia között. A közjegyzői adatstratégia kialakítása során egyrészt adattudomány másrészt a jogtudomány nyelvezete közötti összhangot kell megteremteni.
Az adatstratégiának rugalmasnak kell lennie, és folyamatosan alkalmazkodnia kell a szervezeti stratégiához. Figyelmet kell fordítani az adatstratégia mindenkori hasznának, relevanciájának hangsúlyozására a szervezeti stratégiához mérten, ami állandó kölcsönhatást feltételez a két stratégia között.
Mindezek mellett meg kell fogalmazni az adatstratégia fő törekvéseit, előre kell vetíteni az elérendő célokat és az azokhoz vezető utakat és módszereket, amelynek során tisztázni kell az adathozzáférés és az adatokhoz hozzáférő személyek körét, ügyelve a szükséges személyi kompetencia biztosítására is. Mind a technológiai környezet, mind a szükséges személyi kompetencia megteremtése és a szerepkörök pontos meghatározása kiemelkedő jelentőségű.
Nagyban megkönnyíti továbbá az adatstratégia megvalósítását, az alkalmazási terület pontos meghatározása, vagyis ha pontosan meghatározzák, hogy az milyen típusú adatokra vonatkozik. De nem feltétlenül kell egyszerre minden adattal foglalkozni. Az adatstratégia több irányú, több szintű is lehet. Vonatkozhat konkrét eljárásokra és/vagy konk-
- 30/31 -
rét adatkörökre is. A MOKK Adatkutató Alintézet is eszerint határozza meg az egyes kutatásait, változó terjedelmű adatkörökre vonatkozóan.
A pontosan meghatározott adatmenedzselési elvek segítik az adatstratégia végrehajtásának követését. Az adatmenedzselési elvek között egyaránt találunk megkerülhetetlen elveket, mint például az adatvédelmi elvek, és nyitott adatelveket is aszerint, hogy mit diktálnak a szervezet sajátosságai és céljai. Az adatvédelmi elvektől, amelyek többek között az adatok bizalmasságát, sértetlenségét és rendelkezésre állását biztosítják, nem lehet eltérni, de azok kiegészülhetnek nyílt adatelvekkel, akár FAIR[18] adatelvekkel is, amelyekre az Adatkutató Alintézet is figyelemmel van.
Az adatstratégia felépítésének elvei közül nem hiányozhat a megfelelő mérőszámok meghatározása. Vagyis ha már meghatároztuk, hogy mit szeretnénk az adatokkal elérni, milyen adatokat használunk fel és milyen elvek alapján kezdjük el a munkát, definiálnunk kell, hogy mit jelent a siker. Ehhez megfelelő mérőszámokat kell meghatároznunk, vagyis meg kell határoznunk, hogy milyen mérőszámokkal kísérjük figyelemmel a fejlődést, az adatstratégia érvényesülését. Az Alintézet kutatási projektjeit folyamatosan, de legalább heti rendszerességgel értékeli, amely értékelésbe bevonja a szervezet érintett alegységeit, és folyamatosan tájékoztatja a MOKK elnökét. Ugyanakkor legalább évente egyszer a MOKK elnökének, szakbizottsági vezetőinek, és a területi kamarák elnökeinek bevonásával értékelő értekezletet tart. Mindezek alapján, szükség esetén módosítja az adatstratégiát.
Talán utalni sem kell rá, hogy az adatstratégia megvalósítása során kiemelt figyelmet kell fordítani annak tényleges végrehajtására. Ennek érdekében a szervezeti döntéshozókat is be kell vonni a folyamatba, tekintettel arra, hogy az adatstratégia az egész szervezetet érinti, beleértve az adatokat, technológiát, embereket és folyamatokat. Ennek keretében válik közösen értelmezhetővé pl. az, hogy a szervezeti folyamatok miként befolyásolják az adatokkal kapcsolatos elveket, és ennek alapján, szükség esetén hogyan kell átírni a meglévő szabályzatokat.
Az adatstratégiának ugyanakkor ki kell terjednie a technológiai felkészültség folyamatos mérésére is. Fontos megvizsgálni, hogy a meglévő technológia hogyan támogatja az adatstratégiát, szükséges-e valahol változtatni? Emellett a humán tényező felkészítésére is nagy hangsúlyt kell fektetni, hiszen a humán elem a folyamatnak az elejétől a végéig kölcsönható tényezője. Végső soron a szervezetet alkotó emberek fejében lévő tudás, készségeik és képességeik biztosítják az adatstratégia végrehajtását, amit szükség esetén új szakértelem bevonásával kell biztosítani. Az Adatkutató Alintézet ennek érdekében a technológiai fejlesztés, és a szükséges szakértelem bevonása mellett megkezdte a szervezet teljes állományának kis csoportokban való képzését.
- 31/32 -
Természetesen nem maradhatnak ki a felülvizsgálatból az adatstratégia tervezése során maguk az adatok sem. Meg kell vizsgálni pl. hogy a meglévő adatállományok megfelelnek-e a jövőbeli terveknek? Megfelelően strukturáltak-e? Minőségi adatokkal dolgozunk-e? Szükség van-e gépi tanulásra (machine learning, deep learning) az adatok feldolgozásához?
Ami azt illeti a MOKK által kezelt adatok megfelelnek az aktuális terveinknek, és ehhez képest megfelelően strukturáltak is, valamint a minőségük is megfelelő. Az adatkutatás során azonban további tisztításon és esetenként - az eredeti adatok érintetlenül hagyása mellett - újrastrukturáláson esnek át, ezzel új adatbázisokat képeznek. Emellett folyamatosan halad a kutatási környezet kialakítása, amelynek során eljutunk a gépi tanulás különböző formáinak alkalmazásáig.
A MOKK kezelésében lévő adatok felhasználásának fő céljai az alábbi négy területre koncentrálódnak:
- a közjegyzők és munkatársaik támogatása az eljárási folyamatok optimalizálása révén (folyamat és döntéstámogatás),
- a hivatásrendre vonatkozó szabályozás előkészítésének támogatása,
- a hivatásrendi folyamatok elemzése révén tudományos kutatások folytatása,
- adatbiztonság (archiválás, biztonságos aláírások alkalmazása, IT biztonsági megoldások, adatklasszifikáció, értéktudatos adatmegközelítés).
A fent vázolt célok megvalósítása révén elérhető a hatékonyabb közjegyző-közjegyző, közjegyző-ügyfél közötti kommunikáció, az egyes közjegyzői eljárások hatékonyabb döntéstámogatása, vagyis az, hogy az eljáró közjegyzők az ügyek elintézéséhez szükséges adatokhoz és információkhoz gyorsabban és koncentráltabban juthassanak hozzá, továbbá ún. nyelvi modellek (NLP) és gépi tanulás (machine learning, deep learning) igénybevételével automatikus tartalomgenerálás révén tökéletesebb iratminták legyenek előállíthatók. Az adatstratégia végrehajtása révén folyamatainkat és szolgáltatásainkat kiterjedtebben, szélesebben és mélyebben ismerhetjük meg, és a következtetéseket levonva hatékonyabban használhatjuk ki az erőforrásainkat és optimalizálhatjuk az eljárási folyamatainkat, sőt, adott esetben újfajta eljárásokat vezethetünk be. Az eljárás eredményeként csökkenthető a hibák aránya, még időben lehetővé válik a normasértések és más nem kívánatos anomáliák detektálása, ezek által tovább javítható a szolgáltatásaink minősége, ezen túlmenően pedig lehetővé válik a kockázatok adatvezérelt becslése is. Ugyancsak az eljárásaink tökéletesítésének, az ügyfélközpontú szolgáltatások kialakításának irányába mutat az ügyfélkapcsolati sajátosságok feltérképezésének, az ügyfélelégedettségi előrejelzésnek és más előrejelzésnek a lehetősége is, amit szintén biztosít az adatstartégia fenti célok megvalósítására irányuló végrehajtása.
Mindezeken túl a visszacsatolások révén lehetővé válik az adatbázisaink javítása. Ezt bizonyítja az is, hogy az Adatkutató Alintézet hazai kutatásához csatlakozó szlovák
- 32/33 -
adatelemzés feltárta a szlovák adatbázisok hiányosságait, amelyek folytán azokat azonnal ki lehetett javítani.
A fent vázolt előnyök az adatstratégia és annak végrehajtása révén érhetők el. Annak hiányában a hivatásrend tagjai és szervezeti egységei elesnek ezektől a lehetőségektől és mivel megfelelő tudás hiányában nem ismerik az adatok felhasználásával járó lehetőségeket, bennük gyakran előítéletes gondolkodás alakul ki az adatokkal, az adatok kezelésével kapcsolatban, ami tovább rontja az esélyeiket a digitális világhoz való alkalmazkodásban.
Ugyanakkor gyakran tapasztalható az is, hogy egy-egy szervezet adatstratégia hiányában kezd bele az általa kezelt adatok hasznosításába, de adatstratégia hiányában ezt nem teljeskörűen teszi, így az nem lesz hatékony, mert pl. nem vonják be az összes szükséges hivatásrendi társterületet; nem használják fel az összes szervezeti szinten elérhető adatkört; hanem csak egy-egy szűkebb terület céljait veszik figyelembe, és figyelmen kívül hagyják a szervezeti szintű célokat, vagy pl. pontatlan, nem megfelelő minőségű és tartalmú, vagy inkonzisztens adatokat használnak fel, ami rossz szervezeti döntésekhez vezet.
A Data Governance célja az adatok olyan kombinációjának megtalálása, mely az adathalmazok kiaknázása során a legnagyobb előnyt biztosítja. Megvalósítása érdekében tehát fel kell mérni a rendelkezésre álló és potenciálisan előállítható belső adatforrásokat, és az elérhető külső adatbázisokat. A Data Governance fő területei tehát az adatforrások, az elérhető adatbázisok meghatározása, az adatfelhasználás módjának, az alkalmazott technológiának és az adatinfrastruktúrának, az adathozzáférésnek a meghatározása, az adatkompetenciák biztosítása, az adatok felhasználhatóságának, integritásának és biztonságának megteremtése, továbbá az alkalmazási terület meghatározása valamint a mérés és a végrehajtás.
Mindezeket a MOKK Adatkutató Alintézet vonatkozásában az alábbiak szerint foglalhatók össze:
A MOKK és a MOKK IT lényegében a kezdetektől, vagyis 1992 óta kiemelt figyelmet fordít az adatok megfelelő és biztonságos szervezésére. Cél az adatok egységes kezelése, de vannak szigetszerűen kezelt adatforrások is, amit a vonatkozó jogszabályi háttér is indokol. Jelenleg szigetszerű adatokat képeznek például az ENYER, VSZNY, gkZONY rendszerek. De ezen adatok tekintetében is elmondható, hogy a kapcsolódási pontok fixek és ezek az adathalmazok bár önálló adathalmazoknak tekintendők, a kezdetektől alkalmazott jövőbetekintő tervezési szempontoknak hála pontosan és jól illeszkednek a MOKK központi adatforrásaihoz.
Meg kell jegyezni, hogy a jogszabályi és adatvédelmi előírások miatt egy-egy adatterületet és annak adatait önálló adatforrásként kell kezelni, minden egyes rendszer pl: KDL, HBNY, ENYER tekintetében. Ezek az adatbázisok nem vonhatók össze egyetlen adatforrássá, azonban struktúrálhatóak úgy, hogy minden további adatfeldolgozás szempontjá-
- 33/34 -
ból hasonlítsanak pl. abban, hogy azok alapján hasonló analíziseket statisztikákat lehessen készíteni, de úgy, hogy az adatok továbbra is elkülönültek maradjanak.
Ami a potenciálisan előállítható belső adatforrásokat illeti, folyamatosan vizsgálni kell, hogy a jelenlegi adatok alapján milyen új csoportosítási, legyűjtési, statisztikai vagy továbbfeldolgozási lehetőségek vannak. Egyszerű példával élve, egy-egy statisztika legyűjtése akár órákat is igénybe vehet, így e statisztikai adatok elemzése sok esetben nem lenne lehetséges, ha ezen adatokat nem szerveznénk új adatforrásba (ez a műveletsor ma is jellemző az Adatkutató Alintézetre). Emellett a különböző folyamatok adatainak szervezettebb tárolása is új adatforrásokat eredményez, hisz ezek fogják majd biztosítani az új, ma még nem létező további folyamatoknak az eredményes működését (pl. új feladatkörök meghatározása, kontrol adatok létrehozása vagy magasabb fokú rendelkezésre állás). Ilyen előállítandó, leendő adatforrás lehet az iratanyagok tartalmi feldolgozása során előálló adathalmaz is. A folyamatban ugyanakkor törekedni kell arra, hogy elkerüljük az adatok indokolatlan felhalmozását. (Az indokolatlan adatfelhalmozás, akár hibákhoz, pl. konzisztencia hibához vezethet.)
A belső adatforrásokat kiegészítik az elérhető külső adatforrások pl. nyilvános adatbázisok, nyilvántartások, együttműködési megállapodások keretében beszerzett adatok (pl. OBH együttműködési megállapodás). Külső adatbázisoknak minősülnek a közjegyzői eljárásokban pl. a JÜB, az okmányellenőrzés, vagy pl. az MNB által vezetett deviza lista, vagy a pénzintézetek által vezetett belső nyilvántartások, amelyekből adatszolgáltatás történik a hagyatéki lekérdezéseknél. Ugyanígy az ügyvédi névsor, vagy az MBVK adatlistái is mind-mind önálló adatforrások, ugyanígy a közhiteles és egyéb hozzáférhető nyilvántartások. Ezen adatforrások megfelelő felhasználásához viszont tisztában kell lenni azzal, hogy mikor, milyen adatra van szükség, és azok hol találhatók. E szempontok koordinálása, érvényesítése és ellenőrzése is része az adatstratégiának.
Az adatok felhasználásának módjai a fent vázolt előnyöket szolgálják. Ezek szolgálatában áll az adatstratégia kialakítása és végrehajtása során a MOKK elnökével való folyamatos egyeztetés, a szakbizottságokkal való kapcsolattartás, a kutatási folyamatok monitorozása és összevetése a célkitűzésekkel, és a szabályozási folyamatok adatalapú megközelítéseinek hangsúlyozása is. De ezt szolgálja az adatkutatás összehangolása az európai közjegyzői szervezetekkel és más adatkezelő szervezetekkel, lehetőség szerint együttműködési megállapodások megkötése révén, és a kutatási eredmények interdiszciplináris megközelítésben történő elemzése, így pl. az adattudományi és jogtudományi következtetések levonása is.
Az alkalmazott technológiával és belső adat-infrastruktúrával kapcsolatban elmondható, hogy az adatokat alapvetően a MOKK digitális rendszerei által generált datafikáció szolgáltatja, kiegészítve egyéb adatgyűjtési módszerekkel, pl. kérdőíves kikérdezéssel.
Adat nem veszhet el. Kiemelt fontosságú tehát a leválasztott adatok párhuzamos, külön tárolása, valamint annak biztosítása, hogy az adatokat arra illetéktelen felhasználó nem olvashatja, nem módosíthatja, vagyis azokhoz nem férhet hozzá. Emellett biztosított az adatok gyors elérése. A MOKK és a MOKK IT kiemelten kezeli ezt a kérdéskört, többek
- 34/35 -
között az adatok és adattárolást biztosító eszközök megfelelő redundanciájával[19] és naprakészségével. Az adatok és informatikai eszközök védelme érdekében az analizálandó adatokat a "szülő"(eredeti) adatforrástól elkülönítetten tároljuk. Az Adatkutató Alintézet ezt a stratégiai célt követi, így az analízisek, vizsgálatok nem terhelik túl a központi rendszert és nem gyakorolnak negatív hatást a produktív rendszerek és adatok hozzáférésére, és a rendelkezésreállására. Erre a célra a MOKK IT elkülönített eszközöket vezetett be.
Az adatok analizálására és feldolgozására jelenleg jellemző a hagyományos adatelemzési, statisztikai módszerek alkalmazása és folyamatban van a kutatási környezet kialakítása, részben az IDOM Soft-al való kooperációban, valamint egyetemi kapcsolatokkal támogatva (NME, KRE), ugyanakkor belátható közelségben van az NLP modellek, gépi tanulás bekapcsolása a kutatásba. A kutatások során az adattudományi szempontok maguktól értetődően érvényesülnek.
Ami a közelmúlt és a jelen adatelemzéseit illeti, az adatok feldolgozása és analízise több formában történt és történik. Jelenleg az egyik elemzés a kiemelt metaadatokat vizsgálja. Ezen metaadatok általában önálló egységeket képeznek az adatbázisokban vizsgálatuk nem kifejezetten erőforrás igényes, azonban kifejezetten alkalmasak arra, hogy statisztikai kimutatások készüljenek valamint ezen adatok szélesebb kontextuális összefüggései alapján lehessen következtetéseket levonni, hipotéziseket igazolni és megerősíteni, vagy cáfolni. Sok esetben a szakértők sejtik, hogy milyen igazságokat rejthetnek az adathalmazok, azonban a tervezés során nem megérzésekre, hanem tényekre kell alapoznunk. A digitalizált adatok mentén pedig az érintett folyamatok mérhetővé válnak, amely mérések hozzájárulnak a pontos tervezéshez.
Mindezek mellett - ahogy arra a fentiekben is utaltam - folyamatban van egy olyan megoldás bevezetése, ami már nem csupán a metaadatokat tud analizálni, hanem szövegeket is. Képes pl. vizsgálni, legyűjteni az iratokban található kifejezéseket, szavakat, mintázatokat, vagy szókombinációkat, képes ezeket megkeresni, majd ezen adatok alapján képes további analíziseket statisztikákat készíteni. Azonban mivel az adatok folyamatosan szaporodnak a környezet, a kifejezések pedig gyorsuló ütemben változnak, egy-egy analízishez újabb és újabb fejlesztés válik szükségessé. Mivel az elemzés értékét a valós idejű elemzés adja, és a változáshoz gyorsan kell alkalmazkodni, ennek az elvárásnak a gépi tanulás különböző módjainak a bevezetésével tudunk megfelelni.
A Data Governance központi kérdése az adathozzáférés. Az adathozzáférésről szólva pedig szót kell ejteni az adatbiztonságról, arról, hogy ki mihez és mikor fér hozzá. Esetünkben legtöbbször már a vonatkozó jogszabályok is pontosan definiálják, hogy mely rendszer milyen adatokat kell, hogy tartalmazzon, és hogy ezek közül az adatok közül kinek szükséges további hozzáféréseket biztosítani. Az üzemeltetési folyamatok is pontos szabályrendszerben rögzített módon zajlanak. Fontos tudni azonban, hogy az adatkutatás, az analízisek adatköreinek kérdését is elkülönülten kell kezelni. Az adattárolásnál már eset szó arról, hogy bizonyos adatkörök új saját forrásként jelennek meg, ezzel biztosítva
- 35/36 -
a központi rendszer tehermentesítését. Ezzel kapcsolatban ki kell emelni, hogy ilyenkor nem a teljes adatbázis kerül átemelésre. Az Adatkutató Alintézet eljárásaiban csak olyan adatok kerülnek az új forrásba, amelyek természetes személyes adatot nem tartalmaznak és konkrét személyekre (természetes és jogi személyekre, szervezetekre) vonatkozóan azokból következtetni sem lehet.
A Data Governance következő fontos szempontja a kutatási eredmények közérthető interpretálása (vizualizáció és interpretáció). Ennek érdekében az Alintézet a weboldalán folyamatosan tájékoztatja az érdeklődőket az Alintézet tevékenységéről és eredményeiről, bemutatókat, workshopokat, előadásokat, értekezleteket szervez és tart, kapcsolatot tart adatkutatásban érdekelt más szervekkel, konferenciákon vesz részt, és együttműködési megállapodásokat köt.
Ugyanakkor az eredményes adatkutatás záloga a megfelelő adatkompetenciák biztosítása. Ma már nyilvánvaló, hogy a gyors feljlődés következtében új tudományterületek alakultak és alakulnak ki (pl. adattudomány, hálózattudomány). Ennek megfelelően új szakértőkre van szükség, mivel egy összetett probléma felderítéséhez egy informatikai mérnök vagy egy saját területén kiemelkedő tudással bíró jogász kolléga szakterületi tudása már nem elegendő. Olyan szakemberekre van tehát szükség, akik egyaránt átlátják az informatikai és a jogi elvárásokat is. Mindezeken túl, ha az adatokból érdemi információkat akarunk kinyerni, akkor olyan kompetenciákkal bíró személyekre, csapatokra van szükség, akik átlátják mind a digitalizációs folyamatok mind a jogi területét, emellett jártasak a rendszerelmélet és adattudomány területén is. Erre tekintettel az Adatkutató Alintézet vezetőjével szemben támasztott elvárás a joggyakorlati ismereteken túl az adattudományi képesítés is. Az adathalmazok növekszenek, így azok folyamatos analízise és újrastrukturálása szükséges. Emiatt szükség van mind az informatikusok mind a területspecifikus szakértelem képviselőinek képzése, annak érdekében, hogy a kollégák megismerjék a rendszerek belső működési mechanizmusait, valamint a legújabb technológiákat, amelyek használata a legtöbbször már nem csak opció. Szükséges tehát a jogászok és adminisztrátorok informatikai képzése, hogy a rendszereket megismerve a folytatokat a legoptimálisabban tudják végrehajtani és ezek mellett szükséges azon kollégák képzése, akik tisztában vannak az adattudomány fogalmaival, így megértik a szervezet vezetésétől származó igényeket és azokat transzformálni tudják az adattervezők, informatikusok számára.
A külső kompetenciák igénybevételét illetően fel kell ismernünk, hogy nem lehetünk mindentudók. Szükséges egy-egy szakterületet kellő mélységben ismerő kutatók, szakemberek bevonása a folyamatainkba, akikkel együttműködve az adatstratégia eredményesebben hajtható végre. Ilyen lehetőségek rejlenek az egyetemekkel és más intézményekkel, kutatókkal való együttműködésben. Az adatkutató intézet már jelenleg is kapcsolatot tart több egyetemmel és szakértővel (pl. NME, KRE, KÜRT, IDOM - neurális háló fejlesztők, hálózatkutatók) valamint konkrét projektekkel is foglalkozik az adatanalízis terén.
Az adatok felhasználhatóságát, integritását és biztonságát illetően el kell mondani, hogy az adatok, más terminlológiában az információk védelme az informatikában évek óta kiemelt terület. Az információbiztonság (pl.: az ISO27001-es szabvány szerint is) önálló területté nőtte ki magát és alapjában három fő területre koncentrál:
- 36/37 -
- bizalmasság,
- sértetlenség és
- rendelkezésre állás.
A bizalmasság alatt azt kell érteni, hogy az adatok megfelelően kategorizáltak és a különböző adatkörökhöz csak az arra jogosultak férhetnek hozzá, a sértetlenség alatt mindazt érteni kell, ami az adatok sérülése ellen véd, valamit azoknak az eljárásoknak/technológiáknak a körét, amelyekkel ez a cél elérhető. Ide tartozik pl.: a lenyomatolás (hash képzés) vagy az elektronikus aláírás használata is, de azoknak a környezeteknek a kidolgozása is, ami az adatok hosszú távú és biztonságos tárolását biztosítja. A rendelkezésre állás - bár néha indokolatlanul háttérbe szorul - szintén kiemelten fontos tényező, hiszen ha olyan körülmény adódik, amikor egy információ, adat létezése a kérdés (pl. aláírtak-e egy szerződést, meghatalmazást, történt-e fizetés, stb.), a rendelkezésre állás sérülése, vagyis ha az információ nem érhető el, az ugyanolyan károkat okozhat mintha a kérdéses információ nem is létezne vagy megsemmisült volna.
Az adatstratégiát az Adatkutató Alintézet tervezi, koordinálja és hajtja végre. Az Adatkutató Alintézet az adatstratégiát a MOKK által kezelt adatokat összességére vonatkozóan illetve külön-külön adatterületenként érvényesíti, és a hivatásrendi stratégiától és a kutatási céloktól függően alkalmazza. Kutatásai során folyamatosan monitorozza és méri a tevékenységét, összehasonlítva az elért eredményeket a hivatásrendi stratégiai célkitűzésekkel. Ennek keretében előzetesen meghatározza, hogy az adatok pontosan milyen szerepet töltenek be a szervezetben, felméri és közérthetően megfogalmazza, hogy az adatstratégia milyen összefüggésben áll a szervezeti stratégiai célokkal és elképzelésekkel. E folyamatba, ahogy azt korábban is láttuk, bevonja a szervezeti egységek, szakbizottságok vezetőit és a területi kamarák elnökeit, a MOKK elnökét a szervezeti célok és elképzelések adatstratégiával való összehangolása érdekében, valamint a területi kamarák és a MOKK segítségével összefoglalja az ügyfelektől származó véleményeket (pl. panaszok egyéb beadványok). A széles körű egyeztetés érdekében évente legalább egy alkalommal az Alintézet műhelykonferenciát tart.
Kísérjék figyelemmel a tájékoztatóinkat! ■
JEGYZETEK
[1] Köszönetnyilvánítás: köszönet illeti Péchy Gábort, a MOKK Informatika igazgatóját, hogy szakértelmével hozzájárult a MOKK adatstratégia kialakításához.
[2] Tilesh György-Omar Hatamleh, Mesterség és intelligencia. Budapest, Libri, 2021. 85. o.
[3] Kay Firth-Buttrfield-Ted Kwartler-Sarah Kharty, It's time to change the debate around AI ethics. Here's how - World economic Forum, 21 July 2021, 4. https://www.weforum.org/agenda/2021/07/why-it-s-time-to-change-the-debate-around-ai-ethics/ (2021. július 25.)
[4] A vizsgált adathalmazokról, különösen a rendezetlen adathalmazokról sokszor nem is tudjuk, hogy pontosan mit rejtenek, ezért sok esetben az elsődleges cél az adathalmazban felfedezhető mintázatok meghatározása, azután a felfedezett mintázatok mentén folyik tovább a kutatás.
[5] A fizetési meghagyásos eljárásról szóló 2009. évi L. törvény - hatályos: 2010. június 1.
[6] Az egyes közjegyzői nemperes eljárásokról szóló 2008. évi XLV. törvény 36/E. § - hatályos: 2010. január 1.
[7] Az egyedi azonosításra kétséget kizáróan alkalmas ingó dolgok zálogjogi nyilvántartásának részletes szabályairól szóló 80/2009. (XII. 28.) IRM rendelet - hatályos: 2010. szeptember 1.
[8] A Polgári Törvénykönyvről szóló 2013. évi V. törvény XXV. fejezete - hatályos: 2014. március 15.
[9] Az egyes közjegyzői nemperes eljárásokról szóló 2008. évi XLV. törvény 36/H. § - hatályos: 2014. március 15.
[10] A közjegyzői ügyvitel szabályairól szóló 29/2019. (XII. 20.) IM rendelet - hatályos: 2020. január 1.
[11] A 166/A. §-t az elektronikus cégeljárásról és a cégiratok elektronikus úton történő megismeréséről szóló 2003. évi LXXXI. törvény 12. § (4) bekezdése vezette be.
[12] http://webpub-ext.nmhh.hu/esign2016/szolgParams/main.do
[13] Ezzel a témával bővebben foglalkozom a Jogtudományi közlöny 2021/10 számában megjelent, A jog fölmérése, az intézményi adatkutatás jelentősége című írásomban.
[14] Alessandro Vespignani, A jóslás algoritmusa, Budapest, Libri, 2020. 65-67. o.
[15] Kandrouch Ibtissame, Redouani Yassine, Chaoui Habiba, Real time processing technologies in big data: Comparative Study, 2017. Sept. 21-22, IEEE International Conference of Power, Control, Signals and Instrumentation Engineering (ICPCSI), az irat elérhető a https://ieeexplore.ieee.org/abstract/document/8392202 hivatkozáson.
[16] Hiba Jasim Hadi, Ammar Hameed Shnain, Sarah Hadishaheed, Azizahbt Haji Ahmad, Big Data and Five Vs Characteristics. International Journal of Advances in Electronics and Computer Science, Volume-2, 2015. 01., 20-21. o. Nagyság: az elemzendő adatok mennyiségére utal, amint arra korábban is hivatkoztam, a BigData megközelítés a terabytekben mérhető adatmennyiségektől kezdve értelmezhető. Sebesség: a Big Data feldolgozásának idejét jelenti. Minél közelebb áll időben az adatok feldolgozása az adatok keletkezéséhez, annál értékesebb az elemzés. Az adatoknak a keletkezésük idején történő feldolgozása maximalizálja a hatékonyságot. A sebesség ugyanakkor utal az adatok keletkezésének a sebességére is (pl. másodperces, napi, havi stb.). Változatosság: a Big Data által tartalmazott adatok típusára utal. Ezek az adatok lehetnek strukturáltak vagy strukturálatlanok is. Az adathalmaz bármilyen típusú adatot tartalmazhat, például szöveget, érzékelő adatokat, hangot, videót, kattintási adatfolyamokat, naplófájlokat stb. Érték: az adatoknak arra a jellemzőjére utal, amelyet az elemzés által hozzáadott értékhatároz meg. Az adatok értéke az általuk képviselt eseményektől vagy folyamatoktól függ, például sztochasztikus, valószínű, rendszeres vagy véletlenszerű. Ebből a szempontból az adatérték szorosan összefügg az adatmennyiséggel és a változatossággal. Valósághűség: arra utal, hogy a döntéshozó mennyire bízik a kinyert információban, hogy döntést hozzon. Ezért a fontos a megfelelő összefüggések feltárása, amelyekhez elengedhetetlen az adatok eredeti kontextusainak ismerete, vagyis a szakterületi szakismeret. Az ábra ugyaninnen idézve.
[17] https://www.pwc.com/hu/hu/szolgaltatasok/technologiai_tanacsadas/data_analytics/adatstrategia.html
[18] FAIR Adatelvek: A FAIR adatelveket 2016. márciusában publikálta egy adatmenedzsmentben jártas, tudósokból és szervezetekből álló konzorcium. A FAIR mozaikszó, amit az alábbi angol kifejezések kezdőbetűiből raktak össze: findability, accessibility, interoperability reusablility.
Findability: az adatokat úgy tároljuk és strukturáljuk, hogy azok könnyen megtalálhatók legyenek.
Accessibility: az adatokhoz a megfelelő embereknek megfelelő időben hozzá kell tudni férniük.
Interoperability: az adatokat lehessen egymással integrálni.
Reusability: az adatoknak újra felhasználhatónak kell lenniük.
[19] A redundancia ez esetben az adatok biztonságos elérésére és tárolására utal, arra a biztonsági szempontra hogy az adatok, adatbázisok több példányban, földrajzilag elkülönülten elhelyezett eszközökben legyenek elérhetők, biztosítva ezzel pl egy katasztrófa esetére az adatok sértetlenségét és folyamatos elérhetőségét.
Lábjegyzetek:
[1] A szerző közjegyző, Budapest Magyar Országos Közjegyzői Kamara elnökhelyettes MOKK Adatkutató Alintézet vezetője.
Visszaugrás