Fizessen elő az In Media Resre!
Előfizetés"Minden új technológia maga mögött húzza a világ egyenlőtlenségeit,
és általában olyan módon tesz hozzájuk, amelyre senki sem számított."[1]
A nyelvtechnológiák fokozatos fejlődése egyre több területen bontja le a nyelvi akadályokat és teszi lehetővé a kisebbségek számára a hatékony társadalmi, gazdasági és politikai részvételt. A gépi fordítás és tolmácsolás, a különböző felhasználásokra fejlesztett chatbotok és más eszközök segítségével a kisebbségi nyelvhasználók immár a saját nyelvükön férhetnek hozzá különböző szolgáltatásokhoz, köthetnek szerződéseket vagy tájékozódhatnak közügyekben. Habár a fejlesztések üdvözlendők, ezek a technológiák jellemzően és eredendően elfogultak abban az értelemben, hogy azokat elsősorban a többségi, hivatalos vagy államnyelvek számára fejlesztik ki. Ennek ellenére több hivatalos nyelv és akár államnyelv is abban a helyzetben találhatja magát, hogy már csak beszélőszámánál fogva sem jelent vonzó befektetési lehetőséget a nyelvtechnológiai fejlesztés szempontjából, így újabb választóvonalak kerülhetnek az egyes nyelvek közé és már meglévő kisebbségi státuszok szilárdulhatnak meg. Emellett az olyan nyelvi kisebbségek, mint a siketek, a vakok, a némák, a nagyothallók stb. információkhoz való hozzáférését és kommunikációját is elősegíthetik a nyelvtechnológiai fejlesztések, például az automatikus feliratozás, képernyőfelolvasás vagy jelnyelvi kesztyű útján. Ugyanakkor megállapítható, hogy a fejlesztés éppen ezeken a területeken lassan halad előre, ezért a nyelvi kisebbségek tartósan kiszorulhatnak a modern kommunikációs megoldások használatából. A nyelvtechnológiai fejlesztések tehát nem csupán esélyt teremtenek a felhasználók számára a társadalmi, gazdasági és politikai részvétel fokozására, hanem át is rendezhetik az egyes nyelvek és beszélőik közötti viszonyokat azzal, hogy bizonyos nyelvi közösségek másokhoz képest tartósan lemaradhatnak a nyelvtechnológiai fejlesztésekben.
With the incremental development of language technologies, language barriers are being dismantled in more and more areas, enabling minorities to participate in social, economic and political life. With the help of machine translation, automatic interpretation and chat bots developed for different uses, etc., minority language users can now access various services enter into contracts or access information on public affairs in their own language. While these developments must be welcomed, such technologies are typically and inherently 'biased' in the sense that they are developed primarily for the majority, official, or state languages. Nevertheless, several official languages and even state languages may find themselves in a bind, where language technology development does not reach them due to the low number of their speakers. As a result, new dividing lines may open up between the differentlanguages, and existing minority statuses may be cemented. In addition, linguistic minorities such as the deaf, blind, dumb, hard of hearing, etc. may also benefit from access to and communication through language technology, such as automatic captioning, screen readers or sign-language gloves. At the same time, it exactly is in these areas that progress is slow, which may lead to the long-term exclusion of linguistic minorities from modern communication solutions. the relationship between individual languages and their speakers, with some language communities lagging behind others in language technology developments. Thus, language technology developments not only provide opportunities for users' social, economic and political participation but may also reshape the relationship between languages and their speakers, forcing some language communities to lag behind in terms of language technology developments.
Miközben a nyelvi jogok nemzetközi jogi elismerésére irányuló törekvések továbbra is gyerekcipőben járnak, a nyelvtechnológia folyamatos fejlődése egyre több lehetőséget nyit meg a kisebbségi nyelvek és a nyelvi kisebbségek beszélői számára. Ezeket a technológiákat azonban elsősorban a "nagyobb", illetve a politikai vagy gazdasági szempontból meghatározóbb nyelvek beszélői számára fejlesztik. Ezzel a többségi és a kisebbségi nyelvek beszélői között már eleve fennálló szakadék tovább mélyül, amivel sok esetben egyszerűen a "kiváltságos" és a hátrányos helyzetű nyelvi kisebbségek kategóriái termelődnek újra. Emellett a nyelvi kisebbségek tagjai, így a siketek, a vakok, a némák, a siketnémák hiába rendelkeznek saját nyelvvel, számos kommunikációs akadály nehezíti a társadalmi, gazdasági és politikai életben való teljes, korlátoktól mentes részvételüket.
Az alábbiakban a Language in the Human Machine Era (LITHME) kutatóhálózatnak a nyelvtechnológiák jövőjéről és hatásairól szóló legújabb tanulmányára támaszkodva a modern nyelvtechnológiák egyes kategóriáit és fejlesztéseit ismertetem, kitérve arra is, hogy ezek milyen módon segíthetik a kisebbségi nyelvek, valamint a nyelvi kisebbségek társadalmi, politikai és gazdasági részvételével kapcsolatos hátrányok leküzdését. Többek között arra a kérdésre keresem a választ, hogy ezek az új technológiák miként alakítják át a többségi és a kisebbségi nyelvhasználók közötti viszonyokat. Terjedelmi okokból csupán vázlatosan tekintem át az új nyelvtechnológiai termékeket és szolgáltatásokat, valamint az ezekhez kapcsolódó veszélyeket és lehetőségeket. Végül röviden kitérek a kisebbségi nyelvek asszimilációjának és kulturális kisajátításának kihívásaira is.
Az alábbiakban, ha kifejezetten nem teszek különbséget kisebbségi nyelv és nyelvi kisebbség között, akkor általános jelleggel nyelvi kisebbségként hivatkozom mindazokra a beszélőkö-
- 67/68 -
zösségekre, amelyek vagy nem az államuk hivatalos nyelvét beszélik, vagy olyan közösségek, amelynek tagjai a kommunikációs készségeiket érintő fogyatékossággal élnek (például siketséggel, siketnémasággal, némasággal, vaksággal, siketvaksággal vagy egyéb, a hallást, látást, beszédet érintő fogyatékossággal). Természetesen a nyelvi kisebbség fogalma alá vont közösségek nagyon is eltérő helyzetben vannak, hiszen egyes kisebbségi nyelvek más állam(ok)nak hivatalos nyelvei, aminek számos kulturális és gazdasági előnyét élvezik, míg mások nem csupán nyelvi, de etnikai és/vagy vallási kisebbségnek a tagjai is egyben, ami miatt többszörösen is megtapasztalják a kisebbségi lét esetleges hátrányait. A nyelvi kisebbségek helyzetében azonban közös, hogy nyelvi okokból hátrányosabb helyzetben vannak a közszolgáltatásokhoz, de akár a versenyszféra által nyújtott szolgáltatásokhoz való hozzáférésben, valamint a politikai, társadalmi és gazdasági részvétel terén.
A hivatalos vagy kvázi hivatalos nyelvek rögzítésével, az oktatásban való elterjesztésével és a közigazgatásban, igazságszolgáltatásban való kizárólagossá tételével (elsősorban Európában) közel egynyelvű államok és régiók jöttek létre. Egy politikai közösség számára számos közvetlen előnnyel jár valamely hivatalos nyelv bevezetése: biztosítja a hatékony politikai kommunikációt,[2] racionalizálja a közigazgatást,[3] fokozza a kereskedelmi kapcsolatokat és a kereskedelem biztonságát.[4] A politikai és a gazdasági szempontok a nyelvi rezsim racionalizálása és egy hivatalos nyelv bevezetése és elterjesztése mellett szólnak, ám ez egyenlőtlen feltételeket teremt a politikai közösség egyéb nyelveket beszélő tagjai számára. A hivatalos nyelv ugyanis döntő hatással van a nyelvi többség és kisebbség társadalmi, politikai és gazdasági helyzetére. A hivatalos nyelvek kiváltságos helyzetüknél fogva rendszerint "nagy erőforrásokkal rendelkező nyelvek", megfelelő pénzügyi és egyéb erőforrásokkal e nyelvek egységesítésére, dokumentálására, feldolgozására, kutatására és tanítására.[5] Beszélői számos tényezőnél fogva (például társadalmi helyzet, származás, nem) szenvedhetnek hátrányt, azonban országuk társadalmi, gazdasági és politikai életében való részvételüknek nincsenek nyelvi akadályai.
A hivatalos nyelv kontextusában a kisebbségi nyelvek beszélői számos akadállyal szembesülhetnek: anyanyelvük mellett meg kell tanulniuk a hivatalos nyelvet, így miközben a hivatalos nyelv beszélői például továbbképzik magukat, a kisebbségi nyelvhasználók idejét és kapacitását
- 68/69 -
a hivatalos nyelv elsajátítása köti le.[6] Ha a kisebbségi nyelvhasználó akcentussal beszéli a hivatalos nyelvet, akkor hátrányosabb társadalmi és politikai, ennek következtében pedig hátrányosabb gazdasági helyzetbe kerülhet. A hivatalos nyelv tudásával kapcsolatos esetleges hiányosságai, képzettsége okán tehát a kisebbségi nyelv beszélője sok esetben lemarad a politikai pozíciókért vagy munkahelyekért folytatott versenyben a hivatalos nyelv beszélőivel szemben. A taktilis vagy más jelnyelvet használó nyelvi kisebbségek számára különösen költséges a társadalmi, politikai, gazdasági részvétel nyelvi feltételeinek megteremtése. Emiatt e nyelvi kisebbségek számára csak lassan halad a fejlesztés, és továbbra is hiányos a nyelvi részvétel biztosítása. Ennek következtében a kisebbségi nyelvek beszélői, valamint a nyelvi kisebbségek nem csupán gazdasági, társadalmi és politikai részvételükben, de az olyan közszolgáltatásokhoz való hozzáférésükben is korlátozottak, mint amilyen az oktatás, az egészségügy vagy az igazságszolgáltatás.
Míg az egyéb jogok érvényesítésének előfeltételét képező nyelvi jogok nemzetközi jogi elismerése és védelme iránti erőfeszítések az utóbbi évtizedekben megtorpanni látszanak,[7] a nyelvtechnológiák megjelenése és fejlődése új lehetőségeket nyitott a kisebbségi nyelvek és a nyelvi kisebbségek számára, hogy e nyelvi akadályokat leküzdhessék. A hallókészülékektől és a Braille-olvasó technológiáktól kezdve a gépi fordító és a képernyőfelolvasó szoftverekig számos új megoldás könnyítette meg a kisebbségi nyelvek és a nyelvi kisebbségek tagjainak kommunikációját. Habár e nyelvtechnológiai eszközök közül többet is elsősorban katonai, hírszerzési vagy humanitárius célokra fejlesztettek ki, némi késéssel megjelennek a polgári felhasználásra fejlesztetett változataik is, ami a kisebbségi nyelvek és a nyelvi kisebbségek tagjai, valamint a társadalom más szereplői számára egyaránt előnyös.[8]
A nyelvtechnológiai megoldások az egyes (például szakmai, kétnyelvű stb.) beszélőközösségek, az egyes nyelvek, valamint az (írott, hangzó, jelelt stb.) nyelvi modalitások közötti közvetítést hivatottak elősegíteni. Ma már egyre inkább terjed az online korrepetálás, a virtuális nyelvtanítás, a gépi és a számítógéppel támogatott fordítás, de már a gépi tolmácsolási eszközök is megjelentek.[9] A nyelvtechnológiai fejlesztések immár a kiterjesztett valóság (augmented
- 69/70 -
reality) megteremtése felé haladnak, virtuális vizuális és auditív elemeket integrálva a felhasználó valós érzékelésébe (például Google Glass). Ennek részét képezheti az "idegen" szöveg vagy beszéd gépi feldolgozása, fordítása, tolmácsolása is, amivel újabb felhasználások válnak elérhetővé a hátrányos helyzetű nyelvi kisebbségek tagjai számára.
Habár a kommunikáció és a részvétel nyelvtechnológiai megoldásokkal történő megkönnyítése egyértelmű előnyökkel jár a nyelvi kisebbségek számára, ezek az új technológiák egyben új választóvonalakat is húzhatnak az egyes beszélőközösségek és nyelvi csoportok közé. Ennek oka az, hogy ezeket a technológiákat a méretgazdaságosság érdekében, a piaci kudarc elkerülésére, valamint a kellő fizetőképes kereslet vagy akár a megfelelő humánerőforrás hiányában bizonyos kisebbségi nyelvek vagy nyelvi modalitások számára nem vagy csak jelentős késéssel vagy hiányosságokkal fejlesztik ki. Ezzel megszilárdulhat vagy akár tovább romolhat egy-egy nyelvi kisebbség hátrányos helyzete, de akár a többségi és/vagy a hivatalos nyelvek korábbi politikai, gazdasági és kulturális előnye is csökkenhet.
A nyelvtechnológiai LITHME kutatóhálózat által megalkotott definícióval összhangban nyelvtechnológiaként hivatkozom mindazokra a technológiákra, amelyek képesek a személyek közötti nyelvi kommunikáció feldolgozására és a személyekkel történő közvetlen kommunikációra. Ahogyan a LITHME fogalmaz: ezek azok a technológiák, amelyeken keresztül vagy amelyekkel az emberek kommunikálnak.[10] Az előbbi a fordítást, tolmácsolást támogatja, és az információ feldolgozását segíti elő, az utóbbi pedig lehetővé teszi számunkra, hogy kommunikáció útján lépjünk kapcsolatba különböző egyéb technológiákkal.
Amint azt az Egyesült Nemzetek Szervezetének Emberi Jogi Főbiztosi Hivatala által kiadott, Az egyenlő politikai részvételt akadályozó tényezők és a kihívások leküzdésére tett lépések című jelentés hangsúlyozza:
A politikai és a társadalmi részvételi jogok döntő szerepet játszanak a demokratikus kormányzás, a jogállamiság, a társadalmi befogadás és a gazdasági fejlődés előmozdításában, valamint az emberi jogok érvényesülésében. A politikai és a közéletben való közvetlen vagy közvetett részvétel kiemelkedő jelentőséggel bír az egyének és csoportok pozíciójának erősítésében, ami az emberi jogi megközelítés egyik fő eleme a társadalmi kirekesztés és diszkrimináció felszámolásában. A részvételi jogok elválaszthatatlanok más emberi jogoktól, így például a békés gyülekezéshez és az egyesüléshez való jogtól, a szólás- és a véleményszabadságtól, valamint az oktatáshoz és a tájékoztatáshoz való jogtól.[11]
A jelentés a nyelvi akadályok leküzdésére irányuló intézkedések bevezetését javasolja a társadalom valamennyi tagja részvételének elősegítésére. Ezen belül elsősorban a politikai részvételre összpontosít, és kifejezetten tartalmazza a "választási információk és szavazólapok rendelkezésre bocsátását több különböző, hozzáférhető formátumban és nyelven", továbbá javasolja a
- 70/71 -
politikai folyamatokat bemutató tájékoztató és oktatási anyagok hozzáférhető formátumban és nyelveken történő bemutatását.
Ha a részvétel fogalmát a közszolgáltatásokhoz, az igazságszolgáltatáshoz, az oktatáshoz és az egészségügyi ellátáshoz való hozzáférésre is kiterjesztjük, kijelenthető, hogy a nyelvtechnológiák jelentősen hozzájárulhatnak a nyelvi kisebbségi lét társadalmi, gazdasági és politikai hátrányainak leküzdéséhez,[12] ugyanis elősegíthetik a politikai részvételt és növelhetik a nyelvi kisebbségek tagjainak jelenlétét a hazai és a nemzetközi gazdasági életben,[13] ezzel pedig hozzájárulhatnak a társadalmi igazságossághoz, javíthatják a demokrácia állapotát, de még a gazdasági növekedést is fokozhatják. Ezzel egy időben javítják a nyelvi kisebbségek helyzetét, erősítik társadalmi-gazdasági pozíciójukat és felelősségvállalásukat, továbbá megkönnyítik az egyéni jogok érvényesülését (információs jogok, politikai, szociális és kulturális jogok, vállalkozási szabadság stb.).
A nyelvi kisebbségek számára a nyelvtechnológiák legfőbb felhasználási területe a nyelvek közötti és a nyelven belüli fordítás és tolmácsolás lehet. Emellett a többségi nyelv elsajátítását célzó megoldások is javíthatják a kisebbségi nyelvek beszélőinek helyzetét, természetesen a lehetséges hosszú távú nyelvi asszimiláció veszélye mellett. A nyelvek közötti fordítás területén kialakított olyan technológiák, amelyek többek között a kisebbségi nyelvek beszélői számára is előnyösek lehetnek, az ún. webhelyfordítók (például WeGlot, Google Translate), valamint a gépi fordítószoftverek (például Google Translate, DeepL, Amazon Translate). Ezek a részben ingyenes nyelvtechnológiák lehetővé teszik a kisebbségi nyelvhasználók számára, hogy a többségi és/vagy a hivatalos nyelveken közzétett információkhoz a saját nyelvükön is hozzáférjenek, valamint a többségi és/vagy a hivatalos nyelven kommunikáljanak a hatóságokkal, szolgáltatókkal stb. A képernyőolvasók (például NVDA, Orca) olyan intralingvális szolgáltatást nyújtanak, amely lehetővé teszi a vak vagy gyengénlátó olvasók számára az online forrásokhoz való hozzáférést azáltal, hogy az írott szöveget hangzóvá alakítják. Az insideOne tableten Braille-billentyűzetet helyeztek el,[14] az OrCam szemüvegre felhelyezhető eszköz szintén a vakokat, gyengénlátókat segíti azzal, hogy azonnal felolvassa az érzékelt szöveget,[15] az intelligens kesztyű pedig az első kísérlet arra, hogy a jelnyelvet írott szöveggé alakítsák át.
Az írott szöveg fordítása területén először a forrásnyelvet statisztikai modellek alapján elemző gépi fordítás (SMT) terjedt el, amely "a fordítás feladatát úgy tekinti, mint a fordítás pontosságát, valamint gördülékenységét reprezentáló modellek kombinációja által elérhető maximális valószínűségi értékhez tartozó szöveg meghatározása".[16] Később az SMT fokozatosan háttérbe szorult a neurális gépi fordításhoz (NMT), vagyis az olyan megoldáshoz képest, amely
- 71/72 -
a mélytanulás és a "szövegértés" elemeit igyekszik beépíteni a gépi fordításba. Az NMT ún. vektoros reprezentációkat alkot az egyes szavakhoz, és folyamatosan tanulja azokat, több millió mondatpáron keresztül. Az NMT inkrementális tanulásával fejlődő neurális hálók állandóan változnak, miközben a fordítási teljesítmény javul. A mai gépi fordítóeszközök "kontextustudatosabbak", vagyis felismerik a szavak kontextusából azok jelentését, ezáltal pontosabb fordítások előállítására képesek.
Napjainkban már gépi tolmácseszközök is rendelkezésre állnak, amilyen például a német szövetségi kutatási és technológiai minisztérium által finanszírozott, német, angol és japán nyelvű üzleti tolmácsolás céljából kifejlesztett VERBMOBIL. A konfliktuszónákban is egyre nagyobb szükség van a beszélt nyelvet tolmácsoló szoftverekre. Ilyen eszköz például a MASTOR, amely egy nyelvjárásokat is felismerni képes szoftver az angol és az arab nyelv közötti közvetítéshez. A Phraselator kézi tolmácsgép, amelyet az Applied Data Systems és a VoxTec fejlesztett ki, katonai célokra is használható, és negyven nyelvre fordítja az angolt. Végül a Jibbigo Translator 2.0 ingyenes, húsz nyelv között működő speech to text applikáció, vagyis egy olyan beszédfelismerő eszköz, amely írott szövegként fordítja az elhangzott szóbeli közlést.[17] Ezek a megoldások a nyelvi kisebbségek tagjai számára is hasznos szolgáltatást nyújthatnak, de természetesen csak akkor, ha a nyelvük szerepel a szoftver által tolmácsolt nyelvek között.
A chatbotok (más néven a "beszélgetős mesterséges intelligenciák") jó megoldást kínálhatnak a különféle szolgáltatások elérhetővé tételére, ha ezek kisebbségi nyelveken is rendelkezésre állnak.[18] A chatbotok anticipálják a beszélgetőtárs kérdéseit és válaszait, lehívják az ezekre előre összeállított válaszokat és végrehajtják a kívánt műveleteket. A chatbotok költséghatékony módon biztosítanak hozzáférést akár a nyelvi kisebbségek számára is egyes közszolgáltatásokhoz, de még az idegennyelv-oktatást is kiegészíthetik. A fogyatékossággal élő személyek érdekében ezeket a technológiákat hangzó beszédről írott szövegre vagy írott szövegből hangzó beszédre fordítás funkcióval is ki lehet egészíteni, ami megkönnyíti az adatok bevitelét és a kívánt célnyelvre és/vagy nyelvi modalitásra történő fordítást. A beszédfelismerés területén a technológiai fejlődés ma már nem csupán a nyelvjárások felismerése felé halad, hanem a beszéd kontextusának és érzelmi árnyalatainak (például szarkazmus, boldogság, szomorúság stb.) felismerése felé is.[19]
Végül különleges kihívást jelent a nyelvtechnológiai megoldások ötvözése, az, amikor egyszerre kell a nyelvi modalitások és a nyelvek közötti közvetítést támogatni. Mivel a nemzeti Braille nem használható az idegen nyelv oktatásához, a képernyőfelolvasó az azonos hangzású, de eltérő írásmódú és jelentésű idegen nyelvű szavak gyakorlásában pedig felemás megoldást jelent, olyan eszközt kellett fejleszteni, amely egyszerre képes az írott idegen nyelvet feldolgozni és hozzáférhetővé tenni a vak olvasó számára. A RoboBraille az írott szöveget különböző egyéb formátumokká alakítja át, például mp3, Braille vagy DAISY (digital accessible information system) formára.[20] Ez utóbbi egyfajta kereshető hangoskönyv, amely a Kindle-höz hasonlóan
- 72/73 -
jegyzetek elhelyezését és egyéb források elérését is lehetővé teszi a vakok és a gyengénlátók számára, emellett a képeket taktilis úton érzékelhető formákra "fordítja le".[21]
A fent említett nyelvtechnológiák az alapvető közszolgáltatásokhoz való hozzáférést is biztosíthatják, amilyen például a közszolgálati műsorszolgáltatások, az egészségügyi ellátás, a közigazgatás vagy az oktatás. Ily módon ezek a technológiák jelentős mértékben hozzájárulnak a nyelvi kisebbségek alapvető jogainak érvényesítéséhez, különösen akkor, ha e technológiák ingyenesek vagy megfizethetők a közösség tagjai számára, és integrálják azokat az egészségügyi, oktatási és közigazgatási rendszerekbe. Következésképpen egy participatorikus, esélyegyenlőségre épülő demokráciában kiemelkedő állami feladatnak tekinthető a nyelvtechnológiák fejlesztése a nyelvi kisebbségekhez tartozó személyek alapvető jogainak biztosítása, érdekeik védelme érdekében. Mindeközben a nyelvtechnológiai megoldások a versenyszféra által nyújtott egyéb szolgáltatások igénybevételét is megkönnyíthetik, így például az idősek otthonában történő elhelyezés, a magánegészségügyi ellátás, a kereskedelmi médiaszolgáltatások vagy a magánoktatás területén.
A nyelvtechnológiai megoldások amellett, hogy támogathatják a nyelvi kisebbségeket abban, hogy a többséggel közel egyenlő módon vehessenek részt a társadalmi, politikai és gazdasági életben, hozzájárulhatnak a nyelvi kisebbségek kultúrájának és nyelvének védelméhez és népszerűsítéséhez is. A kisebbségi nyelvek dokumentálása elősegíti azok megőrzését,[22] feldolgozását és kutatását, ez pedig megágyaz annak, hogy a kisebbségi nyelvet új technológiák útján revitalizálják.[23] A televíziót és a rádiót régóta a nyelvváltást kiváltó tényezőnek tekintik, azonban az egyre szélesebb körben alkalmazott automatikus feliratozás most már a nyelvi kisebbségek saját nyelvén is biztosíthatja a hozzáférést. Ha a hivatalos nyelv elsajátítása nem kötelező, és a közvetítés automatikus feliratozással történik, akkor a kisebbségi nyelv és a kultúra megőrzése mellett a beszélők információs jogai is garantálhatók. Ezzel egy időben a hivatalos, azaz rendszerint a többségi nyelv beszélői számára is hozzáférhetővé válnak a kisebbségi nyelven sugárzott és a hivatalos nyelven feliratozott műsorok. Ez a speech-to-text fordítási megoldás kulturális veszteség nélkül hozza közelebb egymáshoz az egyes nyelvi közösségek tagjait, segítve a kölcsönös megértést.
Míg az olyan széles körben használt nyelvek, mint például az angol beszélői gyakorlatilag azonnal élvezhetik a nyelvtechnológiákba fektetett intenzív kutatás és fejlesztés előnyeit, addig a gépi fordítás és tolmácsolás korszakában az ún. erőforráshiányos nyelvek ismét hátrányba kerülnek. A nyelvi kisebbségek nyelvük valamelyik "nagy" vagy hivatalos nyelvhez való nyelvi közelségétől, a rendelkezésre álló pénzügyi és humánerőforrásoktól és a kisebbségi nyelv meglévő
- 73/74 -
adatkészleteinek minőségétől és mennyiségétől függően részesülnek az új nyelvtechnológiák adta lehetőségekből.
A nyelvtechnológiák fejlesztése szempontjából kulcsfontosságú, hogy az adott nyelvet hányan beszélik, hiszen ez határozza meg a technológia jövőbeli fogyasztóinak számát, a fizetőképes kereslet nagyságát, ezáltal a technológiába történő befektetés esélyét.[24] A nyelvi közelség fontos szerepet játszik a fordítási és tolmácsolási eszközfejlesztés minőségében, hiszen az a jelenleg rendelkezésre álló nyelvtechnológiai megoldásoknál közvetlen hatással van az egyes nyelvek (és kultúrák) közötti közvetítés pontosságára.[25] A pénzügyi erőforrások, a rendelkezésre álló idő és a megfelelő szakértelem adott nyelven való elérhetősége szintén meghatározó a nyelvtechnológiák sikeres fejlesztése szempontjából. Jelenleg még kulcsfontosságú tényező az adathalmazok (például a nyelvi korpuszok, beszédadatbázisok, elektronikus szótárak) mennyisége és minősége is, különösen a párhuzamos korpuszok elérhetősége.[26] Például az olyan többnyelvű politikai közösségek, mint amilyen az Európai Unió vagy Kanada, bőséges adatkészletet hoztak létre a hivatalos nyelveiken és a jogszabályaik által szabályozott témákban. Ezek azonban rendszerint egyébként is megfelelő erőforrásokkal rendelkező nagy, hivatalos államnyelvek. Ugyanakkor még a milliók által beszélt nyelvek között is vannak olyanok, amelyek még nem rendelkeznek a nyelvtechnológiai fejlesztéshez szükséges adatkészletekkel - például a volof, a joruba és az ewe nyelvre vonatkozóan transznacionális afrikai projekteket indítottak el helyi kutatók, hogy a nyelvtechnológiai eszközök számára feldolgozható adatkészleteket állítsanak össze.[27]
Ezekhez képest a kisebbségi nyelvek még ritkábban rendelkeznek elegendő adatkészlettel.[28] Márpedig többek között ez dönti el, hogy egy adott nyelvre fejlesztenek-e nyelvtechnológiákat és milyen minőségben teszik. Következésképpen a jövőben a digitális szakadék és a vele együtt járó információs szegénység már nem feltétlenül a hivatalos és a kisebbségi nyelvek között húzódik majd, hanem azon nyelvek között, amelyeken a nyelvtechnológiák hozzáférhetők és amelyeken nem. Ahogy a Mercator Centre tanulmánya fogalmaz: "a nyelvtechnológiában gazdag közösségek és a többi nyelv közötti szakadék egyre szélesedni fog. Azokat a nyelveket, amiken az ember képtelen interakcióba lépni a számítógéppel, [...] alacsonyabb rendűnek, pretechnológiainak könyvelik majd el."[29] A nyelvtechnológiai fejlődés által elkerült nyelvek beszélői számára ez azt jelenti, hogy tovább erősödik "másodlagos" státuszuk a társadalom, a politika és a gazdaság szerkezetében, ami megint csak nyelvváltásra ösztönözheti őket.[30]
Természetesen a kisebbségi nyelveket és azok beszélőit eltérően érintik a nyelvtechnológiai fejlesztések, hiszen vannak olyan nyelvek, amelyek egy adott államban kisebbségi nyelveknek minősülnek, azonban rendelkeznek anyaállammal, ahol viszont hivatalos és/vagy többségi nyel-
- 74/75 -
veknek számítanak. Ennek megfelelően e nyelvek beszélői egyértelműen részesülnek az anyaállam által biztosított kulturális, politikai és gazdasági lehetőségekből, az anyaállam beszélőszáma által indukált nyelvtechnológiai fejlesztések előnyeiből, de akár az adott kisebbségi nyelv uniós hivatalos nyelvi státuszával együtt járó nyelvi szolgáltatásokból is.[31] Példa lehet erre a magyar nyelv, amely egyszerre államnyelv, az Európai Unió hivatalos nyelve és egyben kisebbségi nyelv számos országban.
A Mercator az EU "kisebb", illetve kisebbségi nyelvei tekintetében már 2000-ben kiemelte:
Azokat a nyelveket, amelyek nem rendelkeznek a nyelvi erőforrások teljes skálájával - ideértve a nyelvi korpuszokat, elektronikus szótárakat stb. -, az a veszély fenyegeti, hogy nem csupán az internetről rekesztődnek ki, mint ahogyan az most történik, hanem számos olyan folyamatból, mint amilyen a gépi fordítás és más nyelvi feldolgozási funkciók, amelyeket egyre inkább az interneten keresztül fognak végrehajtani. [...] Következésképpen a nyelvtechnológiák és a nyelvi erőforrások fejlesztése minden európai nyelv számára alapvető fontosságú a polgári és az információs társadalmon belüli részvétel esélyegyenlősége szempontjából.[32]
A nyelvtechnológia fontosságát Kaleimamoowahinekapu Galla is aláhúzza a hawaii nyelv revitalizációjáról szóló tanulmányában, hangsúlyozva, hogy
a technológiai fejlődés és a digitális technológia terjedése ellenére, a világ más népeivel ellentétben, sok őshonos népnek nincs egyenlő és folyamatos hozzáférése, illetve infrastruktúrája a digitális technológiákhoz. Márpedig igen nehéz elképzelni, hogy az őslakos nyelvek a digitális technológiák támogatása nélkül képesek volnának fennmaradni, hiszen csak ezek tudják a különböző nyelveket megfelelő módokon rögzíteni, elemezni, feldolgozni és közvetíteni.[33]
De ahogyan arra egyes afrikai hivatalos nyelvek kapcsán is utaltam és miként azt a LITHME előrejelzéseit összefoglaló beszámoló is kiemeli, még a hivatalos nyelvek is hátrányos helyzetbe kerülhetnek, ha a beszélőik csekély száma nem vonzza a befektetéseket. Ilyen például a lett, amely az EU hivatalos nyelve és Lettoszág államnyelve.[34] A hivatalos nyelvek nyelvjárásai (például bajor osztrák), egyes nyelvváltozatok (például marokkói arab), vagy a különböző beszélőközösségekhez, felhasználókhoz kötődő, eltérő nyelvi regiszterek szintén hátrányos helyzetbe kerülhetnek. Másoknak nincs egységes helyesírásuk (például svájci német, romani),[35] vagy csak viszonylag kicsi az adott nyelven rendelkezésre álló adathalmaz (például az ún. ala-
- 75/76 -
csony erőforrású afrikai nyelvek).[36] Mivel a nyelvtechnológiák jelenleg a természetes nyelvek feldolgozására támaszkodnak, a legtöbb nem sztenderdizált nyelv, következésképpen ezek beszélői hátrányos helyzetbe kerülnek, mivel "az ilyen input nyelvek esetében a természetes nyelvek feldolgozása alacsony pontossággal és magas hibaaránnyal működik".[37]
De nem csupán a nem sztenderdizált nyelvek kerülnek hátrányba a nyelvtechnológiai fejlesztés folyamatában, ugyanis egyelőre a jelnyelvekre és a taktilis jelnyelvekre fejlesztett nyelvtechnológiai megoldások is csak gyenge eredményeket mutatnak fel. Például az "intelligens kesztyűk" továbbra sem közvetítenek pontosan, hiszen a jelnyelv nem pusztán kézjelekből áll, hanem az arc mimikáját, a test mozgását és a testtartást is magában foglalja.[38] Ezeket az intelligens kesztyűk egyelőre képtelenek leolvasni. Emellett a jelnyelveknek, taktilis jelnyelveknek megvannak a maguk sztenderdizált nemzeti nyelvei (például szlovák jelnyelv), de különböző változatai is (például siket iskolától vagy klubtól függően),[39] lehetnek nyelvspecifikusak (például francia Braille) vagy akár tartományspecifikusak (például irodalmi Braille, gyógyszerészeti Braille stb.). Mivel beszélőik, felhasználóik száma viszonylag csekély, ezeken a nyelveken különösen lassú és nehézkes a technológiai fejlesztés,[40] sok esetben pedig hiányoznak a források az adatkészletek összeállítására. Ez különösen a nyelvi kisebbségek esetében problematikus, amelyeknek nincsen lehetőségük a "nyelvváltásra", hiszen fogyatékosságuknál fogva tartósan egy meghatározott nyelvi modalitásban kell kommunikálniuk. Amennyiben tehát az adott nyelvi modalitással kapcsolatos nyelvtechnológiai fejlesztések és ehhez kapcsolódóan az adott nemzeti nyelv vagy nyelvváltozat erőforrásainak fejlesztése nem válik prioritássá, a nyelvi kisebbségek széles rétegei lehetnek, illetve maradnak nyelvileg jogfosztottak, tartósan kiszorulva a társadalmi, a gazdasági és a politikai életből. Tekintettel e modalitások és nyelvek alacsony beszélő- és felhasználószámára, nem feltétlenül várható, hogy a gazdasági szereplők üzleti lehetőséget látnak majd e nyelvtechnológiák és a szükséges erőforrások fejlesztésében, így szükséges lehet az állami vagy uniós intervenció is az információs jogok garantálása és a részvétel előmozdítása érdekében.
A nyelvi kisebbségek társadalmi, politikai és gazdasági életben való fokozottabb részvételével kapcsolatban felmerülhet, hogy ezek a tendenciák kiszolgáltatottá teszik őket az asszimilációval és a kulturális kisajátítással szemben. E ponton meg kell jegyezni, hogy a nyelvi kisebbségek sokfélesége miatt képtelenség általános, valamennyi nyelvi kisebbségre érvényes választ adni a nyelvi asszimiláció és a kulturális kisajátítás kérdésére. Valójában azok a nyelvi kisebbségek,
- 76/77 -
amelyeknek jelelt vagy taktilis jelnyelve valamely hivatalos vagy többségi nyelv körébe tartozik, a többségi kultúra részét képezik, esetleg sajátos kultúrájukkal együtt (például siket kultúra).[41] Mindeközben más nyelvi kisebbségek a nyelvtechnológiák révén férhetnek hozzá más kultúrákhoz, ideértve a nyelvtanulás lehetőségét is, ami a kulturális és nyelvi asszimiláció vagy akár a nyelvváltás lehetőségét is felveti. Ezekben az esetekben különösen fontosak azok a politikai döntések, amelyek az alacsony erőforrású kisebbségi nyelvek revitalizációját és megőrzését szolgálják, többek között ma már a nyelvtechnológiai fejlesztésekre is támaszkodva.[42]
A kisebbségi nyelvek digitalizálásával összefüggésben a kulturális kisajátítástól való félelem is egyre indokoltabb lesz.[43] Ha technológiai úton hozzáférhetővé válnak az egyes kisebbségi nyelvek, az ezeken a nyelveken kódolt kultúrák is hozzáférhetővé válnak, ahogyan az e nyelvekben őrzött tudás is szabad prédává válik. Ezzel lehetővé válik a kisebbségi közösségek hagyományainak, mítoszainak kisajátítása például a népmesék megfilmesítése, fontos mitikus vagy valós személyiségek leegyszerűsített karakterekké alakítása révén. A kulturális kisajátítás tipikus példája a hagyományos tudás gyógyszergyárak általi elbitorlása, a biokalózkodás speciális formája, amelyet a kisebbségek nyelvéhez és kultúrájához való hozzáférés révén követnek el.[44] Ahogy Seonaigh MacPherson fogalmaz, a helyi közösségek környezetükről nélkülözhetetlen ismereteket kódoltak a nyelvükbe - ezeknek az ipari és kereskedelmi célokra való felhasználása anélkül, hogy az ebből származó előnyöket megosztanák az adott közösségekkel, a nyelvtechnológia által elősegített kulturális kisajátítás egyik formája lenne. Ahogyan folyamatosan fejlődnek a rendelkezésre álló nyelvtechnológiai megoldások, az általuk lehetővé tett politikai részvétel és az igazságszolgáltatáshoz való hozzáférés esetleg csökkentheti ezeket a veszélyeket, de további kutatásokra lesz szükség a kisebbségi nyelvek és a kulturális kisajátítás vizsgálatára.[45] ■
JEGYZETEK
[1] Dave Sayers et al.: The dawn of the human-machine era: A forecast of new and emerging language technologies. Report for EU COST Action CA19102. LITHME, 2021, www.lithme.eu, 10.
[2] John S. Mill: Considerations on Representative Government. In John S. Mill: Utilitarianism, On Liberty and Considerations on Representative Government. London, Everyman, 1972, 392.; Bernard Spolsky: Language Man-agement. Cambridge, Cambridge University Press, 2009, 170.
[3] Uo., 147.
[4] Ulrich Ammon: Language conflicts in the European Union. 16(3) International Journal of Applied Linguistics (2006) 322.
[5] Edward O. Ombui - Lawrence Muchemi: Wiring Kenyan languages for the Global Virtual Age: An audit of the human language technology resources. 2(2) International Journal of Scientific Research and Innovative Technology (2015) 35-42.
[6] Az Ádám and Others v. Romania ügyben (no. 81114/17) az Emberi Jogok Európai Bírósága magyar diákoknak a román közoktatási rendszerben elszenvedett diszkriminációját vizsgálta. A román közoktatási szabályok szerint a kisebbségi anyanyelven tanuló diákoknak két további vizsgát kell tenniük román nyelv és irodalomból, hogy megkaphassák érettségi bizonyítványukat. A bíróság szerint "tény, hogy a kérelmező tanulóknak kettővel több vizsgát kell letenniük, mint a román nyelven tanulóknak. Ez azonban annak a közvetlen és megkerülhetetlen következménye, hogy a kérelmezők tudatosan és önkéntesen úgy döntöttek, hogy más nyelven kívánnak tanulni, és az állam biztosította számukra ezt a lehetőséget. Ezzel összefüggésben a bíróság megállapítja, hogy a törvény elismeri a nemzeti kisebbséghez tartozó tanulók anyanyelvükön való tanulásának jogát, azonban ilyen kötelezettséget számukra nem ír elő" (101. bekezdés). Mindezek alapján a bíróság szerint azzal, hogy a diákok maguk dönthetnek a kisebbségi nyelven tanulás mellett, vállalniuk kell a közoktatási törvény által rájuk rótt többletkötelezettségeket is.
[7] 1948: Emberi Jogok Egyetemes Nyilatkozata (2. cikk); 1966: Polgári és Politikai Jogok Nemzetközi Egyezségokmánya (27. cikk); 1989: 169. sz. ILO Egyezmény a bennszülött és törzsi népekről a független országokban (28. és 30. cikk); 1990: Az EBESZ koppenhágai dokumentuma (32-34. pont); 1992: Az ENSZ nyilatkozata a nemzeti vagy etnikai, vallási és nyelvi kisebbségekhez tartozó személyek jogairól (1., 2. és 4. cikk); 1992: A regionális és kisebbségi nyelvek európai kartája; 1995: A nemzeti kisebbségek védelméről szóló keretegyezmény; 1998: A nemzeti kisebbségek nyelvi jogairól szóló oslói ajánlások.
[8] Sophie Hardach: The languages that defy autotranslate. BBC, 2021. március 23., https://bbc.in/3WLzTOL.
[9] Sayers i. m. (1. lj.) 7.
[10] Uo., 6.
[11] Uo., 13. és 95. bekezdés.
[12] Jeremy Colin Eva: Minority languages fight for survival in the digital age. Phys.org, 2014. február 17., https://bit.ly/3UiM4RR; Pratik Joshi et al.: Unsung challenges of building and deploying language technologies for low resource language communities. In Proceedings of the 16th International Conference on Natural Language Processing. 2019, 211-219.
[13] Ned Thomas - Alan King - Elin Haf Gruffydd Jones: Machine Translation and the Internet. https://bit.ly/3fOvtGo, 2001, 27.
[16] Laki László János: Mesterséges intelligencia a gépi fordításban. In Tolcsvai Nagy Gábor (szerk.): A humán tudományok és a gépi intelligencia. Budapest, Gondolat, 2018, 162.
[17] Horváth Ildikó: Információs és kommunikációs technológiák a tolmácsolásban és gépi tolmácsolás. In Horváth Ildikó (szerk.): A modern fordító és tolmács. Budapest, ELTE Eötvös, 2015, 164-től.
[18] Sayers i. m. (1. lj.) 18.
[19] Uo., 20.
[20] Teaching foreign languages to students who are blind. Európai Bizottság, KA201-2015-012.
[22] Steven Bird: Decolonising speech and language technology. In Proceedings of the 28th International Conference on Computational Linguistics. Barcelona, 2020, 3505.
[23] Patrick Eisenlohr: Language revitalization and new technologies: Cultures of electronic mediation and the refiguring of communities. 33(1) Annual Review of Anthropology (2004) 25.
[24] Thomas-King-Jones i. m. (13. lj.) 24.
[25] Uo., 58-59.
[26] Klaudy Kinga: Párhuzamos korpuszok felhasználása a fordításkutatásban. In Lanstyák István - Vančoné Kremmer Ildikó (szerk.): Nyelvészetről - változatosan. Dunaszerdahely, Gramma Nyelvi Iroda, 2005, 153-185.
[27] Fellowship to develop datasets and strengthen capacities and innovation potential for Low Resource African Languages, https://bit.ly/3TjsSBW.
[28] Thomas-King-Jones i. m. (13. lj.) 59.
[29] Uo., 24.
[30] Sayers i. m. (1. lj.) 11.; Dave Sayers - Petra Lea Láncos: (Re)defining linguistic diversity: What is being protected in European language policy? SKY Journal of Linguistics (2017) 42.; Thomas-King-Jones i. m. (13. lj.) 25.
[31] Uo., 30.; Láncos Petra Lea: Nyelvpolitika és nyelvi sokszínűség az Európai Unióban. Doktori értekezés, 2012, 95-96. Érdemes ugyanakkor megemlíteni az EU által támogatott, 1996-os LE-PAROLE projektet, amelynek az volt a célja, hogy az Európai Unió nyelvei számára harmonizált korpuszokat és lexikai adatbázisokat hozzon létre. A projekt nem csupán az EU hivatalos nyelveit foglalta magában, hanem a katalán nyelvet is. https://bit.ly/3UG9sbK.
[32] Thomas-King-Jones i. m. (13. lj.) 5., 7.
[33] Candace K. Galla: Digital realities of indigenous language revitalization: A look at Hawaiian language technology in the modern world. 20(3) Language and Literacy (2018) 100.
[34] Sayers i. m. (1. lj.) 9.
[35] Thomas-King-Jones i. m. (13. lj.) 18.
[37] Sayers i. m. (1. lj.) 8.
[38] Josep Quer - Markus Steinbach: Handling sign language data: The impact of modality. 10 Frontiers in Psychology (2019) 2., 5.
[39] Uo., 4.
[40] Sayers i. m. (1. lj.) 13.
[41] Simon Fanni: Siket kultúra. Jurátus, 2021. december 9., https://bit.ly/3fSmy6H.
[42] Melinda Dooly: Empowering language minorities through technology: Which way to go? (19) eLearning Papers (2010) 5.
[43] Galla i. m. (33. lj.) 106.
[44] Marcia E. DeGreer: Biopiracy: The appropriation of indigenous peoples' cultural knowledge. (9) New England Journal of International and Comparative Law (2003) 179-208.
[45] Seonaigh MacPherson: TESOL for Biolinguistic Sustainability: The ecology of English as a Lingua Mundi. TESL Canada Journal (2003).
Lábjegyzetek:
[1] A szerző egyetemi docens, Pázmány Péter Katolikus Egyetem Jog- és Államtudományi Kar; a LITHME COST Action CA19102 (Language in the Human Machine Era) 2. számú munkacsoportjának (Jog és nyelv) vezetője.Köszönettel tartozom Szemesi Sándornak és Seresi Mártának a tanulmánnyal kapcsolatos észrevételeikért.
Visszaugrás