Bár az utóbbi években sokat fejlődtek, alig boldogulnak az írott szöveggel a számítógépes fordítások, sokszor nevetséges a végeredmény.
A malajziai védelmi minisztérium nemrégiben új tartalommal bővítette internetes honlapját, ám az oldal készítői nem sokkal később kénytelenek voltak bevallani, hogy az angol nyelvű szöveg előállításához a Google fordítóprogramját használták. Így fordulhatott elő például, hogy bár a derék maláj hivatalnokok azt szerették volna közölni a világgal, hogy a nők nem járhatnak olyan ruhában, amely szúrja a szemet, a gép mindezt így fordította: a nők nem viselhetnek olyan ruhát, ami kilöki a szemet. Erre mondják: nem mindegy!
Magyar, japán, koreai
A fenti példa is jól mutatja a gépi fordítás nehézségeit. Pedig a szándék, hogy az informatika megkönnyítse a népek közötti kommunikációt, több mint fél évszázados múltra tekint vissza.
– A fő probléma, hogy a nyelv túl bonyolult, a nyelv több mint szavak egymás utánisága – jelentette ki Philipp Koehn, a gépi fordítások kutatására specializálódott Edinburghi Informatikai Egyetem kutatója. – Egyetlen mondatnak számos értelme lehet, ráadásul a világ nyelvei korántsem egységes logika szerint épülnek fel.
Mindezt lapunknak megerősítette Vihar Judit műfordító, az ELTE és a Károli Gáspár Református Egyetem japán és orosz nyelvi professzora. A szakember elmondása szerint bár egészen tiszta rendszer nincs, mégis, a világ nyelveit három nagy csoportba lehet osztani. Az egyik jellemzően toldalékokat ragaszt (ilyen a magyar is), a másik előreteszi a birtokot, hátra a birtokost, és úgymond hajlítja a szavak végét (angol, orosz, német), míg a harmadik csoportot az izolált rendszerű nyelvek jelentik. Utóbbi elsősorban a kínai nyelvjárásokra igaz: itt ráadásul egyetlen szótagból álló, toldalék nélküli szavakat használnak, amelyek pontos jelentését az adja, hogy azok hol helyezkednek el a mondaton belül.
A magyar, a koreai és a japán abban is különbözik a többi nyelvtől, hogy minden toldalékot hátra pakol. Jó példa erre a gyerekkorunkban már jól megtanult, külföldiek számára értelmezhetetlen elkelkáposztásítottalanítottátok. A professzor asszony szerint a japánban még ennél hosszabb toldalékolás is lehetséges; nem nehéz kitalálni, hogy egy akármilyen fejlettségű fordítóprogram vajon hogyan viszonyulna egy ilyen szóhoz.
Jaj nekem, sok dicséret!
„Előbb-utóbb jól használható, a nyelv belső logikáját is követni képes fordítóprogramok készülnek, ám a műfordításra csakis ember lesz képes” – jósolja a magyar nyelvészprofesszor, aki nemzetközi hírű haiku-fordító (haiku: nagy hagyományú japán nemzeti versforma).
Végezetül mi is tettünk egy próbát. Beütöttük a Google fordítóba ezt a magyar szöveget: „Szeretem anyukámat. Kedves hozzám, sokat dicsér. Megtanít járni, olvasni, szeretni.” Ezt kaptuk angolul: „I love my mommy. Dear me, much praise. Teach you to walk, read, love.”
Ezt visszafordíttattuk magyarra, íme a végeredmény: „Szeretem anyukámat. Jaj nekem, sok dicséretet. Taníts meg járni, olvasni, szeretem.” Nem tökéletes, de azért biztató kísérlet. De, hogy egy abszolút pozitív példával búcsúzzunk, arra biztatjuk olvasóinkat, a Google fordítóval fordíttassák le „oda-vissza” ezt a kifejezést: „A puding próbája az evés.”
Három út…
A gépi fordítóprogramok három módon közelednek a nyelvekhez.
1.Az első természetesen a szavak jelentésének lefordítása, ez azonban azonnal az első nehézséget is jelenti, hiszen egy-egy szónak rengeteg értelme, árnyalata lehet.
2.Második lépcsőben az egyes nyelvek belső szerkezetét kell „ráültetni” a célnyelv belső szerkezetére.
3.Aszoftverek egy része mindezeken felül képes arra, hogy helyesen lefordított szövegekből átvegyenek kifejezéseket, nyelvtani fordulatokat, és azt megpróbálják felhasználni az új szöveg fordításakor.
A fentieket kiegészíti az úgynevezett statisztikai szemlélet. Ez azt jelenti, hogy a nyelvészek nagy mennyiségű szövegekben végigfuttatnak bizonyos szavakat, és megnézik, hogy az adott szó melyik értelme fordult elő a leggyakrabban. Így új szöveg fordításakor elsősorban ez a gyakoriságelv működik – sokszor egészen különös végeredménnyel. Minél fejlettebb egy program, annál összetettebben képes „gondolkodni”.