Ön is tapasztalta, milyen buták a fordítóprogramok?

fordítás
PUBLIKÁLÁS: 2012. május 13. 14:00
Bár az utóbbi években sokat fejlődtek, alig boldogulnak az írott szöveggel a számítógépes fordítások, sokszor nevetséges a végeredmény.

 

A malajziai védelmi minisztérium nemrégiben új tartalommal bővítette internetes honlapját, ám az oldal készítői nem sokkal később kénytelenek voltak bevallani, hogy az angol nyelvű szöveg előállításához a Google fordítóprogramját használták. Így fordulhatott elő például, hogy bár a derék maláj hivatalnokok azt szerették volna közölni a világgal, hogy a nők nem járhatnak olyan ruhában, amely szúrja a szemet, a gép mindezt így fordította: a nők nem viselhetnek olyan ruhát, ami kilöki a szemet. Erre mondják: nem mindegy!

Magyar, japán, koreai

A fenti példa is jól mutatja a gépi fordítás nehézségeit. Pedig a szándék, hogy az informatika megkönnyítse a népek közötti kommunikációt, több mint fél évszázados múltra tekint vissza.

– A fő probléma, hogy a nyelv túl bonyolult, a nyelv több mint szavak egymás utánisága – jelentette ki Philipp Koehn, a gépi fordítások kutatására specializálódott Edinburghi Informatikai Egyetem kutatója. – Egyetlen mondatnak számos értelme lehet, ráadásul a világ nyelvei korántsem egységes logika szerint épülnek fel.

Mindezt lapunknak megerősítette Vihar Judit műfordító, az ELTE és a Károli Gáspár Református Egyetem japán és orosz nyelvi professzora. A szakember elmondása szerint bár egészen tiszta rendszer nincs, mégis, a világ nyelveit három nagy csoportba lehet osztani. Az egyik jellemzően toldalékokat ragaszt (ilyen a magyar is), a másik előreteszi a birtokot, hátra a birtokost, és úgymond hajlítja a szavak végét (angol, orosz, német), míg a harmadik csoportot az izolált rendszerű nyelvek jelentik. Utóbbi elsősorban a kínai nyelvjárásokra igaz: itt ráadásul egyetlen szótagból álló, toldalék nélküli szavakat használnak, amelyek pontos jelentését az adja, hogy azok hol helyezkednek el a mondaton belül.

A magyar, a koreai és a japán abban is különbözik a többi nyelvtől, hogy minden toldalékot hátra pakol. Jó példa erre a gyerekkorunkban már jól megtanult, külföldiek számára értelmezhetetlen elkelkáposztásítottalanítottátok. A professzor asszony szerint a japánban még ennél hosszabb toldalékolás is lehetséges; nem nehéz kitalálni, hogy egy akármilyen fejlettségű fordítóprogram vajon hogyan viszonyulna egy ilyen szóhoz.

Jaj nekem, sok dicséret!

„Előbb-utóbb jól használható, a nyelv belső logikáját is követni képes fordítóprogramok készülnek, ám a műfordításra csakis ember lesz képes” – jósolja a magyar nyelvészprofesszor, aki nemzetközi hírű haiku-fordító (haiku: nagy hagyományú japán nemzeti versforma).

Végezetül mi is tettünk egy próbát. Beütöttük a Google fordítóba ezt a magyar szöveget: „Szeretem anyukámat. Kedves hozzám, sokat dicsér. Megtanít járni, olvasni, szeretni.” Ezt kaptuk angolul: „I love my mommy. Dear me, much praise. Teach you to walk, read, love.”

Ezt visszafordíttattuk magyarra, íme a végeredmény: „Szeretem anyukámat. Jaj nekem, sok dicséretet. Taníts meg járni, olvasni, szeretem.” Nem tökéletes, de azért biztató kísérlet. De, hogy egy abszolút pozitív példával búcsúzzunk, arra biztatjuk olvasóinkat, a Google fordítóval fordíttassák le „oda-vissza” ezt a kifejezést: „A puding próbája az evés.”

Három út…

A gépi fordítóprogramok három módon közelednek a nyelvekhez.

1.Az első természetesen a szavak jelentésének lefordítása, ez azonban azonnal az első nehézséget is jelenti, hiszen egy-egy szónak rengeteg értelme, árnyalata lehet.

2.Második lépcsőben az egyes nyelvek belső szerkezetét kell „ráültetni” a célnyelv belső szerkezetére.

3.Aszoftverek egy része mindezeken felül képes arra, hogy helyesen lefordított szövegekből átvegyenek kifejezéseket, nyelvtani fordulatokat, és azt megpróbálják felhasználni az új szöveg fordításakor.

A fentieket kiegészíti az úgynevezett statisztikai szemlélet. Ez azt jelenti, hogy a nyelvészek nagy mennyiségű szövegekben végigfuttatnak bizonyos szavakat, és megnézik, hogy az adott szó melyik értelme fordult elő a leggyakrabban. Így új szöveg fordításakor elsősorban ez a gyakoriságelv működik – sokszor egészen különös végeredménnyel. Minél fejlettebb egy program, annál összetettebben képes „gondolkodni”. 

Google News Borsonline
A legfrissebb hírekért kövess minket a Bors Google News oldalán is!

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.