A gépi fordítás az elmúlt évtizedben az iparág legdinamikusabban fejlődő szegmensévé vált. Tekintsünk be a kulisszák mögé!
A gépi fordítás az elmúlt évtizedben az iparág legdinamikusabban fejlődő szegmensévé vált, így ma már minden professzionális fordítóiroda szolgáltatásai között találkozhatunk olyan munkafolyamatokkal, amelyek ezt a technológiát alkalmazzák. Az ugrásszerű fejlődés az úgynevezett neurális alapú fordítómotorok elterjedésének köszönhető, amelyek lényegében ugyanazt a mesterséges intelligencia-modellt használják, mint például a kép- és hangfelismerő rendszerek. Ez a paradigmaváltás a korábbi megközelítésekhez képest teljesen új alapokra helyezte a technológiát és radikális minőségjavulást eredményezett. Ennek köszönhetően a gépi fordítás az emberi fordítás valódi alternatívájává vált, segítségével professzionális eredményeket és jelentős költségcsökkentést lehet elérni számos típusú szöveg esetében.
A mindenki által ismert techcégek (pl. Google, Microsoft) ingyenesen elérhető általános célú szolgáltatásai és a nyelvi szolgáltatók ügyfelei számára egyéni igényeik alapján létrehozott projektspecifikus fordítómotorok minősége szövegtípustól függően jelentősen eltérhet, pedig működési elvük ugyanaz: mindenekelőtt be kell tanítani őket. Ez azt jelenti, hogy a rendelkezésre álló (jellemzően emberek által készített) fordításokat mondatpárokra bontva példaként betápláljuk, a gép pedig egy úgynevezett mélytanulási folyamat során ezekből az adatokból külső beavatkozás nélkül kinyeri az adott nyelvek nyelvtanára és a nyelvi egységek megfeleltetésére vonatkozó információkat. Mindebből következik, hogy a fordítás minőségét első sorban az befolyásolja, hogy az adott fordítómotort milyen mennyiségű és minőségű szöveggel tanították. Az EDIMART-nál éppen ezért lehetőség van arra, hogy ügyfeleink kérésére eddig lefordított anyagaikat felhasználva, azokat az adott témakör vagy szakterület egyéb nagy szöveggyűjteményeivel (korpuszaival) kiegészítve egyéni gépi fordítómotort készítsünk számukra, melyet folyamatosan frissítünk és karbantartunk, hogy a lehető legjobb gépi fordítási minőséget tudjuk biztosítani.
A gépi fordítási projektek tervezésekor az első lépés mindig a forrásszöveg elemzése, hiszen nem minden szövegtípus esetében lehet gépi módszerrel megfelelő minőséget elérni, ilyenkor pedig az utószerkesztés aránytalanul drága és időigényes lenne.
A következő két fő kérdést kell mérlegelni:
- Milyen nyelvpárral dolgozunk?
Általában elmondható, hogy a sok beszélővel rendelkező nyelvek esetében (pl. angol, német, spanyol, francia) jó eredmények érhetők el gépi fordítás használatával, de számít az is, hogy az adott nyelvek rokonságban állnak-e egymással, illetve, hogy mennyire hasonlítanak egymásra tipológiai szempontból. Fontos tudni azonban, hogy ennek ellenére ma már az olyan kisnyelvek esetében is kiválóan alkalmazható gépi fordítás, mint amilyen a magyar, amennyiben a másik nyelv például az angol vagy más, nagyobb európai nyelv. - Mennyire komplex a szöveg?
A gépi fordítás legjobban az egyszerűen és tömören megfogalmazott tartalmak esetében használható. Ez azt jelenti, hogy a forrásszövegben előforduló többszörösen összetett mondatok, előre- és visszautalások, homályos megfogalmazások jelentősen csökkentik a hatékonyságát. Ezzel szemben az egyszerű, 20-25 szónál nem hosszabb mondatokat tartalmazó szövegek esetében igen jó minőség várható. Fontos, hogy a nem szó szerint értendő szövegrészek (például a humor vagy a szarkazmus), az idiómák és a nem köznyelvi regiszterbe tartozó nyelvi elemek szintén kihívást jelenthetnek.
A szövegek felhasználási céljától függően az általános belső minőségellenőrzés mellett a gépi fordítási szolgáltatást humán utószerkesztési (poszteditálási) lépéssel is ki kell egészíteni. Az utószerkesztési munkafolyamatok tekintetében megkülönböztetünk úgynevezett minimális és teljes utószerkesztést. Előbbi esetben a cél, hogy a gépi fordításból a lehető legkevesebb emberi beavatkozással, rövid idő alatt állítsunk elő egy nyelvtani és tartalmi szempontból is helyes, súlyos hibáktól mentes, könnyen érthető fordítást. Ezzel szemben teljes utószerkesztés esetén az elkészült szövegnek minden tekintetben meg kell felelnie az emberi fordítás kritériumainak.
A fentiek alapján az alábbi esetekben érdemes elgondolkozni gépi fordítás szolgáltatás igénybevételén:
- ha elsődleges szempont az átfutási idő
- ha a rendelkezésre álló keretbe nem fér bele az emberi fordítás
- ha a fő cél a szöveg lényegének megértése
- ha nagy mennyiségű szöveget kell fordítani
- ha a projekt vagy az együttműködés során sok hasonló, ismétlődő nyelvi elemeket tartalmazó dokumentum fordítása szükséges (pl. jelentések, naplók, terméklapok)
Ezzel szemben nem javasolt a gépi fordítás használata,
- ha a fordításhoz elengedhetetlen az adott szakterület alapos ismerete (pl. jogi, orvosi szövegek)
- ha kreatív tartalomról van szó (marketingkampányok, hirdetések)
- ha az adott nyelvpárban általában nem lehet jó eredményt elérni gépi fordítással (kis nyelvről kis nyelvre történő fordítás)
- ha a szöveg mondattani, jelentéstani vagy pragmatikai szempontból bonyolult (hosszú mondatok, nem szó szerint értendő részek)
Olvasóink, akik idáig eljutottak cikkünkben, most már érthetik, hogy a gépi fordítást tartalmazó munkafolyamatok esetében is sok emberi munkára van szükség a megfelelő minőség eléréséhez. Ahhoz, hogy minden zökkenőmentesen működjön, alaposan mérlegelni kell a forrásszöveg alkalmasságát, ha pedig megfelelőnek ítéljük, az emberi fordítási projektekhez hasonló módon elő kell készíteni, hiszen a legapróbb formázási problémák is összezavarhatják a gépet.
Miután a gép elvégezte feladatát, jöhet a fentiekben ismertetett utószerkesztési folyamat, melynek lépéseiről bővebb információ szolgáltatásaink között található. Mindezekből megérthető, hogy a gép tulajdonképpen csak megkönnyíti és felgyorsítja a nyelvi munkát, de a profi minőséghez – az egyéb projektekhez hasonlóan – nélkülözhetetlen nyelvészeink, projektmenedzsereink és nyelvi mérnökeink szakértelme.