Fordítás

Fordítani alapvetően mindenki tud. A fordítás lépései:

- a szöveg megértése, beleértve az esetleg különleges nyelvtani struktúrákat
- a szöveg átültetése a célnyelvbe, a szavak és a nyelvtani struktúrák megfelelő átültetése.

Gépi fordítás esetén a számítógép végzi a szöveg megértését, nyelvtani analízisét, esetleges különleges szerkezetek fölismerését, a szavak környezetbe illő fordítását és az eredmény bemutatását.

Történet

Fordítókat már megkíséreltek írni az 1950-60-as években is, de ezek egészen az 1980-as évekig lényegében azon buktak meg, hogy nem volt meg a nyelvtani apparátus, nem léteztek szófajelemzők (POS-tagger), szógyök-keresők (lemmatizer) és nyelvtani elemzők (parser), és az akkori csekély gépi tárolókapacitás is akadályozta a nyelvi fejlesztéseket. Szófajelemzők az 1980-es évek végén jelentek meg először és az 1990-es évek elején lettek általánosan ismertek és hozzáférhetőek. Ezek mindmáig a fordítás alapköve, fokozatosan javuló minőségben. Eleinte a szabályokon alapuló szófajelemzők uralták a mezőnyt, de fokozatosan megjelentek a statisztikai módszereken alapuló szófajelemzők, melyek írásához nem szükséges sem a kiindulási, sem a célnyelv ismerete, és mégis jó minőségű elemző állítható elő. A statisztikai módszerek és a szabályok együttes használata pedig igen jó minőséget, a nehezen besorolható esetek nagy részét jól lefedő szófajelemzőt eredményez. Ehhez járul az előtagok számának figyelembe vétele. Eredetileg csupán egy előtagot vettek figyelembe, (2-gram tagger) ez fokozatosan bővült, ma, 2011-ben az öttagú, azaz négy előtagot figyelembe vevő szófajelemzők sem ritkák (5-gram tagger).

Napjainkban a továbbvezető irány a nyelvtani elemzés szabályokkal illetve statisztikai alapon, és itt is biztató eredmények vannak.

Egy gépi fordító lényegében először szófajelemzést végez, ezután azonosítja az ismert nyelvtani struktúrákat, melyek különleges törődést igényelnek, ezután szócsoportokat ismer fel, és az egyes mondatokat szócsoportokra bontva fordítja le a célnyelvre. A fordítást szabályrendszerrel is segíti. Végül pedig a célnyelvi változatot ellenőrzi és szükség esetén formai javításokat végez.

Alapvetően fontos a jó minőségű és kellően nagy szókincsű szótár, enélkül nem érdemes elkezdeni sem a fordító írását.

A Hattyú-fordító írásához sok száz oldalnyi idegen szöveg kézi fordítása volt a motiváció, a fordító által az évek során összegyűjtött jó minőségű, nagy szókincsű szótárakkal. A kérdés ez volt: ha a fordító ki tudja keresgélni a struktúrákat és szavakat, miért ne tudná azt a gép? Vagy legalábbis miért ne tudná a gép a "piszkos munka" nagy részét elvégezni, és ezzel esetenként esetleg jelentősen meggyorsítani a fordítást? Az eredmény azt mutatja, hogy érdemes a gépet segítségül venni, és egy ilyen program valóban sokat segít fordítási feladatok elvégzésénél.

A Hattyú-fordító egyes moduljai a következőképpen működnek együtt: