Strojový preklad/Machine Translation
Kedy a ako používať strojový preklad?
Strojové preklady sú tu s nami už mnoho rokov. Do širšieho povedomia sa však dostali len nedávno, najmä vďaka zlepšujúcej sa kvalite preloženého textu.
Strojový preklad sa posunul do ďalšej fázy vývoja – predchádzajúce štatistické modely (SMT – Statistical Machine Translation) sa nahrádzajú neurónovými (NMT – Neural Machine Translation).
Jednoducho povedané: strojové prekladače sa začali učiť. Nielen z údajov, ktoré poskytujeme, ale aj z vlastných chýb.
Tento zdanlivo malý krok je však veľkým krokom pre konečnú kvalitu preloženého textu.
Stále však platí, že ľudský preklad nič nenahradí. Neznamená to teda zánik prekladateľskej profesie alebo prekladateľských agentúr. Mení sa len prekladateľská práca, resp. služby spojené s prekladom.
U zákazníkov, ktorí majú záujem o strojový preklad, Aspena používa dva hlavné strojové prekladače: DeepL a Google Cloud Translate.
Každý je vhodný na niečo iné – DeepL ponúka v porovnaní s Googlom obmedzený počet jazykov, je pomalší, ale často vykazuje lepšiu kvalitu výsledného prekladu.
Medzi ďalšie kompilátory, s ktorými pracujeme, patria KantanMT, Omniscien, Amazon MT a Tilde MT.
Tu sa dostávame k základnej otázke: kedy a ako používať strojový preklad.
Ako už bolo spomenuté, ľudský preklad nemožno nahradiť strojovým prekladom. Existujú však prípady, keď je použitie strojového prekladu vhodné, napríklad na interné oboznámenie sa s textom v inom jazyku alebo na testovanie viacjazyčného prostredia pri písaní softvéru alebo aplikácie.
Pozrime sa na základný preklad. Definuje sa ako prevod z jedného prirodzeného jazyka do druhého pri zachovaní významu.
Po preklade ľudským prekladateľom získate text, ktorého významu rozumiete bez akejkoľvek znalosti východiskového jazyka.
Pri použití strojového prekladu získate text, ktorý možno zjednodušene opísať takto:
- prevažne mu budete rozumieť aj vy (do akej miery, to závisí od použitého prekladača, jazykovej kombinácie, východiskového textu, úrovne vyškolenia prekladača atď.);
- časť textu bude s väčšou pravdepodobnosťou zrozumiteľná pre niekoho, kto pozná zdrojový jazyk (bude vedieť odhadnúť, ako to stroj pri preklade textu „myslel“);
- časť textu nemusí dávať zmysel.
Ešte nedávno tvorili nezrozumiteľné (až nezmyselné) časti po strojovom preklade rádovo desiatky percent celkového objemu textu. To sa rýchlo mení, a to vďaka využívaniu neurónových sietí a hlbokého učenia (deep learning).
Je však nebezpečné spoliehať sa na to, že strojovo preložené dokumenty budú stopercentne zrozumiteľné.
Strojové preklady bez ďalšej úpravy nie sú vhodné na publikovanie. To zabezpečí až ďalší krok so zapojením ľudského prekladateľa: následná úprava strojového prekladu (MTPE – Machine Translation Post-Editing).
Aspena ponúka dve možnosti následných úprav:
Light Post-Editing – základná revízia textu ľudským prekladateľom, ktorej cieľom je vykonať len najnutnejšie opravy textu tak, aby bol výsledok ako celok zrozumiteľný pre konečného používateľa. Nezameriava sa na štylistiku a preferenčné zmeny. Cieľom nie je poskytnúť preklad, ktorý je porovnateľný s ľudským prekladom. Väčšinou sa používa na naliehavé interné preklady.
Full Post-Editing – precízna revízia textu s cieľom dosiahnuť kvalitu porovnateľnú s ľudským prekladom. To môže znamenať, že prekladateľ preloží niektoré časti znova a ignoruje strojovo preložený text.
Z nášho pohľadu je strojový preklad jednou zo služieb v našom portfóliu, ktorá však nenahrádza klasický preklad.
Je dôležité poznamenať, že nie všetky dokumenty sú vhodné na strojový preklad. Ide najmä o dokumenty, ktoré obsahujú tvorivé texty, špecifické štýly vyjadrovania (irónia, vtipy, básnické obraty atď.)
Vhodné sú technické, stereotypné a štandardizované texty.
Treba poznamenať, že aj text, ktorý nie je vyslovene vhodný na strojový preklad, sa môže stať dobre preloženým textom. Závisí to od správnej kombinácie strojového prekladača a ľudského prekladateľa.
Rovnako dôležité je zvážiť, či má zákazník strojový preklad vyhotoviť sám alebo ho zadať prekladateľskej agentúre.
Stránky DeepL a Google ponúkajú aj preklady kopírovaním textov do webového rozhrania a ich skopírovaním späť do dokumentu. Takýto postup môže byť prácny, zdĺhavý a navyše sa pri ňom nezachová formátovanie.
Na rozdiel od Google ponúka stránka DeepL aj preklady celých súborov (v súčasnosti len vo formáte MS Word a PowerPoint). Ich počet a veľkosť sú však v rámci variantu zadarmo obmedzené (tri dokumenty mesačne). Aj v prípade platených verzií je počet dokumentov a ich objem obmedzený.
Pre zaujímavosť, spoločnosť Google ponúka preklady základných dokumentov vo svojej webovej aplikácii Dokumenty Google.
Stránka DeepL ponúka aj desktopovú aplikáciu pre Windows a Mac, ktorá zjednodušuje prácu, ale stále má svoje limity.
Čo však robiť, ak nechcem byť obmedzený veľkosťou a typom zdrojového súboru?
Keď potrebujem preložiť webové stránky, položky v softvérovom kóde, databázové súbory alebo zložité grafické výtlačky vytvorené v aplikácii InDesign?
A ešte konkrétnejšie: Čo ak potrebujem preložiť e-shop, ktorý má niekoľko miliónov slov?
V takom prípade vstupuje na pomyselné javisko prekladateľská agentúra Aspena.
Pre zákazníkov, ktorí vyžadujú strojový preklad, je to len jeden krok v našom procese spracovania v rámci štandardného pracovného postupu. Neobmedzuje nás veľkosť súboru, počet dokumentov ani zdrojový formát.
Okrem štandardných formátov, ako sú MS Word, Excel, PowerPoint atď., poskytujeme aj preklady nasledujúcich formátov:
- súbory xml, resx, po, json, csv,…
- webové html a php súbory,…
- grafické dokumenty vytvorené v aplikáciách inDesign, Illustrator, FrameMaker, AutoCAD,…
- txt, inf, ini, reg textové súbory,…
- a ďalšie
Veľkou výhodou je prepojenie strojových prekladačov s našimi nástrojmi CAT (Computer Assisted Translation). Ide o softvérové prostredie na spracovanie prekladov pomocou prekladových pamätí a terminologických slovníkov, ktoré sú individuálne pre každého zákazníka.
Dajte si však pozor na častý omyl vo vnímaní nástroja CAT – nie je to strojový preklad, ide o prostredie, v ktorom pracujú profesionálni prekladatelia.
Kombinácia nástroja CAT a strojového prekladača je pre našich stálych zákazníkov vždy výhodnejšia ako jednoduchý preklad cez webové rozhranie alebo aplikáciu DeepL, Google alebo iné nástroje (prekladače).
Prekladové pamäte a terminologické slovníky zabezpečujú lepšiu konzistenciu a presnejšie preklady.
Tieto prekladače dokážeme školiť na základe údajov od zákazníkov (zvyčajne pomocou predtým dokončených prekladov). Na rozdiel od Googlu a iných nástrojov stránka DeepL v súčasnosti neumožňuje školenie.
Teraz už zostáva len jedno – napísať nám na adresu sales@aspena.com a my vám ochotne poradíme s najvhodnejším spôsobom spracovania vašich prekladov, či už pomocou strojového prekladu alebo štandardných služieb ľudského prekladateľa.
Je veľmi pravdepodobné, že každý variant strojového prekladu bude zahŕňať spoluprácu s ľudským prekladateľom – buď základnú, alebo dôkladnú následnú úpravu, či kombináciu jazykovej, odbornej a predtlačovej korektúry. Existuje mnoho možností a kombinácií. Riešenie vždy závisí od očakávaní a potrieb našich zákazníkov.
Autor: Břetislav Svoboda, vedúci technického a obchodného rozvoja