Microsoft Translator | |
Kategória | machine translation software |
A Microsoft Translator weboldala |
A Microsoft Translator egy gépi fordítási felhő alapú API szolgáltatás, amelyet a Microsoft cég fejleszt. A szolgáltatás elérését számos szoftverében és webes felületen biztosítja, például mint a Bing kereső[1] egy kiegészítő funkciója, valamint elérhető mobilapplikáció formájában Android és Apple iOS platformokon.
A szolgáltatás több mint 70 nyelv között alkalmas szöveges fordításra, több mint 20 nyelv esetében pedig hangfelismerési támogatással tud leiratot készíteni, valamint képes azt lefordítani és felolvasni.[2]
A Microsoft Research – a Microsoft cég kutatás-fejlesztési részlege – már 1999-től foglalkozott a gépi fordító elkészítésével, amelynek felelőse a Natural Language Processing csapat volt, a projekt pedig The Machine Translation néven indult.[3] A kutatás-fejlesztési részleg 2002-ben hozta létre a gépi fordításért felelős csoportot (Machine Translation Group), amely része volt a beszéd és nyelvi csoportnak (Speech and Language).[4] Az első generációs szoftverüket arra használták, hogy több különböző nyelvre lefordították a támogatási oldalaik tartalmát.
Az általuk fejlesztett fordító szolgáltatást 2006 óta használhatják a felhasználók a különböző Microsoft termékekben, 2011 óta pedig elérhető a szolgáltatás API felületen keresztül is.
A Microsoft kutatási részlegének megközelítése a kezdetektől „adatközpontú” („data-driven”), tehát ahelyett hogy a természetes nyelvek fordítására explicit szabályokat fogalmazna meg, már emberek által lefordított szövegpárokkal „tanítja” meg a rendszernek, hogy „hogyan kell fordítani”. A fordító szoftverük több különböző metódust használ és folyamatos fejlesztés alatt áll – néhány speciális nyelv és nyelvpár esetében a többi nyelvtől eltérő megoldásokra is szükség van. Az első generációs szoftverük absztrakt struktúrák elemzésével tanulta meg fordítási mintákat. Az ezt követő megoldás a statisztikai elemzésen alapuló tanulása a gépi fordításnak, amelyből létezik szintaxis alapú és kifejezés alapú megközelítés, de közös bennük, hogy nem igényelnek nyelvészeti tudásbázist. Ez egészült ki a neurális hálózatok használatával,[5] amely az emberi gondolkodást utánozva modellezi a fordításra beküldött szöveget, amellyel növeli a fordítás pontosságát – jobb eséllyel határozza meg a szöveg kontextusát.
Egy a magyar és francia nyelvet folyékonyan beszélő ember a „kutya” szó hallatán a gondolataiban egy kutya képét látja, emellett természetesen a képről asszociál a „le chien” kifejezésre, ami a kutya francia nyelven. A neurális háló – korábbi hasonlatnál maradva az emberi agy – eredendően tudná, hogy a „chien” francia nyelven a kutya hím megfelelője („le”, nem pedig „la”). Viszont ha a teljes mondat úgy hangzik, hogy „a kutya éppen hat kölyökkutyának adott életet”, akkor az elképzelt kép a gondolataiban egy olyan kutyára változna, ami éppen a kölykei társaságában van, ezzel együtt pedig a „la chienne” kifejezést használná a szöveg fordítása során, ami a kutya kifejezés nőnemű alakja a francia nyelvben.[5]
Mivel a fordítás továbbra is legfőképp statisztikai elemzések elvén működik, amely eltér az emberek által végzett fordítási módszertől, a gépi fordító által végzett fordítás minősége erősen változik és nem minden esetben hoz pontos eredményt.
A fordítás minőségének mérésére a BLEU (Bilingual Evaluation Understudy) algoritmus pontozási rendszerét használják.[6]
2021 márciusában a Microsoft Translator 89 nyelvet támogatott, a szerbnek támogatta cirill és latin betűs írásmódját is.
Támogatott nyelvek listája: