Politics & society, Research, Science & environment

A gépi fordítás mindenki számára hozzáférhetővé teheti a kizárólag angol nyelvű tudományt

By Robert Sanders

Fordítsa le munkáját a helyi nyelvre

Gépi fordítás DeepLTranslatorral és emberi ellenőrzés Palotás Brigitta által.

Még középiskolás korában Xinyi Liu rövid ideig a pekingi Beihang Egyetem egyik kutatócsoportjában dolgozott, és meglepődve tapasztalta, hogy a kínai kutatók rendszeresen a Google fordítót használják a tudományos cikkek első angol nyelvű vázlatának elkészítéséhez. A fordítás elengedhetetlen, ha a kutatók magas presztízsű folyóiratokban akarnak publikálni, hiszen szinte mindegyike angol nyelvű.

“Szokványos volt, hogy a posztdoktorok a Google Fordítóval először lefordítottak mindent, majd ezt a fordítást módosították és csiszolták. A legelső fordítás után azonban még az egész szöveg értelmezhetetlen volt” – mondta Liu, aki a Berkeley-i Kaliforniai Egyetem molekuláris és sejtbiológia szakán tanul. “Szó szerint az összes szó, az összes kifejezés csak úgy véletlenszerűen volt egymás mellé rakva”.

Arra gondolt, hogy lennie kell jobb megoldásnak.

Ezért tavaly, amikor meglátta Rebecca Tarvin új szemináriumát a tudományos nyelvi korlátok leküzdéséről, beiratkozott.

Ez a kurzus, amelyet 2023 tavaszán már harmadszor tartanak majd meg a Berkeley Egyetemen, egy afféle kísérlet volt Tarvin, az integratív biológia adjunktusa számára. A sokszínűség, a méltányosság és a befogadás témája iránti megújult egyetemi érdeklődés miatt ő és a tanszékén belül működő munkacsoportok úgy gondolták, hogy a kurzus hozzájárulhat a tudományos életben régóta fennálló probléma kezeléséhez a Berkeley Egyetemen. A tudományt uraló angol nyelv komoly akadályt jelent az angolul nem anyanyelvi szinten beszélő kutatók számára.

Nemcsak a külföldi diákok és kutatók vannak hátrányban, ha a tudományt elsősorban angolul művelik. Sok amerikai születésű diák is így van ezzel. 2020 őszén a Berkeley Egyetemre beiratkozó elsőévesek mintegy 40%-a első generációs egyetemista volt, és a Kaliforniai Egyetem 10 campusát összesítve az első generációs hallgatók 39%-ának nem az angol volt az anyanyelve.

“Sok kaliforniai diákunk úgy nőtt fel, hogy a szüleinek fordított” – mondta Tarvin. “A fordítás már egészen kicsi koruk óta az életük része volt.”

Tarvin számára a kurzus – A nyelvi korlátok áttörése az evolúcióban és az ökológiában – “lehetőséget nyújtott arra, hogy a hallgatóknak egyrészt fordítási ismereteket tanítson, másrészt arra ösztönözze őket, hogy tevékeny szerepet vállaljanak a szerkezetváltás ezen területén. És tulajdonképpen úgy láttam, hogy a diákok nagyon pozitívan fogadják ezt a fajta aktivizmust. Úgy tűnik, hogy a kurzus elvégzése után mindannyian egyetértenek abban, hogy a nyelvi korlátok problémájának kezelése nagyon fontos”.”

A kurzus eredményeként Tarvin és néhány végzős hallgató a Berkeley Egyetemről, kanadai, izraeli és magyarországi munkatársakkal egyűttműködve egy tudományos cikkben olyan új gépi fordítóprogramokat értékeltek, amelyeket világszerte használhatnak az emberek arra, hogy tudományos cikkeiket a nem angolul beszélők számára is hozzáférhetővé tegyék. A tanulmány ma (augusztus 3-án) jelent meg online a BioScience című folyóiratban. A spanyol, francia, portugál és magyar nyelvű fordítások – a társszerzők nyelvei – szintén elérhetőek online.

“Az ötlet lényege, hogy megpróbáljuk megadni az embereknek az eszközöket és a motivációt is ahhoz, hogy lefordítsák saját tudományos kutatásukat” – mondta Tarvin. “A tudománynak nem kell egyetlen nyelven alapulnia és rengeteg előny származik abból, ha a tudomány minden fázisában többnyelvű megközelítéseket alkalmazunk. Például a több nyelven történő publikálás a társadalom javára válik a tudományos eredmények hatékonyabb megismertetése révén.”

“A nyelv egyszerre lehet akadály és fantasztikus eszköz is, amely összehozza az embereket” – hangsúlyozta Emma Steigerwald , a tanulmány első szerzője, a UC Berkeley végzős környezettudomány, -politika és -menedzsment szakos hallgatója. “Ez egy olyan akadály, amelyet ezzel az új technológiával leküzdhetünk. Elmagyarázzuk a technológiát és azt, hogy hogyan lehet alkalmazni, és hogy mire kell figyelnünk, amikor használjuk. Bemutatjuk mindazokat a nagyszerű lehetőségeket, amerre a tudományos kommunikáció fejlődhet ennek az új technológiának a bevetésével”.”

Egy többnyelvű tudományos hálózat felé

A közelmúltig a számítógépes fordítás a viccek tárgya volt. Az emberek mulatságos példákat osztottak meg a hibás fordításokról, és gyakran úgy tűnt, mintha az angolon kívüli nyelveket és – ezzel együtt – más kultúrákat becsmérelnének.

A gépi tanulás, vagyis a mesterséges intelligencia azonban drámaian megnövelte a fordítások pontosságát, olyannyira, hogy a turisták már olyan internetes szolgáltatásokat használnak a nem angol nyelvű országokban való kommunikációhoz, mint a Google Translate.

A sok szakzsargont tartalmazó szövegek esetében azonban – amelyek nagy része természettudományos, de akár más tudományágból is származhat – a Google Translate szánalmasan alkalmatlan.

“A fordítás minősége nem méltó egy folyóirathoz” – mondta Ixchel Gonzalez Ramirez, a kurzus egyik mesterszakos témavezetője. “Az embereknek gyakran fizetniük kell azért, hogy munkájuk fordítását egy hivatásos fordító készítse el, és ez nagyon drága.”

A most megjelent cikk kiemel néhányat a sok – többnyire ingyenes – szolgáltatás közül, amelyekkel az angol nyelvű tudományos szövegek lefordíthatók más nyelvekre. A jól ismert Google Translate platform mellett ezek közé tartozik a neurális hálózatokat használó DeepL , amely saját állítása szerint az angol nyelv kínaira, japánra vagy németre fordításakor nagyságrendekkel pontosabb, mint a versenytársak; a Baidu Translate , a kínai Baidu internetes vállalat szolgáltatása, amely kezdetben az angol és kínai közötti fordításra összpontosított; a Naver Pagago, egy dél-koreai cég által fejlesztett többnyelvű fordító; valamint a Yandex.Translate , amely statisztikai gépi fordítást használ, és főként az orosz és angol nyelvre összpontosít.

“A fordítás egyre inkább elérhetővé válik bárki számára. Mindegy, hogy szakértő vagy sem, és akár kétnyelvű vagy sem, a fordítás művelete a ma rendelkezésre álló technológiáknak köszönhetően sokkal egyszerűbbé válik” – mondta Steigerwald. “Hogyan tudjuk ezt beépíteni kutatóként a munkafolyamatainkba, és hogyan változtatja meg ez a tudományos kommunikációt övező elvárásokat?”.

Az angol a tudomány lingua franca-ja

Tarvin érdeklődése a fordítás iránt az egyik végzős hallgatója, Valeria Ramírez Castañeda kapcsán alakult ki, aki egy 2020-ban publikált cikkben kifejtette, hogy milyen költségek merültek fel kolumbiai doktorandusz társai számára, amikor publikálni akartak, vagy kapcsolatba akartak lépni kollégáikkal egy az angol nyelv által uralt világban.

Mivel evolúcióbiológusként az foglalkoztatta, hogy hogyan jutottak el egyes állatok a méreg használatához, Tarvin úgy döntött, hogy új szemináriumán az evolúció és az ökológia területéről szóló cikkek fordítására helyezi a hangsúlyt, bár a jelentkezők végül saját maguk választottak irányt. Kifejezetten olyan hallgatókat keresett, mint Liu, és olyan témavezetőket, mint Gonzalez Ramirez, akik két- vagy többnyelvűek.

“A csoportban mindenkinek volt valamilyen nyelvi érintettsége a családja révén” – mondta Tarvin.

Tarvin felkérte Mairi-Louise McLaughlint, a UC Berkeley francia és nyelvészet professzorát, az újságírói és irodalmi fordítás szakértőjét is, hogy beszéljen az osztálynak arról, hogyan fordítanak a szakemberek, és hogyan befolyásolja a fordítás a jelentést. A téma akkor vált igazán érdekessé a hallgatók számára, amikor kipróbálták magukat tudományos összefoglalók és néha egész cikkek fordításában.

Ruoming Cui másodéves hallgató, aki 2022 tavaszán vett részt a kurzuson, a Baidut választotta tudományos összefoglalók fordítására. Azonnal felfedezte, hogy az angol nyelv hosszú, összetett mondatai és a több szó használata egy fogalom leírására szószaporításnak tűnik, ha kínaira fordítják.

“Ilyet a kínaiban nem szoktunk csinálni, mert így minden mondat extra hosszú lesz, és ez nagyon nehézkes” – mondta.

Liu hozzátette, hogy komoly átdolgozás nélkül sok angol fordítás zavaros lesz.

“Azt mondják, hogy bármilyen remek is az eredményed, ha a fordítás miatt zavaros cikket írsz, az emberek csak bosszankodni fognak, mert nem értik, amit csinálsz” – mondta Liu. “És ez nagyban befolyásolja, hogy az emberek milyennek értékelik a kutatást, vagy hogy egyáltalán elolvassák-e azt. Azt hiszem, ez egy hatalmas akadály a tudományos világban.”

Steigerwald, Tarvin és szerzőtársaik arra is rájöttek, hogy a tudományos cikkek egyszerűbb angol nyelven történő megírása – amit a nem kutatók már régóta szorgalmaznak –  az angolul beszélők, és az angolul nem beszélők számára egyaránt előnyös.

“Ha az anyanyelvünk nem az angol, és éppen a tanulmány angol nyelvű változatát próbáljuk elolvasni, akkor sokkal olvasmányosabbnak és kevésbé félreérthetőnek érzezzük, ha a szerző egyszerű nyelvet használt” – mondta Steigerwald. “Emellett nagyon fontos az is, hogy amikor le akarjuk fordítani az adott szöveget, a gépi tanuló programoknak sokkal könnyebb dolguk van egy egyszerű nyelven íródott szöveggel. Tehát az írásnak ez egyfajta előkészítése is annak bebiztosítására, hogy ha milliónyi nyelvre le szeretnék fordítani, sokkal könnyebben megoldható legyen.”

A tudományos cikkek széles körű fordításának más akadályai is vannak, többek között az, hogy hol tegyék hozzáférhetővé azokat, és hogyan kezeljék a szerzői jogokat. A legtöbb folyóirat egyáltalán nem fogad el nem angol nyelvű cikkeket, és csak kevés folyóirat engedélyezi kifejezetten a cikkek fordítással együtt történő publikálását. Tarvin úgy találta, hogy kevés folyóiratnak van a fordításokra vonatkozó szabályzata, és az általános szerzői jogi korlátozások miatt sok kiadó aránytalanul magas díjat számít fel a publikálás után a fordítások online közzétételéért.

“Eléggé megdöbbentő, hogy hány folyóirat nem teszi lehetővé a fordítások szabad közzétételét a publikálás után, és hogy milyen kevés olyan felület áll rendelkezésre, ahol akár csak egy kivonatot is meg lehet jelentetni egy második vagy harmadik nyelven” – mondta Tarvin. “Azt hiszem, ennek egyik fő akadálya maga a webes felület; a lehetőségeket nemcsak a publikálási és szerzői jogi szabályok korlátozzák, hanem a felület működése és kialakítása is.”

Tarvin és kollégái azt remélik, hogy a “Breaking Barriers” szemináriummal és most a BioScience című cikkel a tudományos életben bevett gyakorlatot sikerül fokozatosan megváltoztatni, és a publikációkat a jövőben alapértelmezésként fordítják le más nyelvekre is mindenekelőtt annak az országnak a nyelvére, ahol a kutatást végezték, illetve a társszerzők nyelvére.

És minél több fordítás készül, annál több anyag áll rendelkezésre a gépi fordítóprogramok továbbfejlesztéséhez, hogy aztán jobb munkát végezzenek, és ezáltal fokozatosan növekedjen a tudományos fordítás minősége.

“Az én kutatócsoportomban sok kutatásunkat fordítjuk le, és most már Emma csoportjában is ezt teszik az emberek” – mondta. “Úgy érzem, hogy az ezzel kapcsolatos pozitív hozzáállásunk és annak bemutatása, hogy ez mennyit számít az embereknek, egyre több emberre van hatásal, akik emiatt elkezdték beépíteni a fordítást a tudományos munkafolyamatukba.”.

A BioScience című cikk további társszerzői Valeria Ramírez-Castañeda és Débora Brandt, a Berkeley Egyetem doktoranduszai; Báldi András, a Vácrátóti Ökológiai és Botanikai Kutatóközpont Ökológiai és Botanikai Intézetének munkatársa; Julie Teresa Shapiro, az izraeli Be’er Sheva-i Ben-Gurion University of the Negev posztdoktora; valamint Lynne Bowker, a kanadai Ottawai Egyetem fordító és tolmács professzora.

Köszönetnyilvánítás a fordításhoz. A magyar fordítást Palotás Brigitta végezte a DeepL fordító segítségével, majd lektorálta és szerkesztette a szöveget.

KAPCSOLÓDÓ INFORMÁCIÓK