La traducción automática podría poner la ciencia al alcance de todos
A medida que mejora la traducción informática, se reducen las barreras para traducir los artículos científicos a varios idiomas con el fin de proporcionar un acceso global
August 16, 2022
Traducido automáticamente con DeepLTranslator y editado por Valeria Ramírez Castañeda. La edición obedece a las formas del español colombiano y usa algunas ideas del lenguaje de género incluyente.
Cuando aún estaba en el instituto, Xinyi Liu trabajó brevemente en un laboratorio de la Universidad de Beihang, en Pekín, y se sorprendió al ver que su colegas de investigación utilizaban habitualmente Google Translate para generar el primer borrador en inglés de artículos científicos. La traducción es imprescindible si los científicos y las científicas quieren presentarse a revistas de alto nivel, casi todas ellas en inglés.
“Era normal que estudiantes posdoctorales se limitaran a utilizar Google Translate para traducir todo primero y luego modificarlo y pulirlo. Pero después de la primera traducción, todo el artículo perdía sentido”, dice Liu, estudiante de tercer año de la Universidad de California en Berkeley, que especializa en biología molecular y celular. “Literalmente, todas las palabras y términos parecían pegados al azar”.
Tenía que haber una forma mejor, pensó.
Así que el año pasado, cuando vio un nuevo curso dictado por Rebecca Tarvin sobre cómo romper las barreras lingüísticas en la ciencia, se apuntó.
Esa clase, que se impartirá por tercera vez en la UC Berkeley en la primavera de 2023, fue un curso de prueba para Tarvin, profesora adjunta de biología integrativa. Con el renovado interés de todo el campus por la diversidad, la equidad y la inclusión, ella y los grupos de trabajo de su departamento pensaron que la clase podría ayudar a UC Berkeley a abordar un problema de largo aliento en la ciencia: El inglés, la lengua dominante en la ciencia, es un gran obstáculo para los científicos y las científicas que no crecieron hablando en inglés.
No sólo extranjeros y extranjeras están en desventaja cuando la ciencia se comunica principalmente en inglés. También lo están muches estudiantes nacidos en Estados Unidos. En el otoño de 2020, alrededor del 40% de los estudiantes de primer año de la UC Berkeley eran estudiantes universitarios de primera generación, y dentro del sistema de 10 campus de la Universidad de California, el 39% de les estudiantes de primera generación crecieron con un idioma distinto al inglés como primera lengua.
“Muchos de nuestros estudiantes de California crecieron traduciendo para sus padres”, dijo Tarvin. “La traducción ha formado parte de su vida desde que eran muy jóvenes”.
Para Tarvin, la clase — Romper las barreras lingüísticas en la evolución y la ecología — fue una “oportunidad tanto para enseñar a les estudiantes habilidades de traducción como para animarles a ser activistas en este ámbito del cambio estructural”. Y de hecho, he visto una recepción realmente positiva de este tipo de activismo por parte de el clase, ya les estudiantes parecen estar de acuerdo en que abordar las barreras lingüísticas es realmente importante después de tomar el curso”.
La clase llevó a Tarvin y a algunes estudiantes de posgrado de la UC Berkeley, junto con colaboradores de Canadá, Israel y Hungría, a escribir un artículo científico en el que se evalúan cómo las nuevas herramientas de traducción automática pueden ser utilizadas por personas de todo el mundo para hacer que sus artículos científicos sean accesibles a quienes no hablan inglés. El trabajo ha aparecido en línea en éste mes en la revista BioScience. También están en línea las traducciones al español, francés, portugués y húngaro, los idiomas de los coautores.
“La idea es que intentamos dar a la gente las herramientas y la motivación para traducir su propia investigación científica”, dijo Tarvin. “La ciencia no tiene por qué basarse en un solo idioma. Y la incorporación de enfoques multilingües en todas las fases de la ciencia aporta muchas ventajas adicionales. Por ejemplo, publicar en varios idiomas beneficiará a la sociedad porque se mejora la comunicación científica”.
“El idioma puede ser una barrera, así como una herramienta fantástica, para unir a la gente”, subrayó Emma Steigerwald, primera autora del trabajo y estudiante de posgrado en ciencias, políticas y gestión medioambientales de la UC Berkeley. “Es una barrera que podemos superar utilizando esta nueva tecnología. Explicamos la tecnología y cómo puede aplicarse, así como los aspectos que debemos tener en cuenta al utilizarla, y todas las formas maravillosas y positivas en que puede transformarse la comunicación científica gracias a esta nueva tecnología.”
Hacia una red científica multilingüe
Hasta hace poco, la traducción por ordenador era objeto de bromas. La gente compartía divertidos ejemplos de traducciones erróneas, que a menudo parecían despreciar otros idiomas distintos del inglés y, por ende, otras culturas.
Pero el aprendizaje automático, o la inteligencia artificial, ha aumentado espectacularmente la precisión de la traducción hasta el punto de que les turistas utilizan servicios de Internet como Google Translate para comunicarse en países que hablan idiomas que no dominan.
Pero para los textos que contienen mucha jerga -mucha de ella científica, pero también de muchos otros campos académicos- Google Translate es lamentablemente inadecuado.
“La calidad de la traducción no es la de una revista”, afirma Ixchel González Ramírez, una de las estudiantes graduadas mentoras del curso. “Muchas veces, la gente tiene que pagar para conseguir un traductor profesional que traduzca su trabajo, y eso es muy caro”.
El nuevo trabajo destaca algunos de los numerosos servicios -la mayoría de ellos gratuitos- que pueden convertir los escritos científicos en inglés a otros idiomas. Además de la conocida plataforma Google Translate, entre ellos se encuentran DeepL, que utiliza redes neuronales y afirma ser muchas veces más preciso que sus competidores a la hora de traducir del inglés al chino, japonés o alemán; Baidu Translate, un servicio de la empresa china de Internet Baidu que inicialmente se centraba en traducir entre el inglés y el chino; Naver Pagago, un traductor multilingüe creado por una empresa de Corea del Sur; y Yandex.Translate, que utiliza la traducción automática estadística y se centra sobre todo en el ruso y el inglés.
“La traducción está cada vez más al alcance de cualquier persona. Seas o no un experto, e incluso seas o no bilingüe, la capacidad de traducir se ve agilizada por muchas de las tecnologías de las que disponemos hoy en día”, dijo Steigerwald. “¿Cómo podemos integrar esto en nuestro flujo de trabajo como científicos y cómo cambia esto las expectativas que rodean a la comunicación científica?
El inglés es la lengua franca de la ciencia
El interés de Tarvin por la traducción surgió de una de sus estudiantes de posgrado, Valeria Ramírez Castañeda, que en 2020 publicó un artículo en el que describía las desventajas en los que incurrían sus doctorandes colombianes que querían publicar o interactuar con sus colegas en un mundo dominado por el inglés.
Como bióloga evolutiva interesada en cómo algunos animales llegaron a utilizar el veneno, Tarvin decidió centrar su nuevo seminario en la traducción de artículos en los campos de la evolución y la ecología, aunque estudiantes que se apuntaron acabaron trazando sus propios cursos. Buscó especialmente estudiantes, como Liu, y mentores, como González Ramírez, que fueran bilingües o multilingües.
“Todos los alumnos y las alumnas de la clase han tenido algún tipo de relación familiar con la lengua”, dijo Tarvin.
Tarvin también pidió a Mairi-Louise McLaughlin, profesora de francés y lingüística de la UC Berkeley y experta en traducción periodística y literaria, que hablara a la clase sobre cómo les profesionales abordan la traducción y cómo ésta afecta al significado. Este tema resonó entre les estudiantes cuando intentaron traducir resúmenes científicos y, a veces, artículos completos.
Ruoming Cui, una estudiante de segundo año que tomó el curso en la primavera de 2022, eligió Baidu para traducir resúmenes científicos. Enseguida descubrió que las frases largas y complejas del inglés y el uso de múltiples palabras para describir un concepto parecían redundantes cuando se traducían al chino.
“No solemos hacer eso en chino porque cada frase se alarga más, y es muy tedioso”, dijo.
Liu añadió que, si no se pulen mucho, muchas traducciones al inglés resultan confusas.
“He oído decir que, aunque tu resultado sea sorprendente, si escribes un documento confuso debido a la traducción, la gente se molestará porque no puede entender lo que estás haciendo”, dijo Liu. “Y eso afectará en gran medida la forma en que la gente valide la investigación o que nadie la lea. Creo que es una gran barrera en el mundo científico”.
Steigerwald, Tarvin y sus coautores también se dieron cuenta de que escribir los artículos científicos en un inglés más sencillo — algo que el público lleva fomentando desde hace tiempo — beneficia tanto a les angloparlantes como a les que no lo son.
“Si tu lengua materna no es el inglés y tratas de leer la versión inglesa del artículo, te parecerá mucho menos ambigua y mucho más legible si el escritor ha utilizado un lenguaje sencillo”, dijo Steigerwald. “Pero también, y esto es muy importante, cuando se vaya a traducir ese texto, las herramientas de aprendizaje automático lo tendrán mucho más fácil para traducir algo que está escrito en lenguaje llano. Se trata, por tanto, de preparar el texto para el futuro, de modo que si alguien quiere traducirlo a un millón de idiomas, lo tendrá mucho más fácil si está escrito de ese modo”.
La traducción generalizada de artículos científicos sigue encontrando obstáculos, como dónde ponerlos a disposición para su lectura y cómo gestionar los derechos de autor. La mayoría de las revistas ni siquiera aceptan artículos que no estén en inglés, y pocas permiten explícitamente la co-publicación de artículos con una traducción. Tarvin ha comprobado que pocas revistas tienen alguna política sobre las traducciones y, como consecuencia de las restricciones generales de los derechos de autor, muchas casas editoriales cobran tarifas exorbitantes por publicar una traducción en línea después de la publicación.
“Es bastante sorprendente la cantidad de revistas que no permiten publicar libremente las traducciones después de la publicación, y las pocas que cuentan con una plataforma en la que se puede tener incluso un resumen en una segunda o tercera lengua”, dijo Tarvin. “Creo que una barrera importante para esto son las plataformas web; no sólo las normas de publicación y derechos de autor, sino también la funcionalidad de la plataforma”.
Con el seminario “Rompiendo barreras lingüísticas” y ahora el artículo de BioScience, Tarvin y sus colegas esperan cambiar gradualmente la norma en la ciencia de traducir por defecto los artículos a otros idiomas, especialmente el del país donde se ha realizado la investigación y el de los coautores y las coautoras.
Y cuantas más traducciones haya, más material habrá para entrenar a los sistemas de traducción automática para que hagan un mejor trabajo, aumentando gradualmente la calidad de la traducción científica.
“En mi laboratorio, traducimos muchas de nuestras investigaciones, y ahora la gente del laboratorio de Emma también lo hace”, dijo. “Creo que compartir nuestra actitud positiva hacia esto y cómo puede marcar la diferencia para la gente ha influido en un pequeño, pero creciente, grupo de personas que están empezando a incorporar la traducción en su flujo de trabajo científico”.
Coautores y coautoras del artículo de BioScience son las estudiantes de doctorado Valeria Ramírez-Castañeda y Débora Brandt, de la Universidad de Berkeley; András Báldi, del Instituto de Ecología y Botánica del Centro de Investigación Ecológica de Vácrátót (Hungría); la becaria postdoctoral Julie Teresa Shapiro, de la Universidad Ben-Gurion del Negev, en Be’er Sheva (Israel); y Lynne Bowker, profesora de traducción e interpretación de la Universidad de Ottawa (Canadá).
Nota: Esta traducción fue primero realizada con la version gratuita del traductor www.DeepL.com/Translator y posteriormente revisada por la co-autora del artículo VRC quién creció en Colombia y es hispanohablante. Sin embargo, cabe destacar que VRC no es traductora profesional, ni especialista en el idioma español (castellano).