Un doctorando de la UPV logra una de las 21 becas de Facebook

Mikel Artetxe, que prepara su tesis doctoral sobre traducción automática, ha logrado una beca de Facebook./
Mikel Artetxe, que prepara su tesis doctoral sobre traducción automática, ha logrado una beca de Facebook.

Mikel Artetxe realiza su tesis sobre traducción automática no supervisada en un grupo de investigación de la facultad de Informática

IRATXE BERNAL

Las multinacionales tecnológicas están siempre ojo avizor en busca de talento y para llegar a donde sus ojeadores no alcanzan crean programas de becas que consiguen que sean los propios jóvenes prometedores quienes se dirijan a ellos. Algunos de estos programas son de ámbito regional. Otros, como el que se acaba de fijar en Mikel Artetxe, mundial. Este graduado en Ingeniería Informática de la UPV que realiza su tesis doctoral sobre las traducciones automáticas en la misma facultad donde estudió, ha ganado una de las 21 ayudas que la red social creada por Mark Zuckerberg concede a doctorandos de todo el mundo y para las que ha recibido más de 900 solicitudes.

La beca, de 37.000 dólares anuales más una ayuda complementaria para la asistencia a congresos, permitirá que el joven zarauztarra permanezca hasta dos años más trabajando dentro del grupo de investigación IXA de la facultad de Informática. Este grupo, integrado por más de 50 investigadores y dirigido por los profesores Gorka Labaka y Eneko Agirre, está dedicado a estudiar el procesamiento del lenguaje natural y el aprendizaje automático. Artetxe, que tiene 26 años, llegó al grupo tras cursar, también en la Universidad pública vasca, el máster en Análisis y Procesamiento del Lenguaje.

«Mi tesis concretamente se centra en la traducción automática no supervisada. Estamos desarrollando un modelo que, a diferencia de lo que ocurre con las traducciones automáticas que ya conocemos, pueda funcionar sin intervención humana. Lo normal es dar al ordenador traducciones hechas por personas para que éste extraiga patrones y aprenda a traducir por su cuenta. En cambio, lo que hacemos nosotros es darle dos textos totalmente distintos en dos idiomas distintos. Por ejemplo, un texto en castellano y otro, que no tenga nada que ver, en euskera. Se trata de comprobar si el modelo puede aprender a traducir sin necesidad de traducciones preexistentes porque para traducir de castellano al euskera o viceversa ya hay muchos recursos, pero, ¿qué pasa si en cambio quieres traducir del euskera al suajili? Lo que queremos lograr es que se puedan realizar traducciones de cualquier idioma a cualquier otro, por minoritario que sea», señala.

Patrones de concurrencia

La premisa de la que parten es que los patrones de concurrencia son muy parecidos en todas las lenguas. «Si coges por ejemplo, no importa en qué idioma hablemos, la palabra 'perro' normalmente siempre aparece acompañada de palabras parecidas o equivalentes, como dueño, paseo o gato», explica el investigador. A partir de ahí se pueden alinear los patrones en que aparecen las palabras tomadas como referencia y después generalizar a textos más complejos, aunque para llegar a ese punto el ordenador deberá antes analizar decenas de millones de frases.

«Son textos larguísimos, mucho más que cualquier novela. Los volcamos directamente de Internet, así construyes un texto muy largo en el idioma que sea. Esas secuencias tan largas permiten que el modelo capte los diferentes matices que puede haber en el uso natural del lenguaje», explica el investigador. «Aún no sabemos dónde está el mínimo de texto con que el modelo puede aprender, pero funcionó con el suajili y teníamos muy poco. Sólo cerca de dos millones de frases», ríe.

«Mi primer contacto con Facebook se dio porque ellos tienen un grupo de trabajo dedicado a investigar el mismo campo con la Sorbona de París. Nosotros vamos dando noticia de nuestros avances en publicaciones internacionales y ellos presentaron su trabajo en Science justo al día siguiente que nosotros. Después, el verano pasado, hice una estancia en París en su departamento de investigación de inteligencia artificial y allí supe que tenían estas becas», explica Artetxe, que el año pasado obtuvo el primer premio nacional de fin de carrera que concede anualmente el Ministerio de Educación.

«Yo voy a seguir realizando mi trabajo como hasta ahora, sólo que antes cobraba de una beca del Ministerio y ahora cobraré de Facebook. La beca supone un reconocimiento al trabajo realizado hasta ahora, así como un apoyo muy importante para continuar avanzando en mi carrera investigadora. A nivel personal estoy muy contento, pero no puedo perder de vista la precarización que sufre la investigación más en general. El hecho de que sea una multinacional extranjera quien me va permitir continuar en unas condiciones dignas debería invitarnos a la reflexión», lamenta.