Borrar

Presentan Latxa, el primer paso hacia un Chat GPT en euskera

«Hacia ello vamos», destaca Eneko Agirre, director de HiTZ, el Centro Vasco de Tecnología de la Lengua de la UPV/EHU

Miércoles, 31 de enero 2024, 15:05

Comenta

¿Imaginan tener un Chat GPT al que poder hacer preguntas en euskera? Ese momento está un poco más cerca tras la presentación este miércoles de Latxa, el primer gran modelo de lenguaje en la lengua vasca. «Es el paso previo hacia un Chat GPT en euskera, hacia ello vamos», ha reconocido en conversación con este periódico Eneko Agirre, director de HiTZ, el Centro Vasco de Tecnología de la Lengua de la UPV/EHU.

Los modelos grandes de lenguaje (LLM, por sus siglas en inglés) son sistemas de inteligencia artificial que gracias a técnicas de aprendizaje automático -básicamente herramientas matemáticas de gran complejidad- son capaces de comprender y generar lenguaje humano. Lo hacen gracias a que son alimentados con miles de millones de datos. La versión anterior de GPT -el motor que hace funcionar a Chat GPT- contaba con 175.000 millones de parámetros, más del doble de neuronas que tenemos en nuestros cerebros -de la versión actual no se han revelado las cifras-. Por eso son capaces de responder a casi todo de forma sorprendentemente solvente. Cuantos más ejemplos de un tema conozca, mejor responderá. Los modelos de lenguaje como el citado ChatGPT o Bard -la contrapartida de Google a Open AI- se benefician de que utilizan idiomas muy utilizados en los que se generan muchos documentos.

Esto no sucede en el caso del euskera y otros idiomas con menos practicantes. El objetivo de Latxa es precisamente superar esos límites y fomentar el desarrollo de investigaciones, innovaciones y productos que funcionan en la lengua vasca. Para construir este modelo se ha utilizado EusCrawl, un conjunto de textos en lengua vasca que contiene 1,72 millones de documentos y 288 millones de palabras.

Basada en el modelo de Meta (Facebook), Latxa sería el equivalente al mencionado GPT de Chat GPT, es su motor o cerebro, y se ha entrenado con entre 7.000 y 70.000 millones de parámetros. En estos momentos no están pensado para chatear como hacemos con las herramientas mencionadas. «Publicamos estos modelos abiertos para que el personal técnico experto los utilice para desarrollar productos o para que ajuste el modelo a las aplicaciones que le interesen. Ya estamos trabajando con modelos capaces de seguir las instrucciones de las personas usuarias», subraya Agirre, que destaca que las investigaciones seguirán para lograr un auténtico Chat GPT vasco.

Publicidad

Publicidad

Publicidad

Publicidad

Esta funcionalidad es exclusiva para suscriptores.

Reporta un error en esta noticia

* Campos obligatorios

elcorreo Presentan Latxa, el primer paso hacia un Chat GPT en euskera

Presentan Latxa, el primer paso hacia un Chat GPT en euskera