El idioma y los ordenadores
Lingüística ·
El lenguaje es uno de los grandes desafíos que tiene ante sí la Inteligencia Artificialmauricio-josé schwarz
Jueves, 1 de abril 2021, 23:42
La lingüística es el estudio del idioma y su estructura, con todos sus aspectos: gramática, sintaxis, fonética, semántica (significados) y pragmática (el contexto y uso ... del lenguaje). Partiendo históricamente de las Humanidades, cada vez aplica más los métodos de la ciencia para llegar a sus conclusiones.
No es fácil. El lenguaje humano, en todos los idiomas, está lleno de sutilezas y matices pequeñísimos que separan frases de significados radicalmente distintos que dependen de quién habla, de su intención, su entonación, el contexto espacial y temporal y muchos otros elementos que modifican el significado de nuestras palabras.
Cuando tratamos con equipos informáticos utilizando números, hablamos en su idioma, el que las máquinas entienden como parte de su diseño original. Y esto bastaba hace décadas, cuando los grandes ordenadores manipulaban únicamente datos numéricos, fuera en empresas, laboratorios científicos, oficinas del Gobierno o en programas como los espaciales. Sin embargo, al paso del tiempo se hizo necesario que la informática empezara a comprender el complejo lenguaje humano y los matices a veces tremendamente diversos de los distintos idiomas.
Un uso común del lenguaje es el uso de motores de búsqueda. Escribimos una o más palabras y esperamos que el motor (Google, Bing, Baidu, Yahoo!, etc.) nos devuelva como resultado las páginas web más relevantes. Y así comenzaron estos servicios. Pero al paso del tiempo, utilizando los elementos de la inteligencia artificial, del aprendizaje de la máquina y del conocimiento, los buscadores han ido intentando comprender más que simples palabras. ¿Cuando buscamos 'auto' debe o no también buscar 'coche', 'automóvil' y 'vehículo familiar'? Si el contexto es legal, ciertamente no, un auto de un juicio no tiene relación con un automóvil. Pero si el contexto es histórico, quizás deba presentar más resultados de autos de fe inquisitoriales que ofertas de berlinas de segunda mano.
El lenguaje es también uno de los grandes desafíos de la inteligencia artificial. Las palabras clave de una búsqueda en Internet son enormemente sencillas comparadas con el lenguaje natural, el que usamos todos los días, en el que nos entendemos. ¿Pueden algún día las máquinas (o, más bien, los programas que se ejecutan en las máquinas) entender nuestro lenguaje común? ¿Podemos conversar con ellas? Para conseguirlo, los lingüistas y los informáticos deben trabajar juntos para desentrañar los elementos del lenguaje y convertirlos en instrucciones que los programas puedan entender. En gran medida sigue siendo un misterio cómo adquirimos el lenguaje y cómo aprendemos el idioma (o los idiomas, como hacen sin aparente esfuerzo los niños que viven en hogares bilingües o incluso trilingües), así que no podemos replicar ese mecanismo en nuestros ordenadores… tenemos que inventar otra forma de enseñarles.
Y si queremos que en lugar de leernos nos escuchen, el problema crece enormemente. De ello se ocupa la rama del 'reconocimiento del habla', que en primera instancia analiza la forma en que distintas personas de distintas regiones y culturas con distintos acentos pueden decir una palabra o una oración y luego enseña a un programa para que las reconozca en todos los casos. En el caso del español, por ejemplo, los programas deben comprender a los usuarios que omiten o aspiran las 's', a los que cecean y a los que sesean, a los que en el cono sur pronuncian la 'y' y la 'll' como 'sh', a los que pronuncian la 'r' como 'l', a los que cambian de lugar los acentos ortográficos, a los que usan el 'voseo' americano, el usted y el vos español, y también a los que hablan tan rápido como si toda una oración fuera una sola palabra.
Y lograr eso en todos los idiomas, con todas sus variantes regionales, nacionales, culturales, sociales y de otro tipo. Una aplicación de esta habilidad son los programas de dictado que aparecieron, con muchas imprecisiones, en 1990. Apenas en 2017, los investigadores de Microsoft consiguieron que, en una prueba de transcripción o dictado, sus programas alcanzaran la misma precisión que los transcriptores humanos.
Los asistentes
Los asistentes virtuales como los que ofrecen Apple, Google y Amazon, son una consecuencia de los esfuerzos por lograr programas que comprendan razonablemente el habla humana. Estos asistentes además aprenden de las personas que los utilizan, refinando poco a poco su capacidad de respuesta. Por supuesto, los programas tanto de reconocimiento del habla como de respuesta no residen en el interior de los dispositivos, sino que se remiten a grandes servidores de las empresas donde se procesa tanto nuestra voz cuando le pedimos a un asistente, por ejemplo, que reproduzca una canción de Los Beatles como la respuesta que nos ofrece. Y el ejemplo no es ocioso. La primera patente de un asistente virtual, Alexa, de Amazon, se solicitó el 31 de agosto de 2012 con ese ejemplo: un hombre en una habitación sin ruido pedía «Por favor toca 'Let it be' de Los Beatles» y el dispositivo de mesa respondía «Sin problema, John» y reproducía la canción.
Este ejemplo nos introduce en otro espacio que es el del reconocimiento del hablante, es decir, de la interpretación que un programa hace de los tonos, armónicos y cadencia de la voz para saber quién está hablándole y, de ser posible, ajustar su respuesta al historial, gustos y tendencias de las varias personas integrantes de una unidad familiar.
Lo que ha intentado la Informática es abordar el desafío del lenguaje en sus máquinas sin que se haya todavía desentrañado cómo lo usamos nosotros, cómo es que el autor de este artículo puede escribir una serie de ideas y usted, el lector, puede comprenderlo con claridad y, se espera, poco margen para la interpretación incorrecta.
El objetivo final, que aún parece lejano, es que podamos dejar atrás, al menos cuando lo deseemos, el tecleo y las distintas operaciones de toque, clic y gestos con los dedos con los cuales hoy nos comunicamos con el mundo informatizado y podamos hacerlo mediante el habla, como lo hacemos con las personas a nuestro alrededor.
Y, en el proceso, entender mejor cómo es que este primate singular desarrolló la capacidad de un lenguaje complejo, estructurado y capaz de comunicar toda la experiencia de una persona a otra, sea subjetiva u objetiva.
Ida y vuelta
Así como la lingüística sirve a la informática, esta a su vez es una herramienta fundamental para los científicos del idioma. Las grandes bases de datos de los buscadores, por ejemplo, son una fuente vastísima que representa las variaciones y características del idioma que antes se conseguía solo pacientemente revisando periódicos, revistas y libros, y que es el punto de partida para investigar el misterio de cómo nos entendemos pese a todo.
¿Tienes una suscripción? Inicia sesión
Comentar es una ventaja exclusiva para suscriptores
¿Ya eres suscriptor?
Inicia sesiónNecesitas ser suscriptor para poder votar.