Un científico indio hizo funcionar la “máquina del lenguaje” del sánscrito por primera vez en 2500 años: logró decodificar una regla incluida en el sistema de Pāṇini, un mecanismo ideado alrededor del año 500 a. C., que “crea” palabras y oraciones gramaticalmente correctas a través de un proceso paso a paso. El algoritmo decodificado podría aplicarse al mundo informático, concretamente en el área del procesamiento del lenguaje natural.

Un nuevo estudio que sirvió como tesis doctoral al investigador indio Rishi Rajpopat, en la Universidad de Cambridge, en Reino Unido, ha terminado con un misterio gramatical que atravesó dos milenios y medio de cultura humana: logró descifrar una regla enseñada por Pāṇini, considerado "el padre de la lingüística", que hace funcionar su “máquina del lenguaje”, capaz de producir todo tipo de frases y oraciones a partir de la introducción de la base y el sufijo de cualquier palabra. 

Según una nota de prensa, el descubrimiento hace posible derivar cualquier palabra sánscrita para construir millones de palabras y oraciones gramaticalmente correctas utilizando el sistema diseñado por Pāṇini, que es ampliamente considerado como uno de los grandes logros intelectuales de la historia. Los principales expertos en sánscrito han indicado que el nuevo descubrimiento de Rajpopat es "revolucionario" y podría significar que la gramática de Pāṇini se “enseñe” por primera vez a los ordenadores. 

La máquina del lenguaje en acción

El gran aporte del nuevo estudio, publicado en el repositorio Apollo de la Universidad de Cambridge, radica en que decodificó un algoritmo de 2,500 años de antigüedad que hace posible, por primera vez, utilizar con precisión la “máquina de lenguaje” de Pāṇini. El sistema de Pāṇini, que incluye 4.000 reglas detalladas y fue producido sobre el año 500 a. C., está pensado para trabajar como una máquina. Al introducir la base y el sufijo de una palabra, se obtienen otras palabras, frases y oraciones siempre gramaticalmente correctas, mediante un proceso en fases.

Sin embargo, cuando dos o más de las reglas de Pāṇini se aplican simultáneamente en el mismo paso, surge un problema que ha quitado el sueño a los especialistas hasta hoy: no está claro qué camino o solución elegir. Para resolver los llamados “conflictos de reglas”, que afectan a millones de palabras en sánscrito, incluidas ciertas formas de los términos “mantra” y “gurú”, se requiere un algoritmo. Esa construcción lógica es la que finalmente ha logrado descifrar Rajpopat.

Video: un problema gramatical que ha derrotado a los estudiosos del sánscrito desde el siglo V a. C. finalmente ha sido resuelto. Crédito: Universidad de Cambridge / YouTube.

Aplicaciones en el procesamiento informático del lenguaje

Históricamente, los especialistas han entendido que la metarregla de Pāṇini explicaba que, en el caso de un conflicto entre dos reglas gramaticales de igual fuerza, ganaba siempre la regla que viene después en el orden serial de la gramática. Rajpopat rechazó esto, argumentando en cambio que Pāṇini quiso decir que, entre las reglas aplicables a los lados izquierdo y derecho de una palabra, siempre debía optarse por la indicada para el costado derecho.

Empleando esta interpretación, el especialistas indio descubrió que la máquina de lenguaje de Pāṇini producía palabras gramaticalmente correctas, casi sin excepciones y en forma completamente autosuficiente. El hallazgo no tiene solamente implicaciones en el campo de la gramática: el algoritmo revelado por Rajpopat podría aplicarse también a los ordenadores, logrando que comprendan mejor el lenguaje humano y puedan incluso producir expresiones más ricas en forma independiente.

Referencia

In Pāṇini We Trust: Discovering the Algorithm for Rule Conflict Resolution in the Aṣṭādhyāyī (Doctoral thesis). Rajpopat, R. Apollo / Universidad de Cambridge (2021). DOI:https://doi.org/10.17863/CAM.80099