Investigadores reconstruyen las principales ramas del árbol lingüístico

La diversidad de las lenguas humanas puede compararse con las ramas de un árbol. El inglés, por ejemplo, se encuentra en una rama que se remonta a un ancestro común con el escocés, que se remonta a un ancestro más lejano que se dividió en alemán y holandés.

Si nos adentramos en la rama europea, se originan el germánico, el celta, el albanés, las lenguas eslavas, las lenguas romances como el italiano y el español, el armenio, el báltico y el griego helénico.

Antes de esta rama, y unos 5.000 años atrás en la historia de la humanidad, está el indoeuropeo, una importante proto-lengua que se dividió en la rama europea por un lado, y por otro, el ancestro indoiraní del persa moderno, el nepalí, el bengalí, el hindi y muchos más.

Uno de los objetivos definitorios de la lingüística histórica es trazar un mapa de la ascendencia de las lenguas modernas tan lejos como sea posible, quizás, según esperan algunos lingüistas, hasta un único ancestro común que constituiría el tronco de ese árbol metafórico.

Lenguas altaicas | foto Alexei S. Kassian et al.

Pero aunque se han sugerido muchas conexiones emocionantes basadas en comparaciones sistémicas de datos de la mayoría de las lenguas del mundo, gran parte del trabajo, que se remonta a la década de 1800, ha sido propenso a errores. Los lingüistas siguen debatiendo sobre la estructura interna de familias tan consolidadas como la indoeuropea, y sobre la propia existencia de familias cronológicamente más profundas y amplias.

Para comprobar qué ramas resisten el peso del escrutinio, un equipo de investigadores asociados al programa de Evolución de las Lenguas Humanas está utilizando una novedosa técnica para peinar los datos y reconstruir las principales ramas del árbol lingüístico. En dos artículos recientes examinan la familia indoeuropea de unos 5.000 años de antigüedad, que ha sido bien estudiada, y una rama más tenue y antigua conocida como macrofamilia altaica, que se cree que conecta los ancestros lingüísticos de lenguas tan distantes como el turco, el mongol, el coreano y el japonés.

Cuanto más se quiere retroceder en el tiempo, menos se puede confiar en los métodos clásicos de comparación lingüística para encontrar correlaciones significativas, dice el coautor George Starostin, profesor externo del Santa Fe Institute con sede en la Escuela Superior de Economía de Moscú. Explica que uno de los principales retos a la hora de comparar lenguas es distinguir entre las palabras que tienen sonidos y significados similares porque pueden descender de un ancestro común, y las que son similares porque sus culturas tomaron prestados términos entre sí en un pasado más reciente.

Tenemos que llegar a la capa más profunda de la lengua para identificar su ascendencia, porque las capas exteriores están contaminadas. Se corrompen fácilmente con sustituciones y préstamos, afirma.

Para llegar a las capas más profundas del lenguaje, el equipo de Starostin parte de una lista establecida de conceptos básicos y universales de la experiencia humana. Incluye significados como «roca», «fuego», «nube», «dos», «mano» y «humano», entre un total de 110 conceptos. A partir de esta lista, los investigadores utilizan los métodos clásicos de reconstrucción lingüística para dar con una serie de formas de palabras que luego relacionan con significados específicos de la lista.

Lenguas indoeuropeas | foto nerdy.maps en Wikimedia Commons

Este enfoque, denominado reconstrucción onomasiológica, difiere notablemente de los enfoques tradicionales de la lingüística comparada porque se centra en encontrar qué palabras se utilizaban para expresar un determinado significado en la proto-lengua, en lugar de reconstruir las formas fonéticas de esas palabras y asociarlas a una vaga nube de significados.

Su última reclasificación de la familia indoeuropea, que aplica el principio onomasiológico y se publicó en la revista Linguistics, confirmó genealogías bien documentadas en la literatura. Una investigación similar sobre el grupo lingüístico altaico de Eurasia, cuyo proto-lenguaje se remonta a unos 8.000 años, confirmó una señal positiva de relación entre la mayoría de las ramas principales del altaico: el turco, el mongólico, el tungúsico y el japonés. Sin embargo, no pudo reproducir una relación publicada anteriormente entre el coreano y las demás lenguas del grupo altaico. Esto podría significar que los nuevos criterios eran demasiado estrictos o (menos probable) que las agrupaciones anteriores eran incorrectas.

A medida que los investigadores comprueban y reconstruyen las ramas del lenguaje humano, uno de los objetivos finales es comprender las trayectorias evolutivas que siguen las lenguas a lo largo de las generaciones, al igual que hacen los biólogos evolutivos con los organismos vivos.

Una de las grandes ventajas de la reconstrucción histórica de las lenguas es que es capaz de sacar a la luz mucha información cultural, afirma Starostin. Reconstruir su filogenia interna, como estamos haciendo en estos estudios, es el paso inicial de un procedimiento mucho más amplio que consiste en intentar reconstruir gran parte del acervo léxico de esa lengua, incluido su léxico cultural.


Fuentes

Santa Fe Institute | Kassian, A., Starostin, G., Egorov, I., Logunova, E., & Dybo, A. (2021). Permutation test applied to lexical reconstructions partially supports the Altaic linguistic macrofamily. Evolutionary Human Sciences, 3, E32. doi:10.1017/ehs.2021.28 | Kassian, Alexei S., Zhivlov, Mikhail, Starostin, George, Trofimov, Artem A., Kocharov, Petr A., Kuritsyna, Anna and Saenko, Mikhail N.. Rapid radiation of the inner Indo-European languages: an advanced approach to Indo-European lexicostatistics. Linguistics, vol. 59, no. 4, 2021, pp. 949-979. doi.org/10.1515/ling-2020-0060