Puntoycoma número 121 - COLABORACIONES

Cómo clasificar las clasificaciones
II. Cladística aplicada al ámbito lingüístico

En el número anterior de puntoycoma vimos las aportaciones del enfoque cladístico a la taxonomía de los seres vivos y sus repercusiones en la actualización de la sistemática. Una nueva reflexión llevará a preguntarnos si ese método también puede ser adecuado para aplicarlo a la clasificación de las lenguas.

En el fondo, una clasificación filogenética de estas debería ser bastante más sencilla, tanto porque su origen es más reciente como porque su inventario está mucho más completo, dado que en la actualidad se conocen prácticamente todas las lenguas existentes (puede faltar solo un puñado de idiomas hablados por poblaciones indígenas de la Amazonia o de Nueva Guinea), mientras que el catálogo de especies vivientes presenta grandes lagunas, sobre todo en lo que a los microorganismos se refiere: con toda probabilidad, las especies descritas hasta ahora no representan más que una pequeña fracción de la diversidad de la vida.

Pongámonos, pues, manos a la obra; a lo largo de la historia solo ha habido dos intentos realmente serios de clasificar las lenguas: el tipológico y el genealógico.

Clasificación tipológica

Dividía las lenguas en tres grandes grupos: las aislantes, las aglutinantes y las flexivas. En su momento, fue una clasificación que se presentó como una forma de progresión en la que las primeras originarían las segundas, que, a su vez, darían paso a las terceras: en efecto, las lenguas aislantes serían impermeables a todo tipo de análisis; en las aglutinantes podrían distinguirse los prefijos y los sufijos, y las flexivas contarían con un sistema «más depurado» de declinaciones. Esto se ajustaba perfectamente a la ideología dominante de esa época, hace ahora un par de siglos: en el mundo habría unas tribus salvajes con lenguas aislantes, unos pueblos semicivilizados con lenguas aglutinantes y finalmente las naciones cultas con sus lenguas flexivas.

Pero esas elucubraciones eran radicalmente falsas. Por ejemplo, el paradigma de «lengua aislante» era el chino; pues bien, al compararlo con otras lenguas de su mismo grupo genealógico (como el birmano), puede observarse que lo que representa ese chino «aislante» es una etapa posterior (lo que entonces hubiera significado lo mismo que superior, por ser «más avanzada») de la evolución lingüística. Y eso podemos comprobarlo muy bien sin necesidad de viajar tan lejos: con las propias lenguas de Europa. De hecho, hace noventa años ya lo hizo por nosotros un preclaro lingüista: Otto Jespersen.

En 1922 procedió a comparar el latín con varias lenguas europeas. En la frase opus uirorum omnium bonorum ueterum y su equivalente en inglés all good old men’s work, el orden de las palabras, que en latín podríamos notar «uvxyz», en inglés sería «xyzvu». Si llamamos «n» a la marca de número; «g», a la de género, y «c», a la de caso, la frase latina puede formularse:

uc + vngc + xnc + yngc + zngc,

mientras que en inglés actual sería:

x + y + z + vngc + u,

o, como escribiría Jespersen:

(x+y+z+v+u)ngc.

Esto nos lleva a dos conclusiones: la primera nos muestra la auténtica evolución, porque, como observó el propio Jespersen, si acudimos al anglosajón (o «inglés antiguo»), vemos que sí conservaba esas declinaciones (ealra godra ealdra manna weorc), que, de considerarse vértices evolutivos, pasaban a descubrirse como simples muestras de arcaísmo. La segunda destruye la falacia de que todas las lenguas indoeuropeas (en esa época se decía «arias») eran un dechado de perfección por tener más declinaciones que nadie. Es decir: ni las lenguas flexivas representan ninguna etapa «más avanzada» que las aislantes y las aglutinantes, ni una lengua indoeuropea tiene que seguir siendo necesariamente flexiva.

Clasificación genealógica

Agrupa a las lenguas en familias, a la luz de las leyes de la evolución. El haber podido observar innegables testimonios escritos de las diversas etapas del latín y de su transición hacia las lenguas románicas nos ha mostrado claramente cómo van variando las lenguas: aquí tampoco caben sofismas y ni el más recalcitrante de los fundamentalistas podrá atreverse a decir nunca que el latín es un mito y que cada lengua románica fue creada por Dios en persona.

Sobre esta base genealógica puede procederse al estudio de las posibles agrupaciones de estas familias de lenguas en grupos más amplios, de la misma manera que las familias de seres vivos podían agruparse en órdenes y clases.

Si a muchos de nuestros contemporáneos el apellido Jones puede recordarles al protagonista de unas películas de aventuras, a los lingüistas nos retrotrae algo más lejos, aunque nuestro personaje no tenga absolutamente nada que envidiar al del cine; recordemos una vez más aquellos celebérrimos párrafos que sir William Jones pronunció hace exactamente 225 años, el 2 de febrero de 1786, en su discurso ante la Asiatick Society de Bengala:

The Sanskrit language, whatever may be its antiquity, is of a wonderful structure; more perfect than the Greek, more copious than the Latin, and more exquisitely refined than either, yet bearing to both of them a stronger affinity, both in the roots of verbs and in the forms of grammar, than could possibly have been produced by accident; so strong indeed that no philologer could examine them all three without believing them to have sprung from some common source, which perhaps no longer exists. There is a similar reason, though not quite so forcible, for supposing that both the Gothick and the Celtick had the same origin with the Sanskrit, and the old Persian might be added to the same family.

Estas frases no significan únicamente la partida oficial de nacimiento del indoeuropeo, sino la confirmación de que la lingüística comparada puede aplicarse a lenguas de cuya antigüedad no tenemos ningún testimonio escrito (de la misma manera que en biología podemos seguir la genealogía de organismos de los que no nos ha llegado ningún registro fósil).

De todos modos, a pesar de sus aspiraciones genealógicas, esta clasificación de las lenguas se había limitado durante mucho tiempo a agruparlas según su parecido (e incluso, en ciertos casos extremos, según la proximidad geográfica de cada una, como también le había sucedido a veces a la sistemática morfológica). Hace cincuenta años, ningún lingüista hubiera podido presentar una clasificación de las lenguas del mundo en menos de cien familias: en efecto, si bien se aceptaban los grandes grupos de Eurasia (como el altaico, el fino-úgrico, el indoeuropeo o el sino-tibetano), en África y sobre todo en América reinaba la balcanización pura y simple. Los al principio muy polémicos trabajos de Joseph Greenberg, basados en su método de comparación multilateral, lograron poner algo de orden en ese embrollo. Así, en 1987, Merritt Ruhlen pudo desglosar las lenguas del mundo en solo diecisiete «superfamilias»: cuatro en África (afroasiática, koisana, nígero-kordofana y nilo-sahariana), tres en América (amerindia, esquimo-aleuta y na-dené), siete en Eurasia (caucásica, chukoto-kamchadal, drávida, indohitita, norasiática, sino-tibetana y uralo-yucaguira) y tres en Oceanía (australiana, áustrica e indopacífica), sin contar con un puñado de lenguas aún difíciles de clasificar.

Permítaseme un pequeño inciso para hacer observar que ciertos lingüistas caen, curiosamente, en la misma trampa de la que hablábamos en nuestro anterior artículo en relación con la proliferación de denominaciones imposibles que siguió al fin de los taxones clásicos de los seres vivos, provocado por la revolución cladística, y quieren bautizar «nuevos niveles filogenéticos»: así, hablan del megafilo amerindio, del macrofilo áustrico, del superfilo eurasiático o del gigafilo nostrático.

Polinesios y vertebrados, por ejemplo

Muchas lenguas de los archipiélagos de Oceanía muestran un parecido muy estrecho entre sí: los navegantes europeos de los siglos XVI y XVII pudieron apercibirse de ello cuando comprobaron que un indígena capturado en Filipinas podía servirles de intérprete con los nativos de Fiyi, o que un tahitiano se entendía sin gran dificultad con los maoríes de Nueva Zelanda. Estas lenguas son las que se denominaron malayo-polinesias, que forman parte del gran grupo austronésico (véase la clasificación de la figura 1).

Observemos ahora un paralelo de este tipo de clasificación en la taxonomía biológica, que se había utilizado mucho tradicionalmente; lo más práctico será elegir el ejemplo de los cordados, pues quien más quien menos recordará aquella clasificación en clases y subclases que nos enseñaron en el bachillerato elemental (véase la figura 2).

¿Qué queda de esa clasificación tras la revolución cladística? Apenas nada, pues la mayoría de esas clases son taxones claramente parafiléticos (véase el apartado sobre la cladística en puntoycoma n° 120, p. 4). Para la filogenética, el primer carácter distintivo aquí es el que separa a aquellos animales cuya cuerda dorsal (notocordio) está segmentada en pequeños bloques (somites). Es así como los urocordados, que carecen de ellos, forman un cladón hermano del resto: los miomerozoos. El desglose siguiente está marcado por la aparición en estos de unos arcos cartilaginosos que protegen el sistema nervioso central en una de las extremidades del notocordio, lo que distingue a los cefalocordados de los craneados. La tercera división separa a unos animales vermiformes, sin auténticas vértebras (los mixinoideos), de los vertebrados estrictos. La cuarta divide el cladón siguiente en función de si estos vertebrados poseen mandíbulas (gnatóstomos) o carecen de ellas (petromizóntidos). La siguiente distingue a los primeros según si poseen un esqueleto cartilaginoso (condrictios) u óseo (osteictios). Luego pasarán a ser un cladón hermano los actinopterigios (que carecen de cintura basal) y los sarcopterigios (que sí cuentan con ella). Una séptima división de estos separará a los actinistios (con respiración branquial) de los ripidistios (pulmonados); la siguiente señalará la diferenciación de los vertebrados provistos de cuatro extremidades (tetrápodos) de los dipneos, y así sucesivamente; en el filograma de la figura 3 podemos observar que se cumple la regla de oro de las clasificaciones cladísticas: de cada nudo solo pueden salir dos ramas, ni más, ni menos (para la genealogía, una madre puede tener varios hijos; con arreglo a la cladística, un cladón solo puede originar dos cladones a la vez, como ya apuntamos en el apartado antes citado de nuestro artículo anterior).

Aclaremos este punto: un nudo de un cladograma solo se divide en dos, por definición. A esto se le llama dicotomía. Una división en tres ramas (tricotomía) o más (politomía) solo puede tenerse en cuenta como «provisionalmente no resuelta»: en efecto, supongamos una especie alfa que hace cien millones de años diera origen a dos especies beta y gamma, y que, diez mil años después (apenas nada, a escala geológica), la especie gamma se subdividiera a su vez en otras dos especies delta y épsilon. De una observación puramente morfológica se derivaría que alfa se había dividido en tres y, dada la casi nula probabilidad de encontrar un registro fósil de gamma, la única manera de saber la verdad sería estudiar a fondo el genoma de beta, delta y épsilon (lo que, claro está, solo sería posible si esas tres especies hubieran llegado a tener descendencia en la actualidad).

Hacia otra visión de las relaciones entre las lenguas

Aplicando el enfoque filogenético de la sistemática a la clasificación de las lenguas, la figura 1 quedaría transformada por completo (véase la figura 4). Y observando este cladograma se nos muestra con claridad meridiana la evidencia de que de él podemos extraer mucha más información que del gráfico anterior. En efecto, de esta clasificación puede deducirse perfectamente que todas las lenguas austronésicas actuales tienen su origen en la isla de Taiwán (donde aún hoy sigue existiendo la mayor diversidad, en el sentido de que cuenta con la presencia de los principales «cladones» del grupo), dato que nadie hubiera podido inferir de una clasificación morfológica clásica.

Siempre habrá quien pretenda que una clasificación lingüística no podrá ser nunca «científica», en el sentido de que los organismos vivos, por ejemplo, sí entran dentro del ámbito de la ciencia (la biología), mientras que las lenguas pertenecen al de las denominadas «ciencias humanas».

No creo que estas páginas sean el lugar adecuado para ese viejo debate, y lejos de mí la tentación de caer ahora en él, pero sí quiero simplemente destacar que el pensamiento científico puede aplicarse a disciplinas muy variadas.

Me explicaré con un ejemplo sencillo: el fracaso del primer intento de reconstrucción del protobantú se debió a que quiso elaborarse una protolengua a partir de las características de la mayoría de los idiomas surgidos de ella. En un ámbito estrictamente científico, podría haberle sucedido lo mismo a un mastozoólogo que hubiera pretendido que los mamíferos ancestrales eran vivíparos solo porque el 99,93 % de las especies actuales lo son.

Para llevar a cabo una clasificación filogenética digna de tal nombre, el método científico requiere en general un «grupo exterior» con el que poder establecer comparaciones. Para los mamíferos, ese grupo es el de los reptiles; para el protobantú, el de las lenguas de la cuenca del río Benue. Así, todos sabemos ahora que los primeros mamíferos eran ovíparos, como sus primos los reptiles, y que las lenguas bantúes nacieron en el golfo de Guinea, como rama oriental del grupo nígero-congoleño meridional.

Si hemos llegado a comprender el significado de estos ejemplos con las lenguas austronésicas y con los vertebrados, es decir, si somos conscientes de las inmensas posibilidades que ofrecen las clasificaciones de tipo filogenético, podemos pasar con relativa facilidad (digo relativa porque aquí nos faltará algo que acabamos de señalar como muy importante: el «grupo exterior») a intentar construir, en la medida de nuestros conocimientos actuales, el cladograma de todas las lenguas y el de todos los organismos vivos: para ello nos aguarda un tal Luca.

Glosario

afroasiático: grupo lingüístico anunciado por Francis Newman en 1844 y establecido por Joseph Greenberg en 1950 para reunir las lenguas bereberes, chádicas, cusitas y semíticas.

altaico: grupo lingüístico anunciado por Philip von Strahlenberg en 1730 y establecido por Wilhelm Schott en 1849 para reunir las lenguas manchúes, mongolas y turcas.

amerindio: grupo lingüístico anunciado por Edward Sapir en 1929 y establecido por Joseph Greenberg en 1960 para reunir todas las lenguas habladas por los nativos de las Américas, con la excepción del grupo na-dené y del esquimal.

australiano: grupo lingüístico establecido por George Grey en 1841 para reunir las lenguas habladas por los aborígenes australianos.

áustrico: grupo lingüístico establecido por Wilhelm Schmidt en 1926 para reunir las lenguas austroasiáticas y austronésicas con el tai y otros idiomas del sudeste asiático.

austroasiático: grupo lingüístico establecido por Ernst Kuhn en 1889 para reunir las lenguas jemer, mon y munda con las de las islas Nicobar.

austronésico: grupo lingüístico anunciado por Frederick de Houtman en 1603 y establecido por Lorenzo Hervás y Panduro en 1784 para reunir las lenguas malayas y polinesias con el malgache de Madagascar.

caucásico: grupo lingüístico establecido por Peter Uslar en 1873 para reunir las lenguas habladas en el Cáucaso que no pertenecen ni al grupo altaico ni al indoeuropeo; esta denominación solo cubre actualmente las lenguas del norte del Cáucaso, pues con las del sur se ha constituido un grupo aparte, denominado kartúlico.

chukoto-esquimal: grupo lingüístico establecido por Joseph Greenberg en 1987 para reunir las lenguas chukoto-kamchadales con las esquimo-aleutas y el nivejí.

chukoto-kamchadal: grupo lingüístico establecido por Stepan Krasheninnikov en 1775 para reunir las lenguas paleosiberianas del extremo nororiental de Rusia.

congo-sahariano: grupo lingüístico propuesto por Edgar Gregersen en 1972 para reunir las lenguas nígero-congoleñas con las nilo-saharianas.

dené-caucásico: grupo lingüístico propuesto por Sergei Nikolaiev en 1986 para reunir las lenguas na-dené con las sino-caucásicas.

drávida: grupo lingüístico establecido por Francis Ellis en 1816 para reunir las lenguas no indoeuropeas de la India meridional.

esquimo-aleuta: grupo lingüístico anunciado por Rasmus Rask en 1818 y establecido por John Powell en 1891 para reunir las lenguas habladas por los pueblos esquimales y de las islas Aleutianas.

eurasiático: grupo lingüístico propuesto por Joseph Greenberg en 1987 para reunir las lenguas chukoto-esquimales, indoeuropeas, norasiáticas y uralo-yucaguiras.

indoeuropeo: grupo lingüístico anunciado por William Jones en 1786 y establecido por Rasmus Rask en 1814 para reunir las lenguas bálticas, célticas, eslavas, germánicas, índicas, iránicas y románicas junto con ciertos idiomas aislados; también se ha denominado indogermánico e indohitita.

indopacífico: grupo lingüístico establecido por Joseph Greenberg en 1971 para reunir las lenguas no austronésicas de Nueva Guinea con las de las islas Andamán.

koisano: grupo lingüístico anunciado por Albert Drexel en 1929 y establecido por Joseph Greenberg en 1949 para reunir las lenguas de los pueblos koi y san, incluyendo el hatsa y el sandavi.

kordofano: grupo lingüístico establecido por Joseph Greenberg en 1963 para reunir ciertas lenguas del Sudán.

na-dené: grupo lingüístico anunciado por John Powell en 1891 y establecido por Edward Sapir en 1929 para reunir el coluchano y el haida con las lenguas atabascanas.

nígero-congoleño: grupo lingüístico establecido por Joseph Greenberg en 1963 para reunir las lenguas atlánticas, bantúes, mandé y voltaicas con otros idiomas del África ecuatorial.

nígero-kordofano: grupo lingüístico establecido por Patrick Bennet y Jan Sterk en 1977 para reunir las lenguas kordofanas con las nígero-congoleñas.

nígero-sahariano: grupo lingüístico propuesto en 1992 por Roger Blench, que considera las lenguas nígero-congoleñas como un subgrupo de las nilo-saharianas.

nilo-sahariano: grupo lingüístico anunciado por Gilbert Murray en 1920 y establecido por Joseph Greenberg en 1963 para reunir las lenguas nilóticas y saharianas junto con ciertos idiomas africanos aislados.

norasiático: grupo lingüístico propuesto por John Street en 1962 para reunir las lenguas altaicas con el aíno y el coreano-japonés.

nostrático: grupo lingüístico propuesto por Vladislav Illich-Svitych en 1987 para reunir las lenguas afroasiáticas, drávidas, indoeuropeas, kartúlicas, norasiáticas y uralo-yucaguiras.

sino-caucásico: grupo lingüístico propuesto por Sergei Starostin en 1984 para reunir las lenguas caucásicas, sino-tibetanas y yeniseyas junto con ciertos idiomas aislados.

sino-tibetano: grupo lingüístico establecido por Sten Konow en 1909 para reunir las lenguas siníticas con las tibeto-birmanas.

tibeto-birmano: grupo lingüístico establecido por Brian Hodgson en 1828 para reunir las lenguas birmanas, karen y tibetanas.

urálico: grupo lingüístico establecido por Johann von Eckhart en 1717 para reunir las lenguas fino-úgricas con las samoyedas.

uralo-yucaguiro: grupo lingüístico establecido por Björn Collinder en 1965 para reunir el urálico con el yucaguiro.

COLABORACIONES

Cómo clasificar las clasificaciones II. Cladística aplicada al ámbito lingüístico

Cómo clasificar las clasificaciones
II. Cladística aplicada al ámbito lingüístico