Cómo clasificar las clasificaciones
II. Cladística aplicada al ámbito lingüístico
En el número
anterior de puntoycoma vimos las aportaciones del enfoque
cladístico a la taxonomía de los seres vivos y sus repercusiones en
la actualización de la sistemática. Una nueva reflexión llevará a
preguntarnos si ese método también puede ser adecuado para aplicarlo
a la clasificación de las lenguas.
En el fondo,
una clasificación filogenética de estas debería ser bastante más
sencilla, tanto porque su origen es más reciente como porque su
inventario está mucho más completo, dado que en la actualidad se
conocen prácticamente todas las lenguas existentes (puede faltar
solo un puñado de idiomas hablados por poblaciones indígenas de la
Amazonia o de Nueva Guinea), mientras que el catálogo de especies
vivientes presenta grandes lagunas, sobre todo en lo que a los
microorganismos se refiere: con toda probabilidad, las especies
descritas hasta ahora no representan más que una pequeña fracción de
la diversidad de la vida.
Pongámonos,
pues, manos a la obra; a lo largo de la historia solo ha habido dos
intentos realmente serios de clasificar las lenguas: el tipológico y
el genealógico.
Clasificación tipológica
Dividía las
lenguas en tres grandes grupos: las aislantes, las
aglutinantes y las flexivas. En su momento, fue una
clasificación que se presentó como una forma de progresión en la que
las primeras originarían las segundas, que, a su vez, darían paso a
las terceras: en efecto, las lenguas aislantes serían impermeables a
todo tipo de análisis; en las aglutinantes podrían distinguirse los
prefijos y los sufijos, y las flexivas contarían con un sistema «más
depurado» de declinaciones. Esto se ajustaba perfectamente a la
ideología dominante de esa época, hace ahora un par de siglos: en el
mundo habría unas tribus salvajes con lenguas aislantes, unos
pueblos semicivilizados con lenguas aglutinantes y finalmente
las naciones cultas con sus lenguas flexivas.
Pero esas
elucubraciones eran radicalmente falsas. Por ejemplo, el paradigma
de «lengua aislante» era el chino; pues bien, al compararlo con
otras lenguas de su mismo grupo genealógico (como el birmano), puede
observarse que lo que representa ese chino «aislante» es una etapa
posterior (lo que entonces hubiera significado lo mismo que
superior, por ser «más avanzada») de la evolución
lingüística. Y eso podemos comprobarlo muy bien sin necesidad de
viajar tan lejos: con las propias lenguas de Europa. De hecho, hace
noventa años ya lo hizo por nosotros un preclaro lingüista: Otto
Jespersen.
En 1922
procedió a comparar el latín con varias lenguas europeas. En la
frase opus uirorum omnium bonorum ueterum y su equivalente en
inglés all good old men’s work, el orden de las palabras, que
en latín podríamos notar «uvxyz», en inglés sería «xyzvu». Si
llamamos «n» a la marca de número; «g», a la de género, y «c», a la
de caso, la frase latina puede formularse:
uc + vngc + xnc + yngc + zngc,
mientras que en inglés actual
sería:
x + y + z + vngc + u,
o, como escribiría Jespersen:
(x+y+z+v+u)ngc.
Esto nos lleva
a dos conclusiones: la primera nos muestra la auténtica evolución,
porque, como observó el propio Jespersen, si acudimos al anglosajón
(o «inglés antiguo»), vemos que sí conservaba esas declinaciones (ealra
godra ealdra manna weorc), que, de considerarse vértices
evolutivos, pasaban a descubrirse como simples muestras de arcaísmo.
La segunda destruye la falacia de que todas las lenguas indoeuropeas
(en esa época se decía «arias») eran un dechado de perfección por
tener más declinaciones que nadie. Es decir: ni las lenguas flexivas
representan ninguna etapa «más avanzada» que las aislantes y las
aglutinantes, ni una lengua indoeuropea tiene que seguir siendo
necesariamente flexiva.
Clasificación genealógica
Agrupa a las
lenguas en familias, a la luz de las leyes de la evolución. El haber
podido observar innegables testimonios escritos de las diversas
etapas del latín y de su transición hacia las lenguas románicas nos
ha mostrado claramente cómo van variando las lenguas: aquí tampoco
caben sofismas y ni el más recalcitrante de los fundamentalistas
podrá atreverse a decir nunca que el latín es un mito y que cada
lengua románica fue creada por Dios en persona.
Sobre esta base
genealógica puede procederse al estudio de las posibles agrupaciones
de estas familias de lenguas en grupos más amplios, de la misma
manera que las familias de seres vivos podían agruparse en órdenes y
clases.
Si a muchos de
nuestros contemporáneos el apellido Jones puede recordarles al
protagonista de unas películas de aventuras, a los lingüistas nos
retrotrae algo más lejos, aunque nuestro personaje no tenga
absolutamente nada que envidiar al del cine; recordemos una vez más
aquellos celebérrimos párrafos que sir William Jones pronunció hace
exactamente 225 años, el 2 de febrero de 1786, en su discurso ante
la Asiatick Society de Bengala:
The Sanskrit language,
whatever may be its antiquity, is of a wonderful structure;
more perfect than the Greek, more copious than the Latin,
and more exquisitely refined than either, yet bearing to
both of them a stronger affinity, both in the roots of verbs
and in the forms of grammar, than could possibly have been
produced by accident; so strong indeed that no philologer
could examine them all three without believing them to have
sprung from some common source, which perhaps no longer
exists. There is a similar reason, though not quite so
forcible, for supposing that both the Gothick and the
Celtick had the same origin with the Sanskrit, and the old
Persian might be added to the same family.
Estas frases no
significan únicamente la partida oficial de nacimiento del
indoeuropeo, sino la confirmación de que la lingüística comparada
puede aplicarse a lenguas de cuya antigüedad no tenemos ningún
testimonio escrito (de la misma manera que en biología podemos
seguir la genealogía de organismos de los que no nos ha llegado
ningún registro fósil).
De todos modos,
a pesar de sus aspiraciones genealógicas, esta clasificación de las
lenguas se había limitado durante mucho tiempo a agruparlas según su
parecido (e incluso, en ciertos casos extremos, según la proximidad
geográfica de cada una, como también le había sucedido a veces a la
sistemática morfológica). Hace cincuenta años, ningún lingüista
hubiera podido presentar una clasificación de las lenguas del mundo
en menos de cien familias: en efecto, si bien se aceptaban los
grandes grupos de Eurasia (como el altaico, el fino-úgrico, el
indoeuropeo o el sino-tibetano), en África y sobre todo en América
reinaba la balcanización pura y simple. Los al principio muy
polémicos trabajos de Joseph Greenberg, basados en su método de
comparación multilateral, lograron poner algo de orden en ese
embrollo. Así, en 1987, Merritt Ruhlen pudo desglosar las lenguas
del mundo en solo diecisiete «superfamilias»: cuatro en África
(afroasiática, koisana, nígero-kordofana y nilo-sahariana), tres en
América (amerindia, esquimo-aleuta y na-dené), siete en Eurasia
(caucásica, chukoto-kamchadal, drávida, indohitita, norasiática,
sino-tibetana y uralo-yucaguira) y tres en Oceanía (australiana,
áustrica e indopacífica), sin contar con un puñado de lenguas aún
difíciles de clasificar.
Permítaseme un
pequeño inciso para hacer observar que ciertos lingüistas caen,
curiosamente, en la misma trampa de la que hablábamos en nuestro
anterior artículo en relación con la proliferación de denominaciones
imposibles que siguió al fin de los taxones clásicos de los seres
vivos, provocado por la revolución cladística, y quieren bautizar
«nuevos niveles filogenéticos»: así, hablan del megafilo
amerindio, del macrofilo áustrico, del superfilo
eurasiático o del gigafilo nostrático.
Polinesios y vertebrados,
por ejemplo
Muchas lenguas
de los archipiélagos de Oceanía muestran un parecido muy estrecho
entre sí: los navegantes europeos de los siglos
XVI
y XVII
pudieron apercibirse de ello cuando comprobaron que un indígena
capturado en Filipinas podía servirles de intérprete con los nativos
de Fiyi, o que un tahitiano se entendía sin gran dificultad con los
maoríes de Nueva Zelanda. Estas lenguas son las que se denominaron
malayo-polinesias, que forman parte del gran grupo austronésico
(véase la clasificación de la figura 1).
Observemos
ahora un paralelo de este tipo de clasificación en la taxonomía
biológica, que se había utilizado mucho tradicionalmente; lo más
práctico será elegir el ejemplo de los cordados, pues quien más
quien menos recordará aquella clasificación en clases y subclases
que nos enseñaron en el bachillerato
elemental (véase la figura 2).
¿Qué queda de
esa clasificación tras la revolución cladística? Apenas nada, pues
la mayoría de esas clases son taxones claramente parafiléticos
(véase el apartado sobre la cladística en
puntoycoma n° 120,
p. 4). Para la filogenética, el primer carácter distintivo aquí es
el que separa a aquellos animales cuya cuerda dorsal (notocordio)
está segmentada en pequeños bloques (somites). Es así como los
urocordados, que carecen de ellos, forman un cladón hermano del
resto: los miomerozoos. El desglose siguiente está marcado por la
aparición en estos de unos arcos cartilaginosos que protegen el
sistema nervioso central en una de las extremidades del notocordio,
lo que distingue a los cefalocordados de los craneados. La tercera
división separa a unos animales vermiformes, sin auténticas
vértebras (los mixinoideos), de los vertebrados estrictos. La cuarta
divide el cladón siguiente en función de si estos vertebrados poseen
mandíbulas (gnatóstomos) o carecen de ellas (petromizóntidos). La
siguiente distingue a los primeros según si poseen un esqueleto
cartilaginoso (condrictios) u óseo (osteictios). Luego pasarán a ser
un cladón hermano los actinopterigios (que carecen de cintura basal)
y los sarcopterigios (que sí cuentan con ella). Una séptima división
de estos separará a los actinistios (con respiración branquial) de
los ripidistios (pulmonados); la siguiente señalará la
diferenciación de los vertebrados provistos de cuatro extremidades
(tetrápodos) de los dipneos, y así sucesivamente; en el filograma de
la figura 3 podemos observar que se cumple la regla de oro de las
clasificaciones cladísticas: de cada nudo solo pueden salir dos
ramas, ni más, ni menos (para la genealogía, una madre puede tener
varios hijos; con arreglo a la cladística, un cladón solo puede
originar dos cladones a la vez, como ya apuntamos en el apartado
antes citado de nuestro artículo anterior).
Aclaremos este
punto: un nudo de un cladograma solo se divide en dos, por
definición. A esto se le llama dicotomía. Una división en
tres ramas (tricotomía) o más (politomía) solo puede
tenerse en cuenta como «provisionalmente no resuelta»: en efecto,
supongamos una especie alfa que hace cien millones de años
diera origen a dos especies beta y gamma, y que, diez
mil años después (apenas nada, a escala geológica), la especie
gamma se subdividiera a su vez en otras dos especies delta
y épsilon. De una observación puramente morfológica se
derivaría que alfa se había dividido en tres y, dada la casi
nula probabilidad de encontrar un registro fósil de gamma, la
única manera de saber la verdad sería estudiar a fondo el genoma de
beta, delta y épsilon (lo que, claro está, solo sería
posible si esas tres especies hubieran llegado a tener descendencia
en la actualidad).
Hacia otra visión de las
relaciones entre las lenguas
Aplicando el
enfoque filogenético de la sistemática a la clasificación de las
lenguas, la figura 1 quedaría transformada por completo (véase la
figura 4). Y observando este cladograma se nos muestra con claridad
meridiana la evidencia de que de él podemos extraer mucha más
información que del gráfico anterior. En efecto, de esta
clasificación puede deducirse perfectamente que todas las lenguas
austronésicas actuales tienen su origen en la isla de Taiwán
(donde aún hoy sigue existiendo la mayor diversidad, en el sentido
de que cuenta con la presencia de los principales «cladones» del
grupo), dato que nadie hubiera podido inferir de una clasificación
morfológica clásica.
Siempre habrá
quien pretenda que una clasificación lingüística no podrá ser nunca
«científica», en el sentido de que los organismos vivos, por
ejemplo, sí entran dentro del ámbito de la ciencia (la biología),
mientras que las lenguas pertenecen al de las denominadas «ciencias
humanas».
No creo que
estas páginas sean el lugar adecuado para ese viejo debate, y lejos
de mí la tentación de caer ahora en él, pero sí quiero simplemente
destacar que el pensamiento científico puede aplicarse a disciplinas
muy variadas.
Me explicaré
con un ejemplo sencillo: el fracaso del primer intento de
reconstrucción del protobantú se debió a que quiso elaborarse una
protolengua a partir de las características de la mayoría de los
idiomas surgidos de ella. En un ámbito estrictamente científico,
podría haberle sucedido lo mismo a un mastozoólogo que hubiera
pretendido que los mamíferos ancestrales eran vivíparos solo porque
el 99,93 % de las especies actuales lo son.
Para llevar a
cabo una clasificación filogenética digna de tal nombre, el método
científico requiere en general un «grupo exterior» con el que poder
establecer comparaciones. Para los mamíferos, ese grupo es el de los
reptiles; para el protobantú, el de las lenguas de la cuenca del río
Benue. Así, todos sabemos ahora que los primeros mamíferos eran
ovíparos, como sus primos los reptiles, y que las lenguas bantúes
nacieron en el golfo de Guinea, como rama oriental del grupo
nígero-congoleño meridional.
Si hemos
llegado a comprender el significado de estos ejemplos con las
lenguas austronésicas y con los vertebrados, es decir, si somos
conscientes de las inmensas posibilidades que ofrecen las
clasificaciones de tipo filogenético, podemos pasar con relativa
facilidad (digo relativa porque aquí nos faltará algo que acabamos
de señalar como muy importante: el «grupo exterior») a intentar
construir, en la medida de nuestros conocimientos actuales, el
cladograma de todas las lenguas y el de todos los
organismos vivos: para ello nos aguarda un tal Luca.
Glosario
afroasiático:
grupo lingüístico anunciado por Francis Newman en 1844 y establecido
por Joseph Greenberg en 1950 para reunir las lenguas bereberes,
chádicas, cusitas y semíticas.
altaico:
grupo lingüístico anunciado por Philip von Strahlenberg en 1730 y
establecido por Wilhelm Schott en 1849 para reunir las lenguas
manchúes, mongolas y turcas.
amerindio:
grupo lingüístico anunciado por Edward Sapir en 1929 y establecido
por Joseph Greenberg en 1960 para reunir todas las lenguas habladas
por los nativos de las Américas, con la excepción del grupo na-dené
y del esquimal.
australiano:
grupo lingüístico establecido por George Grey en 1841 para reunir
las lenguas habladas por los aborígenes australianos.
áustrico:
grupo lingüístico establecido por Wilhelm Schmidt en 1926 para
reunir las lenguas austroasiáticas y austronésicas con el tai y
otros idiomas del sudeste asiático.
austroasiático:
grupo lingüístico establecido por Ernst Kuhn en 1889 para reunir las
lenguas jemer, mon y munda con las de las islas Nicobar.
austronésico:
grupo lingüístico anunciado por Frederick de Houtman en 1603 y
establecido por Lorenzo Hervás y Panduro en 1784 para reunir las
lenguas malayas y polinesias con el malgache de Madagascar.
caucásico:
grupo lingüístico establecido por Peter Uslar en 1873 para reunir
las lenguas habladas en el Cáucaso que no pertenecen ni al grupo
altaico ni al indoeuropeo; esta denominación solo cubre actualmente
las lenguas del norte del Cáucaso, pues con las del sur se ha
constituido un grupo aparte, denominado kartúlico.
chukoto-esquimal:
grupo lingüístico establecido por Joseph Greenberg en 1987 para
reunir las lenguas chukoto-kamchadales con las esquimo-aleutas y el
nivejí.
chukoto-kamchadal:
grupo lingüístico establecido por Stepan Krasheninnikov en 1775 para
reunir las lenguas paleosiberianas del extremo nororiental de Rusia.
congo-sahariano:
grupo lingüístico propuesto por Edgar Gregersen en 1972 para reunir
las lenguas nígero-congoleñas con las nilo-saharianas.
dené-caucásico:
grupo lingüístico propuesto por Sergei Nikolaiev en 1986 para reunir
las lenguas na-dené con las sino-caucásicas.
drávida:
grupo lingüístico establecido por Francis Ellis en 1816 para reunir
las lenguas no indoeuropeas de la India meridional.
esquimo-aleuta:
grupo lingüístico anunciado por Rasmus Rask en 1818 y establecido
por John Powell en 1891 para reunir las lenguas habladas por los
pueblos esquimales y de las islas Aleutianas.
eurasiático:
grupo lingüístico propuesto por Joseph Greenberg en 1987 para reunir
las lenguas chukoto-esquimales, indoeuropeas, norasiáticas y
uralo-yucaguiras.
indoeuropeo:
grupo lingüístico anunciado por William Jones en 1786 y establecido
por Rasmus Rask en 1814 para reunir las lenguas bálticas, célticas,
eslavas, germánicas, índicas, iránicas y románicas junto con ciertos
idiomas aislados; también se ha denominado indogermánico e
indohitita.
indopacífico:
grupo lingüístico establecido por Joseph Greenberg en 1971 para
reunir las lenguas no austronésicas de Nueva Guinea con las de las
islas Andamán.
koisano:
grupo lingüístico anunciado por Albert Drexel en 1929 y establecido
por Joseph Greenberg en 1949 para reunir las lenguas de los pueblos
koi y san, incluyendo el hatsa y el sandavi.
kordofano:
grupo lingüístico establecido por Joseph Greenberg en 1963 para
reunir ciertas lenguas del Sudán.
na-dené:
grupo lingüístico anunciado por John Powell en 1891 y establecido
por Edward Sapir en 1929 para reunir el coluchano y el haida con las
lenguas atabascanas.
nígero-congoleño:
grupo lingüístico establecido por Joseph Greenberg en 1963 para
reunir las lenguas atlánticas, bantúes, mandé y voltaicas con otros
idiomas del África ecuatorial.
nígero-kordofano:
grupo lingüístico establecido por Patrick Bennet y Jan Sterk en 1977
para reunir las lenguas kordofanas con las nígero-congoleñas.
nígero-sahariano:
grupo lingüístico propuesto en 1992 por Roger Blench, que considera
las lenguas nígero-congoleñas como un subgrupo de las
nilo-saharianas.
nilo-sahariano:
grupo lingüístico anunciado por Gilbert Murray en 1920 y establecido
por Joseph Greenberg en 1963 para reunir las lenguas nilóticas y
saharianas junto con ciertos idiomas africanos aislados.
norasiático:
grupo lingüístico propuesto por John Street en 1962 para reunir las
lenguas altaicas con el aíno y el coreano-japonés.
nostrático:
grupo lingüístico propuesto por Vladislav Illich-Svitych en 1987
para reunir las lenguas afroasiáticas, drávidas, indoeuropeas,
kartúlicas, norasiáticas y uralo-yucaguiras.
sino-caucásico:
grupo lingüístico propuesto por Sergei Starostin en 1984 para reunir
las lenguas caucásicas, sino-tibetanas y yeniseyas junto con ciertos
idiomas aislados.
sino-tibetano:
grupo lingüístico establecido por Sten Konow en 1909 para reunir las
lenguas siníticas con las tibeto-birmanas.
tibeto-birmano:
grupo lingüístico establecido por Brian Hodgson en 1828 para reunir
las lenguas birmanas, karen y tibetanas.
urálico:
grupo lingüístico establecido por Johann von Eckhart en 1717 para
reunir las lenguas fino-úgricas con las samoyedas.
uralo-yucaguiro:
grupo lingüístico establecido por Björn Collinder en 1965 para
reunir el urálico con el yucaguiro.