  
En la sección
«Colaboraciones» se recogen opiniones y propuestas firmadas por
lectores o por miembros de la Redacción cuando intervienen a título
personal. La responsabilidad de los cabos sueltos firmados y de las
colaboraciones incumbe a sus autores.
PUNTOYCOMA |
COLABORACIONES
Andanzas académicas de la varianza y de su hermana, la desviación
estándar
Lo que en castellano se designa con el término «varianza» o «variancia»
es un concepto fundamental en estadística. Pero a pesar de ser un concepto
científico básico, como «masa» en física, «clase social» en sociología o
«producto interior bruto» en economía, y a pesar de que la estadística es
una herramienta cada vez más común en todos los campos de la ciencia y la
cultura, en castellano ha habido una constante vacilación entre las
grafías «varianza» y «variancia». Hace dos años, en una carta publicada en
la Revista Panamericana de Salud Pública1, defendí el uso de la grafía «varianza». Mis
argumentos iban en contra de la grafía «variancia», que era la única que
recogían varios diccionarios de la Real Academia Española2. «Variancia» era también la traducción del
inglés variance que recomendaba el entonces recién publicado
Diccionario crítico de dudas inglés-español de medicina3 de Fernando Navarro, que atacaba la grafía
«varianza» calificándola de «anglicismo frecuente».
Amadeu Solà me avisó hace algún tiempo de que la grafía «varianza»
ha sido admitida en la nueva edición del Diccionario de la lengua
española. Consultándolo en la Red4, veo que la entrada «variancia» remite a
«varianza», término este que es el que se define y que, por tanto, recibe
preferencia.
Por supuesto que me alegra que la nueva edición del diccionario de la
Academia recoja «varianza» y le dé preferencia sobre «variancia». Hay a mi
juicio muchas razones lingüísticas y de uso para tal preferencia, razones
que ya expuse en la carta citada, fácilmente accesible en la Red. Pero
quizá sea esta una buena ocasión para comentar la definición de varianza
que da la Academia y que es, en concreto, la siguiente: «media de las
desviaciones cuadráticas de una variable aleatoria, referidas al valor
medio de esta».
Usar «desviaciones cuadráticas» en una definición de un diccionario
general como este no parece demasiado apropiado. El término «cuadrático»
es más que nada jerga matemática. No decimos que el área del círculo es el
producto de pi por el «radio cuadrático», sino el producto de pi por el
radio al cuadrado (pr2). Las «desviaciones cuadráticas» que
menciona la definición de «varianza» del diccionario de la Academia harán
que más de uno no entienda que se trata simplemente de las desviaciones (o
diferencias) respecto de la media, elevadas al cuadrado.
Por otra parte, la definición citada tampoco es del todo correcta.
Según el mismo diccionario, lo aleatorio es lo «perteneciente o relativo
al juego de azar» o «dependiente de algún suceso fortuito». Pero la
varianza puede calcularse para cualquier conjunto numérico, para cualquier
«variable», sea o no aleatoria. El adjetivo «aleatoria» sobra en la
definición. Ya que una constante es un caso particular de una variable,
también podemos calcular la varianza de un conjunto numérico formado por
una constante k repetida n veces. Como la media aritmética
de k repetido n veces es k, sean cualesquiera k
y n, la varianza de ese conjunto numérico será una suma
(k-k)2 + (k-k)2 + ... +
(k-k)2 de n sumandos, dividida luego por
n. Como el numerador es cero, el resultado será también cero sea
cual sea el denominador n. Esto significa que la varianza es
exactamente cero si todos los datos son el mismo número. Por todo lo
dicho, una definición sencilla y precisa de varianza para un diccionario
general podría ser algo así como lo siguiente: «media aritmética de las
diferencias al cuadrado de cada valor de un conjunto de números respecto
de la media aritmética de todos ellos». Y si se quisiera dar una noción
más intuitiva se podría añadir que la varianza expresa la variabilidad de
los datos de un conjunto numérico, o el grado en que se desvían de su
media aritmética.
La desviación estándar (standard deviation en inglés) es la raíz
cuadrada de la varianza. Como conceptos estadísticos íntimamente
relacionados se podría decir que la varianza y la desviación son
«hermanas». La desviación estándar también se conoce como «desviación
típica» (del francés écart-type) y en América Latina se usa a veces
«desvío estándar» con el mismo sentido de raíz cuadrada de la varianza.
Ninguna de estas expresiones, hoy muy habituales en la literatura
científica en castellano, consta en la nueva edición del diccionario de la
Academia, que sí recoge en cambio conceptos matemáticos tan abstrusos y
desusados como «número perfecto» («entero y positivo igual a la suma de
sus divisores positivos, excluido él mismo») o «números amigos»
(«par de números en que cada uno de ellos es igual a la suma de las
partes alícuotas del otro»).
En otro lugar5 comenté los reparos
que, en lo que respecta a terminología estadística, pueden hacerse a la
nueva edición del Diccionario de uso del español, el diccionario
cuya primera edición corrió a cargo de María Moliner. Incluso para un buen
lexicógrafo o un equipo de lexicógrafos y lingüistas expertos no es tarea
fácil elaborar un diccionario general que dé buenas definiciones, recoja
los términos importantes que se van convirtiendo en patrimonio común de
los hablantes cultos y excluya los extranjerismos innecesarios, los
tecnicismos especializados y los arcaísmos en desuso. Si la tarea corre a
cargo de una institución mastodóntica, que lleva consigo pesadas cargas,
será mucho más fácil que no se llegue a buen puerto.
José A. Tapia Granados New School Unversity Nueva
York tapiaj01@newschool.edu
«Varianza» y «variancia» en el DRAE
DRAE
1992 variancia. (De variante.) f. Estad.
Media de las desviaciones cuadráticas de una variable aleatoria,
referidas al valor medio de esta. |
DRAE
2001 variancia. (De variante). f. Mat.
varianza. varianza. f. Mat. Media de las
desviaciones cuadráticas de una variable aleatoria, referidas al
valor medio de esta. |
PUNTOYCOMA
1. |
«Varianza
o variancia», Revista Panamericana de Salud Pública / Pan
American Journal of Public Health, vol. 8, nº 5, 2000,
pp. 368-370. |
2. |
Por ejemplo, el Diccionario manual e ilustrado de
la lengua española, Madrid, Espasa-Calpe, 1989, y las ediciones
20.a (Madrid, Espasa-Calpe, 1984) y 21.a del
Diccionario de la lengua española. |
3. |
F. Navarro, Diccionario crítico de dudas
inglés-español de medicina, Madrid, McGraw-Hill, 2000. |
4. |
Real Academia Española, Diccionario de la lengua
española, 22.a edición. |
5. |
«La
estadística y el castellano: La terminología estadística en la nueva
edición del Diccionario de uso del español», Nómadas,
nº 2, 2000. |
  
|