miércoles, 6 de mayo de 2009

Medias para ir a la moda

No, no me he vuelto loco. No vamos a hablar de la moda en el sentido fashion ni de las medias que aparecen en la imagen. Hoy vamos a hablar un poco de estadística, pero de la facilona.

Todo comienza con una paradoja (en el sentido que atenta contra nuestra primera intuición) que leí en el libro Ajá! Paradojas de Martin Gardner. Os la voy a comentar.

Un codiciado empleado llega a una empresa que lo quiere contratar, pero antes quiere saber algo más de la empresa y de los sueldos. El empleado pregunta acerca del sueldo medio de la empresa, ante lo que el Director le responde que éste asciende a la nada despreciable cifra de 2.500€ mensuales. El empleado se queda perplejo ante tal afirmación y sin dudarlo firma el contrato, sin saber exactamente lo que iba a cobrar. Cual es su sorpresa cuando, al cabo del primer mes, en su cuenta corriente le ingresan sólo 1.000€.

Muy molesto con el Director, va a verlo a su despacho y le acusa de haberle mentido en la entrevista de trabajo sobre el sueldo medio, ante lo cual el director le dice:

- Nada más lejos de la realidad. En esta empresa trabajamos 30 personas en total. 25 de ellas sois empleados, que cobráis cada uno 1.000€ mensuales; mientras que los otros 5 somos directivos y cobramos mensualmente 10.000€. Si hace usted la cuenta, el sueldo medio de la empresa es de 2.500€ mensuales.

¿Cuál ha sido el problema de nuestro empleado? Pues que preguntó por la media y no por la moda. ¿Pero qué es esta jerga? vamos a explicarlo.

Supongamos que tenemos una tabla (o lista finita) de datos numéricos. La media (o media aritmética) es un parámetro estadístico que se calcula sumando todos los valores de la tabla y dividiendo entre el número total de datos obtenidos. En el ejemplo de la empresa anterior, nuestra tabla tendría 30 entradas, 25 de las cuales serían iguales a 1.000 y las 5 restantes serían 10.000. Por tanto la media de esta tabla de valores (el sueldo medio) resulta ser
Sueldo Medio=(25*1.000+5*10.000)/30 = 75.000/30=2.500
Por tanto el director de la empresa no mintió.

Por otro lado, la moda es otro parámetro estadístico que se calcula observando cuál es el valor que más veces se repite en nuestra tabla de datos. En el caso de del ejemplo anterior, la moda sería, evidentemente, 1.000.

¿Dónde está el problema? Pues en que estamos demasiado acostumbrados a entender que la media es un parámetro que representa, por sí mismo, a la tabla completa, y esto no siempre es así. De hecho, según el DRAE, en su 34ª acepción, la media es un
número que resulta al efectuar una serie determinada de operaciones con un conjunto de números y que, en determinadas condiciones, puede representar por sí solo a todo el conjunto.
(negritas mías). Es evidente que la media, por sí sola, no siempre nos da una información veraz sobre una tabla de datos. Es por ello que, acompañando a la media está la desviación típica, que es un parámetro que mide cómo de alejados están los valores de la tabla de la media. Mientras menor sea este nuevo parámetro, mejor. La desviación típica se calcula sumando las diferencias al cuadrado de cada valor de la tabla respecto de la media y dividiendo entre el número total de entradas y a dicho resultado le hacemos la raíz cuadrada. En nuestro caso
Desviación Típica=[(25*(1.000-2.500)2+5*(10.000-2.500)2)/30]1/2 = [337.500.000/30]1/2 =√11.250.000 = 3.354'1
es decir, nuestra desviación típica es bastante mayor que la media (aproximadamente 1'5 veces mayor). Esto nos indica que los datos están muy dispersos y que la media no es una buena aproximación del comportamiento típico de nuestros valores.

Como conclusión de todo esto, deciros que no siempre la media es una buena medida de lo típico. Para calibrar esto, necesitamos, además, otros parámetros como es la desviación típica o la moda.

Como añadido a todo lo dicho, deciros que en Estadística se utiliza la Media Aritmética, pero que para tablas de valores existen otros tipos de medias como son la media geométrica por ejemplo. Ésta última, que siempre será menor que la aritmética, se calcula multiplicando todos los valores de la tabla y haciendo después la raíz N-ésima, siendo N el número total de datos.

Así que ya sabéis. Ahora que proliferan datos estadísticos en telediarios, periódicos y medios digitales, tened un poco de precaución si os hablan de la media y pensad que no siempre es lo típico. A veces la moda nos da una información más cercana a la realidad. Ya lo dijo el gran Bernard Shaw:
La estadística es una ciencia que demuestra que si mi vecino tiene dos coches y yo ninguno, los dos tenemos uno.


Tito Eliatron Dixit.

ACTUALIZACIÓN: El artículo ha sido meneado por raskalakabra. Si quieres puedes votarlo desde aquí.


Fotografía obra de zurZa y extraída de su Flickr

2 comentarios:

  1. En la mayoría de casos, ni la media, ni la varianza, ni la moda, son fiables, lo curioso es que la gente se fía y luego, pues vienen crisis que nadie se espera y esas cosas.

    Si el empleado hubiese pedido la moda, de nuevo se puede equivocar de plano: Si los empleados cobran el 50% de su sueldo por antigüedad, y son todos antiguos, ni la moda, ni la media, ni la varianza ni todo eso junto, ni siquiera la distribución completa nos diría NADA de nada.

    Es una rama peligrosa de las matemáticas, dan falsas esperanzas a muchos, y se suele pensar que "los números no se equivocan"... ya lo creo que si, siempre que le des un significado real a un número, te estas colando, y no me refiero a los decimales!

    ResponderEliminar
  2. "La inmensa mayoría de los hombres tiene un número de piernas superior a la media"

    La frase es verdadera, la paradoja se aclara cuando aclaramos lo que es la media y la moda (y en particular, para el caso de variables discretas).

    ResponderEliminar

Si no comentas, Gauss se comerá una integral.
Y, por favor, respeta a todos con tus opiniones.