2.3.- Parámetros de centralización: moda y mediana.

La moda (xo o mo): es el valor que más se repite en un conjunto de datos. Representa el valor dominante (el más frecuente, “lo que más se lleva”…). En su cálculo no intervienen todos los valores y tiene la ventaja de que se puede usar para valores cualitativos.

Para calcular la moda se siguen estos pasos:

Se observa la columna de la frecuencia absoluta (fi), y aquel valor de la variable cuya fi sea la mayor será la moda.
Cuando hay más de un valor con la misma frecuencia se dice que las distribución es bimodal, trimodal... y si todos los valores de la variable tuvieran la misma frecuencia absoluta, se dice que no hay moda.

En el caso de que los datos se presenten agrupados en intervalos, el mayor valor de fi se corresponde con un intervalo o clase modal (en el que estará la moda), y para calcularla se usa la siguiente fórmula:

X sub o es igual a L sub i (límite inferior del intervalo modal) más el producto de c (amplitud del intervalo) por la fracción de D sub 1 (diferencia entre la frecuencia absoluta de la clase modal y de la clase inmediatamente anterior) entre la suma de D sub 1 (diferencia entre la frecuencia absoluta de la clase modal y de la clase inmediatamente anterior) y D sub 2 (diferencia entre la frecuencia absoluta de la clase modal y de la clase siguiente).

En esta fórmula Li es el límite inferior de la clase o intervalo modal; c la amplitud del intervalo; D1 es la diferencia entre la frecuencia absoluta de la clase modal y de la clase inmediatamente anterior; y D2: es la diferencia entre la frecuencia absoluta de la clase modal y de la clase siguiente.

La mediana es un valor de la variable, tal que el número de observaciones menores o iguales que él, es igual al número de observaciones mayores o iguales que él. O dicho de otra manera, es aquel valor, que ordenados todos de menor a mayor, se encuentra en la “mitad” o en el centro de la distribución.

Debes conocer

En la siguiente animación puedes observar cómo se colocan las bolas ordenadas de menor a mayor, y cómo se destaca la bola o las dos bolas del medio para el cálculo de la mediana. Fíjate en el caso de que los datos sean pares e impares.

Al activar la animación se van colocando en fila las bolas, y se remarcan tanto en el caso de un número par de datos como de uno impar, las bolas del medio.

Es una medida única y su información complementa a la media. Es un parámetro útil para distribuciones con algún intervalo abierto o cuando hay valores muy extremos que afectan a la media.

Cuando los datos son impares hay un valor central pero cuando son pares hay dos. Fíjate en los siguientes casos, los números que están en negrita.

0, 1, 1, 3, 4, 6, 7
1, 2, 2, 2, 4, 6.

Para calcular la mediana se siguen estos pasos:

  • Se ordenan los datos de menor a mayor.
  • Para datos que no se presentan en intervalos: la mediana es el primer valor de la variable cuya frecuencia absoluta acumulada (F) es mayor de la mitad del número de datos (n/2). Se usa n/2 porque es el valor que está en la mitad.
  • Para datos que si se presentan en intervalos: se determina primero el intervalo o la clase mediana (aquel en el que F supera a n/2, y por tanto contendrá a la mediana) y después se calcula el valor en concreto, mediante la fórmula:

La mediana es igual a la suma de L sub i (límite inferior del intervalo mediano) más el producto de c (amplitud del intervalo mediano) ; y la fracción en cuyo numerador está la diferencia entre n partido por dos y f mayúscula sub i menos 1 (frecuencia absoluta acumulada de la clase anterior ) y en cuyo denominador está f sub i ( frecuencia absoluta de la clase mediana).

En esta fórmula:

Li es el límite inferior del intervalo mediano; c es la amplitud; n, el número total de datos; Fi-1 la frecuencia absoluta acumulada de la clase anterior (por eso se escribe i-1) al intervalo mediano; y fi la frecuencia absoluta de la clase mediana.