Saltar la navegación

3.9.- Medidas de dispersión.

Así como las medidas de posición central nos permiten identificar el punto central de los datos, las medidas de dispersión nos permiten reconocer cuánto se dispersan los datos alrededor del punto central. Es decir, nos indican cuánto se desvían los valores alrededor de su media. Este tipo de medidas son parámetros informativos que nos permiten conocer cómo los valores de los datos se reparten a través del eje X, mediante un valor numérico que representa el promedio de dispersión de los datos. Las medidas de dispersión más importantes y las más utilizadas son la varianza y la desviación estándar (o típica).

La varianza (S2) nos permite identificar la diferencia media que hay entre cada uno de los valores respecto a su punto central (X). Esta diferencia media es calculada, elevando cada una de las diferencias al cuadrado (con el fin de eliminar los signos negativos), y calculando su media aritmética; es decir, sumando todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el número de observaciones que se tengan.S mayúscula al cuadrado es igual al sumatorio del cuadrado de la diferencia entre x minúscula sub i menos la media de X mayúscula dividido todo entre N mayúscula.

Donde representa la media de todos los valores y N representa el número de observaciones o el tamaño de la muestra.

Recomendación

En ocasiones podemos encontrarnos que el denominador de la fórmula de la varianza es (N-1) en lugar de N, es decir, que se le resta uno al tamaño de la muestra; esto se hace con el objetivo de aplicar una pequeña medida de corrección a la varianza, intentado hacerla más representativa para la población.

Con frecuencia Formula Media aritmética 2. no es un número entero, entonces las desviaciones suelen ser números decimales. Las operaciones de elevar al cuadrado cada una de las desviacionesFormula x minúscula sub i minúscula menos la media de X. y multiplicarlas por las frecuencias respectivas pueden resultar sumamente laboriosas, por ello se suele usar otra fórmula en la que se evitan estos cálculos.
S mayúscula al cuadrado es igual al cociente del sumatorio de x minúscula sub i al cuadrado por n minúscula sub i entre N mayúscula dividido todo el cociente entre la media de x mayúscula al cuadrado.

La desviación estándar o típica (S) se obtiene de la raíz cuadrada positiva de la varianza. Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación estándar nos da como resultado un valor numérico que representa la media de diferencia que hay entre los datos y la media. De su cálculo resulta por tanto un número más manejable, siendo este un parámetro más usado que la varianza.
S mayúscula es igual a la raíz cuadrada de S mayúscula al cuadrado.

Ejercicio resuelto

Dados los valores 0, 1, 1, 8: calcular la varianza y la desviación estándar.