2.10.- Medidas de dispersión y coeficiente de variación.

Estos parámetros son los que informan de cómo se concentran o cómo se separan los datos de los valores centrales o parámetros de centralización.

Estos parámetros que expresan la mayor o menor concentración de los datos con respecto a las medidas de centralización, son medidas fundamentales para caracterizar una serie de datos, Imagínate, que has hecho dos exámenes y has tenido una media de 5. Ha podido ser un 10 y un 0 o ha podido ser un 6 y un 4, ¿sería lo mismo?

Reflexiona

Las medidas de centralización siempre han de ir acompañadas de las medidas de dispersión. Decir solo la media aritmética de una distribución es decir “muy poco”.
Persona trabajando delante de un ordenador.

Hay bastantes parámetros pero sólo vamos a estudiar el recorrido o rango y la desviación típica que se usan bastante. La varianza sólo la presentamos como un paso intermedio para la obtención de la desviación típica, y vamos a intentar usar solo una de las distintas fórmulas de cálculo.

Amplitud, rango o recorrido (R): Es la diferencia entre el mayor y el menor valor que toma la variable estadística (observaciones extremas). Sirve para valorar entre que valores se mueve la distribución.

Varianza (S2, б2 o sigma2): Es un parámetro que mide la distancia existente entre los valores de la serie y la media. Es la media aritmética de los cuadrados de las desviaciones respecto a la media. La varianza siempre será mayor que cero. Cuanto más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media, y por el contrario, mientras mayor sea la varianza, más dispersos están.

La varianza, igual a s al cuadrado, es igual al cociente del sumatorio del producto de f sub i por el cuadrado de x sub i , dividido por el sumatorio de f sub i, todo ello menos la media aritmética al cuadrado.

Desviación típica o estándar (б; S o sigma): Es la raíz cuadrada positiva de la varianza. Es una medida que expresa, en las mismas unidades de la variable (puntos, porcentajes, kilos, metros...) lo que se separan los datos de los valores centrales. Al igual que en el caso de la varianza, cuando más pequeña es más próximos están los datos al valor de la media. Para su cálculo vamos a utilizar la fórmula más sencilla.

S minúscula igual a la raíz cuadrada de s2 o de la varianza.

El coeficiente de variación (CV), que se define como la relación existente entre la desviación típica y la media. Expresa la variabilidad de los datos de una distribución y se dice que cuanto más pequeño sea, más útil será la distribución para trabajar con ella, e incluso cuando es mayor de un 33%, se considera que la distribución es poco homogénea, poco uniforme, muy dispersa y poco útil.

CV es igual al cociente de s (desviación típica) entre x ̅  (media aritmética), multiplicado por un coeficiente.

Autoevaluación

Pregunta

Señala de estas dos afirmaciones la que consideras que es más cierta.

Respuestas

Las medidas de centralización son mucho más útiles que las medidas de dispersión.

Las medidas de dispersión y las medidas de centralización se deben utilizar conjuntamente.

Retroalimentación