Medidas de dispersión

La variabilidad es uno de los aspectos que la estadística estudia, debido a la importancia que este concepto supone para el análisis de los elementos de una población o una muestra. Esta característica se cuantifica a través de las medidas de dispersión.

En este artículo, te explicaremos de qué se tratan las medidas de dispersión, cuál es su utilidad, qué tipos de medidas existen y cuáles son algunos de los campos profesionales en que es necesario su uso. 

¿Qué son las medidas de dispersión?

Las medidas de dispersión, o medidas de variabilidad, son unos parámetros estadísticos que representan el grado de dispersión de los elementos de un conjunto, es decir, el grado en que se alejan, o se acercan, los datos analizados respecto al promedio o media aritmética. Por lo general, a estas se les denomina desviaciones.

Los valores numéricos que proporcionan las medidas de dispersión se pueden interpretar o definir como la variación de los datos respecto a la media de los mismos, lo que indica que el conjunto es estable, u homogéneo (a un grado de dispersión menor), o no lo es (a un grado de dispersión mayor, es decir, un conjunto heterogéneo).

¿Para qué sirven las medidas de dispersión?

La utilidad de las medidas de dispersión radica, principalmente, en proporcionar información respecto a la estabilidad de los datos de un conjunto y, de esta manera, definir unos márgenes o límites de normalidad aceptables

En gran parte del análisis estadístico, específicamente en su primera etapa, se lleva a cabo una observación del conjunto estudiado, con el fin de realizar una descripción precisa del mismo, tanto a nivel general como rigurosamente. Es en las medidas de dispersión donde se encuentra dicha rigurosidad, pues permite observar el comportamiento de los elementos del conjunto

Entre otras razones por las cuales las medidas de dispersión son útiles se pueden mencionar:

  • Permiten comparar el comportamiento de dos conjuntos de datos, a pesar de que no cuenten con las mismas unidades de medida.
  • Establecen rangos de error, lo que permite tener una mayor exactitud a la hora de analizar los resultados.

Tipos de medidas de dispersión

Las medidas de dispersión se clasifican según el tipo de resultado que proporcionen, ya sea un valor entero o porcentual. Las dos clases son importantes al momento de analizar un conjunto de datos, en cuanto que proporcionan información relacionada a la variabilidad de sus elementos, o dos muestras con unidades de medidas diferentes.

Medidas de dispersión absolutas

Las medidas de dispersión absolutas son utilizadas para representar la variabilidad de los datos estadísticos de una muestra, respecto a la media aritmética o promedio. Además, permiten comparar la distribución de los elementos de dos conjuntos que cuenten con las mismas unidades de medida. Estas son:

Rango o recorrido

El rango o recorrido, algunas veces también denominado oscilación, es, matemáticamente, la diferencia entre el máximo de los valores, de una muestra o población, y el mínimo de los mismos. Es un dato que representa la variación general que presenta un conjunto, por lo que entre mayor sea este, mayor dispersión existe. 

Fórmula

La fórmula del rango o recorrido es:

Formula del rango o recorrido

Donde: 

  • xmax: es el máximo de los valores de la muestra.
  • xmin: es el mínimo de los datos de la muestra. 
Ejemplo

El rango o recorrido puede ser aplicado en una gran cantidad de escenarios, tal como el análisis de estaturas de un grupo de estudiantes. Así, si se consideran los siguientes datos estadísticos:

1,731,721,891,901,701,781,811,82

Se puede observar que la mayor de las estaturas es de 1,90 metros, mientras que la menor es de 1,70 metros. Cabe destacar que, a menudo, es recomendable ordenar los datos de menor a mayor, con el fin de agilizar el proceso analítico.

Ahora, se calcula el rango:

R = 1,90 – 1,70 = 0,2.

En este caso, el rango no es demasiado grande, sin embargo, es necesario aplicar otras medidas de dispersión para un análisis más preciso del conjunto de datos. Esto se debe a que el rango o recorrido solo brinda información acerca de los extremos del intervalo en el que se encuentran los demás valores, obviando cambios importantes entre estos.

Desviación media

La desviación media, denominada también desviación media absoluta, es el promedio de las desviaciones absolutas de un conjunto de datos. Se le puede definir, asimismo, como una aproximación y un dato más representativo de la dispersión de los datos de una muestra o población. 

Fórmula

Para calcular la desviación media se debe aplicar la siguiente fórmula:

Formula desviación media absoluta

Donde:

  • xi: es cada uno de los datos de la muestra.
  • x̅: es la media aritmética del conjunto de datos.
  • n: es el número de datos de la muestra. 

Estos elementos se tienen en cuenta para el resto de las medidas de dispersión, por lo que no existe una variación importante entre las distintas fórmulas que se deben aplicar e, incluso, algunas son bastante similares.

Ejemplo

En física, la desviación media es una de las medidas de dispersión más utilizadas, y se emplea en una gran cantidad de ramas de esta ciencia. Un ejemplo típico es el siguiente: en un experimento escolar, se les solicita a los estudiantes conocer la desviación media de los tiempos obtenidos al dejar caer una esfera desde cierta altura. Observemos los siguientes datos:

8,909,009,108,859,019,028,878,82

Primero, se deben calcular cada uno de los elementos que se deben tener en cuenta en la fórmula. Así:

  • x̅: 8,95 segundos.
  • n: 8.

Ahora, se realizan los respectivos cálculos:

  • |8,90 – 8,95| + |9,00 – 8,95| + |9,10 – 8,95| + |8,85 – 8,95| + |9,01 – 8,95| + |9,02 – 8,95| + |8,87 – 8,95| + |8,82 – 8,95| = 0,69.
  • 0,69 / 8 = 0,09.

Por lo tanto, la desviación media de los tiempos obtenidos es de 0,09.

Desviación estándar o típica

La desviación estándar o típica es aquella que representa el nivel de dispersión de un conjunto de datos respecto a la media o promedio de los mismos. Es la medida de dispersión más utilizada en los diferentes campos científicos, debido a que se pueden realizar comparaciones de la variabilidad absoluta entre dos o más muestras.

En general, se define como la raíz cuadrada de las desviaciones absolutas respecto a la media. Se representa por la letra s o por la letra griega sigma minúscula σ.

Fórmula

Al momento de calcular la desviación estándar o típica, se debe aplicar la fórmula a continuación:

Formula desviación estándar o típica
Ejemplo

Teniendo en cuenta el ejemplo anterior, se debe realizar la misma suma, excepto que, en este caso, cada uno de los términos se debe elevar al cuadrado. Por lo tanto:

|8,90 – 8,95|2 + |9,00 – 8,95|2 + |9,10 – 8,95|2 + |8,85 – 8,95|2 + |9,01 – 8,95|2 + |9,02 – 8,95|2 + |8,87 – 8,95|2 + |8,82 – 8,95|2 = 0,07.

Ahora, se divide el resultado entre el número de datos:

0,07 / 8 = 0,009.

Y, por último, se calcula la raíz cuadrada, la cual es igual a 0,095, aproximadamente.

Varianza

La varianza es similar a la desviación estándar, sin embargo, en este caso, el resultado se da en términos cuadrados. Se define como la media aritmética de la sumatoria de las desviaciones absolutas elevadas al cuadrado. 

Fórmula

Por último, la fórmula de la varianza es:

Formula de la varianza

Como se puede observar, la fórmula de la varianza es similar a la desviación estándar, y se puede observar que esta última medida es semejante al despeje de la primera.

Ejemplo

Si se tiene en cuenta el ejemplo expuesto para demostrar la aplicación de la desviación estándar, se puede observar que la varianza ya ha sido calculada en el segundo paso, la cual equivale a 0,009. 

Por esta razón, al calcular la desviación típica de un conjunto de datos, también se puede determinar la varianza del mismo, pues la fórmula de la primera medida incluye la de la segunda.

Medidas de dispersión relativas

Las medidas de dispersión relativas son utilizadas, principalmente, para comparar dos o más muestras o poblaciones cuyas unidades de medidas no sean iguales, lo que evita que se puedan realizar comparaciones exactas. Por lo tanto, representan el porcentaje de variabilidad de dichos conjuntos

Coeficiente de variación

El coeficiente de variación es el porcentaje de dispersión que presentan los elementos de un conjunto. Es utilizado al momento de comparar dos muestras cuyos datos no cuentan con las mismas unidades de medida.

Fórmula

Para calcular el coeficiente de variación se aplica:

Formula coeficiente de variación
Ejemplo

Un grupo de investigadores ha recopilado las temperaturas alcanzadas durante un mes, en algunos desiertos de Europa y de Estados Unidos. Sin embargo, en el Viejo Continente se utilizan grados Celsius, mientras que en el país norteamericano se utilizan grados Fahrenheit, por lo que no es posible comparar la variabilidad de las temperaturas. Por lo tanto, es necesario emplear el coeficiente de variación. 

Así, se tiene en cuenta lo siguiente:

  • Desviación estándar y media aritmética de la temperatura en Estados Unidos: 11,53 y 80,78 °F.
  • Desviación estándar y media aritmética de la temperatura en Europa: 5,45 y 33,23 °C.

A partir de lo anterior, se calcula para cada uno su coeficiente de variación:

  • Coeficiente de variación (Estados Unidos): 11,53 / 80,78 = 14%.
  • Coeficiente de variación (Europa): 5,45 / 33,23 = 16%.

Como se puede observar, es posible determinar que en los desiertos de Europa existe una mayor dispersión de las temperaturas respecto al promedio que en los de Estados Unidos.

Campos de aplicación de las medidas de dispersión

En general, la estadística es aplicada en un amplio rango de campos e, incluso, es la base para el desarrollo de muchos de ellos. Las medidas de dispersión, por su parte, son indispensables para muchas de estas áreas y, en especial, en aquellas donde existen una gran cantidad de datos cuya variabilidad puede influir en los resultados de sus actividades.

Algunas de estas son:

  • Metrología: el desarrollo de instrumentos de medición que proporcionen información precisa es una de las principales tareas de la metrología, por lo que es necesario conocer la desviación de los resultados obtenidos a partir de una misma herramienta, con el fin de obtener la mejor. 
  • Física: en los laboratorios de física, es usual utilizar medidas de dispersión para cuantificar la desviación de los resultados de un experimento, y así, determinar las características físicas de un fenómeno o acción de manera exacta. 
  • Biología: el análisis de los seres vivos y de los fenómenos que los rodean, supone un verdadero desafío para los científicos, debido a que las experiencias individuales y colectivas pueden diferir totalmente de otras, por lo que es necesario aplicar medidas de dispersión para conocer en cuánto un grupo poblacional, especie u otro orden, difiere de otro y establecer un orden natural.

    Esto también aplica para otras ciencias relacionadas como la química, la medicina, la bioquímica, la biología molecular, entre otras. 
  • Economía: las medidas de dispersión son ampliamente utilizadas en economía y un breve ejemplo de ello es en la proyección de ventas de una empresa, con el fin de establecer rutas específicas para alcanzar los objetivos económicos de la misma y reducir la dispersión o volatilidad de los ingresos y egresos

Importancia de la interpretación adecuada de la dispersión en el contexto específico de cada campo

Una correcta interpretación de los resultados de cualquier cálculo, que se realice en una investigación, es fundamental para conocer, con exactitud, lo que se está estudiando y emprender las acciones adecuadas para cumplir con los objetivos de cada proyecto. En cuanto a las medidas de dispersión, los resultados que pueden proporcionar para una u otra área, requieren de un análisis particular para cada caso.

Por ejemplo, en aquellas áreas donde se analizan objetos de gran magnitud, una desviación pequeña puede no sugerir una variabilidad importante. Sin embargo, en aquellas ciencias donde se estudian objetos microscópicos, la misma desviación puede suponer una alta dispersión de los datos. 

De igual manera, cada ámbito posee unos límites de error definidos, ya sea a través de la experiencia u otro criterio, por lo que en una u otra ciencia, una misma desviación puede suponer un error insignificante o una grave error que debe ser solucionado instantáneamente.

Conclusiones

Las medidas de dispersión, en conjunto con las medidas de tendencia central y la distribución de frecuencias, es una de las partes más importantes de la estadística descriptiva, y es la que, en realidad, proporciona información capaz de representar el comportamiento de un conjunto de datos.

A partir de la información que se puede obtener a través de estas medidas, se puede determinar la estabilidad de un conjunto de datos y, en consecuencia, conocer el grado de seguridad que se puede tener sobre el mismo, al momento de establecer otros valores y parámetros. 

A continuación, te dejamos un breve listado de algunos de artículos que te podrán ayudar a complementar la información de este contenido:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *