Gráfico de dispersión

Gráfico de Dispersión

El gráfico de dispersión es quizás una de las herramientas de análisis y priorización de problemas más conocida entre los estudiantes de educación estadística. 

Si no has escuchado sobre él o tienes una vaga idea de su existencia, estás ante la oportunidad de profundizar sobre este tema. 

Desde este momento, iniciamos juntos un recorrido para comprender qué es un gráfico de dispersión y cómo se hace; además, te dejaremos un ejemplo para poner en práctica lo aprendido.

¿Qué es un gráfico de dispersión?

Un gráfico de dispersión, también conocido como diagrama de dispersión, es un gráfico de correlación donde se representan dos variables que se obtienen a partir de datos organizados en columnas y filas. 

El conjunto de datos es analizado en relación con ambas variables. De esta manera, podemos determinar qué tanto son dependientes entre sí o qué tan apartada está una en relación con la otra. 

Para representar las variables del gráfico de dispersión, visualizamos un punto por cada una dentro de un plano cartesiano. 

Recordemos que un plano cartesiano hace referencia a dos rectas numéricas perpendiculares, es decir, cuando una línea recta corta a la otra, formando un ángulo recto de 90 grados. El punto en que se cortan se llama punto cero. Cada línea es un eje y se denominan de acuerdo a su posición. La línea horizontal es X y la vertical, Y.

Luego de visualizar los puntos sobre la gráfica de dispersión de datos, estamos ante la posibilidad de definir el tipo de correlación que hay entre las variables, de acuerdo a la distancia existente entre ellas. Cuando estamos ante lo que es un gráfico de dispersión, la X representa la variable independiente y la Y, la variable dependiente.

¿Cuándo utilizar una gráfica de dispersión?

Una gráfica de dispersión se usa para analizar la correlación y distribución de datos, permitiendo reconocer a tiempo en qué momento estamos ante valores atípicos. 

De igual manera, permite hallar la relación entre dos variables y así reconocer si una variable afecta o no a la otra. Por lo tanto, muestra la relación entre dos variables sobre un campo visual de datos compactos. Entre más datos se incluyen, mejor será la comparación a realizar.

Sin embargo, no se recomienda usar el gráfico de dispersión cuando nos enfrentamos al deseo de analizar rápidamente la información y de manera detallada, dado que los gráficos de tipo XY de dispersión no arrojan datos precisos. Cuando lo que se busca es claridad, es necesario acudir a otro tipo de métodos.

Ventajas y desventajas del gráfico de dispersión

La gráfica de dispersión, si bien cuenta con varias ventajas, también trae consigo algunas desventajas. Ambas listas, las traemos a continuación:

Ventajas

  • Permite ver la relación entre dos variables
  • Si queremos analizar un patrón no lineal, este es el mejor método
  • Se puede determinar el valor máximo y el valor mínimo de un rango de flujo
  • Es fácil de interpretar
  • Sencillo de trazar

Desventajas

  • Se requiere de varios puntos de estudio
  • La información que obtenemos a través de la gráfica es solo una aproximación
  • Es posible encontrar errores en algunas zonas de las gráficas
  • En ocasiones, la curva de tendencias es difícil de encontrar

Tipos de gráficos de dispersión

Existen varios tipos de gráficos de dispersión, los cuales se usan en atención de cada manera en que busquemos de mostrar y comparar valores relacionados con números, datos científicos o información estadística. 

La dispersión en sí son puntos; sin embargo, es preciso tener en cuenta que el tipo de gráfico hace referencia a la forma de unirlos y marcarlos.

Dispersión 

Es la gráfica dispersión realizada sin filtros adicionales, donde se observa solamente los puntos sin una conexión realizada por líneas.

Dispersión con líneas suavizadas y marcadores

En este tipo de gráfico de dispersión, podemos ver un ejemplo de una línea suave, dibujando una curva que une los puntos del gráfico. 

Dispersión con líneas suavizadas

La línea suavizada que une los puntos dentro del gráfico; puede ser sencilla, sin marcadores. Esta es recomendada cuando hay muchos puntos de datos. 

Pero también pueden ir con marcadores para resaltar los puntos de datos del gráfico de dispersión.

Dispersión con líneas rectas y marcadores

Los puntos dentro de un gráfico de dispersión se pueden unir con líneas rectas, las cuales se podrán mostrar o no marcadas.

Dispersión con líneas rectas

Las líneas rectas muestran una conexión entre los puntos, sin acudir a las curvaturas. Son líneas que al unirse nos muestra una gráfica con un punto marcando cada esquina.

Burbuja

El gráfico de burbujas es la recomendación general para analizar tres variables, en lugar de dos, porque además de graficar en X y Y, gráfica con otra variable que surge de un tercer valor. 

Burbuja 3D

Los conjuntos de este tipo de gráfico de dispersión, se representan en 2D o en 3D. Ambos se usan para comparar conjuntos de tres valores, y lo que hace el tercer valor es especificar el tamaño del marcador de la burbuja. La burbuja 3D se grafica sin usar un eje de profundidad.

Elementos de un gráfico de dispersión

Todos los tipos de gráficos contienen unos elementos que debemos identificar para apoyarnos y mejorar la forma en que mostramos la información, y no es la excepción cuando buscamos cómo hacer un gráfico de dispersión en excel.

  • Ejes. Los ejes hacen referencia a la manera en que son trazados los datos. Estos se trazan en el eje X, también conocido como eje horizontal; o el eje Y, conocido, de igual manera, como eje vertical.
  • Títulos del eje. Cada eje puede llevar el título que consideres pertinente, de acuerdo a la información que requieres graficar.
  • Título del gráfico. El título del gráfico permite especificar la información que se mostrará, relacionada con los puntos de dispersión. Aparecerá en la parte inferior o superior del gráfico.
  • Etiquetas de datos. Las etiquetas de datos ayudan a que el gráfico sea fácil de entender porque hacen énfasis en datos o puntos de datos individuales. Estos datos se vinculan a valores de la hoja de Excel y se actualizan de manera automática cuando los valores cambian.
  • Barras de error. Se usan para marcar un error que se estima en una medida. En otras palabras, indica la incertidumbre de un valor.
  • Líneas de cuadrícula. Las líneas de cuadrícula son las líneas que se usan para separar o distinguir las celdas de una hoja de cálculo. Estas vienen con un color predeterminado, el cual puede ser modificado al igual que el grueso de la línea.
  • Leyenda. Se puede decir que la leyenda es una caja que contiene las indicaciones correspondientes necesarias para la identificación de cada una de las series de un gráfico.
  • Línea de tendencia. Esta es una herramienta de análisis que muestra la tendencia de los puntos dentro de una gráfica, y que permite visualizar los datos que van más allá de la información real, puesto que posibilita la visión de posibles valores futuros.

Cómo hacer una gráfica de dispersión

Para saber cómo hacer una gráfica de dispersión en excel, pongamos en ejecución los siguientes pasos:

  1. Copiar los datos que irán en el gráfico de dispersión

Para ello, seleccionamos dos columnas. La primera será el eje X y la segunda el eje Y. Una al lado de la otra de manera inmediata.

  1. Selección de los datos

Luego de ingresar la información en las celdas, seleccionamos los datos que deseamos trazar en la gráfica de dispersión.

  1. En este paso, damos clic en la pestaña “insertar” de nuestro menú de Excel. Luego buscamos la opción de gráficos de dispersión y elegimos.

Los datos seleccionados de ambas columnas se verán ahora representados en una gráfica de dispersión.

Si queremos ahondar en el diseño de nuestra gráfica de dispersión podemos dar clic sobre el gráfico para ver las opciones de diseño y formato. También puedes experimentar cambiando el título del gráfico, el tamaño de su fuente, color y tipo.

En el siguiente apartado, veremos un ejemplo de los pasos aquí mostrados, porque comprender las gráficas de dispersión se facilita con ejemplos.

Ejemplo

Una mejor manera de entender el tema es con ejemplos de gráficas de dispersión. Veamos lo siguiente, donde buscamos comprender cómo influye la temperatura en la venta de helados. Para ello:

  1. En cada eje se relacionan los datos correspondientes. En el eje X irá la temperatura y en el eje Y el total de las ventas en el día.
Tabla de datos para grafico de dispersión
  1. Seleccionar los datos.

  2. Con nuestra tabla seleccionada damos clic en insertar y en todos los gráficos señalamos el de dispersión.

  3. Finalmente, tendremos el gráfico de dispersión en Excel donde podremos analizar la dispersión, notando que a medida que crece la temperatura hay una relación con el incremento de la venta de helados en el día.
Gráfico de dispersión ejemplo

Ahora, ya sabes cómo hacer una gráfica de dispersión en Excel. Puedes usarla con diferentes datos donde quieras hallar su correlación para analizarlos desde una perspectiva general.

¿Necesitas ayuda?

Esperamos que este contenido sobre el gráfico de dispersión haya sido de gran utilidad para ti. Si necesitas ayuda, escríbenos aquí.