Gráfico de dispersión
El gráfico de dispersión es quizás una de las herramientas de análisis y priorización de problemas más conocida entre los estudiantes de educación estadística.
Si no has escuchado sobre él o tienes una vaga idea de su existencia, estás ante la oportunidad de profundizar sobre este tema.
Desde este momento, iniciamos juntos un recorrido para comprender qué es un gráfico de dispersión y cómo se hace; además, te dejaremos un ejemplo para poner en práctica lo aprendido.
¿Qué es un gráfico de dispersión?
Un gráfico de dispersión, también conocido como diagrama de dispersión, es un gráfico de correlación donde se representan dos variables que se obtienen a partir de datos organizados en columnas y filas.
El conjunto de datos es analizado en relación con ambas variables. De esta manera, podemos determinar qué tanto son dependientes entre sí o qué tan apartada está una en relación con la otra.
Para representar las variables del gráfico de dispersión, visualizamos un punto por cada una dentro de un plano cartesiano.
Recordemos que un plano cartesiano hace referencia a dos rectas numéricas perpendiculares, es decir, cuando una línea recta corta a la otra, formando un ángulo recto de 90 grados. El punto en que se cortan se llama punto cero. Cada línea es un eje y se denominan de acuerdo a su posición. La línea horizontal es X y la vertical, Y.
Luego de visualizar los puntos sobre la gráfica de dispersión de datos, estamos ante la posibilidad de definir el tipo de correlación que hay entre las variables, de acuerdo a la distancia existente entre ellas. Cuando estamos ante lo que es un gráfico de dispersión, la X representa la variable independiente y la Y, la variable dependiente.
¿Cuándo utilizar una gráfica de dispersión?
Una gráfica de dispersión se usa para analizar la correlación y distribución de datos, permitiendo reconocer a tiempo en qué momento estamos ante valores atípicos.
De igual manera, permite hallar la relación entre dos variables y así reconocer si una variable afecta o no a la otra. Por lo tanto, muestra la relación entre dos variables sobre un campo visual de datos compactos. Entre más datos se incluyen, mejor será la comparación a realizar.
Sin embargo, no se recomienda usar el gráfico de dispersión cuando nos enfrentamos al deseo de analizar rápidamente la información y de manera detallada, dado que los gráficos de tipo XY de dispersión no arrojan datos precisos. Cuando lo que se busca es claridad, es necesario acudir a otro tipo de métodos.
Ventajas y desventajas del gráfico de dispersión
La gráfica de dispersión, si bien cuenta con varias ventajas, también trae consigo algunas desventajas. Ambas listas, las traemos a continuación:
Ventajas
- Permite ver la relación entre dos variables
- Si queremos analizar un patrón no lineal, este es el mejor método
- Se puede determinar el valor máximo y el valor mínimo de un rango de flujo
- Es fácil de interpretar
- Sencillo de trazar
Desventajas
- Se requiere de varios puntos de estudio
- La información que obtenemos a través de la gráfica es solo una aproximación
- Es posible encontrar errores en algunas zonas de las gráficas
- En ocasiones, la curva de tendencias es difícil de encontrar
Tipos de gráficos de dispersión
Existen varios tipos de gráficos de dispersión, los cuales se usan en atención de cada manera en que busquemos de mostrar y comparar valores relacionados con números, datos científicos o información estadística.
La dispersión en sí son puntos; sin embargo, es preciso tener en cuenta que el tipo de gráfico hace referencia a la forma de unirlos y marcarlos.
Dispersión
Es la gráfica dispersión realizada sin filtros adicionales, donde se observa solamente los puntos sin una conexión realizada por líneas.
Dispersión con líneas suavizadas y marcadores
En este tipo de gráfico de dispersión, podemos ver un ejemplo de una línea suave, dibujando una curva que une los puntos del gráfico.
Dispersión con líneas suavizadas
La línea suavizada que une los puntos dentro del gráfico; puede ser sencilla, sin marcadores. Esta es recomendada cuando hay muchos puntos de datos.
Pero también pueden ir con marcadores para resaltar los puntos de datos del gráfico de dispersión.
Dispersión con líneas rectas y marcadores
Los puntos dentro de un gráfico de dispersión se pueden unir con líneas rectas, las cuales se podrán mostrar o no marcadas.
Dispersión con líneas rectas
Las líneas rectas muestran una conexión entre los puntos, sin acudir a las curvaturas. Son líneas que al unirse nos muestra una gráfica con un punto marcando cada esquina.
Burbuja
El gráfico de burbujas es la recomendación general para analizar tres variables, en lugar de dos, porque además de graficar en X y Y, gráfica con otra variable que surge de un tercer valor.
Burbuja 3D
Los conjuntos de este tipo de gráfico de dispersión, se representan en 2D o en 3D. Ambos se usan para comparar conjuntos de tres valores, y lo que hace el tercer valor es especificar el tamaño del marcador de la burbuja. La burbuja 3D se grafica sin usar un eje de profundidad.
Elementos de un gráfico de dispersión
Todos los tipos de gráficos contienen unos elementos que debemos identificar para apoyarnos y mejorar la forma en que mostramos la información, y no es la excepción cuando buscamos cómo hacer un gráfico de dispersión en excel.
- Ejes. Los ejes hacen referencia a la manera en que son trazados los datos. Estos se trazan en el eje X, también conocido como eje horizontal; o el eje Y, conocido, de igual manera, como eje vertical.
- Títulos del eje. Cada eje puede llevar el título que consideres pertinente, de acuerdo a la información que requieres graficar.
- Título del gráfico. El título del gráfico permite especificar la información que se mostrará, relacionada con los puntos de dispersión. Aparecerá en la parte inferior o superior del gráfico.
- Etiquetas de datos. Las etiquetas de datos ayudan a que el gráfico sea fácil de entender porque hacen énfasis en datos o puntos de datos individuales. Estos datos se vinculan a valores de la hoja de Excel y se actualizan de manera automática cuando los valores cambian.
- Barras de error. Se usan para marcar un error que se estima en una medida. En otras palabras, indica la incertidumbre de un valor.
- Líneas de cuadrícula. Las líneas de cuadrícula son las líneas que se usan para separar o distinguir las celdas de una hoja de cálculo. Estas vienen con un color predeterminado, el cual puede ser modificado al igual que el grueso de la línea.
- Leyenda. Se puede decir que la leyenda es una caja que contiene las indicaciones correspondientes necesarias para la identificación de cada una de las series de un gráfico.
- Línea de tendencia. Esta es una herramienta de análisis que muestra la tendencia de los puntos dentro de una gráfica, y que permite visualizar los datos que van más allá de la información real, puesto que posibilita la visión de posibles valores futuros.
Cómo hacer una gráfica de dispersión
Para saber cómo hacer una gráfica de dispersión en excel, pongamos en ejecución los siguientes pasos:
- Copiar los datos que irán en el gráfico de dispersión
Para ello, seleccionamos dos columnas. La primera será el eje X y la segunda el eje Y. Una al lado de la otra de manera inmediata.
- Selección de los datos
Luego de ingresar la información en las celdas, seleccionamos los datos que deseamos trazar en la gráfica de dispersión.
- En este paso, damos clic en la pestaña “insertar” de nuestro menú de Excel. Luego buscamos la opción de gráficos de dispersión y elegimos.
Los datos seleccionados de ambas columnas se verán ahora representados en una gráfica de dispersión.
Si queremos ahondar en el diseño de nuestra gráfica de dispersión podemos dar clic sobre el gráfico para ver las opciones de diseño y formato. También puedes experimentar cambiando el título del gráfico, el tamaño de su fuente, color y tipo.
En el siguiente apartado, veremos un ejemplo de los pasos aquí mostrados, porque comprender las gráficas de dispersión se facilita con ejemplos.
Ejemplo
Una mejor manera de entender el tema es con ejemplos de gráficas de dispersión. Veamos lo siguiente, donde buscamos comprender cómo influye la temperatura en la venta de helados. Para ello:
- En cada eje se relacionan los datos correspondientes. En el eje X irá la temperatura y en el eje Y el total de las ventas en el día.
- Seleccionar los datos.
- Con nuestra tabla seleccionada damos clic en insertar y en todos los gráficos señalamos el de dispersión.
- Finalmente, tendremos el gráfico de dispersión en Excel donde podremos analizar la dispersión, notando que a medida que crece la temperatura hay una relación con el incremento de la venta de helados en el día.
Ahora, ya sabes cómo hacer una gráfica de dispersión en Excel. Puedes usarla con diferentes datos donde quieras hallar su correlación para analizarlos desde una perspectiva general.
¿Necesitas ayuda?
Esperamos que este contenido sobre el gráfico de dispersión haya sido de gran utilidad para ti. Si necesitas ayuda, escríbenos aquí.