Diagrama de dispersión

Representa puntos de datos individuales en dos ejes para revelar correlaciones, grupos y valores atípicos.

¿Qué es un diagrama de dispersión?

Un diagrama de dispersión coloca puntos de datos individuales en una cuadrícula bidimensional donde cada eje representa una variable diferente. Cada punto muestra la intersección de dos mediciones para una observación. El patrón resultante revela si las dos variables están relacionadas.

Los diagramas de dispersión son la herramienta principal para explorar relaciones entre variables. Un grupo diagonal ajustado sugiere correlación fuerte. Una dispersión aleatoria sugiere ninguna. Los valores atípicos destacan visualmente y los grupos naturales emergen sin análisis estadístico.

Cuándo usar un diagrama de dispersión

  • Explorar la correlación entre dos variables continuas
  • Identificar valores atípicos en un conjunto de datos
  • Detectar grupos o clústeres naturales
  • Mostrar la distribución de puntos en dos dimensiones
  • Comparar grupos graficando cada uno con un color diferente

Mejores prácticas

  • Usa ambos ejes para variables continuas (numéricas), no categorías
  • Añade etiquetas de eje que incluyan unidades
  • Usa puntos semi-transparentes cuando muchos se solapan
  • Codifica grupos por color para comparar subpoblaciones
  • Considera añadir una línea de tendencia si la relación es significativa
  • Mantén los tamaños de puntos consistentes salvo que codifiques una tercera variable

Ejemplo

Horas de estudio vs. puntuaciones en exámenes, mostrando la correlación positiva entre el tiempo invertido y los resultados.

Crear esto en Claude

Con ChartPane instalado, solo describe lo que quieres:

Create a scatter plot of study hours vs test scores for these students: (2,55), (3,62), (4,68), (5,74), (6,78), (7,85), (8,88), (9,92)

Tipos de gráficos relacionados