Diagrama de dispersión
Representa puntos de datos individuales en dos ejes para revelar correlaciones, grupos y valores atípicos.
¿Qué es un diagrama de dispersión?
Un diagrama de dispersión coloca puntos de datos individuales en una cuadrícula bidimensional donde cada eje representa una variable diferente. Cada punto muestra la intersección de dos mediciones para una observación. El patrón resultante revela si las dos variables están relacionadas.
Los diagramas de dispersión son la herramienta principal para explorar relaciones entre variables. Un grupo diagonal ajustado sugiere correlación fuerte. Una dispersión aleatoria sugiere ninguna. Los valores atípicos destacan visualmente y los grupos naturales emergen sin análisis estadístico.
Cuándo usar un diagrama de dispersión
- Explorar la correlación entre dos variables continuas
- Identificar valores atípicos en un conjunto de datos
- Detectar grupos o clústeres naturales
- Mostrar la distribución de puntos en dos dimensiones
- Comparar grupos graficando cada uno con un color diferente
Mejores prácticas
- Usa ambos ejes para variables continuas (numéricas), no categorías
- Añade etiquetas de eje que incluyan unidades
- Usa puntos semi-transparentes cuando muchos se solapan
- Codifica grupos por color para comparar subpoblaciones
- Considera añadir una línea de tendencia si la relación es significativa
- Mantén los tamaños de puntos consistentes salvo que codifiques una tercera variable
Ejemplo
Horas de estudio vs. puntuaciones en exámenes, mostrando la correlación positiva entre el tiempo invertido y los resultados.
Crear esto en Claude
Con ChartPane instalado, solo describe lo que quieres:
Create a scatter plot of study hours vs test scores for these students: (2,55), (3,62), (4,68), (5,74), (6,78), (7,85), (8,88), (9,92)