Gráfico de Dispersão
Plote pontos de dados individuais em dois eixos para revelar correlações, clusters e outliers.
O que é um gráfico de dispersão?
Um gráfico de dispersão posiciona pontos de dados individuais numa grade bidimensional onde cada eixo representa uma variável diferente. Cada ponto mostra a intersecção de duas medições para uma observação. O padrão resultante revela se as duas variáveis estão relacionadas.
Gráficos de dispersão são a principal ferramenta para explorar relações entre variáveis. Um grupo diagonal estreito sugere correlação forte. Uma dispersão aleatória não sugere nenhuma. Valores atípicos se destacam visualmente e agrupamentos naturais emergem sem análise estatística.
Quando usar um gráfico de dispersão
- Explorar correlação entre duas variáveis contínuas
- Identificar valores atípicos num conjunto de dados
- Detectar grupos ou clusters naturais
- Mostrar a distribuição de pontos em duas dimensões
- Comparar grupos plotando cada um com uma cor diferente
Melhores práticas
- Use ambos os eixos para variáveis contínuas (numéricas), não categorias
- Adicione rótulos de eixo que incluam unidades
- Use pontos semi-transparentes quando muitos se sobrepõem
- Codifique grupos por cor para comparar subpopulações
- Considere adicionar uma linha de tendência se a relação for significativa
- Mantenha tamanhos de pontos consistentes, salvo para codificar uma terceira variável
Exemplo
Horas de estudo vs. notas nos testes, mostrando a correlação positiva entre o tempo investido e os resultados.
Crie isso no Claude
Com o ChartPane instalado, basta descrever o que você quer:
Create a scatter plot of study hours vs test scores for these students: (2,55), (3,62), (4,68), (5,74), (6,78), (7,85), (8,88), (9,92)