Gráfico de Dispersão

Plote pontos de dados individuais em dois eixos para revelar correlações, clusters e outliers.

O que é um gráfico de dispersão?

Um gráfico de dispersão posiciona pontos de dados individuais numa grade bidimensional onde cada eixo representa uma variável diferente. Cada ponto mostra a intersecção de duas medições para uma observação. O padrão resultante revela se as duas variáveis estão relacionadas.

Gráficos de dispersão são a principal ferramenta para explorar relações entre variáveis. Um grupo diagonal estreito sugere correlação forte. Uma dispersão aleatória não sugere nenhuma. Valores atípicos se destacam visualmente e agrupamentos naturais emergem sem análise estatística.

Quando usar um gráfico de dispersão

  • Explorar correlação entre duas variáveis contínuas
  • Identificar valores atípicos num conjunto de dados
  • Detectar grupos ou clusters naturais
  • Mostrar a distribuição de pontos em duas dimensões
  • Comparar grupos plotando cada um com uma cor diferente

Melhores práticas

  • Use ambos os eixos para variáveis contínuas (numéricas), não categorias
  • Adicione rótulos de eixo que incluam unidades
  • Use pontos semi-transparentes quando muitos se sobrepõem
  • Codifique grupos por cor para comparar subpopulações
  • Considere adicionar uma linha de tendência se a relação for significativa
  • Mantenha tamanhos de pontos consistentes, salvo para codificar uma terceira variável

Exemplo

Horas de estudo vs. notas nos testes, mostrando a correlação positiva entre o tempo investido e os resultados.

Crie isso no Claude

Com o ChartPane instalado, basta descrever o que você quer:

Create a scatter plot of study hours vs test scores for these students: (2,55), (3,62), (4,68), (5,74), (6,78), (7,85), (8,88), (9,92)

Tipos de gráficos relacionados