Точечная диаграмма

Наносите точки данных на две оси для выявления корреляций, кластеров и выбросов.

Что такое точечная диаграмма?

Точечная диаграмма (или диаграмма рассеяния) размещает отдельные точки данных на двумерной сетке, где каждая ось представляет разную переменную. Каждая точка показывает пересечение двух измерений для одного наблюдения. Образующийся паттерн показывает, связаны ли переменные.

Точечные диаграммы — основной инструмент для изучения связей между переменными. Плотный диагональный кластер указывает на сильную корреляцию. Случайный разброс — на её отсутствие. Выбросы выделяются визуально, а естественные группы появляются без статистического анализа.

Когда использовать точечную диаграмму

  • Изучение корреляции между двумя непрерывными переменными
  • Выявление выбросов в наборе данных
  • Обнаружение естественных кластеров или групп
  • Показ распределения точек данных в двух измерениях
  • Сравнение групп путём нанесения каждой своим цветом

Лучшие практики

  • Используйте обе оси для непрерывных (числовых) переменных, а не для категорий
  • Добавляйте подписи осей с единицами измерения
  • Используйте полупрозрачные точки при сильном перекрытии
  • Кодируйте группы цветом для сравнения подгрупп
  • Добавьте линию тренда, если связь значима
  • Сохраняйте размер точек одинаковым, если только не кодируете третью переменную

Пример

Часы учёбы и результаты тестов.

Создайте это в Claude

С установленным ChartPane просто опишите желаемое:

Create a scatter plot of study hours vs test scores for these students: (2,55), (3,62), (4,68), (5,74), (6,78), (7,85), (8,88), (9,92)

Похожие типы графиков