散点图

在两个坐标轴上绘制数据点,揭示相关性、聚类和离群值。

什么是散点图?

散点图将各个数据点放置在二维网格上,每个轴代表不同变量。每个点显示单个观测的两个测量值的交叉。由此产生的图案揭示两个变量是否相关。

散点图是探索变量间关系的主要工具。紧密的对角线簇表明强相关。随机分布表明无相关。异常值在视觉上突出,自然分组无需统计分析即可显现。

何时使用散点图

  • 探索两个连续变量之间的相关性
  • 识别数据集中的异常值
  • 发现自然簇或分组
  • 显示数据点在两个维度上的分布
  • 通过为每组使用不同颜色来比较组

最佳实践

  • 两个轴都使用连续(数值)变量,而不是类别
  • 添加包含单位的轴标签
  • 当许多点重叠时使用半透明点
  • 用颜色编码组以比较子群体
  • 如果关系有意义,考虑添加趋势线
  • 保持点大小一致,除非要编码第三个变量(气泡图)

示例

学习时间与考试成绩,展示投入时间与结果之间的正相关关系。

在 Claude 中创建此图表

安装 ChartPane 后,只需描述您想要的内容:

Create a scatter plot of study hours vs test scores for these students: (2,55), (3,62), (4,68), (5,74), (6,78), (7,85), (8,88), (9,92)

相关图表类型