散点图
在两个坐标轴上绘制数据点,揭示相关性、聚类和离群值。
什么是散点图?
散点图将各个数据点放置在二维网格上,每个轴代表不同变量。每个点显示单个观测的两个测量值的交叉。由此产生的图案揭示两个变量是否相关。
散点图是探索变量间关系的主要工具。紧密的对角线簇表明强相关。随机分布表明无相关。异常值在视觉上突出,自然分组无需统计分析即可显现。
何时使用散点图
- 探索两个连续变量之间的相关性
- 识别数据集中的异常值
- 发现自然簇或分组
- 显示数据点在两个维度上的分布
- 通过为每组使用不同颜色来比较组
最佳实践
- 两个轴都使用连续(数值)变量,而不是类别
- 添加包含单位的轴标签
- 当许多点重叠时使用半透明点
- 用颜色编码组以比较子群体
- 如果关系有意义,考虑添加趋势线
- 保持点大小一致,除非要编码第三个变量(气泡图)
示例
学习时间与考试成绩,展示投入时间与结果之间的正相关关系。
在 Claude 中创建此图表
安装 ChartPane 后,只需描述您想要的内容:
Create a scatter plot of study hours vs test scores for these students: (2,55), (3,62), (4,68), (5,74), (6,78), (7,85), (8,88), (9,92)