散点图
简介
定义
散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。
通过观察散点图上数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。数据的相关关系主要分为:正相关(两个变量值同时增长)、负相关(一个变量值增加另一个变量值下降)、不相关、线性相关、指数相关等,表现在散点图上的大致分布如下图所示。那些离点集群较远的点我们称为离群点或者异常点。
何时使用
散点图通常用于显示和比较数值,不光可以显示趋势,还能显示数据集群的形状,以及在数据云团中各数据点的关系。
名称 | 说明 |
---|---|
图表类型 | 散点图 |
功能 | 展示数据分布情况 |
适合的数据条数 | 小于2000 |
图表示例
设计指引
用法建议
适合场景 | 不适合场景 |
---|---|
展示分布 | 不适合分类过少的场景 |
构成
图形(Element):散点图有点或方形,三角形等组成。
与其他图表的对比
散点图和气泡图
- 散点图和气泡图都是将两个字段映射到x,y轴的位置上。散点图侧重于展示点之间的分布规律,而气泡图将数值映射到气泡的大小上,增加了一个维度的数据展示。 散点图可以展示成千上万个点的数据,而气泡图为了防止气泡的互相遮挡,需要根据画布的大小控制数据的规模
案例
案例数据下载:各省市大学平均分排序.xls
案例介绍: 本案例是我国各省高校数量和高校平均分的统计数据。
制作流程:
- 选择数据集:各省市大学平均分排序
- 将【省市】拖动到列,【大学数量】拖动行,选择形状