What does standard deviation tell you?

Standard deviation measures how spread out numbers are from the average. A small standard deviation means data points are close to the mean; a large one means they're spread out. For example, test scores of [85, 87, 88, 90, 90] have a small standard deviation (~2), while [50, 70, 85, 95, 100] have a large one (~19).

What is the difference between population and sample standard deviation?

Population standard deviation (σ) divides by N (total count) when you have data for everyone. Sample standard deviation (s) divides by N-1 when you only have a subset of data, which corrects for underestimation bias. Use sample (N-1) unless you truly have the entire population.

What is a good standard deviation?

There's no universal 'good' value — it depends on context. A standard deviation of 5 on test scores out of 100 means very consistent performance. The same value of 5 on data ranging from 1-10 means huge variability. Compare standard deviation relative to the mean using the coefficient of variation (CV = SD/Mean × 100%).

标准差简单解释——分步指南

2026年3月31日 · 12分钟阅读

📑 目录

什么是标准差?
公式解释
分步计算示例
总体与样本:何时使用哪个
解释你的结果
实际应用
常见错误避免
理解方差和标准差
变异系数:比较不同数据集
工具和计算器
常见问题
相关文章

什么是标准差?

标准差是一种统计度量,告诉你数据点与平均值(均值)的分散程度。可以把它看作数据集的"一致性分数"。

当数字紧密聚集在均值周围时,你会得到较低的标准差。当它们分散得很远时,标准差就很高。就是这么简单。

想象你在比较两名篮球运动员。球员A在五场比赛中分别得分20、21、19、20和20分。球员B得分5、35、15、30和15分。两人场均得分都是20分,但球员A的表现要稳定得多。标准差量化了这种差异。

快速提示:标准差始终以原始数据相同的单位表示。如果你测量的身高单位是厘米,那么标准差也将以厘米为单位。

为什么标准差很重要

标准差在数据分析中无处不在,从制造业的质量控制到金融领域的风险评估。以下是它如此有价值的原因:

质量控制:制造商用它来确保产品始终如一地符合规格
金融:投资者用它来衡量投资风险和波动性
教育:教师用它来了解学生表现的差异
医疗保健:医学研究人员用它来评估治疗效果
天气预报:气象学家用它来评估预测可靠性

公式解释

标准差有两种类型:总体标准差和样本标准差。公式乍一看令人生畏,但它们只是测量分散程度的系统方法。

总体标准差(σ)

σ = √[Σ(xᵢ − μ)² / N]

当你拥有整个总体的数据时使用此公式——你所研究群体的每一个成员。

样本标准差(s)

s = √[Σ(xᵢ − x̄)² / (N−1)]

当你拥有来自样本的数据时使用此公式——代表更大总体的子集。

符号分解

符号	含义	示例
σ (西格玛)	总体标准差	所有500名员工工资的标准差
s	样本标准差	50名受访员工工资的标准差
xᵢ	单个数据点	一个人的工资
μ (缪)	总体均值	所有500份工资的平均值
x̄ (x横杠)	样本均值	50份受访工资的平均值
N	数据点数量	我们示例中的500或50
Σ (西格玛)	所有值的总和	将所有内容相加
√	平方根	计算的最后一步

为什么样本用N−1?

样本公式除以N−1而不是N。这称为贝塞尔校正,它补偿了样本倾向于低估总体变异性的事实。

当你只有样本时,你使用的信息有限。除以N−1会略微增加标准差,为你提供对真实总体标准差更准确的估计。

分步计算示例

让我们计算这些测试分数的标准差:4、8、6、5、3、7、8、9

我们将把这视为完整总体(小班级中的所有学生),因此我们将使用总体公式。

步骤1:计算均值

将所有值相加并除以计数:

均值(μ) = (4 + 8 + 6 + 5 + 3 + 7 + 8 + 9) ÷ 8
均值(μ) = 50 ÷ 8 = 6.25

步骤2:找出每个与均值的偏差

从每个值中减去均值。一些结果将是负数(低于平均值),一些是正数(高于平均值)。

步骤3:对每个偏差求平方

平方消除了负号并强调了较大的偏差。这就是为什么标准差对异常值敏感。

步骤4:计算完整表格

值(x)	x − 均值	(x − 均值)²	解释
4	4 − 6.25 = −2.25	5.0625	低于平均值2.25分
8	8 − 6.25 = 1.75	3.0625	高于平均值1.75分
6	6 − 6.25 = −0.25	0.0625	非常接近平均值
5	5 − 6.25 = −1.25	1.5625	低于平均值1.25分
3	3 − 6.25 = −3.25	10.5625	最低于平均值
7	7 − 6.25 = 0.75	0.5625	略高于平均值
8	8 − 6.25 = 1.75	3.0625	高于平均值1.75分
9	9 − 6.25 = 2.75	7.5625	最高于平均值
平方偏差之和:		31.50

步骤5:计算方差

将平方偏差之和除以N(总体)或N−1(样本):

总体方差 = 31.50 ÷ 8 = 3.9375
样本方差 = 31.50 ÷ 7 = 4.50

步骤6:计算标准差

对方差取平方根:

总体标准差(σ) = √3.9375 = 1.98
样本标准差(s) = √4.50 = 2.12

标准差约为2分。这意味着大多数测试分数在平均值(6.25)的2分范围内。

专业提示:使用我们的标准差计算器来验证你的手工计算并节省处理大型数据集的时间。

总体与样本:何时使用哪个

在总体标准差和样本标准差之间进行选择取决于你是拥有完整数据还是只有子集。

完整比较表

特征	总体(σ)	样本(s)
公式除数	N	N − 1
何时使用	你拥有所有数据	你拥有子集
符号	σ(小写西格玛)	s
结果大小	略小	略大
目的	描述总体	从样本估计总体
示例	你班级中所有30名学生	从10,000名学生中调查100名
常见于	质量控制、小群体	研究、调查、实验

实际决策示例

使用总体标准差的情况:

分析上个月的所有交易
测量办公室中每个人的身高
计算单个班级所有学生的成绩
审查一批中制造的所有产品
检查城市的完整历史天气数据

使用样本标准差的情况:

从50,000个客户数据库中调查500名客户
从10,000件产品的生产运行中测试30件产品
调查1,000名选民以预测选举结果
进行有200名参与者的临床试验
分析网站访问者的随机样本

经验法则:如有疑问,使用样本标准差(N−1)。这是更安全、更保守的选择,不会低估变异性。

解释你的结果

计算标准差只是成功的一半。理解数字在上下文中的含义才是真正的洞察所在。

68-95-99.7规则(经验法则)

对于正态分布数据(钟形曲线),标准差遵循可预测的模式:

68%的数据落在均值的1个标准差范围内
95%的数据落在均值的2个标准差范围内
99.7%的数据落在均值的3个标准差范围内

这个规则帮助你快速评估数据点是典型的还是不寻常的。如果一个值距离均值超过2个标准差,它就在外围5%中——可能是值得调查的异常值。

实际解释示例

假设你测量咖啡店的客户等待时间:

平均等待时间:5分钟
标准差:1.5分钟

这告诉你:

68%的客户等待时间在3.5到6.5分钟之间(5 ± 1.5)
95%的客户等待时间在2到8分钟之间(5 ± 3)
10分钟的等待时间是不寻常的(距离均值超过3个标准差)

什么是"好的"标准差?

没有通用答案。上下文非常重要。在一种情况下,标准差为10可能很好,而在另一种情况下可能很糟糕。

考虑这些示例:

制造螺栓:标准差0.01毫米是好的;1毫米是灾难性的
股票回报:标准差15%是中等的;5%是非常稳定的
测试分数:100分测试中标准差10分显示合理的变化
人类身高:成年男性标准差7厘米是典型的

关键是将标准差与均值和行业基准进行比较。这就是变异系数变得有用的地方(稍后详述)。

实际应用

标准差不仅仅是学术性的——它每天推动各行各业的决策。

金融和投资

在金融领域,标准差衡量投资风险。较高的标准差意味着较高的波动性和回报的更大不确定性。

投资组合经理用它来:

比较不同投资之间的风险
计算夏普比率(每单位风险的回报)
确定适当的头寸规模
设置止损水平

一只年回报率30%、标准差25%的股票可能比年回报率20%、标准差10%的股票风险更大,这取决于你的风险承受能力。

质量控制和制造

制造商使用标准差来确保产品质量的一致性。例如,六西格玛方法旨在实现缺陷率低于百万分之3.4的流程——通过将规格保持在均值的6个标准差范围内来实现。

应用包括:

监控生产线一致性
识别机器何时需要校准
设置可接受的公差范围
比较供应商可靠性

医疗保健和医学

医疗专业人员使用标准差来:

建立生命体征和实验室结果的正常范围
评估临床试验中的治疗效果
识别需要关注的异常症状患者
比较不同医院或程序的结果

例如,如果血压读数具有高标准差,可能表明需要调查的潜在健康问题。

教育和测试

教师和管理人员使用标准差来:

了解学生表现的差异
识别测试是太容易还是太难
比较不同班级或教学方法
检测潜在的评分不一致

如果每个人的分数都在85-95之间(低标准差),测试可能太容易了,而分数范围从20-100(高标准差)可能表明测试不清楚或学生准备不足。

专业提示:向