What does standard deviation tell you?

Standard deviation measures how spread out numbers are from the average. A small standard deviation means data points are close to the mean; a large one means they're spread out. For example, test scores of [85, 87, 88, 90, 90] have a small standard deviation (~2), while [50, 70, 85, 95, 100] have a large one (~19).

What is the difference between population and sample standard deviation?

Population standard deviation (σ) divides by N (total count) when you have data for everyone. Sample standard deviation (s) divides by N-1 when you only have a subset of data, which corrects for underestimation bias. Use sample (N-1) unless you truly have the entire population.

What is a good standard deviation?

There's no universal 'good' value — it depends on context. A standard deviation of 5 on test scores out of 100 means very consistent performance. The same value of 5 on data ranging from 1-10 means huge variability. Compare standard deviation relative to the mean using the coefficient of variation (CV = SD/Mean × 100%).

표준편차를 쉽게 설명 — 단계별 가이드

2026년 3월 31일 · 12분 읽기

📑 목차

표준편차란 무엇인가?
공식 설명
단계별 계산 예제
모집단 vs 표본: 언제 무엇을 사용할까
결과 해석하기
실제 적용 사례
피해야 할 일반적인 실수
분산과 표준편차 이해하기
변동계수: 서로 다른 데이터셋 비교하기
도구 및 계산기
자주 묻는 질문
관련 글

표준편차란 무엇인가?

표준편차는 데이터 포인트들이 평균(mean)으로부터 얼마나 퍼져 있는지를 알려주는 통계적 측정값입니다. 데이터셋의 "일관성 점수"라고 생각하면 됩니다.

숫자들이 평균 주변에 밀집되어 있으면 낮은 표준편차를 얻게 됩니다. 멀리 흩어져 있으면 표준편차가 높습니다. 그만큼 간단합니다.

두 명의 농구 선수를 비교한다고 상상해보세요. 선수 A는 5경기에서 20, 21, 19, 20, 20점을 득점합니다. 선수 B는 5, 35, 15, 30, 15점을 득점합니다. 둘 다 경기당 평균 20점이지만, 선수 A가 훨씬 더 일관적입니다. 표준편차는 이 차이를 수치화합니다.

빠른 팁: 표준편차는 항상 원본 데이터와 동일한 단위로 표현됩니다. 키를 센티미터로 측정하면 표준편차도 센티미터로 표시됩니다.

표준편차가 중요한 이유

표준편차는 제조업의 품질 관리부터 금융의 위험 평가까지 데이터 분석의 모든 곳에 나타납니다. 이것이 매우 가치 있는 이유는 다음과 같습니다:

품질 관리: 제조업체는 제품이 일관되게 사양을 충족하는지 확인하는 데 사용합니다
금융: 투자자는 투자 위험과 변동성을 측정하는 데 사용합니다
교육: 교사는 학생 성적이 어떻게 변하는지 이해하는 데 사용합니다
의료: 의학 연구자는 치료 효과를 평가하는 데 사용합니다
날씨 예보: 기상학자는 예측 신뢰성을 평가하는 데 사용합니다

공식 설명

표준편차에는 두 가지 유형이 있습니다: 모집단과 표본. 공식은 처음에는 위협적으로 보이지만, 단지 퍼짐을 측정하는 체계적인 방법일 뿐입니다.

모집단 표준편차 (σ)

σ = √[Σ(xᵢ − μ)² / N]

전체 모집단에 대한 데이터가 있을 때 사용합니다 — 연구하는 그룹의 모든 구성원.

표본 표준편차 (s)

s = √[Σ(xᵢ − x̄)² / (N−1)]

표본의 데이터가 있을 때 사용합니다 — 더 큰 모집단을 대표하는 부분집합.

기호 분석

기호	의미	예시
σ (시그마)	모집단 표준편차	전체 500명 직원 급여의 표준편차
s	표본 표준편차	조사한 50명 직원 급여의 표준편차
xᵢ	개별 데이터 포인트	한 사람의 급여
μ (뮤)	모집단 평균	전체 500명 급여의 평균
x̄ (엑스바)	표본 평균	조사한 50명 급여의 평균
N	데이터 포인트 수	예시에서 500 또는 50
Σ (시그마)	모든 값의 합	모두 더하기
√	제곱근	계산의 마지막 단계

표본에 N−1을 사용하는 이유는?

표본 공식은 N 대신 N−1로 나눕니다. 이것을 베셀 보정이라고 하며, 표본이 모집단 변동성을 과소평가하는 경향이 있다는 사실을 보상합니다.

표본만 있을 때는 제한된 정보로 작업하는 것입니다. N−1로 나누면 표준편차가 약간 증가하여 실제 모집단 표준편차를 더 정확하게 추정할 수 있습니다.

단계별 계산 예제

다음 시험 점수의 표준편차를 계산해봅시다: 4, 8, 6, 5, 3, 7, 8, 9

이것을 완전한 모집단(작은 학급의 모든 학생)으로 취급하므로 모집단 공식을 사용하겠습니다.

1단계: 평균 계산

모든 값을 더하고 개수로 나눕니다:

평균 (μ) = (4 + 8 + 6 + 5 + 3 + 7 + 8 + 9) ÷ 8
평균 (μ) = 50 ÷ 8 = 6.25

2단계: 평균으로부터 각 편차 찾기

각 값에서 평균을 뺍니다. 일부 결과는 음수(평균 이하), 일부는 양수(평균 이상)가 됩니다.

3단계: 각 편차 제곱하기

제곱하면 음수 부호가 제거되고 더 큰 편차가 강조됩니다. 이것이 표준편차가 이상값에 민감한 이유입니다.

4단계: 전체 표 계산

값 (x)	x − 평균	(x − 평균)²	설명
4	4 − 6.25 = −2.25	5.0625	평균보다 2.25점 낮음
8	8 − 6.25 = 1.75	3.0625	평균보다 1.75점 높음
6	6 − 6.25 = −0.25	0.0625	평균에 매우 가까움
5	5 − 6.25 = −1.25	1.5625	평균보다 1.25점 낮음
3	3 − 6.25 = −3.25	10.5625	평균보다 가장 낮음
7	7 − 6.25 = 0.75	0.5625	평균보다 약간 높음
8	8 − 6.25 = 1.75	3.0625	평균보다 1.75점 높음
9	9 − 6.25 = 2.75	7.5625	평균보다 가장 높음
제곱 편차의 합:		31.50

5단계: 분산 계산

제곱 편차의 합을 N(모집단) 또는 N−1(표본)로 나눕니다:

모집단 분산 = 31.50 ÷ 8 = 3.9375
표본 분산 = 31.50 ÷ 7 = 4.50

6단계: 표준편차 계산

분산의 제곱근을 구합니다:

모집단 표준편차 (σ) = √3.9375 = 1.98
표본 표준편차 (s) = √4.50 = 2.12

표준편차는 약 2점입니다. 이는 대부분의 시험 점수가 평균(6.25)의 2점 이내에 있다는 것을 의미합니다.

전문가 팁: 표준편차 계산기를 사용하여 수동 계산을 확인하고 더 큰 데이터셋에서 시간을 절약하세요.

모집단 vs 표본: 언제 무엇을 사용할까

모집단과 표본 표준편차 중 선택하는 것은 완전한 데이터가 있는지 아니면 부분집합만 있는지에 따라 달라집니다.

전체 비교표

특징	모집단 (σ)	표본 (s)
공식 제수	N	N − 1
사용 시기	모든 데이터가 있을 때	부분집합이 있을 때
기호	σ (소문자 시그마)	s
결과 크기	약간 작음	약간 큼
목적	모집단 설명	표본에서 모집단 추정
예시	학급의 전체 30명 학생	10,000명 학생 중 100명 조사
일반적 사용	품질 관리, 소규모 그룹	연구, 설문조사, 실험

실제 결정 예시

모집단 표준편차를 사용할 때:

지난달의 모든 거래 분석
사무실의 모든 사람의 키 측정
단일 학급의 모든 학생 성적 계산
배치에서 제조된 모든 제품 검토
도시의 완전한 역사적 날씨 데이터 검토

표본 표준편차를 사용할 때:

50,000명 데이터베이스에서 500명 고객 조사
10,000개 생산 실행에서 30개 제품 테스트
선거 결과 예측을 위해 1,000명 유권자 여론조사
200명 참가자로 임상 시험 수행
웹사이트 방문자의 무작위 표본 분석

경험 법칙: 확실하지 않을 때는 표본 표준편차(N−1)를 사용하세요. 변동성을 과소평가하지 않는 더 안전하고 보수적인 선택입니다.

결과 해석하기

표준편차를 계산하는 것은 절반에 불과합니다. 맥락에서 숫자가 의미하는 바를 이해하는 것이 진정한 통찰력이 발생하는 곳입니다.

68-95-99.7 규칙 (경험적 규칙)

정규 분포 데이터(종 곡선)의 경우 표준편차는 예측 가능한 패턴을 따릅니다:

데이터의 68%는 평균의 1 표준편차 이내에 있습니다
데이터의 95%는 평균의 2 표준편차 이내에 있습니다
데이터의 99.7%는 평균의 3 표준편차 이내에 있습니다

이 규칙은 데이터 포인트가 일반적인지 비정상적인지 빠르게 평가하는 데 도움이 됩니다. 값이 평균에서 2 표준편차 이상 떨어져 있으면 외부 5%에 있는 것으로 조사할 가치가 있는 잠재적 이상값입니다.

실용적 해석 예시

커피숍에서 고객 대기 시간을 측정한다고 가정해봅시다:

평균 대기 시간: 5분
표준편차: 1.5분

이것은 다음을 알려줍니다:

고객의 68%는 3.5분에서 6.5분 사이에 대기합니다 (5 ± 1.5)
고객의 95%는 2분에서 8분 사이에 대기합니다 (5 ± 3)
10분 대기는 비정상적입니다 (평균에서 3 표준편차 이상)

"좋은" 표준편차란 무엇인가?

보편적인 답은 없습니다. 맥락이 매우 중요합니다. 10의 표준편차는 한 시나리오에서는 훌륭할 수 있고 다른 시나리오에서는 끔찍할 수 있습니다.

다음 예시를 고려하세요:

볼트 제조: 0.01mm의 표준편차는 좋음; 1mm는 재앙적
주식 수익률: 15%의 표준편차는 보통; 5%는 매우 안정적
시험 점수: 100점 만점 시험에서 10점의 표준편차는 합리적인 변동을 보여줌
인간 키: 성인 남성의 7cm 표준편차는 일반적

핵심은 표준편차를 평균 및 업계 벤치마크와 비교하는 것입니다. 여기서 변동계수가 유용해집니다(나중에 자세히 설명).

실제 적용 사례

표준편차는 단지 학문적인 것이 아닙니다 — 매일 산업 전반에 걸쳐 의사 결정을 주도합니다.

금융 및 투자

금융에서 표준편차는 투자 위험을 측정합니다. 표준편차가 높을수록 변동성이 크고 수익에 대한 불확실성이 커집니다.

포트폴리오 관리자는 다음을 위해 사용합니다:

서로 다른 투자 간의 위험 비교
샤프 비율 계산 (위험 단위당 수익)
적절한 포지션 크기 결정
손절매 수준 설정

연간 수익률 30%와 표준편차 25%인 주식은 위험 허용도에 따라 수익률 20%와 표준편차 10%인 주식보다 더 위험할 수 있습니다.

품질 관리 및 제조

제조업체는 일관된 제품 품질을 보장하기 위해 표준편차를 사용합니다. 예를 들어 식스 시그마 방법론은 평균의 6 표준편차 이내에 사양을 유지하여 달성되는 백만 개당 3.4개 미만의 결함률을 가진 프로세스를 목표로 합니다.

적용 사례는 다음과 같습니다:

생산 라인 일관성 모니터링
기계 보정이 필요한 시기 식별
허용 가능한 공차 범위 설정
공급업체 신뢰성 비교

의료 및 의학

의료 전문가는 표준편차를 다음과 같이 사용합니다:

활력 징후 및 실험실 결과의 정상 범위 설정
임상 시험에서 치료 효과 평가
주의가 필요한 비정상적인 증상을 가진 환자 식별
서로 다른 병원이나 절차 간의 결과 비교

예를 들어, 혈압 측정값의 표준편차가 높으면 조사가 필요한 기저 건강 문제를 나타낼 수 있습니다.

교육 및 시험

교사와 관리자는 표준편차를 다음과 같이 사용합니다:

학생 성적이 어떻게 변하는지 이해
시험이 너무 쉬웠는지 어려웠는지 식별
서로 다른 학급이나 교수법 비교
잠재적인 채점 불일치 감지

모든 사람이 85-95점 사이에 점수를 받는 시험(낮은 표준편차)은 너무 쉬울 수 있으며, 20-100점 범위의 점수(높은 표준편차)는 시험이 불명확하거나 학생들이 적절히 준비되지 않았음을 나타낼 수 있습니다.

전문가 팁: 데이터를 제시할 때