평균 (Mean)
학습 목표
이 레슨을 완료하면 평균 (Mean)에 대해 깊이 이해하고, 실제 데이터에 적용할 수 있게 됩니다.
평균이란 무엇일까요?
평균(Mean)은 통계학에서 가장 기본적이고 중요한 개념 중 하나입니다. 데이터의 중심 경향을 나타내는 대표값으로, 일상생활에서도 자주 사용됩니다.
질문: 평균은 어떻게 계산할까요?
평균은 모든 관측값의 합을 관측값의 개수로 나눈 값입니다.
수식으로 나타내면:
여기서:
- (x-bar)는 평균을 나타냅니다
- 은 관측값의 개수입니다
- 는 각각의 관측값입니다
예제: 시험 점수의 평균
Question
medium어떤 교과목을 수강한 6명 학생들의 중간고사 성적은 다음과 같다:
89, 78, 91, 86, 76, 84
학생들의 성적에 대한 표본평균을 구하라.
학생 7명의 수학 시험 점수가 다음과 같다고 가정해봅시다:
23, 45, 67, 89, 12, 34, 56
직접 계산해서 평균을 구해보세요:
(소수점 둘째자리)결과 해석
| 통계량 | 값 | 해석 |
|---|---|---|
| 평균 점수 | 46.57점 | 7명 학생 점수의 중심 위치 |
| 데이터 범위 | 12 ~ 89점 | 점수가 비교적 넓게 분포 |
해석 가이드:
- 평균 46.57점은 이 집단의 전반적인 성취 수준을 나타냅니다
- 최솟값(12)과 최댓값(89)의 차이가 77점으로 크므로, 평균만으로 집단을 대표하기 어려울 수 있습니다
- 평균과 함께 표준편차나 중앙값을 확인하여 분포의 형태를 파악하는 것이 좋습니다
평균의 특성
평균은 모든 관측값으로부터의 거리의 합이 최소가 되는 점입니다.
평균의 주요 특성:
- 균형점: 평균은 데이터의 무게 중심과 같습니다
- 민감성: 극단값(이상치)에 영향을 많이 받습니다
- 모든 값 사용: 데이터의 모든 값이 평균 계산에 포함됩니다
이상치의 영향
Question
medium예제 2.5의 학생들에 새로운 학생이 추가되었다고 하자. 추가된 학생의 점수가 42점이라면 평균은 어떻게 달라지는가?
이상치(outlier)가 평균에 미치는 영향을 살펴봅시다.
결과 해석
| 통계량 | 값 | 해석 |
|---|---|---|
| 정상 데이터 평균 | 46.57 | 이상치 없을 때의 대표값 |
| 이상치 포함 평균 | 103.25 | 이상치 500으로 인해 급등 |
| 차이 | +56.68 | 이상치 하나가 평균을 56점 이상 끌어올림 |
해석 가이드:
- 평균이 이상치에 얼마나 민감한지 보여주는 사례입니다
- 실무에서 평균이 예상보다 크게 높거나 낮다면 이상치 존재 여부를 먼저 확인하세요
- 데이터 수집 오류, 측정 오류, 또는 실제 극단값인지를 판단해야 합니다
이상치 하나가 평균을 크게 변화시킬 수 있음을 알 수 있습니다!
실습 문제
다음 데이터의 평균을 계산하고, 이상치가 있는지 확인해보세요:
15, 18, 21, 19, 17, 20, 16, 95
직접 계산해서 평균을 구해보세요:
(소수점 둘째자리)코딩 챌린지
직접 코드를 작성해서 평균을 구해보세요! Python과 R 중 원하는 언어를 선택할 수 있습니다.
Python으로 평균 계산하기
R로 평균 계산하기
도전 과제: 이상치 제거 후 평균
Python 버전:
R 버전:
95가 명백한 이상치이므로, 평균만으로는 데이터를 대표하기 어렵습니다.
이런 경우에는:
- 중앙값(median)을 함께 고려하거나
- 이상치를 제거한 후 평균을 계산하거나
- 절사평균(trimmed mean)을 사용하는 것이 좋습니다
다음 레슨에서 중앙값에 대해 배워보겠습니다!
실제 활용 사례
HRD/교육공학
HRD 분야에서는 교육 만족도 평균, 역량 점수 평균 등을 계산하여 교육 프로그램의 전반적인 효과를 파악합니다. 예를 들어, 교육 후 학습자들의 만족도를 5점 척도로 조사한 경우, 평균 만족도 점수를 통해 교육의 전반적인 품질을 평가할 수 있습니다. 또한 교육 전후의 역량 점수 평균을 비교하여 교육 프로그램의 효과성을 측정합니다.
결과 해석
| 통계량 | 값 | 해석 |
|---|---|---|
| 교육 만족도 평균 | 약 4.1점 | 5점 만점 기준 높은 만족도 |
| 응답자 수 | 50명 | 충분한 표본 크기 |
해석 가이드:
- 4.0 이상: 전반적으로 긍정적인 반응, 프로그램 개선보다 유지에 집중
- 3.5 ~ 4.0: 보통 이상의 만족도, 개선 가능한 부분 탐색 필요
- 3.5 미만: 낮은 만족도, 프로그램의 구조적 검토 필요
- 만족도 조사에서는 평균만으로 판단하지 말고, 분포(히스토그램)와 이상치도 함께 확인하세요
핵심 요약
- 평균은 모든 값의 합을 개수로 나눈 값입니다
- 데이터의 중심 경향을 나타내는 가장 기본적인 측도입니다
- 이상치에 민감하다는 단점이 있습니다
- Python에서는
np.mean(), R에서는mean()함수를 사용합니다
📝 연습문제
11개의 문제로 학습 내용을 점검하세요
레슨을 완료하셨나요?
완료 버튼을 눌러 진행률을 업데이트하세요