descriptive statistics
pythonr

평균 (Mean)

15
입문

학습 목표

이 레슨을 완료하면 평균 (Mean)에 대해 깊이 이해하고, 실제 데이터에 적용할 수 있게 됩니다.

평균이란 무엇일까요?

평균(Mean)은 통계학에서 가장 기본적이고 중요한 개념 중 하나입니다. 데이터의 중심 경향을 나타내는 대표값으로, 일상생활에서도 자주 사용됩니다.

질문: 평균은 어떻게 계산할까요?

평균은 모든 관측값의 합관측값의 개수로 나눈 값입니다.

수식으로 나타내면:

xˉ=1ni=1nxi\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i

여기서:

  • xˉ\bar{x} (x-bar)는 평균을 나타냅니다
  • nn관측값의 개수입니다
  • xix_i각각의 관측값입니다

예제: 시험 점수의 평균

Question

medium

어떤 교과목을 수강한 6명 학생들의 중간고사 성적은 다음과 같다:

89, 78, 91, 86, 76, 84

학생들의 성적에 대한 표본평균을 구하라.

학생 7명의 수학 시험 점수가 다음과 같다고 가정해봅시다:

23, 45, 67, 89, 12, 34, 56

직접 계산해서 평균을 구해보세요:

(소수점 둘째자리)

결과 해석

통계량해석
평균 점수46.57점7명 학생 점수의 중심 위치
데이터 범위12 ~ 89점점수가 비교적 넓게 분포

해석 가이드:

  • 평균 46.57점은 이 집단의 전반적인 성취 수준을 나타냅니다
  • 최솟값(12)과 최댓값(89)의 차이가 77점으로 크므로, 평균만으로 집단을 대표하기 어려울 수 있습니다
  • 평균과 함께 표준편차나 중앙값을 확인하여 분포의 형태를 파악하는 것이 좋습니다

평균의 특성

평균은 모든 관측값으로부터의 거리의 합이 최소가 되는 점입니다.

평균의 주요 특성:

  • 균형점: 평균은 데이터의 무게 중심과 같습니다
  • 민감성: 극단값(이상치)에 영향을 많이 받습니다
  • 모든 값 사용: 데이터의 모든 값이 평균 계산에 포함됩니다

이상치의 영향

Question

medium

예제 2.5의 학생들에 새로운 학생이 추가되었다고 하자. 추가된 학생의 점수가 42점이라면 평균은 어떻게 달라지는가?

이상치(outlier)가 평균에 미치는 영향을 살펴봅시다.

결과 해석

통계량해석
정상 데이터 평균46.57이상치 없을 때의 대표값
이상치 포함 평균103.25이상치 500으로 인해 급등
차이+56.68이상치 하나가 평균을 56점 이상 끌어올림

해석 가이드:

  • 평균이 이상치에 얼마나 민감한지 보여주는 사례입니다
  • 실무에서 평균이 예상보다 크게 높거나 낮다면 이상치 존재 여부를 먼저 확인하세요
  • 데이터 수집 오류, 측정 오류, 또는 실제 극단값인지를 판단해야 합니다

이상치 하나가 평균을 크게 변화시킬 수 있음을 알 수 있습니다!

실습 문제

다음 데이터의 평균을 계산하고, 이상치가 있는지 확인해보세요:

15, 18, 21, 19, 17, 20, 16, 95

직접 계산해서 평균을 구해보세요:

(소수점 둘째자리)

코딩 챌린지

직접 코드를 작성해서 평균을 구해보세요! Python과 R 중 원하는 언어를 선택할 수 있습니다.

Python으로 평균 계산하기

🧑‍💻평균 계산하기 (Python)쉬움
아래 데이터의 평균을 계산하는 코드를 완성하세요. 결과를 'result' 변수에 저장하세요.
1
2
3
4
5
6
7
8
9
10
11

R로 평균 계산하기

🧑‍💻평균 계산하기 (R)쉬움
아래 데이터의 평균을 계산하는 코드를 완성하세요. 결과를 'result' 변수에 저장하세요.
1
2
3
4
5
6
7
8
9

도전 과제: 이상치 제거 후 평균

Python 버전:

🧑‍💻이상치 제거 후 평균 계산 (Python)보통
이상치(95)를 제외한 데이터의 평균을 계산하세요. 결과를 'result' 변수에 저장하세요.
1
2
3
4
5
6
7
8
9
10
11
12

R 버전:

🧑‍💻이상치 제거 후 평균 계산 (R)보통
이상치(95)를 제외한 데이터의 평균을 계산하세요. 결과를 'result' 변수에 저장하세요.
1
2
3
4
5
6
7
8
9
10

95가 명백한 이상치이므로, 평균만으로는 데이터를 대표하기 어렵습니다.

이런 경우에는:

  • 중앙값(median)을 함께 고려하거나
  • 이상치를 제거한 후 평균을 계산하거나
  • 절사평균(trimmed mean)을 사용하는 것이 좋습니다

다음 레슨에서 중앙값에 대해 배워보겠습니다!

실제 활용 사례

HRD/교육공학

HRD 분야에서는 교육 만족도 평균, 역량 점수 평균 등을 계산하여 교육 프로그램의 전반적인 효과를 파악합니다. 예를 들어, 교육 후 학습자들의 만족도를 5점 척도로 조사한 경우, 평균 만족도 점수를 통해 교육의 전반적인 품질을 평가할 수 있습니다. 또한 교육 전후의 역량 점수 평균을 비교하여 교육 프로그램의 효과성을 측정합니다.

결과 해석

통계량해석
교육 만족도 평균약 4.1점5점 만점 기준 높은 만족도
응답자 수50명충분한 표본 크기

해석 가이드:

  • 4.0 이상: 전반적으로 긍정적인 반응, 프로그램 개선보다 유지에 집중
  • 3.5 ~ 4.0: 보통 이상의 만족도, 개선 가능한 부분 탐색 필요
  • 3.5 미만: 낮은 만족도, 프로그램의 구조적 검토 필요
  • 만족도 조사에서는 평균만으로 판단하지 말고, 분포(히스토그램)와 이상치도 함께 확인하세요

핵심 요약

  • 평균은 모든 값의 합을 개수로 나눈 값입니다
  • 데이터의 중심 경향을 나타내는 가장 기본적인 측도입니다
  • 이상치에 민감하다는 단점이 있습니다
  • Python에서는 np.mean(), R에서는 mean() 함수를 사용합니다

📝 연습문제

11개의 문제로 학습 내용을 점검하세요

문제 풀기

레슨을 완료하셨나요?

완료 버튼을 눌러 진행률을 업데이트하세요

평균 (Mean) | Method | Method