본문 바로가기
생활꿀팁

Big Data 시대에 반드시 알아야 할 기초 통계지식 최종평가 24년도 최신 문제 및 답안

by 부자쿠마 2024. 5. 28.
728x90
728x90

 

 

1.다음 중 자료의 성격이 다른 하나는?    (5점)
  ①성별
  ②주민등록번호
  ③온도
  ④우편번호

 

정답 해설
3 다른 자료는 명목척도인데 온도는 구간척도로 나타내는 것이 일반적이다.

 

2.구간자료(척도)와 비율자료(척도)의 차이는 무엇인가?    (5점)
  ①절대 원점이 있는가의 차이이다.
  ②연속형 자료인가 이산형 자료인가의 차이이다.
  ③평균을 도출할 수 있는가의 차이이다.
  ④수치형 자료인가 질적 자료인가의 차이이다.
정답 해설
1 구간자료는 절대 원점이 없지만 비율자료는 절대 원점이 존재한다.

 

3.다음은 S사의 대리점들의 영업이익률을 나타낸 도수분포표이다. 도수분포표에 대해 잘못 설명한 것은?

영업이익률 ㅣ 도수
-10% 이상 ~ 0% 미만 ㅣ 3
0% 이상 ~ 10% 미만 ㅣ 7
10% 이상 ~ 20% 미만 ㅣ 3
20% 이상 ~ 30% 미만 ㅣ 2
30% 이상 ~ 40% 미만 ㅣ 1    (5점)

 

  ①도수분포표의 계급의 수는 5이다.
  ②총 표본의 크기는 16이다.
  ③두 번째 계급의 누적 상대도수는 0.4375이다.
  ④수익률이 20% 미만인 표본의 수는 13이다.
정답 해설
3 두 번째 계급은 0%이상 ~ 10%미만이며 누적도수는 10이고 누적상대도수는 10/16이므로 0.625이다. 0.4375는 상대도수 (=7/16)이다

반응형

4.횡단면 자료와 대비되는 개념으로 일정한 기간동안 동일한 시간간격에 따라 수집된 자료를 시계열 자료라고 한다.    (5점)
  ①O
  ②X
정답 해설
1 시계열 자료(일별, 월별, 분기별 등 일정한 시간간격으로 수집된 자료)에 대한 올바른 설명이다.

 

5.왜도는 자료의 뽀족한 정도이며 정규분포를 기준으로 자료가 더 중심에 집중되어 있어서 뽀족한가의 여부를 나타내는 수치이다.    (5점)
  ①O
  ②X
정답 해설
2 첨도에 대한 설명이다.

 

6.대표치로서의 평균에 대한 특성을 잘못 설명한 것은?    (5점)
  ①산술평균은 자료에 극단적인 값이 포함될 경우에도 적절한 대표치가 된다.
  ②모평균과 표본평균은 산술평균에 속한다.
  ③평균은 모든 자료의 값이 다 반영되어 계산된다.
  ④가장 대표적인 중심경향도로 사용된다.
정답 해설
1 평균은 모든 자료가 다 반영되어 도출되므로 극단적인 값에 영향을 받으므로 극단적인 값이 포함될 경우에는 적절한 대표치가 되지 못한다.

 

7.중심경향도를 나타내는 수치에는 분산, 표준편차, 범위, 평균절대편차, 변동계수가 있다.    (5점)
  ①O
  ②X
정답 해설
2 중심경향도를 나타내는 수치에는 평균, 산출평균, 가중평균, 중위수(median), 최빈수(mode)가 있다.

 

8.다음 중 정성조사에 속하는 조사방법으로 보기 어려운 것은?    (5점)
  ①출구조사
  ②집단심층면접조사 (FGI)
  ③에스노그라피
  ④고객가장관찰조사
정답 해설
1 출구조사는 선거 등의 결과 예측에 주로 사용되며 선거를 마치고 나오는 다수의 유권자들에게 동일한 유형의 설문조사를 정량적으로 수행하는 것이다.

 

9.주사위를 던져 나오는 눈금에 대한 기댓값은?    (5점)
  ①3.5
  ②2.5
  ③3
  ④4.5
정답 해설
1 이산확률변수의 기댓값은 확률변수에 대해 확률을 가중평균하여 구한다.
(1/6) x (1+2+3+4+5+6)=3.5

 

10.표준정규분포에 대한 설명으로 올바르지 못한 것은?    (5점)
  ①평균이 0이고 분산이 1인 정규분포이다.
  ②표준화과정의 Z변수는 (μ - X) / σ로 계산된다.
  ③일반적으로 Z분포라고 한다.
  ④평균 0을 중심으로 좌우대칭인 분포이다.
정답 해설
2 표준화과정의 Z변수는 (X - μ) / σ로 계산된다

 

11.연속균등분포의 발생 구간이 [2, 12]일 때 P(4 < X <10)의 확률은 얼마인가?    (5점)
  ①0.4
  ②0.5
  ③0.6
  ④0.8
정답 해설
3 균등분포의 확률은 (x2 - x1)/(b - a) 이므로 (10 - 4)/(12 - 2) = 0.6

 

12.정규모집단에서 모분산이 알려지지 않은 경우 30미만의 소표본을 추출했다면 모평균의 추론을 위해 사용되는 분포는?    (5점)
  ①자유도 n-1의 t분포
  ②Z분포
  ③자유도 n-1의 Z분포
  ④카이제곱 분포
정답 해설
1 정규모집단에서 모분산이 알려지지 않고 소표본이면 자유도 n-1의 t분포를 적용하여 모평균을 추론해야 한다

 

13.다음 중 카이제곱 분포의 특성에 대한 설명으로 적절하지 않은 것은?    (5점)
  ①표본분산의 분포를 설명하여 모분산에 대한 추정 및 검정이 가능하다
  ②상호 독립인 n개의 표준정규변수가 있을 때 변수들의 제곱의 합으로 유도된다
  ③변수간의 독립성 검정 및 통계적 분석을 위한 여러 가지 가정에 대한 적합성 검정에도 이용된다
  ④자유도 n-1인 카이제곱 분포와 모분산과는 선형관계가 성립된다.
정답 해설
4 자유도 n-1인 카이제곱 분포와 표본분산의 선형관계가 성립된다.

 

14.모분산의 검정에 대한 설명으로 적절한 것은?    (5점)
  ①표본의 크기가 크면 Z검정이 가능하다.
  ②모분산 검정을 위한 검정통계량은 {(n-1)σ2}/s2이다.
  ③자유도 n-1의 카이제곱 검정을 한다.
  ④양측검정일 경우의 임계치는 ±zα/2이다.
정답 해설
3 1) 모분산에 대한 가설을 검정하기 위해서는 카이제곱 분포를 이용하고, 2) 검정통계량은 X2 = {(n-1)s2}/σ2과 같이 계산되며, 4) 양측검정일 경우 임계치는 X2n-1, 1-α/2, X2n-1,α/2이다.

 

15.조정결정계수는 음의 값을 가질 수도 있다.    (5점)
  ①O
  ②X
정답 해설
1 조정결정계수는 음의 값을 가질수도 있으며, 독립변수가 1개 이상이라면 조정결정계수가 결정계수보다 적은 값을 가지게 된다.

 

16.다중회귀분석이란 독립변수가 2개 이상인 회귀분석을 말한다.    (5점)
  ①O
  ②X
정답 해설
1 다중회귀분석은 독립변수가 2개 이상으로 구성되며 독립변수가 1개인 경우는 단순회귀분석이라고 한다

 

17.다중회귀분석에 대한 설명으로 잘못된 것은?    (5점)
  ①k개의 독립변수가 미치는 전체의 영향이 종속변수와 선형관계에 있다는 가정을 한다.
  ②개별 독립변수 하나하나와 종속변수 간에 통계적으로 유의한 선형관계가 있다는 것을 의미한다.
  ③다중회귀분석에서 표본회귀식을 도출하면 k개의 독립변수와 절편 1개가 있으므로 자유도는 n-k-1이 된다.
  ④다중회귀분석의 적합성 검정을 위한 가설은 H0 : β1 = β2 = ...βk = 0, H1 : 귀무가설은 사실이 아니다 이다.
정답 해설
2 다중회귀모형의 가정은 기본적으로 단순회귀모형의 가정과 일치한다. 다만 독립변수가 k개이므로 독립변수와 종속변수 간에 선형관계가 있어야 한다는 가정은 k개의 독립변수가 미치는 전체의 영향이 종속변수와 선형관계에 있다는 가정으로 확대되어야 한다. 여기서 주의할 점은 개별 독립변수 하나하나와 종속변수 간에 통계적으로 유의한 선형관계가 있다는 의미가 아니라는 것이다.(가정이 지켜지지 않는 현상을 다중공선성이라고 함)

 

18.세 개의 이동통신사 고객들의 월평균 요금에 차이가 있는가를 비교하기 위해 가장 적절한 분석방법은?    (5점)
  ①카이제곱 검정
  ②t검정
  ③회귀분석
  ④분산분석
정답 해설
4 세 개의 모집단에서 표본을 뽑아 모집단 평균 차이를 분석하는 방법은 분산분석이다.

 

19.다음 설명 중 잘못된 것은?    (5점)
  ①분산분석은 두 개 이상의 모집단에 대한 모평균의 차이를 비교할 때 사용하는 통계적 기법이다.
  ②분산분석은 모집단을 구분하는 기준 혹은 요인의 수에 따라 일원분류분산분석, 이원분류분산분석, 삼원분류분산분석 등으로 구분된다.
  ③이원분류분산분석은 반복이 없는 이원분류분석(주효과, 교호효과)과 반복이 있는 이원분류분석으로 분류하여 검정한다.
  ④군집분석은 조사 대상자 또는 일련의 자료들을 중요한 특성별로 집단화하기 위한 분석방법이다.
정답 해설
3 이원분류분산분석은 반복이 없는 이원분류분산분석과 반복이 있는 이원분류분산분석(주효과, 교호효과)으로 분류하여 검정한다.

 

20.교호효과란 반복적으로 자료를 수집하는 이원분류분산분석에서 두 요인이 동시에 작용할 때 급간 변동이 발생하는가를 파악하는 것을 말한다.    (5점)
  ①O
  ②X
정답 해설
1 교호효과에 대한 올바른 설명이다. 이원분류분산분석은 자료를 구분하는 기준이 두 개이며 두 요인이 동시에 작용할 경우 집단간 차이가 발생하는가를 파악하는 것은 교호효과가 있는가를 보는 것이다.

728x90
728x90