기초 통계학 1

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

히스토그램의 주요 목적은 무엇인가요?

  • 모든 자료를 같은 범주로 요약하기 위해서이다.
  • 정확한 수치를 제공하기 위해서이다.
  • 자료의 대략적인 분포 형태를 파악하기 위해서이다. (correct)
  • 자료를 복잡하게 나타내기 위해서이다.

양적 자료의 분류 중 이산형 자료의 예로 옳은 것은?

  • 키와 몸무게
  • 혈압
  • 온도
  • Tumor의 개수 (correct)

상대도수는 무엇을 나타내는가?

  • 전체 자료의 평균을 나타내는 값이다.
  • 도수를 전체 자료와 비교한 비율이다. (correct)
  • 각 범주에 속하는 데이터를 전부 더한 값이다.
  • 특정 범주에 속하는 데이터를 나타내는 정확한 수치이다.

양적 변수의 범주 중 연속형 변수의 예로 적절한 것은?

<p>체중 (B)</p> Signup and view all the answers

변수의 정의에 대한 설명으로 옳지 않은 것은?

<p>모든 변수는 동일한 측정 단위를 가진다. (A)</p> Signup and view all the answers

비율척도의 특징은 무엇인가?

<p>숫자 0에 의미가 있다. (C)</p> Signup and view all the answers

표본 평균은 어떤 식으로 구해지는가?

<p>표본으로부터 구한 n개의 값을 평균내어 계산한다. (B)</p> Signup and view all the answers

질적 자료를 요약하는 방법은 무엇인가?

<p>도표나 그래프로 정리한다. (C)</p> Signup and view all the answers

최빈값의 정의는 무엇인가?

<p>가장 많이 나타나는 값을 의미한다. (C)</p> Signup and view all the answers

데이터의 중심 위치를 표현하는 측도에 포함되지 않는 것은?

<p>도수 (B)</p> Signup and view all the answers

통계학의 주된 목적은 무엇인가?

<p>의사결정에 도움이 되는 결론을 도출하는 것 (D)</p> Signup and view all the answers

의학/의생명 연구에서 통계학이 활용되는 방법 중 하나는?

<p>환자의 치료 후 효과 분석 (C)</p> Signup and view all the answers

모집단의 특성을 추정하기 위한 통계적 추론의 주 목적은 무엇인가?

<p>모집단의 특성을 나타내는 값의 도출 (D)</p> Signup and view all the answers

자료 수집의 주된 목적은 무엇인가?

<p>자료를 정리하고 해석하는 것 (D)</p> Signup and view all the answers

통계량의 정의는 무엇인가?

<p>모집단의 특성을 나타내는 수치 (B)</p> Signup and view all the answers

통계적 추론에서 모집단의 특성을 탐색하기 위해 사용하는 방법은?

<p>탐색적 데이터 분석(EDA) (B)</p> Signup and view all the answers

의료보험 청구 심사에 관한 통계 분석은 주로 무엇을 위한 것인가?

<p>효율적인 치료 확인 (B)</p> Signup and view all the answers

측정치의 정확도 판단은 어떤 과정을 통해 이루어지는가?

<p>측정 방법 비교 (A)</p> Signup and view all the answers

환자 만족도의 조사는 주로 어떤 통계적 분석을 위해 이루어지는가?

<p>의료 서비스 제반 변수와의 관계 분석 (D)</p> Signup and view all the answers

범위는 무엇으로 정의되는가?

<p>최대값과 최소값의 차이 (D)</p> Signup and view all the answers

정상치 평가의 주된 목적은?

<p>정상으로 간주되는 기준 설정 (D)</p> Signup and view all the answers

제p 백분위수가 나타내는 것은 무엇인가?

<p>p%의 자료가 그 값보다 작다 (A)</p> Signup and view all the answers

사분위수 범위(IQR)는 어떻게 계산되는가?

<p>Q3 - Q1 (B)</p> Signup and view all the answers

상자그림에서 어떤 요소를 기준으로 자료를 시각적으로 표현하는가?

<p>Q1과 Q3 (C)</p> Signup and view all the answers

제1사분위수(Q1)는 어떤 백분위수에 해당하는가?

<p>제25백분위수 (A)</p> Signup and view all the answers

자료의 퍼짐(spreading)의 정도를 어떻게 표현할 수 있는가?

<p>범위, 분산 및 표준편차 사용 (B)</p> Signup and view all the answers

제10 백분위수를 구할 때 필요한 작업은 무엇인가?

<p>자료를 오름차순으로 정렬 (C)</p> Signup and view all the answers

소수점 이하로 백분위수를 계산할 때 어떤 조치를 취해야 하는가?

<p>소수점 아래 값을 올림한다 (A)</p> Signup and view all the answers

상자그림에서 이상점은 어떻게 표시되는가?

<p>별표(*)로 표시된다 (C)</p> Signup and view all the answers

범위의 단점은 무엇인가?

<p>극단값에 민감하다 (C)</p> Signup and view all the answers

표준 정규분포의 누적 확률 분포 함수(cdf)는 어떻게 정의되는가?

<p>P(Z &lt; z) = 1 - P(Z ≤ z) (D)</p> Signup and view all the answers

다음 중 포아송 분포의 확률 질량 함수(PMF)의 올바른 식은 무엇인가?

<p>$P(X = x) = \frac{e^{-\mu} \mu^x}{x!}$ (A)</p> Signup and view all the answers

표준 정규분포의 확률 밀도 함수(f(z))는 다음 중 어떤 식으로 표현되는가?

<p>$f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{1}{2} z^2}$ (B)</p> Signup and view all the answers

포아송 분포의 파라미터 $ ewline$µ$가 4.6인 경우, $P(X = 2)$의 식은 무엇인가?

<p>$P(X = 2) = \frac{e^{-4.6} \cdot 4.6^2}{2!}$ (D)</p> Signup and view all the answers

정규분포의 평균과 분산에 대한 정보가 주어지면, 분포는 어떻게 나타나는가?

<p>Z는 평균이 0이고 분산이 1인 정규분포를 따른다. (A)</p> Signup and view all the answers

확률 밀도 함수에서 Z는 어떤 분포를 따르는가?

<p>정규분포 (D)</p> Signup and view all the answers

다음 중 포아송 분포의 특징이 아닌 것은 무엇인가?

<p>연속형 확률 분포이다. (C)</p> Signup and view all the answers

다음 중 누적 확률 분포 함수(cdf)의 주 목적인 무엇인가?

<p>특정 값 이하의 확률을 제공한다. (B)</p> Signup and view all the answers

표준편차가 아닌 것은 무엇인가?

<p>확률변수의 평균 (C)</p> Signup and view all the answers

두 확률변수가 독립일 때 공분산은?

<p>0이 된다 (C)</p> Signup and view all the answers

변동계수를 계산할 때 사용하는 식은 무엇인가?

<p>cv = s / x̄ (C)</p> Signup and view all the answers

정규분포의 특징으로 옳지 않은 것은?

<p>확률변수의 평균에 의존하지 않는다 (B)</p> Signup and view all the answers

표준정규분포에서 평균과 분산은 각각 얼마인가?

<p>0, 1 (C)</p> Signup and view all the answers

공분산의 정의는 무엇인가?

<p>한 변수가 커질 때 다른 변수의 변화 경향 (C)</p> Signup and view all the answers

정규분포의 확률밀도함수에서 평균이 다르고 분산이 같은 경우 나타나는 형태는?

<p>평균만 다르다 (B)</p> Signup and view all the answers

정규분포의 경험적인 특징에서 68%의 면적을 차지하는 구간은?

<p>±1 표준편차 (D)</p> Signup and view all the answers

표준편차와 분산의 주된 차이점은 무엇인가?

<p>표준편차는 분산의 제곱근이다 (C)</p> Signup and view all the answers

정규분포에서 분포의 형태가 결정되는 요소는?

<p>평균과 분산 (C)</p> Signup and view all the answers

변동계수의 주 사용 용도는 무엇인가?

<p>상대적 동질성을 비교하는 것 (B)</p> Signup and view all the answers

확률변수 X가 N(µ, σ²)를 따를 때, µ와 σ²는 각각 무엇을 의미하는가?

<p>평균, 분산 (B)</p> Signup and view all the answers

정규분포의 꼬리 부분의 특성은 무엇인가?

<p>꼬리 부분은 급격히 낮아져 0이 된다 (B)</p> Signup and view all the answers

수치의 극단값(outlier)을 정의하는 방법 중 하나는 무엇인가?

<p>Q1 - 1.5 x IQR (A)</p> Signup and view all the answers

아동의 신경학적 기능과 정신적 기능에 대한 연구에서 어떤 변수가 측정되었는가?

<p>손가락-손목 탭 수 (C)</p> Signup and view all the answers

Wechsler IQ 점수의 측정은 어떤 측면을 평가하는가?

<p>지능 (C)</p> Signup and view all the answers

IQR의 정의는 무엇인가?

<p>Q3와 Q1의 차이 (A)</p> Signup and view all the answers

연구에서 두 그룹의 처리 방법은 무엇인가?

<p>노출그룹과 대조군 (D)</p> Signup and view all the answers

Q1 - 3 x IQR 방정식은 무엇을 찾는 데 사용되는가?

<p>극단값 (D)</p> Signup and view all the answers

연구에서 아동의 손가락-손목 taps의 수는 어떤 손에서 측정되었는가?

<p>지배 손 (A)</p> Signup and view all the answers

Q3 + 1.5 x IQR은 무엇을 식별하는 데 사용되는가?

<p>극단값 찾기 (C)</p> Signup and view all the answers

IQ 점수를 측정하기 위해 사용된 도구는 무엇인가?

<p>Wechsler 지능검사 (A)</p> Signup and view all the answers

그룹 1과 그룹 2의 구분에서 '노출'은 어떤 그룹을 지칭하는가?

<p>두 번째 그룹 (D)</p> Signup and view all the answers

연구에서 아동의 신경학적 기능을 평가하기 위해 측정된 변수로 포함되지 않은 것은 무엇인가?

<p>체지방 지수 (A)</p> Signup and view all the answers

극단값의 하한을 찾기 위해 사용되는 식은 무엇인가?

<p>Q1 - 1.5 x IQR (D)</p> Signup and view all the answers

연구에서 어떤 변수가 수집되지 않았는가?

<p>심박수 (C)</p> Signup and view all the answers

Flashcards

통계학이란 무엇인가요?

데이터를 수집하고 정리하며 해석하여 신뢰성 있는 결론을 이끌어내는 과학의 한 분야입니다. 통계학은 숫자로 표시되는 정보를 사용하여 주어진 문제에 대한 합리적인 답을 찾는 데 도움을 줍니다.

통계학의 구성요소는 무엇인가요?

통계학은 데이터를 수집, 기술 및 표현, 그리고 결론 도출의 세 가지 주요 구성 요소로 이루어져 있습니다.

의학/의생명 자료 연구에서 통계학은 어떻게 활용될까요?

특정 질병의 진단 검사 개발 또는 효능성 평가, 정상치 평가, 치료 효과 분석, 의료보험 청구 심사 분석 등 의학 및 의생명 연구 분야에서 필수적으로 사용됩니다.

통계적 추론이란 무엇인가요?

모집단의 특성을 추론하는 과정으로, 표본 데이터를 사용하여 모집단의 특성을 추정하고 일반화합니다. 모집단의 특성을 나타내는 값을 모수라고 하며, 모수를 추정하는 데 사용되는 값을 통계량이라고 합니다.

Signup and view all the flashcards

탐색적 데이터 분석(EDA)은 무엇인가요?

통계적 추론 과정에서 모집단의 특성을 추정하기 위해 표본 데이터를 분석하는 방법입니다. 표본 데이터의 특성을 분석하여 모집단의 특성을 파악하고, 모수에 대한 추론을 수행합니다.

Signup and view all the flashcards

통계량(estimator)이란 무엇인가요?

모집단의 특성을 나타내는 값을 추정하기 위해 사용되는 값입니다. 즉, 표본 데이터를 사용하여 모집단의 특성을 추정하는 데 사용되는 값입니다.

Signup and view all the flashcards

모수(parameter)란 무엇인가요?

모집단의 특성을 수치로 나타낸 값입니다. 모집단의 평균, 분산, 표준편차 등이 모수의 예시입니다.

Signup and view all the flashcards

통계적 추론에서 모집단의 분포를 파악하는 것이 중요한 이유는 무엇인가요?

모집단의 특성을 추론하는 과정에서 모집단의 분포를 파악하는 것은 매우 중요합니다. 모집단의 분포를 파악함으로써 모수를 더 정확하게 추정하고, 통계적 추론의 신뢰성을 높일 수 있습니다.

Signup and view all the flashcards

심장 질환자의 유병률 조사에 통계학이 어떻게 사용될까요?

특정 질병의 유병률, 발생률, 원인 등을 조사하고 분석하기 위해 통계학적 방법이 활용됩니다. 예를 들어, 심장 질환자의 유병률을 조사하여 심장 질환의 위험 요인을 파악하고 예방 전략을 수립할 수 있습니다.

Signup and view all the flashcards

간호 서비스에 대한 환자 만족도 조사에 통계학이 어떻게 사용될까요?

간호 서비스에 대한 환자 만족도를 조사하고, 환자 만족도와 관련된 여러 변수들 간의 관계를 분석하여 간호 서비스의 질을 향상시키는 데 활용될 수 있습니다.

Signup and view all the flashcards

히스토그램이란?

자료를 요약하고 분석하기 위한 도구로, 자료의 분포를 시각적으로 나타내는 막대 그래프입니다. 각 막대의 높이는 해당 구간에 속하는 자료의 개수를 나타냅니다.

Signup and view all the flashcards

평균이란?

모든 자료값을 더한 후 자료의 개수로 나눈 값입니다. 자료의 대표적인 값을 나타냅니다.

Signup and view all the flashcards

도수분포표란?

데이터를 몇 개의 범주로 나누고 각 범주에 속하는 자료의 개수(빈도)를 나타냅니다. 자료의 분포를 파악하는 데 유용합니다.

Signup and view all the flashcards

질적 자료란?

질적 자료는 숫자로 표현되지 않고 범주로 분류되는 자료이며, 범주의 종류에 따라 명목척도와 순서척도로 나뉩니다.

Signup and view all the flashcards

양적 자료란?

양적 자료는 숫자로 표현되는 자료이며, 연속형 자료와 이산형 자료로 나뉩니다.

Signup and view all the flashcards

연속형 자료란?

연속형 자료는 범위 내의 모든 값을 가질 수 있는 자료이며, 키, 몸무게, 온도 등과 같이 측정 가능한 자료입니다.

Signup and view all the flashcards

이산형 자료란?

이산형 자료는 셀 수 있는 값만을 가지는 자료이며, 학생 수, 자동차 수, 사과 수 등과 같이 정수로 표현되는 자료입니다.

Signup and view all the flashcards

히스토그램의 목적은?

자료의 분포를 나타내는 그래프로, 자료의 중심 위치, 퍼짐 정도, 왜도 등을 파악하는 데 유용합니다.

Signup and view all the flashcards

자료의 중심 위치를 나타내는 방법은?

자료를 요약하는 방법으로, 자료의 대표적인 값을 나타내는 평균, 중앙값, 최빈값 등이 있습니다.

Signup and view all the flashcards

자료의 퍼짐 정도를 나타내는 방법은?

자료의 퍼짐 정도를 나타내는 방법으로, 자료의 산포도를 나타내는 척도입니다.

Signup and view all the flashcards

퍼짐 측도 (Spread Measure)

자료의 퍼짐(spreading)의 정도를 하나의 수치로 표현하는 것. 자료가 얼마나 흩어져 있는지 나타내는 척도

Signup and view all the flashcards

범위 (Range)

자료의 최대값과 최소값의 차이. 범위 = 최대값 - 최소값

Signup and view all the flashcards

백분위수 (Percentile)

자료 값 중에서 많아야 p%가 그 값보다 작고, 많아야 (100-p)%가 그 값보다 크게 되는 값. 예를 들어 제 25 백분위수는 자료 값 중 25%가 그 값보다 작고, 75%가 그 값보다 크다는 의미

Signup and view all the flashcards

사분위수 (Quartile)

자료를 오름차순으로 정렬했을 때 4등분하는 3개 위치의 값. Q1, Q2, Q3로 표시하며 Q2는 중앙값과 같다

Signup and view all the flashcards

사분위수 범위 (Interquartile Range: IQR)

제 1 사분위수(Q1)와 제 3 사분위수(Q3)의 차이. IQR = Q3 - Q1. 자료의 중간 50%의 퍼짐 정도를 나타낸다.

Signup and view all the flashcards

상자그림 (Box Plot)

자료를 상자와 선으로 표현하여 데이터의 분포를 시각적으로 보여주는 그래프. 상자는 Q1과 Q3를 나타내고, 중간 선은 중앙값을 나타낸다

Signup and view all the flashcards

이상점 (Outlier)

상자그림에서 상자 양끝에서 1.5×IQR 크기의 범위를 벗어나는 자료 값들. 이상값이나 극단값을 나타내는 것으로 판단할 수 있다.

Signup and view all the flashcards

변동계수 (Coefficient of Variation)

자료의 퍼짐을 평균으로 나눈 값. 자료의 퍼짐이 평균에 비해 얼마나 큰지 나타내는 척도

Signup and view all the flashcards

분산 (Variance)

데이터 집합의 퍼짐을 나타내는 가장 일반적인 척도. 각 데이터 값이 평균에서 얼마나 떨어져 있는지를 제곱한 값들의 평균. 분산의 제곱근은 표준편차이다.

Signup and view all the flashcards

표준편차 (Standard Deviation)

분산의 제곱근. 데이터 값이 평균에서 얼마나 떨어져 있는지 나타내는 척도. 단위는 원래 자료의 단위와 같다.

Signup and view all the flashcards

표준 정규 분포의 누적 분포 함수(cdf)란 무엇인가요?

표준 정규 분포의 누적 분포 함수(cdf)는 X가 x보다 작거나 같은 확률을 나타냅니다. 즉, Z가 z보다 작거나 같은 확률을 계산하는 데 사용됩니다.

Signup and view all the flashcards

표준 정규 분포는 무엇인가요?

표준 정규 분포는 평균이 0이고 표준 편차가 1인 정규 분포입니다. Z ~ N(0, 1)으로 표기합니다.

Signup and view all the flashcards

푸아송 분포는 무엇인가요?

푸아송 분포는 특정 시간 또는 공간 내에서 발생하는 이벤트의 횟수를 나타내는 확률 분포입니다. X ~ Poi(µ)로 표기하며, µ는 이벤트의 평균 발생 횟수입니다.

Signup and view all the flashcards

푸아송 분포에서 팩토리얼(x!) 은 무엇을 의미하나요?

푸아송 분포에서 확률을 계산하려면 x! (x 팩토리얼)을 사용해야 합니다. 이는 x개의 이벤트가 발생할 수 있는 경우의 수를 나타냅니다.

Signup and view all the flashcards

푸아송 분포의 평균(µ)은 무엇을 의미하나요?

푸아송 분포의 평균(µ)은 시간 또는 공간 내에서 발생하는 이벤트의 평균 횟수입니다. 예를 들어, 시간당 평균 4.6개의 고객이 방문한다면, µ = 4.6입니다.

Signup and view all the flashcards

푸아송 분포에서 e^µ (µ의 지수)는 무엇을 의미하나요?

푸아송 분포에서 확률을 계산하려면 e^µ (µ의 지수)를 사용해야 합니다. e는 자연 로그의 밑이며 약 2.718입니다.

Signup and view all the flashcards

푸아송 분포에서 µ^x (µ 의 x승)은 무엇을 의미하나요?

푸아송 분포에서 µ^x (µ 의 x승)는 시간 또는 공간 내에 x개의 이벤트가 발생할 확률에 영향을 미칩니다. x가 클수록 이 확률은 증가합니다.

Signup and view all the flashcards

이상치란 무엇일까요?

데이터 집합에서 다른 값들과 현저히 다른 값을 의미합니다. 즉, 데이터의 일반적인 패턴에서 벗어난 값을 말합니다.

Signup and view all the flashcards

상자 그림에서 수염(Whisker)은 무엇을 나타낼까요?

상자 그림의 양쪽 끝에 있는 선분으로, 데이터 집합의 최솟값과 최댓값을 나타냅니다. 즉, 이상치를 제외한 데이터의 최소값과 최대값을 보여줍니다.

Signup and view all the flashcards

상자 그림에서 중간 선(Q2)은 무엇을 나타낼까요?

상자 그림에서 상자의 중간에 있는 선으로, 데이터 집합의 중앙값(Median)을 나타냅니다.

Signup and view all the flashcards

상자 그림에서 아래쪽 선(Q1)은 무엇을 나타낼까요?

상자 그림에서 상자의 아래쪽 선으로, 데이터 집합의 1사분위수(Q1)를 나타냅니다. 즉, 데이터 집합을 크기 순으로 정렬했을 때 아래에서 25% 지점에 해당하는 값을 의미합니다.

Signup and view all the flashcards

상자 그림에서 위쪽 선(Q3)은 무엇을 나타낼까요?

상자 그림에서 상자의 위쪽 선으로, 데이터 집합의 3사분위수(Q3)를 나타냅니다. 즉, 데이터 집합을 크기 순으로 정렬했을 때 아래에서 75% 지점에 해당하는 값을 의미합니다.

Signup and view all the flashcards

IQR(Interquartile Range)이란 무엇일까요?

1사분위수(Q1)와 3사분위수(Q3)의 차이를 말하며, 데이터 집합의 산포 정도를 나타냅니다. IQR이 클수록 데이터의 산포가 크고, IQR이 작을수록 데이터의 산포가 작습니다.

Signup and view all the flashcards

상자 그림에서 이상치를 판별하는 기준은 무엇일까요?

IQR(Interquartile Range)의 1.5배를 1사분위수(Q1)에서 빼고, IQR(Interquartile Range)의 1.5배를 3사분위수(Q3)에 더한 값입니다. 즉, 데이터 집합의 일반적인 범위를 벗어난 이상치를 판별하는 기준이 됩니다.

Signup and view all the flashcards

상자 그림에서 매우 극단적인 이상치를 판별하는 기준은 무엇일까요?

IQR(Interquartile Range)의 3배를 1사분위수(Q1)에서 빼고, IQR(Interquartile Range)의 3배를 3사분위수(Q3)에 더한 값입니다. 즉, 데이터 집합에서 매우 극단적인 이상치를 판별하는 기준이 됩니다.

Signup and view all the flashcards

분산(Variance)이란 무엇일까요?

데이터 집합의 분산 정도를 나타내는 값으로, 각 데이터 값과 평균 값의 차이를 제곱한 값을 모두 더한 후 데이터 개수에서 1을 뺀 값으로 나눈 값입니다. 분산이 클수록 데이터가 평균에서 멀리 떨어져 있고, 분산이 작을수록 데이터가 평균에 가깝게 분포되어 있습니다.

Signup and view all the flashcards

표준 편차(Standard Deviation)는 무엇일까요?

데이터 집합의 분산 정도를 나타내는 값으로, 분산의 제곱근입니다. 표준 편차는 데이터 집합의 평균과 각 데이터 값 사이의 평균적인 거리를 나타냅니다. 표준 편차가 클수록 데이터가 평균에서 멀리 떨어져 있고, 표준 편차가 작을수록 데이터가 평균에 가깝게 분포되어 있습니다.

Signup and view all the flashcards

상자 그림은 어떤 연구 결과를 보여주고 있을까요?

납 노출이 아이들의 신경학적 기능과 정신적 기능에 미치는 영향을 연구한 의학 연구 결과를 나타낸 상자 그림입니다. 그림을 통해 납에 노출된 그룹과 그렇지 않은 그룹의 신경학적 기능과 정신적 기능의 차이를 비교 분석할 수 있습니다.

Signup and view all the flashcards

상자 그림에서 MAXFWT는 무엇을 나타낼까요?

상자 그림에서 데이터의 최댓값은 무엇을 나타낼까요?

Signup and view all the flashcards

상자 그림에서 IQF는 무엇을 나타낼까요?

상자 그림에서 데이터의 최솟값을 나타내는 것은 무엇일까요?

Signup and view all the flashcards

상자 그림은 어떤 목적으로 사용될 수 있을까요?

납에 노출된 그룹과 그렇지 않은 그룹의 신경학적 기능과 정신적 기능 데이터를 비교 분석하여 납 노출이 아이들의 신경학적 기능과 정신적 기능에 미치는 영향을 객관적으로 파악할 수 있는 통계적 방법입니다.

Signup and view all the flashcards

표준 편차

데이터의 산포도를 측정하는 값으로, 데이터가 평균에서 얼마나 떨어져 있는지를 나타냅니다. 데이터의 분산의 제곱근으로 계산됩니다.

Signup and view all the flashcards

분산

데이터의 산포도를 측정하는 값으로, 데이터가 평균에서 얼마나 떨어져 있는지를 나타냅니다.

Signup and view all the flashcards

공분산

확률 변수 X와 Y의 관계를 나타내는 척도로, X가 평균보다 커질 때 Y가 평균보다 커지는 경향이 있는지를 측정합니다.

Signup and view all the flashcards

상관 계수

두 확률 변수의 관계를 나타내는 척도로, 공분산을 두 변수의 표준 편차로 나눈 값입니다. -1과 1 사이의 값을 가지며, 1에 가까울수록 양의 상관관계가 강하고, -1에 가까울수록 음의 상관관계가 강합니다.

Signup and view all the flashcards

변동 계수

평균으로 나눈 표준 편차로, 데이터의 산포도를 평균과 비교하여 상대적으로 나타낸 값입니다. 데이터의 상대적인 변동성을 측정하는 데 사용합니다.

Signup and view all the flashcards

정규 분포

연속 확률 분포 중 가장 중요한 분포로, 대칭적인 종 모양을 가지고 있으며 평균과 분산에 의해 형태가 결정됩니다. 많은 자연 현상과 사회 현상에서 나타나는 분포입니다.

Signup and view all the flashcards

정규 분포 확률 밀도 함수

정규 분포의 확률 밀도 함수는 평균으로부터 멀어질수록 값이 감소하는 형태이며, 평균과 분산에 의해 그 형태가 달라집니다. 특정 값을 가질 확률을 계산하는 데 사용됩니다.

Signup and view all the flashcards

정규 분포 누적 분포 함수

정규 분포의 확률 밀도 함수를 적분한 함수로, 특정 값보다 작거나 큰 확률을 계산하는 데 사용됩니다.

Signup and view all the flashcards

정규 분포의 경험적 특징

정규 분포에서 평균을 기준으로 표준 편차 값을 바탕으로 데이터가 분포하는 비율을 나타냅니다. 예를 들어, 약 68%의 데이터는 평균에서 표준 편차 1개 범위 내에, 약 95%의 데이터는 평균에서 표준 편차 2개 범위 내에, 약 99.7%의 데이터는 평균에서 표준 편차 3개 범위 내에 분포합니다.

Signup and view all the flashcards

중심 극한 정리

표본 평균의 분포가 정규 분포에 가까워지는 경향을 나타냅니다. 표본 크기가 커질수록 표본 평균의 분포는 더 정확하게 정규 분포에 가까워집니다.

Signup and view all the flashcards

통계적 추론

모집단에서 추출한 표본에 대한 통계량을 사용하여 모집단의 특성을 추론하는 과정입니다.

Signup and view all the flashcards

탐색적 데이터 분석

표본 데이터의 특성을 분석하여 모집단의 특성을 파악하고 모집단의 특성에 대한 추론을 수행하는 방법입니다.

Signup and view all the flashcards

통계량

모집단의 특성을 나타내는 값을 추정하기 위해 사용되는 표본 값입니다.

Signup and view all the flashcards

모수

모집단의 특성을 나타내는 값입니다. 모집단의 평균, 분산, 표준 편차 등은 모두 모수입니다.

Signup and view all the flashcards

모집단의 분포 파악의 중요성

모집단의 분포를 파악하여 모수를 더 정확하게 추정하고, 통계적 추론의 신뢰성을 높일 수 있습니다.

Signup and view all the flashcards

Study Notes

기초 통계학 1

  • 통계학은 주어진 문제에 대해 합리적인 해답을 제시하기 위해 수치 데이터를 수집, 정리, 분석하고 신뢰할 수 있는 결론을 도출하는 과학 분야임.
  • 통계학자는 통계학을 연구하고 활용하는 전문가임.
  • 통계량은 통계적 분석에서 사용되는 수치적 지표임.
  • 통계 자료는 측정치 또는 질적자료로 구성됨.

통계학의 구성

  • 자료 수집
  • 자료 기술 및 표현
  • 자료로부터 결론 도출(의사결정)

자료형태

  • 질적 자료: 성별, 혈액형과 같이 범주로 분류되는 자료.
    • 명목척도: 범주 간에 순서가 없음 (예: 성별, 혈액형).
    • 서열척도: 범주 간에 순서가 있음 (예: 학년).
  • 양적 자료: 나이, 키, 수입과 같이 숫자로 표현되는 자료
    • 이산형 자료: 정수로 표현되는 자료 (예: 사람 수, 학생 수)
    • 연속형 자료: 실수로 표현되는 자료(예: 키, 몸무게)

통계적 추론

  • 표본으로부터 모집단의 특징을 추론하는 과정
  • 추정: 모수(모집단의 특징) 추정 값을 제시하는 것.
  • 가설 검정: 모수에 대한 가설을 검정하는 방식.

기초 통계 측도

  • 중심 위치 측도: 평균, 중앙값, 최빈값.
    • 평균: 자료값의 합을 자료 개수로 나눈 값.
    • 중앙값: 자료를 크기 순으로 정렬했을 때, 정중앙에 위치하는 값.
    • 최빈값: 자료 중에서 가장 빈도가 높은 값.
  • 산포 측도: 범위, 사분위수 범위, 분산, 표준편차, 변동계수
    • 범위: 최대값과 최소값의 차이
    • 사분위수 범위: 제3사분위수 값과 제1사분위수 값의 차이
    • 분산: 평균으로부터 자료값들이 흩어져 있는 정도.
    • 표준편차: 분산의 제곱근으로, 자료의 흩어진 정도를 나타냄.
    • 변동계수: 표준편차를 평균으로 나눈 값, 상대적인 분산 정도를 보여주는 지표.
  • 최빈값: 가장 자주 나타나는 데이터 값
  • 상자 그림(box plot): 자료의 분포를 시각적으로 보여주는 도표.

정규 분포

  • 정규 분포는 연속적인 확률 분포의 일종으로 가우스 분포라 불린다.
  • 대칭적이고 종 모양을 하고 있으며 평균, 표준편차에 의해 특징이 결정된다.
  • 정규 분포는 자료의 분포를 분석하는 데 매우 중요한 분포임.
  • 특히, 표준정규분포는 평균 0, 표준편차 1인 정규분포이며, 확률 계산에 널리 활용됨.

기술 통계량

  • 도수, 상대도수, 도수분포표, 히스토그램과 같은 통계적 도표.
  • 원형 그래프, 막대 그래프와 같은 차트 도표.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Uso Moderado de la Estadística
21 questions
Basic Concepts in Statistics
45 questions

Basic Concepts in Statistics

PleasantHamster9602 avatar
PleasantHamster9602
Use Quizgecko on...
Browser
Browser