통계학: 가설 검정 및 Wilcoxon 검정

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

Wilcoxon signed rank test의 주요 목적은 무엇인가?

  • 우연적 분포의 적합성을 검정하기 위해
  • 그룹 간의 평균 차이를 분석하기 위해
  • 모집단의 정규성을 검정하기 위해
  • 한 그룹의 평균이 모집단의 특성을 대표하는지를 확인하기 위해 (correct)

정규성 검정에서 사용되는 방법이 아닌 것은 무엇인가?

  • Shapiro-Wilk test
  • Kolmogorov-Smirnov test
  • QQ-plot
  • ANOVA 분석 (correct)

귀무가설이 기각되는 경우는 어떤 경우인가?

  • 평균 차이가 완전히 없을 때
  • 우연적이지 않은 평균 차이가 발견될 때 (correct)
  • 모든 데이터가 동일할 때
  • 데이터가 정상적으로 분포할 때

Shapiro-Wilk test의 목적은 무엇인가?

<p>정규분포의 적합성을 검정하기 위해 (C)</p> Signup and view all the answers

가설검정에서 귀무가설이 맞다는 가정 하에 관측되기 어려운 경우는 무엇을 의미하는가?

<p>통계적으로 유의미한 차이가 있을 때 (A)</p> Signup and view all the answers

총 변동은 무엇에 의해 정의되나요?

<p>집단 간 변동과 집단 내 변동의 합 (A)</p> Signup and view all the answers

다음 중 집단 내 변동을 설명하는 데 적합한 것은 무엇인가요?

<p>개별 데이터 포인트의 분산 (C)</p> Signup and view all the answers

SStreat의 의미는 무엇인가요?

<p>집단 사이의 총 변동 (D)</p> Signup and view all the answers

다음 중 집단 간 변동을 잘 설명하는 것은 무엇인가요?

<p>집단 평균 간의 차이 (A)</p> Signup and view all the answers

변동을 나타내는 두 가지 유형은 무엇인가요?

<p>집단 내 변동과 집단 간 변동 (A)</p> Signup and view all the answers

말기 신장 질환(ESKD) 환자와 일반 인구 간의 암 발생률은 어떻게 다른가?

<p>말기 신장 질환 환자의 암 발생률이 일반 인구보다 높다. (C)</p> Signup and view all the answers

연구에서 신장 이식 환자와 비교하여 말기 신장 질환 환자가 소화관 암 위험이 얼마나 증가했는가?

<p>1.9배 증가 (B)</p> Signup and view all the answers

연구에서 사용할 수 있는 암 검진 가이드라인의 주요 참고 사항은 무엇인가?

<p>소화관 암의 발생 빈도 (D)</p> Signup and view all the answers

연구의 조정된 위험 비율(1.9)에서 신뢰 구간은 무엇인가?

<p>1.31–2.81 (A)</p> Signup and view all the answers

어떤 기관이 이 연구를 수행했는가?

<p>아주대학교 의과대학 (A)</p> Signup and view all the answers

말기 신장 질환 환자군이 소화관 암에 걸릴 확률은 일반 인구에 비해 어떤 특성을 가지는가?

<p>높은 암 발생 위험 (A)</p> Signup and view all the answers

연구에서 제시된 P 값은 무엇인가?

<p>0.001 (A)</p> Signup and view all the answers

말기 신장 질환 환자의 암 발생률과 관련된 연구에서의 주요 데이터 출처는 무엇인가?

<p>실제 연구 데이터 (C)</p> Signup and view all the answers

두 그룹의 평균을 비교하기 위해 사용하는 통계적 방법은 무엇인가?

<p>t-검정 (A)</p> Signup and view all the answers

그룹 간 분산이 정의되는 방법은 무엇인가?

<p>각 그룹의 관측값 차이의 제곱의 평균 (B)</p> Signup and view all the answers

변동이 크지 않은 경우 어떤 결론을 내릴 수 있는가?

<p>집단 간의 차이가 없다고 할 수 있다. (C)</p> Signup and view all the answers

다음 중 신뢰 구간을 계산할 때 고려해야 할 요소는 무엇인가?

<p>표본 크기 (C)</p> Signup and view all the answers

두 개의 그룹 간의 차이가 통계적으로 유의미하다고 판단하는 기준은 무엇인가?

<p>p 값이 0.05 이하일 때 (A)</p> Signup and view all the answers

다음 중 예측 분석에 사용되지 않는 방법은 무엇인가?

<p>t-검정 (A)</p> Signup and view all the answers

집단 간 분산이 유의미하다고 결론을 내릴 수 있는 식별 기준은 무엇인가?

<p>q 값과 p 값의 비교 (D)</p> Signup and view all the answers

두 집단 평균의 차이를 나타내는 지표는 무엇인가?

<p>효과 크기 (A)</p> Signup and view all the answers

다음 중 가설에 대한 설명으로 올바른 것은 무엇인가?

<p>가설은 검증 가능한 예측이 있어야 한다. (A)</p> Signup and view all the answers

L/ = 1에서 L (B − 1, 8 − B) 조건을 만족하지 않을 때의 행동은 무엇인가?

<p>가설을 기각한다. (C)</p> Signup and view all the answers

다음 중 E의 정의가 올바른 것은 무엇인가?

<p>E는 변수의 결과를 표현한다. (A)</p> Signup and view all the answers

B8 G의 의미에 대한 이해가 올바른 것은 무엇인가?

<p>B8 G는 가설 검증의 기준이다. (A)</p> Signup and view all the answers

다음 중 L/ = 1의 의미로 가장 적절한 것은 무엇인가?

<p>최소한의 데이터를 사용한다는 의미이다. (B)</p> Signup and view all the answers

H ?# ~ @@I &에서 'H'는 무엇을 나타내는가?

<p>가설의 변수 중 하나이다. (A)</p> Signup and view all the answers

Variation의 정의는 무엇인가요?

<p>값들의 집합에서의 차이를 측정하는 것 (B)</p> Signup and view all the answers

Within-group variation을 설명하는 것은?

<p>각 그룹 내의 개별 값 간의 차이 (C)</p> Signup and view all the answers

다음 중 ?F

<p>이는 데이터 분석의 일부분으로 가정된다. (C)</p> Signup and view all the answers

가설의 결과를 평가하는 과정에서의 중요 요소는 무엇인가?

<p>결과에 대한 명확한 결론이 필요하다. (B)</p> Signup and view all the answers

다음 식에서 '$!+#!+#$'의 해는 무엇인가요?

<p>실제 수가 아닐 수 있음 (D)</p> Signup and view all the answers

다음 중 $!+#!+#$-$!+#!+$의 의미는 무엇인가요?

<p>대비되는 두 그룹 간의 차이 (D)</p> Signup and view all the answers

다음 표현 '$!+#!+#~ ~&(('의 주된 목표는 무엇인가요?

<p>상관관계를 수학적으로 정의하는 것 (A)</p> Signup and view all the answers

Variation의 중요한 특징은 무엇인가요?

<p>데이터의 배분 형태에 따라 달라진다. (D)</p> Signup and view all the answers

다음 중 '$!

<p>零, 隐藏信息, 理解 (B)</p> Signup and view all the answers

Variation을 구하기 위한 수식에서 가장 많이 사용되는 자료형은 무엇인가요?

<p>정수 (D)</p> Signup and view all the answers

Flashcards

정규성 검정

데이터가 정규분포를 따르는지 확인하는 검정 방법입니다. 정규분포를 따른다면 모수적 방법을 사용할 수 있습니다. 그렇지 않다면 비모수적 방법을 사용합니다.

Shapiro-Wilk 검정

표본 크기가 작을 때 정규성을 검정하는 방법입니다. Shapiro-Wilk 검정은 데이터가 정규분포를 따른다는 귀무가설을 검정합니다.

Kolmogorov-Smirnov 검정

표본 크기가 클 때 정규성을 검정하는 방법입니다. Kolmogorov-Smirnov 검정은 데이터가 임의 분포를 따른다는 귀무가설을 검정합니다.

QQ-plot, 왜도, 첨도

데이터의 분포를 시각적으로 확인하는 방법입니다. QQ-plot, 왜도, 첨도를 통해 정규성을 대략적으로 판단할 수 있습니다.

Signup and view all the flashcards

가설 검정

모집단의 특정 값(예: 평균)이 특정 값을 가진다는 귀무가설을 검정합니다. 관측된 데이터가 귀무가설 하에서 예상되는 분포에서 벗어나면 귀무가설을 기각합니다.

Signup and view all the flashcards

t-검정

두 그룹의 평균 차이를 비교하는 데 사용되는 통계적 검정입니다.

Signup and view all the flashcards

분산(variance)

분산은 데이터의 퍼짐 정도를 나타내는 척도입니다.

Signup and view all the flashcards

집단 간 분산 비교

두 집단의 분산을 비교하여 집단 간 분산이 큰지 또는 작은지 확인합니다.

Signup and view all the flashcards

z0

t-검정에서 두 그룹의 평균 차이를 계산하는 데 사용되는 값입니다.

Signup and view all the flashcards

총 분산(total variance)

전체 데이터의 분산을 나타내는 척도입니다.

Signup and view all the flashcards

p-값

t-검정 결과를 해석하는 데 사용되는 값입니다.

Signup and view all the flashcards

평균 비교

두 집단의 평균을 비교하는 통계적 방법입니다.

Signup and view all the flashcards

변동 분석

데이터의 변동을 분석하고 데이터와 관련된 통계적 결론을 도출하는 과정입니다.

Signup and view all the flashcards

집단 간 변동 비율

전체 데이터의 변동 중 집단 간 변동이 차지하는 비율을 나타냅니다. 집단 간 변동이 클수록 그룹 간 차이가 크다고 해석할 수 있습니다.

Signup and view all the flashcards

집단 내 변동 비율

전체 데이터의 변동 중 집단 내 변동이 차지하는 비율을 나타냅니다. 집단 내 변동이 클수록 그룹 내 데이터의 퍼짐이 크다고 해석할 수 있습니다.

Signup and view all the flashcards

분산 분석 (ANOVA)

분산 분석(ANOVA)은 데이터의 변동을 분석하고, 그룹 간 차이를 검정하는 통계적 기법입니다. 집단 간 변동과 집단 내 변동을 비교하여 집단 평균 간 유의미한 차이가 있는지 확인합니다.

Signup and view all the flashcards

총 변동 (Total Variance)

총 변동은 전체 데이터의 변동을 나타내는 척도입니다. 집단 간 변동과 집단 내 변동의 합입니다.

Signup and view all the flashcards

회귀 분석

두 변수 간의 관계를 분석하는 방법입니다. 회귀 분석은 한 변수가 다른 변수의 변화에 따라 어떻게 변하는지 분석합니다.

Signup and view all the flashcards

가설 검정이란 무엇인가요?

가설 검정은 데이터를 분석하여 모집단에 대한 가설을 검증하는 통계적 방법입니다. 데이터가 가설과 일치하는지 또는 가설을 기각할 만큼 충분히 다르게 나타나는지 분석합니다.

Signup and view all the flashcards

귀무 가설이란 무엇인가요?

귀무 가설은 검증하려는 가설의 반대 개념입니다. 데이터를 분석하여 귀무 가설을 기각할 만큼 충분한 증거가 있는지 확인합니다.

Signup and view all the flashcards

대립 가설이란 무엇인가요?

대립 가설은 귀무 가설의 반대 개념으로, 검증하려는 가설을 의미합니다. 귀무 가설을 기각할 만큼 충분한 증거가 있다면 대립 가설을 채택합니다.

Signup and view all the flashcards

유의 수준(α)이란 무엇인가요?

유의 수준(α)은 귀무 가설을 기각할 확률을 나타냅니다. 일반적으로 0.05 또는 0.01을 사용하며, 유의 수준이 낮을수록 귀무 가설을 기각하기 어려워집니다.

Signup and view all the flashcards

p-값이란 무엇인가요?

p-값은 귀무 가설이 참일 때 관측된 데이터와 같거나 더 극단적인 데이터를 얻을 확률입니다. p-값이 유의 수준보다 작으면 귀무 가설을 기각합니다.

Signup and view all the flashcards

검정 통계량이란 무엇인가요?

검정 통계량은 관측된 데이터를 요약하여 귀무 가설을 검증하는 데 사용하는 값입니다. 검정 통계량은 데이터의 분포, 표본 크기, 가설에 따라 다릅니다.

Signup and view all the flashcards

기각 역역이란 무엇인가요?

기각 역역은 귀무 가설을 기각할 만큼 충분히 극단적인 검정 통계량의 값을 나타냅니다. 유의 수준과 검정 통계량의 분포에 따라 결정됩니다.

Signup and view all the flashcards

가설 검정의 중요성은 무엇인가요?

가설 검정은 데이터 분석에서 중요한 도구입니다. 새로운 가설을 검증하고 데이터에 대한 통찰력을 얻는 데 도움이 됩니다.

Signup and view all the flashcards

말기 신장 질환의 암 발병률

말기 신장 질환 환자는 일반인보다 암 발병률이 높다고 보고되었습니다.

Signup and view all the flashcards

말기 신장 질환과 소화기암의 연관성

말기 신장 질환 환자는 일반인에 비해 소화기암 발병 위험이 높았습니다. (위험 비율=1.9; 95% 신뢰 구간: 1.31~2.81; p < 0.001)

Signup and view all the flashcards

연구의 중요성

이 연구 결과는 암 검진 지침에 유용한 정보가 될 수 있습니다.

Signup and view all the flashcards

말기 신장 질환 (ESKD)

말기 신장 질환 (ESKD)는 만성 신장 질환의 마지막 단계로, 신장 기능이 거의 또는 완전히 상실된 상태입니다.

Signup and view all the flashcards

말기 신장 질환의 치료

말기 신장 질환 환자는 신장 기능이 매우 저하되어 혈액투석이나 신장 이식 등의 치료가 필요합니다.

Signup and view all the flashcards

말기 신장 질환과 암 검진

말기 신장 질환 환자는 암 발병 위험이 높아 암 검진을 통해 조기 발견 및 치료가 중요합니다.

Signup and view all the flashcards

연구 수행 기관

이 연구는 한국 아주대학교 의과대학 신장내과 교수팀이 수행했습니다.

Signup and view all the flashcards

연구의 의의

이 연구는 암 검진 지침을 개선하는 데 도움이 될 수 있는 중요한 연구입니다. 특히, 말기 신장 질환 환자는 암 발병 위험이 높으므로 주의 깊은 검진이 필요합니다.

Signup and view all the flashcards

Study Notes

연속형 자료분석 이론

  • 연속형 자료 분석 이론에 대한 내용
  • 강의자는 박범희 교수이며 아주대학교 의과대학 소속이다.
  • 이메일 주소는 [email protected]이다.
  • 자료의 무단 복제 및 배포는 금지된다.

대표적 평균 비교 분석 방법

  • 모수적 방법과 비모수적 방법으로 평균 비교 분석 방법이 나뉘며,
  • 두 그룹 간 비교와 두 그룹 이상 비교에 대한 분석 방법들이 설명되어 있다.
  • 독립 표본 t검정, 대응 표본 t검정, ANOVA, Wilcoxon rank sum test, Wilcoxon signed rank test, Kruskal Wallis test, Mann-Whitney U test 등 다양한 방법들이 소개된다.
  • 각 방법의 적용 조건과 사용 시기에 대한 설명이 포함되어 있다.
  • 한 그룹의 평균/중앙값이 그 집단의 특징을 잘 대표하는지에 대한 질문 제시

모집단의 분포에 대한 정규성 검정

  • 정규성 검정 방법 설명
  • Shapiro-Wilk 검정과 Kolmogorov-Smirnov 검정은 표본의 크기에 따라 활용하는 방법이 다르다
  • 목적은 정규 분포의 적합성을 확인하고 가설을 검정하는 것
  • 가설 설정 : 정규 분포를 따른다 vs 임의 분포를 따른다
  • 각 검정 방법이 적용될 수 있는 상황에 대한 설명

한 그룹의 평균이 그 집단의 특징을 잘 대표하는가?

  • 한 그룹의 평균이 그 집단을 대표하는지에 대한 질문과 가설검정
  • 통계적 차이 유무 판단
  • 관측 값과 귀무가설에 대한 분포 차이에 대한 설명

두 집단의 평균 비교 (t-검정)

  • 두 집단의 평균 비교를 위한 t-검정에 대한 내용
  • t-검정의 가정(정규성, 독립성, 등분산성)
  • t-통계량 계산 방법
  • 귀무가설(두 집단의 평균이 같다)과 대립가설(두 집단의 평균이 다르다)에 대한 내용
  • 유의 수준에 따른 결정 규칙

두 집단의 평균 비교 (t-검정) 2

  • 두 집단의 평균 비교 (계속) - 등분산성을 가정하지 않는 t-검정
  • 두 집단의 평균이 같은지에 대한 가설 설정
  • Welch's t-검정(등분산성 불균형), 두 표본 평균의 차이
  • 두 표본 평균의 표준 오차(t-통계량) 구하는 공식

평균 비교와 변동

  • 두 그룹 이상 비교에서 분산의 역할
  • 귀무가설(두 집단의 평균이 같다.) vs 대립가설(두 집단의 평균이 다르다)
  • 그룹 내 변동과 그룹 간 변동의 분해
  • t-통계량 계산 방법 및 공식

예제: 독립 표본 t-검정

  • 부모의 흡연 여부와 신생아 건강 간의 관계를 분석하는 예제
  • 두 표본(흡연/비흡연) 간 유의미한 차이 존재 여부
  • 통계적 유의성(p-value) 검정
  • 신뢰구간

예제: 대응 표본 t-검정

  • 비만 여성의 음식 조절 전후 체중 변화를 분석하는 예제
  • 두 시점(전/후)의 데이터를 비교하는 대응 표본 t-검정
  • 차이가 있는지 판단

그룹을 나누는 요인이 하나 더 있다면?

  • 어떤 요인에 따라 두 집단 이상의 평균 비교
  • 혈압 측정, 식이요법에 따른 그룹 분할
  • 그룹별 평균, 남/여 구분, 비율

일원 분산분석(ANOVA)

  • 두 그룹 또는 그 이상의 집단 평균 비교
  • 데이터 구조, 가정 설정
  • 그룹 간 평균 비교, 관측값을 이용한 변동량(SS) 계산
  • 변동원(SST, SStreat, SSE)으로 나누고 검정
  • F-검정 통계량 사용

변동의 분해

  • 변동 분석을 통한 원인 찾기(SS)
  • 관찰 값, 전체 평균 편차, 그룹별 평균 편차, 분산
  • 총변동(SST), 그룹 간 변동(SStreat), 그룹 내 변동(SSE)
  • 통계 분석을 위한 변동 분해

ANOVA table & F-test

  • ANOVA 표와 F-검정 내용
  • 여러 그룹의 평균이 동일한지 확인
  • 귀무가설 설정과 F 통계량, p-value 계산

예제1

  • 흡연 형태에 따라 남성의 폐 기능 변화(FEF)
  • 그룹 간 FEF의 평균 차이 분석

예제1 (계속)

  • 흡연 형태에 따른 FEF 데이터 분석을 위한 ANOVA 검정
  • 그룹 간 FEF 데이터의 차이 검정

ANOVA 사례

  • 다양한 현실 세계 연구에서 ANOVA 적용 예시
  • 질병, 질환, 환경 등 변수별 데이터 차이 검증

반복수가 다른 경우

  • 데이터 구조, 평균 계산 공식, 변동(SS)의 표현
  • 여러 그룹의 평균 비교, 반복수 차이 고려

Post-hoc comparisons after F-test

  • F 검정 후 그룹 간 평균 차이 검정
  • LSD, Duncan's LSR, SNK, Tukey's HSD, Scheffe, Bonferroni, FDR 등 다양한 후속 검정 방법,
  • 각 방법의 특징과 사용 시기

그룹을 나누는 요인이 하나 더 있다면?

  • 두 가지 이상의 요인에 의한 그룹 분할
  • 혈압, 식이요법, 성별 등 두 가지 이상 변수 고려
  • 이들을 통한 그룹 평균 차이

Two-way ANOVA with interaction

  • 두 가지 이상의 요인에 따른 효과 분석
  • 요인 간 상호작용 고려, 반복수 고려 안했을 때 interaction 항 필요 없음

결론

  • 강의자(박범희 교수)가 작성한 자료에 대한 내용
  • 다양한 통계적 방법과 개념 제시
  • 실제 데이터 분석 방법과 예제 포함

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser