상관계수와 통계적 가설 검정 퀴즈

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

Pearson 상관계수에서 r 값이 1에 가까운 경우 무엇을 의미하는가?

  • 상관관계가 약하다.
  • 연관성이 없다.
  • 음의 상관관계가 강하다.
  • 양의 상관관계가 강하다. (correct)

H0: ρ = 0에 대한 대립 가설 H1은 무엇인가?

  • ρ < 0 (correct)
  • ρ ≠ 0 (correct)
  • ρ > 1
  • ρ = 0

T 통계량이 t_α,n 보다 작을 때 무엇을 해야 하는가?

  • H0를 기각한다. (correct)
  • 검정을 진행한다.
  • 데이터를 무시한다.
  • H0를 채택한다.

R 값이 0인 경우는 무엇을 나타내는가?

<p>선형관계가 없다. (C)</p> Signup and view all the answers

상관계수의 추론에서 H1: ρ > 0을 채택할 조건은 무엇인가?

<p>T &gt; t_α,n (D)</p> Signup and view all the answers

조사에서 사용된 공식의 AUC 값은 얼마인가?

<p>0.835 (C)</p> Signup and view all the answers

신경심리 변수와 관련 있는 기능적 연결성(FC)은 무엇에 대한 것인가?

<p>수면무호흡증 (D)</p> Signup and view all the answers

제공된 공식에 포함된 진단 검사 요소는 무엇인가?

<p>신체 검사 (A)</p> Signup and view all the answers

표본상관계수의 정의는 무엇인가?

<p>모수의 추정량으로 특정 모집단을 나타낸다. (C)</p> Signup and view all the answers

상관계수의 특징 중 틀린 것은 무엇인가?

<p>상관계수는 항상 양수이다. (C)</p> Signup and view all the answers

연구에서 사용된 민감도 값은 얼마인가?

<p>0.776 (D)</p> Signup and view all the answers

표본상관계수의 수식을 올바르게 기술한 것은 무엇인가?

<p>$r = \frac{Cov(X, Y)}{S_{xx}S_{yy}}$ (A)</p> Signup and view all the answers

이 연구의 자금 지원 기관은 무엇인가?

<p>한국 정부 (D)</p> Signup and view all the answers

상관계수 $ ho$의 기호는 무엇을 나타내는가?

<p>모집단의 상관계수 (A)</p> Signup and view all the answers

연구에 기반하여 적합한 공식을 선택하는 기준은 무엇인가?

<p>응용의 용이성 (A)</p> Signup and view all the answers

표본상관계수 $r$의 계산에서 중요한 요소는 무엇인가?

<p>각 변수의 편차의 곱 (D)</p> Signup and view all the answers

이 연구는 어떤 질환에 대한 평가를 다루고 있는가?

<p>폐쇄성 수면 무호흡증 (A)</p> Signup and view all the answers

임상 예측 공식을 위한 교차 검증의 결과는 어땠는가?

<p>모델의 적합성이 뛰어나다. (A)</p> Signup and view all the answers

상관계수 식에 포함되는 'Cov(X, Y)'는 무엇을 나타내는가?

<p>X와 Y의 공분산 (C)</p> Signup and view all the answers

상관관계를 측정할 때 중요한 값은 무엇인가?

<p>상관계수의 절대값 (A)</p> Signup and view all the answers

상관계수가 0에 가까운 경우 무엇을 의미하는가?

<p>둘 간의 관계가 없다. (A)</p> Signup and view all the answers

H0가 기각되면 무엇이 성립하는가?

<p>두 변수 간에는 통계적으로 유의미한 선형의 상관관계가 있다. (D)</p> Signup and view all the answers

T-변환에서 H0가 true일 때, T의 분포는 어떤 형태인가?

<p>t-분포를 따른다. (B)</p> Signup and view all the answers

P가 0.4, r이 0.3일 때 T의 식은 어떻게 표현되는가?

<p>T = n * 2p / r^2 (D)</p> Signup and view all the answers

다음 중 H0가 true일 때 T에 대한 표기법으로 올바른 것은?

<p>T는 t(n)로 표현된다. (A)</p> Signup and view all the answers

H0가 기각됨에 따라 어떤 관계가 존재할 가능성이 높은가?

<p>두 변수 간의 선형의 상관관계가 유의미하다. (B)</p> Signup and view all the answers

T의 그래프에서 p의 값이 0.3일 때, 어떤 형태의 그래프가 형성되는가?

<p>T의 값은 p의 비율에 따라 연속적이다. (C)</p> Signup and view all the answers

P 값이 0.2일 때 T의 동작 방식은 어떻게 설명될 수 있는가?

<p>p의 값이 T의 크기에 직접적으로 영향을 미친다. (C)</p> Signup and view all the answers

T의 변환식이 포함된 T의 표현은 어떻게 되어 있는가?

<p>T = n * 2p / r (A)</p> Signup and view all the answers

Durbin-Watson 통계량은 무엇을 확인하기 위해 사용되는가?

<p>독립성 여부를 확인하기 위함 (A)</p> Signup and view all the answers

에스트리올 수준이 15 mg일 때 신생아 몸무게의 평균 예측값은 얼마인가?

<p>0.61 x 100 g (D)</p> Signup and view all the answers

Sxy는 어떻게 계산되는가?

<p>각 관측치의 xy 값의 합 (B)</p> Signup and view all the answers

회귀직선의 기울기 ˆˆ11은 어떤 값을 가지고 있는가?

<p>0.608 (A)</p> Signup and view all the answers

신생아 체중에 영향을 미치는 독립변수는 무엇인가?

<p>모체의 에스트리올 수준 (C)</p> Signup and view all the answers

회귀직선의 평균 예측값을 구할 때 사용되는 공식은 무엇인가?

<p>ˆˆ00 + ˆˆ11x (D)</p> Signup and view all the answers

신생아 체중 예측에서 에스트리올이 1mg 증가할 때 체중 변화는 얼마인가?

<p>약 0.61 x 100g 증가 (D)</p> Signup and view all the answers

다중회귀분석에서 독립변수 간에 상관관계가 있을 때, 어떤 현상이 발생하는가?

<p>다중공선성이 존재한다. (A)</p> Signup and view all the answers

다중공선성의 확인 방법으로 옳지 않은 것은 무엇인가?

<p>회귀선의 각 기울기를 다 더한다. (B)</p> Signup and view all the answers

분산팽창요인(VIF)은 어떤 값 이상일 때 다중공선성이 의심되는가?

<p>10 (C)</p> Signup and view all the answers

다중공선성으로 인해 발생할 수 있는 문제는 무엇인가?

<p>개별 회귀계수의 표준오차가 커질 수 있다. (B)</p> Signup and view all the answers

회귀분석에서 결정계수 $R^2$의 값은 어떤 범위에 있는가?

<p>1 이하 (C)</p> Signup and view all the answers

수정 결정계수($R_{adj}$)는 어떤 상황에서 사용되는가?

<p>독립변수의 수가 증가할 때 (B)</p> Signup and view all the answers

회귀식이 유의하더라도, 다중공선성의 문제로 인해 어떤 결과가 발생할 수 있는가?

<p>추정치가 불안정해질 수 있다. (D)</p> Signup and view all the answers

다중회귀분석에서 F값이 매우 큰 경우, 어떤 결론을 끌어낼 수 있는가?

<p>모델이 통계적으로 유의할 수 있다. (D)</p> Signup and view all the answers

다중공선성을 해결하기 위한 가장 일반적인 방법은 무엇인가?

<p>독립변수 중 일부를 제거한다. (C)</p> Signup and view all the answers

다중공선성이 존재할 때, 이로 인해 어떤 현상이 나타날 수 있는가?

<p>회귀계수의 부호가 바뀔 수 있다. (A)</p> Signup and view all the answers

다중공선성을 확인하기 위해 공차한계(tolerance)를 측정할 때, 어떤 기준을 사용해야 하는가?

<p>0.1 이하일 경우 의심된다. (C)</p> Signup and view all the answers

회귀 분석에서 결정계수는 무엇을 나타내는가?

<p>모델이 설명하는 분산의 비율 (D)</p> Signup and view all the answers

회귀식에서 $y_i$는 무엇을 의미하는가?

<p>관측된 종속 변수의 값 (A)</p> Signup and view all the answers

다중회귀분석에서 회귀선의 유의성이 확인되면 어떤 점이 중요해지는가?

<p>전체 모델의 유의성이 더 중요해진다. (D)</p> Signup and view all the answers

Flashcards

상관관계 (Correlation)

두 변수 간의 선형적인 관계의 강도와 방향을 나타내는 척도. -1에서 1까지의 값을 가지며, 1에 가까울수록 강한 양의 상관관계, -1에 가까울수록 강한 음의 상관관계, 0에 가까울수록 상관관계가 약하다는 것을 의미합니다.

모상관계수 (Population Correlation Coefficient)

모집단의 상관관계를 나타내는 값. 그리스 문자 'ρ' (로)로 표기합니다.

표본상관계수 (Sample Correlation Coefficient)

표본에서 계산된 상관관계를 나타내는 값. 'r'로 표기합니다.

상관관계 추정 (Correlation Estimation)

표본 데이터를 사용하여 모집단의 상관관계를 추정하는 방법. 표본상관계수를 이용하여 모상관계수를 추정합니다.

Signup and view all the flashcards

일차변환 (Linear Transformation)

상관관계에 영향을 미치지 않는 변환. 변수에 상수를 더하거나 곱해도 상관관계는 변하지 않습니다.

Signup and view all the flashcards

무상관 (Zero Correlation)

상관관계가 0이라는 가설. 두 변수 간에 선형적인 관계가 없다는 것을 의미합니다.

Signup and view all the flashcards

완벽한 상관관계 (Perfect Correlation)

상관관계가 1 또는 -1이라는 가설. 두 변수 간에 완벽한 선형적인 관계가 존재한다는 것을 의미합니다.

Signup and view all the flashcards

피어슨 상관계수 (Pearson Correlation Coefficient)

두 변수 X와 Y 사이의 선형적 관계의 강도와 방향을 나타내는 측도. -1과 1 사이의 값을 가지며, 1에 가까울수록 양의 상관관계가 강하고, -1에 가까울수록 음의 상관관계가 강하며, 0에 가까울수록 관계가 약하거나 없음을 의미합니다.

Signup and view all the flashcards

상관관계 검정 (Correlation Test)

귀무 가설: 두 변수 X와 Y 사이에 상관관계가 없다 (ρ=0). 대립 가설: 두 변수 사이에 상관관계가 있다 (ρ≠0).

Signup and view all the flashcards

t-통계량 (t-statistic)

상관관계 검정에서 사용되는 통계량. 표본 상관계수 r을 기반으로 하며, t-분포를 따릅니다.

Signup and view all the flashcards

임계값 (Critical Value)

t-통계량을 이용하여 상관관계 검정 결과를 해석하는 데 사용되는 임계값. 유의수준(α)에 따라 결정되며, 임계값을 넘어서면 귀무 가설을 기각하게 됩니다.

Signup and view all the flashcards

p-값 (p-value)

상관관계 검정 결과에서 p-값이 유의수준보다 작으면 귀무 가설을 기각하고, 두 변수 사이에 상관관계가 있다고 결론 내립니다.

Signup and view all the flashcards

귀무 가설(H0)

귀무 가설이 참일 경우, 두 변수 간에 선형적 관계가 없다는 것을意味합니다. 즉, 두 변수는 서로 독립적입니다.

Signup and view all the flashcards

귀무 가설 기각(Rejection of H0)

귀무 가설이 기각되면, 두 변수는 “통계적으로 유의미한” 선형의 상관관계가 있습니다. 즉, 두 변수는 서로 연관되어 있습니다.

Signup and view all the flashcards

기각 영역(Rejection Region)

p-값 분포 그래프에서 특정 값(t(n))을 넘어서는 영역을 나타냅니다. 이 영역에 p-값이 포함되면 귀무 가설이 기각됩니다.

Signup and view all the flashcards

t(n)

p-값을 계산하는 데 사용되는 값입니다. 자료의 크기와 p-값 분포에 영향을 미칩니다.

Signup and view all the flashcards

임상 예측 공식

특정 질환을 예측하는 공식으로, 물리적 검사 결과나 기타 임상적 정보를 사용하여 질환 발생 가능성을 계산합니다.

Signup and view all the flashcards

검증 집단 분석

임상 실험에서 개발된 공식의 정확성과 유용성을 평가하기 위해 새로운 집단에 적용하는 과정.

Signup and view all the flashcards

민감도 (Sensitivity)

질병 진단 시, 특정 증상이나 검사 결과가 실제 질병을 가진 환자들에게 얼마나 자주 나타나는지를 나타내는 지표입니다. 즉, 질병을 정확하게 진단해낼 확률을 의미합니다.

Signup and view all the flashcards

특이도 (Specificity)

질병 진단 시, 실제 질병이 없는 환자들에게 얼마나 자주 정상으로 판단하는지를 나타내는 지표입니다. 즉, 질병이 없는 사람을 정확하게 판별해낼 확률

Signup and view all the flashcards

AUC (Area Under the Curve)

ROC 곡선 아래 면적은, 임상 예측 공식의 전체적인 성능을 나타내는 지표입니다. 값이 1에 가까울수록 예측 성능

Signup and view all the flashcards

상관관계

두 변수 간의 선형적인 관계의 강도와 방향을 나타내는 척도. 1에 가까

Signup and view all the flashcards

기능적 연결성 (Functional Connectivity)

뇌의 특정 영역 간의 활동 연관성을 나타내는 지표. 뇌파나 fMRI 등의 뇌 영상 기술로 측정

Signup and view all the flashcards

섬엽 기능적 연결성 (Insular Functional Connectivity)

수면 무호흡증 환자의 뇌 특정 영역 간의 기능적 연결성을 분석하여 질환과의

Signup and view all the flashcards

Durbin-Watson 통계량이란 무엇인가요?

Durbin-Watson 통계량은 회귀 분석에서 잔차의 자기 상관 관계를 측정하는 데 사용되는 통계량입니다. 잔차가 독립적이라는 가정을 확인하는 데 도움이 됩니다.

Signup and view all the flashcards

Durbin-Watson 통계량은 어떤 범위의 값을 가지나요?

Durbin-Watson 통계량은 0과 4 사이의 값을 가지며, 값이 2에 가까울수록 잔차가 독립적임을 나타냅니다. 0에 가까울수록 양의 자기 상관 관계를, 4에 가까울수록 음의 자기 상관 관계를 나타냅니다.

Signup and view all the flashcards

Durbin-Watson 통계량이 2와 크게 다르면 무엇을 의미하나요?

Durbin-Watson 통계량이 2보다 훨씬 작거나 크면 잔차가 자기 상관 관계를 갖고 있으며, 독립적이지 않다는 것을 나타냅니다.

Signup and view all the flashcards

Durbin-Watson 통계량은 어떻게 계산되나요?

Durbin-Watson 통계량은 잔차의 시간적 순서를 고려하여 계산됩니다. 즉, 연속된 잔차 간의 관계를 측정합니다.

Signup and view all the flashcards

Durbin-Watson 통계량이 2와 크게 다르면 어떤 문제가 발생할 수 있나요?

Durbin-Watson 통계량이 2와 크게 다르면 회귀 모형의 가정이 위배될 수 있으며, 모형의 신뢰성이 떨어질 수 있습니다.

Signup and view all the flashcards

Durbin-Watson 통계량은 어떤 분석에 유용한가요?

Durbin-Watson 통계량은 시간 순서 데이터 분석, 시계열 분석 등에서 특히 유용하게 쓰입니다.

Signup and view all the flashcards

Durbin-Watson 통계량이 2에 가까우면 무엇을 의미하나요?

Durbin-Watson 통계량이 2에 가까울수록 잔차는 독립적이며, 회귀 모형이 데이터에 잘 맞는다는 것을 나타냅니다.

Signup and view all the flashcards

Durbin-Watson 통계량은 회귀 분석에서 어떤 역할을 하나요?

Durbin-Watson 통계량은 잔차의 자기 상관 관계를 측정하는 데 사용되는 통계량이므로, 회귀 분석에서 잔차의 독립성을 확인하는 데 중요한 역할을 합니다.

Signup and view all the flashcards

결정계수 (R-squared)

회귀식에 의해 설명되는 자료의 변동 비율을 나타내는 지표로, 0에서 1 사이의 값을 가집니다. 1에 가까울수록 회귀식이 자료의 변동을 더 잘 설명한다는 것을 의미합니다.

Signup and view all the flashcards

수정 결정계수 (Adjusted R-squared)

독립변수가 증가함에 따라 결정계수가 높아지는 현상을 방지하기 위해 사용하는 수정된 결정계수입니다. 독립변수의 개수가 증가하면 결정계수가 자동으로 증가하는 경향이 있는데, 수정 결정계수는 이러한 현상을 보정하여 실제 회귀식의 적합성을 더 정확하게 반영합니다.

Signup and view all the flashcards

다중공선성

회귀분석에서 독립변수가 서로 강한 상관관계를 가지고 있을 때 발생하는 문제로, 회귀계수의 추정이 불안정해지고 그 결과 회귀분석 결과의 신뢰성이 떨어지는 현상입니다.

Signup and view all the flashcards

분산팽창요인 (VIF, Variance Inflation Factor)

다중공선성을 확인하는 방법 중 하나로, 각 독립변수가 다른 독립변수들과 얼마나 독립적인지를 나타내는 지표입니다. VIF 값이 10 이상이면 다중공선성이 존재할 가능성이 높습니다.

Signup and view all the flashcards

공차한계 (Tolerance)

다중공선성을 확인하는 방법 중 하나로, VIF의 역수 값입니다. 0에서 1 사이의 값을 가지며, 0.1 이하이면 다중공선성이 존재할 가능성이 높습니다.

Signup and view all the flashcards

다중공선성 해결 방법

다중공선성 문제를 해결하기 위해 독립변수를 제거하거나 변수를 변형하는 방법 등을 사용합니다. 가장 간단한 해결 방법은 상관관계가 높은 변수 중 하나를 제거하는 것입니다.

Signup and view all the flashcards

F 통계량

다중회귀모형에서 독립변수의 효과를 검정하는 데 사용하는 통계량입니다. F 값이 클수록 독립변수가 종속변수에 유의미한 영향을 미친다는 것을 의미합니다.

Signup and view all the flashcards

t 통계량

다중회귀모형에서 독립변수의 효과를 검정하는 데 사용하는 통계량입니다. t 값이 클수록 독립변수가 종속변수에 유의미한 영향을 미친다는 것을 의미합니다.

Signup and view all the flashcards

회귀계수

회귀분석에서 독립변수가 변화할 때 종속변수가 얼마나 변화하는지 나타내는 값입니다. 회귀계수는 독립변수의 단위 변화에 따른 종속변수의 변화량을 나타냅니다.

Signup and view all the flashcards

회귀계수 표준오차

회귀계수의 신뢰구간을 구하는 데 사용하는 지표로, 회귀계수가 얼마나 정확하게 추정되었는지를 나타냅니다. 표준오차가 작을수록 회귀계수의 추정이 정확하다고 할 수 있습니다.

Signup and view all the flashcards

회귀계수 검정

회귀계수가 0인지 아닌지 검정하는 데 사용하는 가설 검정 방법입니다. 귀무 가설은 회귀계수가 0이고, 대립 가설은 회귀계수가 0이 아니라는 것입니다.

Signup and view all the flashcards

회귀식

회귀분석에서 독립변수가 종속변수에 미치는 영향을 설명하는 선형방정식입니다. 회귀식은 독립변수의 값을 입력하면 종속변수의 예측 값을 계산하는 데 사용됩니다.

Signup and view all the flashcards

잔차

회귀분석에서 종속변수의 실제 값과 예측 값의 차이를 나타내는 값입니다. 잔차는 회귀식의 적합성을 평가하는 데 사용됩니다.

Signup and view all the flashcards

회귀모형 적합성 검정

회귀분석에서 사용되는 가설 검정 방법 중 하나로, 귀무 가설은 회귀모형이 적합하지 않다는 것이고, 대립 가설은 회귀모형이 적합하다는 것입니다. F 통계량을 사용하여 검정을 수행합니다.

Signup and view all the flashcards

회귀계수 유의성 검정

회귀분석에서 사용되는 가설 검정 방법 중 하나로, 귀무 가설은 독립변수가 종속변수에 영향을 미치지 않는다는 것이고, 대립 가설은 독립변수가 종속변수에 영향을 미친다는 것입니다. t 통계량을 사용하여 검정을 수행합니다.

Signup and view all the flashcards

Study Notes

연속형 자료분석 이론

  • 자료의 분포와 관계성을 분석하는 이론을 다룬다.
  • 변수 간의 선형적인 관계를 파악하는데 중점을 둔다.
  • 자료의 분포에 따라 분석 방법이 달라진다.
  • 다양한 상관 분석 방법(Pearson, Spearman 등)과 회귀분석 등을 포함한다.

두 변수 간의 관계

  • 산점도(scatter plot)를 이용하여 두 변수 간의 관계를 시각적으로 확인한다.
  • 두 변수 간에 직선적인 관계가 있는지(선형성)를 확인한다.
  • 양의 상관관계, 음의 상관관계, 상관관계가 없는지 파악한다.
  • 상관관계의 강도를 나타내는 지표가 존재한다.

Pearson 상관계수

  • 두 연속형 변수 사이의 선형적인 관계를 측정하는 지표다.
  • 1에 가까울수록 강력한 양의 상관관계, -1에 가까울수록 강력한 음의 상관관계를 의미한다.
  • 0에 가까울수록 상관관계가 없음을 나타낸다.

상관분석의 가정

  • 정규성: 변수들이 정규분포를 따르는지 확인해야 한다.
  • 독립성: 변수들이 독립적으로 관측되었는지 확인해야 한다.
  • 등분산성: 자료들의 분산이 일정한지 확인해야 한다.

회귀분석

  • 하나 이상의 독립변수와 종속변수 사이의 선형적인 관계를 파악하는 분석 방법이다.
  • 종속변수의 값을 독립변수들의 값에 따라 예측하는 모델을 만든다.
  • 회귀 계수는 독립변수의 변화에 따른 종속변수의 변화량을 나타낸다.

회귀분석의 가정

  • 선형성: 종속변수와 독립변수 간의 관계가 선형적이어야 한다.
  • 독립성: 독립변수들이 서로 독립적이어야 한다.
  • 등분산성: 종속변수의 잔차가 일정한 분산을 가져야 한다.
  • 정규성: 잔차들이 정규분포를 따르는지 검정해야 한다.

다중공선성

  • 독립변수들이 서로 강하게 상관관계가 있을 때 발생하는 문제점이다.
  • 회귀 계수의 해석이나 신뢰도에 문제가 있을 수 있다.
  • 독립변수들의 선택이나 변수 제거 등을 통해 해결할 수 있다.

변수 선택 방법

  • 전진 선택법, 후진 제거법, 단계적 선택법 등이 있다.
  • 각 방법은 변수 선택하는 과정과 기준이 다르다.

가변수

  • 범주형 변수를 회귀분석에 사용하기 위한 변수다.
  • 범주형 변수를 0과 1로 바꿔서 사용한다.
  • 각 범주의 값에 따른 종속변수의 차이를 비교하는데 활용된다.
  • 참고로 실제 예시와 수식은 주어진 페이지에 따라 다를 수 있음.

공분산분석(ANCOVA)

  • 독립변수와 혼란 요인인 공변량을 함께 고려한 통계 분석 방법
  • 분석을 통해 공변량을 제어한 후, 독립변수의 효과를 명확히 파악한다.

편상관분석(Partial Correlation)

  • 특정 변수를 제거한 후 나머지 변수들 간의 상관관계를 파악하는 분석 방법
  • 어떤 변수가 다른 변수들에 미치는 영향을 독립적으로 평가할 필요가 있을 때 사용한다.

SPSS 예제 및 분석

  • SPSS를 이용한 다양한 회귀분석 방법, 변수 선택법, 다중공선성 체크에 대한 설명
  • 실제 데이터셋을 활용한 예제 분석 결과를 보여준다.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser