Biostatistik år 1 – crash course tillägg 1 korrelationskoefficient PDF
Document Details
Uploaded by SelfSatisfactionLightYear7986
Karolinska Institutet
2024
Pernilla Lång
Tags
Summary
These notes cover a crash course on correlation, a fundamental aspect of biostatistics within a medical context. The document describes different aspects of correlation, addressing its calculation methods and interpretations using examples and graphs.
Full Transcript
Biostatistik år 1 – crash course tillägg 1 korrelationskoefficent Pernilla Lång, BMA, Fil Dr Patologi KANDIDAT G1 Bild gjord med Firefly Vad ska du kunna? Korrelationskoefficent Statistisk interferens Variabel och sk...
Biostatistik år 1 – crash course tillägg 1 korrelationskoefficent Pernilla Lång, BMA, Fil Dr Patologi KANDIDAT G1 Bild gjord med Firefly Vad ska du kunna? Korrelationskoefficent Statistisk interferens Variabel och skalnivåer Konfidensintervall Population vs stickprov Precision Parameter Riktighet Fördelningar Grafer Centralmått/trendvärde Excel (se videos specifikt om detta) Spridningsmått Statistik variation Outliers, extrema värden Karolinska Institutet - ett medicinskt universitet 26 juni 2024 2 Korrelationskoefficient Hur förhåller sig två variable till varandra? Vad är korrelation? Korrelation beskriver styrkan och riktningen av ett linjärt samband mellan två kvantitativa variabler. Karolinska Institutet - ett medicinskt universitet 26 juni 2024 4 Verkligt exempel på korrelation Karolinska Institutet - ett medicinskt universitet 26 juni 2024 5 Korrelationskoefficienten (r) Korrelationskoefficienten (r) är ett tal mellan -1 och 1: r = 1: Perfekt positiv linjär korrelation r = -1: Perfekt negativ linjär korrelation r = 0: Ingen linjär korrelation Var går gränsen för om man har korrelation eller inte? Bra fråga… beror på. Signifikans Pearson eller Spearman Karolinska Institutet - ett medicinskt universitet 26 juni 2024 6 Hur beräknas detta? Σ 𝑥𝑥 − 𝑥𝑥̅ 𝑦𝑦 − 𝑦𝑦 𝑟𝑟 = √(𝛴𝛴 𝑥𝑥 − 𝑥𝑥̅ 2 𝑦𝑦 − 𝑦𝑦 2 ) 1. Medelvärde för variablerna: Exempelvis för ålder och blodtryck 𝑥𝑥̅ resp 𝑦𝑦 30 resp 40. 2. Avvikelse från medelvärdet: Räkna ut hur mycket varje observation avviker från medelvärdet. 𝑥𝑥 − 𝑥𝑥̅ resp 𝑦𝑦 − 𝑦𝑦 50 – 30 = 20 resp 40 – 40 = 0. 3. Samspel mellan avvikelserna: Multiplicera avvikelserna för ålder och blodtryck med varandra. Svarar på om de rör sig åt samma håll eller åt olika håll (𝑥𝑥 − 𝑥𝑥̅ )(𝑦𝑦 − 𝑦𝑦 ) ex 20*0. 4. Summera av samspelet: Addera alla produkter från punkt 3 = Σ 𝑥𝑥 − 𝑥𝑥̅ 𝑦𝑦 − 𝑦𝑦. Karolinska Institutet - ett medicinskt universitet 26 juni 2024 7 Hur beräknas detta? 5. Normalisering för att se till att r alltid ligger mellan -1 och 1: 1. Räkna kvadraten av avvikelserna för varje variabel 𝑥𝑥 − 𝑥𝑥̅ 2 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑦𝑦 − 𝑦𝑦 2 2. Lägg ihop summan av dessa för x respective y dvs för alla 𝑥𝑥 − 𝑥𝑥̅ 2 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑦𝑦 − 𝑦𝑦 2. 3. Multiplicera summan av alla 𝑥𝑥 − 𝑥𝑥̅ 2 𝑚𝑚𝑚𝑚𝑚𝑚 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑎𝑎𝑎𝑎 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑦𝑦 − 𝑦𝑦 2. 4. Ta roten av summan från 3. Karolinska Institutet - ett medicinskt universitet 26 juni 2024 8 Begränsningar Korrelation innebär inte kausalitet. Korrelationskoefficienten mäter bara linjära samband. Karolinska Institutet - ett medicinskt universitet 26 juni 2024 9