Logistische Regression II: PDF
Document Details
Uploaded by CohesiveDiscernment8610
Universität Kassel
2024
Florian Scharf
Tags
Related
- Tema 1 (1) PDF - Introducción a la Innovación
- Hindi PDF 1-31 dQÀfa¶fSXX, 2023
- Immune System Review PDF
- AP Ch 23 PDF: Obesity and Disorders of Nutrition
- Logistische Regression I: Modell, Interpretation der Modellparameter (PDF)
- Astroglial Hmgb1 Regulates Postnatal Astrocyte Morphogenesis and Cerebrovascular Maturation PDF
Summary
This document is a lecture outline from a multivariate statistics and data analysis course, specifically looking at logistic regression and other statistical methods. It includes an overview of previous lectures and topics like the general linear model. The document focuses on statistical inference and model interpretation, without posing specific questions for the course.
Full Transcript
Multivariate Statistik und Datenanalyse Wintersemester 2024/25 Florian Scharf 12. November 2024 Logistische Regression II: Schätzung, Modellgüte und stat. Inferenz Themen der Vorlesung 1 22.10. Allgemeines Lineares Modell I: Modell, Int...
Multivariate Statistik und Datenanalyse Wintersemester 2024/25 Florian Scharf 12. November 2024 Logistische Regression II: Schätzung, Modellgüte und stat. Inferenz Themen der Vorlesung 1 22.10. Allgemeines Lineares Modell I: Modell, Interpretation & Inferenz 2 29.10. Allgemeines Lineares Modell II: Kategoriale Prädiktoren & Interaktionen 3 05.11. Logistische Regression I: Modell, Interpretation der Modellparameter 4 12.11. Logistische Regression II: Schätzung, Modellgüte und stat. Inferenz 5 19.11. LMM I: Grundidee, Modelltypen 6 26.11. LMM II: Modellschätzung, Interpretation 7 03.12. LMM III: Modellierung wiederholter Messungen 8 10.12. CFA I: Grundmodell und Modellmatrix 9 17.12. CFA II: Schätzung und Modellgültigkeit 10 14.01. SEM I: Grundidee, Schätzung und Parameterinterpretation 11 21.01. SEM II: Flexibilität von SEMs, Pfadanalyse und Probleme von SEMs 12 28.01. Längsschnittliche SEMs I: Latente Wachstumskurvenmodelle 13 04.02. Längsschnittliche SEMs II: Messinvarianz und weitere Modelle 14 11.02. Statistik und Kausalität 203 Rückblick Grundmodell der logistischen Regression: e b0 +b1 ·x1n +...+bP ·xP n AAAH/HicpVXbbtNAEJ1QICVAaeERCVlUSEWtopjrAyoqF1U8UBHUW1BTLNvZBKu+yXZKgzHiY3hAQrzyGzwjIfEjPHB2vGmThlwotrwez86ZM3t2bFuh68RJpfKjcGrq9JmzxelzpfMXLs5cmp27vBUH7cgWm3bgBlHNMmPhOr7YTJzEFbUwEqZnuWLb2nsi57f3RRQ7gb+RdEKx65kt32k6tpnAZcx+ri68MnxtWdO191rNSHU/w8MBG0tauVzWlqS72nXDuAmr3oxMW0vF69QyKouWoWt1uxEkCqgtMnJRs4zq0QSgWaalOvwnwBmz85VyhQ9t0NCVMb/y4Nf3jz9vR9Vgbuoa1alBAdnUJo8E+ZTAdsmkGOcO6VShEL5dSuGLYDk8LyijErBtRAlEmPDuYWzhaUd5fTzLnDGjbbC4uCIgNbqBa5UzWoiWrAJ2jPtvXO/Y1/ovhmHYlMcIOBN4GZmfJVzDEP4AZnhlUjupkg/tZFXSChGbcL32CN1SXk3MLAm9OaxtXLyM9SaObkIhqXesEKURiAijixkHOyImYJDr3kPskaqj4w+oA58zUpUd2lBKdivv6tit/Sk8ec/KeteUeluqoxxGpbDk3sWKaR2zCcYONLG4b1ZV9hT3kLEyT8A5sj58Si+4pox7TuIjtj0e/QkYXJ7r9vxg9jV63pfd68nvADeeIe7x/p1hvY8hHrqCrp6PkCnE3US8YI76YafmNU2uUYxcmdq9yVksdMBkLBY662QrScauJOHa/223ZWe2+Ds1bldqao/fMtocYJJc8h1u8tvsIE+np/r9ET0vkRG/OwLZ5bfSU9+zBivQm7GBGPncxlOuR856zI//jX787zJobN0q6/fKd1/ix/OY8mOartJ1WoCq92mFnlGVNskuzBTuFJYLD4sfip+KX4pf89BTBYW5Qn1H8dsfUJyuyA== P (Yn = 1|X1n = x1n ,..., XP n = xP n ) = 1 + e b0 +b1 ·x1n +...+bP ·xP n Interpretation einfacher logistischer Regression: – drei alternative Darstellungsformen – Regressionskonstante – Regressionsgewicht Rückblick 204 Vokabeln... Listen & Repeat bedingte Wahrscheinlichkeit P(Yn=1|Xn = xn): die vom logistischen Regressionsmodell vorhergesagte Wahrscheinlichkeit, dass eine Person mit einer spezifischen Ausprägung in den Prädiktoren, einen y-Wert von 1 hat bedingte Odds (= Chance = Wettquotient): der Quotient der bedingten Wahrscheinlichkeit und ihrer Gegenwahrscheinlichkeit: sprich: „Um das Wievielfache ist es für diese spezifische AAAEA3iclVLLbhMxFL3p8GjDK4UlmxERUlkQzSCUskGqxENskIJE2kBbRR7Hk1qZl+xJaRiy5DP4AnaILSu28AH8CwuOb6egpooAjzz3+tx7j4+vHRWJtmUQ/GiseOfOX7i4uta8dPnK1Wut9evbNp8aqfoyT3IziIRVic5Uv9RlogaFUSKNErUTTR65+M6hMlbn2ctyVqj9VIwzHWspSkDD1uZebISsehuvhpn/0A/9d/6AvaNhdmdehXeXRIatdtAJePhnnbB22lSPXr7eeE17NKKcJE0pJUUZlfATEmTx7VJIARXA9qkCZuBpjiuaUxO1U2QpZAigE/zHWO3WaIa147RcLbFLgmlQ6dNtzKfMGCHb7argW9ifmG8ZGy/doWJmp3AGG4FxjRmfAy/pABl/q0zrzBMt/1JZID5DxHXA/kel60dJMT3gPmicrGDEdUj+5nmMiAE24YhPTzhzDI6I14foXQbbh3Z3PycMPvdqBCvYKmbJakYBPgPr7s3pWa5Rgtfps1D6pzvL80dQpIHahXs+OnXTrv5Yj6I3HEmZ3SmtEIu5ViN/xtpjPlmC3eccd2oW8Sbeebj4qs862/c6YbfTfXG/vdWtX/wq3aRbtIFXvUlb9Ix66KakD/SVvtF377330fvkfT5OXWnUNTfo1PC+/AIu9NNs P(Yn = 1|Xn = xn ) Prädiktorausprägung wahrscheinlicher, dass Y = 1 ist, als 1 → P(Yn = 1|Xn = xn ) dass Y = 0 ist?“ Odds Ratio (= Chancenverhältnis): der Quotient der (bedingten) Odds für verschiedene Prädiktorausprägungen (i.d.R.: xn vs. xn+1) ! " sprich: „Um welchen Faktor ändern AAAE0nicpVJNb9NAEB0XF0r5auDIZUWEFESJbASBC1JVPi9IATVtIAmW7azTVfwle1OSWj4grpy4wh/jv3Dg7cYtaqqoVGy0mdmZN2+eZ9dLQ5FLy/plrFwwVy9eWru8fuXqtes3Nmo3d/Nkkvm84ydhknU9N+ehiHlHChnybppxN/JCvueNn6v83gHPcpHEO3KW8kHkjmIRCN+VCDk1Y5V/KjzHLtkz1g8y1y/6IQ9kozq0Gx+cGCmb9SMxZF2nsGMNlXwqdffe+9fbg8JuPd60Nq2SFdM55D6zy3tlYbMH7D85WD8To30Jsn9SNq89o/UR6Jjb2ahbTUsvdtqxK6dO1WonNeMj9WlICfk0oYg4xSThh+RSjl+PbLIoRWxABWIZPKHznEpaR+0EKA6Ei+gY/yOcelU0xllx5rraR5cQO0Mlo7vYrzSjB7TqyuHnsL+xD3VstLRDoZmVwhmspxnnnG+RkbQPzFm1UYUsz1GZIj9DRs0gP0elmoikgJ7qSQh8W6ojakb+Mc8LZDLExjrD6KVGjsDh6fMBphfDdqBd3dARA9PTGsK62nLNEleMLvgyWHVzSs9yjT54lb4cSv9OZzl+CEUC0Xzhpqcn7lrVz/Vw+qwzkWZXSgvkAl0rgJ9p7YH+shDdS51XahbieOf24qs+7ew+bNqtZuvdo/rWdvXi1+g23aEGXvUT2qI31MYsfSM0vhs/jJ/mjnlofjG/zqErRlVzi04s89sfipMVVg== P(Yn =1|X1n =x1n +1) 1→P(Yn =1|X1n =x1n +1) sich die vorhergesagten Odds, wenn e b1 = ! " man den Prädiktor um eine Einheit P(Yn =1|X1n =x1n ) erhöht?“ (ggf. weitere Prädiktoren 1→P(Yn =1|X1n =x1n ) beachten bei multipler log. Regression) Rückblick 205 Beispiel Chance, dass eine ländlich wohnende Person zur Wahl gegangen ist im Vergleich zur Chance, dass eine städtisch wohnende Person zur Wahl gegangen ist Wahlteilnahme W nein (W = 0) ja (W = 1) Städtisch (Ds = 0) 35 165 Ländlich (Ds = 1) 37 163 )* ,&../%. 165 𝐶ℎ𝑎𝑛𝑐𝑒!"ä$"%&'( = = 4.72 35 4.41 𝑂𝑅 = = 0.91 163 4.72 )* ,&../%. 𝐶ℎ𝑎𝑛𝑐𝑒0ä.$1%'( = = 4.41 37 OR = 1: Chancen unterscheiden sich nicht OR >1 bzw. 0: Kategorie Yn = 1 ist wahrscheinlicher § b0 < 0: Kategorien Yn = 0 ist wahrscheinlicher Logistische Regression I: 208 Grundmodell Parameterinterpretation weitere Darstellungsformen Beispiel Zusammenhang zwischen Intelligenz (IQ) und Wahlteilnahme (W; 0 = nein, 1 = ja) Person IQ (X1) W (Y) logistische Regression: 1 13 1 e b0 +b1 ·IQn AAAHo3icpVXbbtNAEJ22QEq4pfCIhCyqSkWVohgEPCCkclEFgqopTdJKSRrZziZY8U1epxBMJH6K7+AZgcQL/AUPnB07JRdyAWx5PZ6dM2f27Ng2A8eWUaHweWl55czZc5nV89kLFy9dvpJbu1qRfje0RNnyHT88Mg0pHNsT5ciOHHEUhMJwTUccmp0nav7wRITS9r1S1AtE3TXant2yLSOCq5HbK24eNjztoaa/157vN7xbMGut0LC0WBzHZqOgbWlmQ9dqVtOPOKLf12J9azA5PtfIrRfyBT60SUNPjfXtB98+ffh6Jyz6ays3qEZN8smiLrkkyKMItkMGSZxV0qlAAXx1iuELYdk8L6hPWWC7iBKIMODtYGzjqZp6PTyrnJLRFlgcXCGQGm3g2uGMJqIVq4Atcf+J6x372v/FMA0b8xgCZwCvIpMzi2sawpvATK9MaadU8qCdqkpZAWIjrteaoVvMq5HMEtHr09rmxatYd+HoFhRSessUkZ2BCDE6mLGxI2IBBrXuDmJ/qzo7/i314LNnqlKlUqrkoPKBjoPan8KT9KyqdzdVr5J2lM2oGJbaO5kyHWA2wtiDJib3zU6aPcY9YKzK43OO/gg+pj2uqc89p/Ah2y6P3gIMDs8Nen4y+y69HMnuDuW3gZvPIIe8f2Y4GGGQU1cw0PMRMgW4G4gXzFE77dSkpsU1ksjVT3dvcRYTHbAYi4nO+reVRHNXEnHtf7fbqjPb/J2atytH6R6/YbQxwaS41Dvc4rfZRp7eUPUnM3peIUN+dwSyq2+lm37PmqzAcMYmYtRzF0+JHgnrmB//G3387zJpVG7n9Xv5u/v48Tym5Fil63STNqHqfdqmZ1SkMir6SF/oO/3IbGReZF5lSkno8lKKuUYjR6b+C9eKlAc= 2 17 1 P (Wn = 1|IQn ) = 3 13 1 1 + e b0 +b1 ·IQn 4 13 0 b0 = 0.41 AAAHcHicpVVNb9NAEJ220JTwlcIFCQSBCISQiGwU4IRUPlRxoKKoTRqpqSLb2QQr/pLXKQQrF34NV/g3/A3OHHg73pSkIYkBW16PZ+fNm307tu3Ic2ViGN9XVtfOnF0vbJwrnr9w8dLl0uaVhgwHsSPqTuiFcdO2pPDcQNQTN/FEM4qF5dueOLD7L9X8wbGIpRsG+8kwEke+1QvcrutYCVzt0g27bZTvPSs/NKo1s9xqFct221QOo2rW2qWKUTX4KM8apjYqpI/dcHPtJrWoQyE5NCCfBAWUwPbIIonzkEwyKILviFL4YlguzwsaURHYAaIEIix4+xh7eDrU3gDPKqdktAMWD1cMZJnu4trmjDaiFauALXH/iesT+3r/xTAPm/IYA2cBryKzs4hrHiKYwcyvTGmnVAqgnapKWRFiE67XWaBbyquRzJLQ+5PalsWrWD93dBcKKb2lRhQXIGKMHmZc7IjIwaDW3Ufsb1UXx3+kIXzuQlUOaV8rOa58rOO49lfwZD2r6t3R6jV0R7mMSmGpvZOaaQ+zCcYhNLG5b7Z19hT3iLEqT8g5RlP4lN5yTSPuOYWP2fZ5DHIweDw37vnZ7Dv0Ziq7P5HfBW45g5zw/plhb4pBzl3BWM/nyBThbiFeMEfrpFOzmvJrJJFrpHcvP4uNDsjHYqOz/m0lydKVJFz73+226swef6eW7UpT7/EHRlszTIpLvcNdfptd5BlOVH+8oOcVMuZ3RyC7+lb6+nvWYQUmM3YQo54HeMr0yFhP+fG/MU//XWaNxqOq+aT6+F2tsvVC/3k26DrdoftQ9Slt0WvapToq+kxf6Ct9W/9RuFa4Vbidha6uaMxVmjoKD34B9y17/Q== 5 20 1 b1 = 0.14 6 13 1 0.41 e b0 = e AAAHb3icpVXLbtNQEJ220BTzSmHBolJlESHBgshBEFYV5aGKBRVFbdJIaYls5yZY8Uu+TiFYWfAtLNjCV/AJiM9gz4Jzx05JGpIYsOXr8dw5c+aeO7at0HVkbBjfl5ZXzp1fLaxd0C5eunzlanH9Wl0G/cgWNTtwg6hhmVK4ji9qsRO7ohFGwvQsVxxavadq/vBERNIJ/IN4EIpjz+z6TsexzRiuVnFDvE50q2UM9S0d5l2jfL+ibKNcrbaKJaNs8KFPG5XMKD36qm2FH79pe8H6yiYdUZsCsqlPHgnyKYbtkkkSZ5MqZFAI3zEl8EWwHJ4XNCQN2D6iBCJMeHsYu3hqZl4fzyqnZLQNFhdXBKROt3DtcEYL0YpVwJa4/8T1nn3d/2KYhU14jIAzgVeR6anhmoXwpzCzK1PaKZV8aKeqUlaI2JjrtefolvBqJLPE9Oa0tkXxKtbLHd2BQkpvmSG0OYgIo4sZBzsicjCodfcQ+1vV+fHvaACfM1eVJh1kSo4qH+k4qv0ZPGnPqnp3M/XqWUc5jEpgqb2TGdM+ZmOMA2hicd/sZNkT3EPGqjwB5xhO4BN6yTUNuecUPmLb49HPweDy3Kjnp7Pv0ouJ7N5Yfge4xQxyzPtnhv0JBjlzBSM9HyNTiLuJeMEcR6edmtaUXyOJXMNs9/KzWOiAfCwWOuvfVhIvXEnMtf/dbqvO7PJ3atGuNLI9fstoc4pJcal3uMNvs4M8g7HqT+b0vEJG/O4IZFffSi/7nrVZgfGMbcSo5z6eUj1S1jN+/G8qZ/8u00b9XrlSLT94ZZS2n1B6rNEG3aTbUPUhbdNz2qMaKvpAn+gzfVn9UbhR2CzoaejyUoa5ThNH4c4vWT6AjQ== = 0.66 7 15 1 8 8 0 Wenn keine Aufgaben im IQ-Test gelöst wurden, sind die vorhergesagten Odds der … Wahlteilnahme 0.66. Logistische Regression I: 209 Grundmodell Parameterinterpretation weitere Darstellungsformen Bedingte Odds Grundmodell als bedingte Odds: AAAHxHicpVXbbtNAEJ20tCnhloLECxKyKEhFiChGAp6QwkURD1QEtWmDmhLZziZY8U1epzQY8yV8Ct+BxB/wxg/0gbNjp02a5gLY2vXszJyZ2bNj2wwcW0bl8s/c0vKFldX82sXCpctXrl4rrl/flX4/tETd8h0/bJiGFI7tiXpkR45oBKEwXNMRe2bvpbLvHYpQ2r63Ew0CceAaXc/u2JYRQdUqBs1OaFhaXNt83/K0Z5qufdEarVj3kvtJrD88T42l+BCbrfIDs6U3rbYfaUdsOrUkWqrn1bhPq7hRLpX50iYFPRM2KpXfv77f/Ha35q8v36Ymtckni/rkkiCPIsgOGSRx75NOZQqgO6AYuhCSzXZBCRWA7cNLwMOAtoe5i9V+pvWwVjEloy1kcTBCIDW6h1HliCa8VVYBWeJ5jPGZdd3/yjANG/McAmcArzzTu4AxDeFNYKZXprhTLHngTlWlpAC+EddrzeAt5t1IzhLRx5Pa5vkrX3dh7w4YUnzLDFGYgQgxO7DYOBGxQAa17x58T1md7X9EA+jsmazs007G5LDyIY/D2l9Bk/asqncrY2836yibUTEkdXYyy7QNa4R5AE5M7ptqFj3GM2CsiuNzjGQMH9NbrinhnlP4kGWXZ2+BDA7bhj0/GX2L3oxFd0fi28DNzyBHtOdn2B7LIKfuYMjnc0QK8DTgLzhH86RT05oW50giVpKd3uJZTHTAYllMdNa/7SSau5OIa/+701ad2eXv1LxTaWRn/InRxkQmlUu9wx1+m23EGYxUfzij5xUy5HdHILr6VrrZ96zNDIxGbMNHrftYpXykWc/o8b/Rz/5dJoXdRyX9SenxO/x4XlB6rdEtukObYPUpVeg11aiOin7QcW4lt5qv5p28zPdT16VchrlBY1f+6x/M0Z89 P (Yn = 1|X1n ) = e b0 +b1 ·x1n = e b0 · e b1 ·x1n 1 P (Yn = 1|X1n ) b1 AAAHWXicpVXbbtNAEJ200ARza+kjEqqIkHiKHCTgCVEuqnigoqjNRUpLZbubsIpv8jqFYOUjeIVHPoZPQIhf4YGz401JGpIYsOX1eHbOnNmzY9uNfalS2/5eWlm9cHGtXLlkXb5y9dr19Y0bTRUNEk80vMiPkrbrKOHLUDRSmfqiHSfCCVxftNz+Mz3fOhWJklF4kA5jcRQ4vVB2peekcLXEm8w9ro+O16t2zeZja9aoG6P6+Kv1KP7yzdqLNlZv0SGdUEQeDSggQSGlsH1ySOHsUJ1siuE7ogy+BJbkeUEjsoAdIEogwoG3j7GHp47xhnjWORWjPbD4uBIgt+gOrh3O6CJaswrYCvefuD6wr/dfDPOwGY8JcA7wOjI/LVzzEOEMZn5lWjutUgjtdFXaihGbcr3eAt0yXo1ilpTentW2LF7HBoWju1BI660MwlqASDD6mJHYEVGAQa+7j9jfqi6Of09D+ORCVTp0YJQcVz7WcVz7c3jyntX17hr1mqajJKMyWHrvlGHax2yKcQhNXO6bHZM9wz1mrM4TcY7RFD6jV1zTiHtO4xO2Ax7DAgw+z417fjb7Lr2cyh5M5JfALWdQE94/M+xPMai5Kxjr+QSZYtwdxAvmODzr1Lym4hop5BqZ3SvO4qIDirG46Kx/W0m6dCUp1/53u607s8ffqWW70jZ7/I7RzgyT5tLvcJffZok8w4nqTxf0vEYm/O4IZNffysB8z05YgcmMJ4jRzwM85XrkrOf8+N/Uz/9dZo3mvVr9Qe3+a7u6/ZTyo0I36TbdhaoPaZte0B41+I3/SJ/o89qPcqlcKVt56ErJYDZp6ihv/gLv/XsG e – Interpretation : als Odds-Ratio, d.h. eine Änderung der Odds