ΔΙΑΛΕΞΗ ΜΕΤΑΠΤΥΧΙΑΚΟΥ ΠΕΡΙΒΑΛΛΟΝ-ΥΓΕΙΑ PDF

Document Details

DashingHeliotrope603

Uploaded by DashingHeliotrope603

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ

Tags

statistical tests confidence intervals hypothesis testing statistics

Summary

This document details a lecture on statistical tests and confidence intervals, covering topics such as hypothesis testing, p-values, and different types of statistical tests. The document discusses the concept of hypothesis testing and different types of errors and calculations involved.

Full Transcript

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ – ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Η Εκτιμητική ή Συμπερασματική Στατιστική είναι ο κλάδος της Στατιστικής που ασχολείται με την εξαγωγή συμπερασμάτων για έναν πληθυσμό, βάση των αποτελεσμάτων που λαμβάνονται από ένα δείγμα. Μας ενδιαφέρει να εξετάσουμε μια υπόθεση αν είναι αληθής ή όχι σ...

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ – ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Η Εκτιμητική ή Συμπερασματική Στατιστική είναι ο κλάδος της Στατιστικής που ασχολείται με την εξαγωγή συμπερασμάτων για έναν πληθυσμό, βάση των αποτελεσμάτων που λαμβάνονται από ένα δείγμα. Μας ενδιαφέρει να εξετάσουμε μια υπόθεση αν είναι αληθής ή όχι στον ΠΛΗΘΥΣΜΟ Οι ερευνητικές υποθέσεις π.χ. ο μεγάλος χρόνος εισόδου στο Νοσοκομείο από την έναρξη των συμπτωμάτων, συσχετίζεται με αυξημένο κίνδυνο θανάτου; Μια διατροφή πλούσια σε υδατάνθρακες συσχετίζεται με μειωμένο σωματικό βάρος; Ένα συγκεκριμένο φάρμακο κατεβάζει το επίπεδο τριγλυκεριδίων Η αύξηση στην φορολογία στα τσιγάρα σχετίζεται με την μείωση του καπνίσματος; Γιατί είναι απαραίτητες οι στατιστικές «συγκρίσεις»; Μέση τιμή δείγματος = Ολική χοληστερόλη (mg/dl) 215 mg/dl ΕΡΩΤΗΜΑ Μπορεί να ισχυριστεί κανείς ότι η δίαιτα Α μείωσε τα επίπεδα ολικής χοληστερόλης σε σύγκριση με τη δίαιτα Β, σε ασθενείς με ΟΕΜ; Μέση τιμή δείγματος = 165 mg/dl Δίαιτα Α Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ Δίαιτα Β 4 Γιατί είναι απαραίτητες οι στατιστικές «συγκρίσεις»; Μέση τιμή δείγματος = Ολική χοληστερόλη 215  45 mg/dl Τα 2 δείγματα έχουν πολύ μεγάλο κοινό εύρος τιμών, γεγονός που κάνει την (mg/dl) σύγκριση των μέσων τιμών αναξιόπιστη. Μέση τιμή δείγματος = 165  97 mg/dl Δίαιτα Α Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ Δίαιτα Β 5 Η διαδικασία που ακολουθείται για την λήψη τέτοιου είδους αποφάσεων ονομάζεται έλεγχος υποθέσεων Στον έλεγχο υποθέσεων ξεκινάμε διατυπώνοντας δύο Υποθέσεις: Μηδενική υπόθεση η οποία συμβολίζεται με Ηο Εναλλακτική υπόθεση η οποία συμβολίζεται με. Εφαρμόζοντας το κατάλληλο στατιστικό κριτήριο, θα πρέπει να αποφασίσουμε ποια από τις δύο είναι αληθής στον πληθυσμό. Για παράδειγμα: Αν θέλουμε να εξετάσουμε αν οι μέση τιμή αρτηριακής πίεσης είναι ίδια στην Ικαρία και στην Αττική, έχουμε να επιλέξουμε μεταξύ των δύο υποθέσεων: Μηδενική υπόθεση: Ηο: μ1=μ2 (οι μέσες τιμές πίεσης είναι ίσες) Εναλλακτική υπόθεση: μ1 ≠μ2 (οι μέσες τιμές διαφέρουν) Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 6 ΣΦΑΛΜΑΤΑ Σε κάθε έλεγχο είναι δυνατόν να πραγματοποιηθούν δύο ειδών σφάλματα: Σφάλμα τύπου Ι: Απόρριψη της Ηο ενώ στην πραγματικότητα είναι αληθής. Σφάλμα τύπου ΙΙ: Απόρριψη της (Αποδοχή της Ηο) ενώ στην πραγματικότητα η είναι αληθής. Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 7 Σφάλματα στη λήψη απόφασης α=P(σφάλμα τύπου Ι)=P(Απόρριψη της Ηο ενώ στην πραγματικότητα είναι αληθής) β=P(σφάλμα τύπου ΙΙ)=P(Αποδοχή της Ηο ενώ στην πραγματικότητα η είναι αληθής) Η πιθανότητα γ= 1-β ονομάζεται ισχύς του ελέγχου και εκφράζει το ποσοστό των «σωστών» απορρίψεων της Ηο. Η πιθανότητα του σφάλματος μπορεί να υπολογιστεί. Μας ενδιαφέρει κυρίως το σφάλμα τύπου Ι: α Αυτό που γίνεται στην πράξη είναι να οριοθετείται μια πιθανότητα για το σφάλμα τύπου Ι: α που είμαστε διατεθειμένοι να ανεχτούμε. Η πιθανότητα αυτή λέγεται επίπεδο σημαντικότητας και οι συνηθισμένες τιμές της είναι α=0,05 (5%) ή α=0,1 (10%) Επίπεδο σημαντικότητας α=0,05 σημαίνει οτι η ανεκτή πιθανότητα λάθους είναι 5% και οτι απορρίπτουμε την Ηο, μόνο αν η πιθανότητα σφάλματος στην απόρριψη της, υπολογιστεί μικρότερη από 5% Υπάρχουν 2 τρόποι για να αποφασίσουμε ποια υπόθεση είναι αληθής: 1ος τρόπος: Με υπολογισμό του p-value Υπολογίζουμε την τιμή του p-value, και την συγκρίνουμε με το προκαθορισμένο επίπεδο σημαντικότητας (συνήθως α=0,05). Το p-value είναι η πιθανότητα σφάλματος στην απόρριψη της Ηο. Απορρίπτεται η Ηο αν η τιμή του p-value είναι μικρή. Αν p-valueμ2 Η1: μ1 0.05. Επίσης το στατιστικό λογισμικό μας υπολογίζει και την τιμή του t κριτηρίου ίση με -1.9043. Σημειώνεται ότι αναφερόμαστε σε κανονικούς πληθυσμούς με άγνωστες και ίσες διασπορές (σ1=σ2=σ). 23 Statistical Tests –Confidence Intervals 2.1 Statistical tests I Όπως διαπιστώνουμε επίσης το 95% διάστημα εμπιστοσύνης για την διαφορά των μέσων τιμών μ1-μ2 του καλίου του ορού στις δύο αυτές ομάδες είναι: [-2,1558;0,155798]. Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 24 Statistical Tests –Confidence Intervals 2.1 Statistical tests I Παράδειγμα: Σε τέσσερα άτομα με αυξημένες τιμές των τριγλυκεριδίων του ορού (mg/dl) χορηγήθηκε για ένα μήνα φάρμακο που πιστεύεται ότι ελαττώνει τα επίπεδα των τριγλυκεριδίων. Οι τιμές των τριγλυκεριδίων στα τέσσερα αυτά άτομα πριν και μετά τη χορήγηση του φαρμάκου ήταν: Άτομο Πριν τη χορήγηση Μετά τη χορήγηση 1o 180 120 2o 200 220 3o 240 130 4o 230 160 Βρείτε ένα 95% δ.ε. για την διαφορά των μέσων μ1-μ2 στα επίπεδα των τριγλυκεριδίων πριν και μετά την χορήγηση. Ελαττώνει τα επίπεδα των τριγλυκεριδίων το φάρμακο αυτό; (Άσκηση 65 σελ. 16 του Βιβλίου Ασκήσεων Βιοστατιστικής Α. Τζώνου & Κ. Κατσουγιάννη) Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 25 Statistical Tests –Confidence Intervals 2.1 Statistical tests I Έλεγχοι υποθέσεων και δ.ε. για παρατηρήσεις κατά ζεύγη: H0: μ1=μ2 H0: μ1=μ2 H0: μ1=μ2 Η1: μ1>μ2 Η1: μ10,05 και άρα δέχομαι την Ηο: μ1=μ2. Ταυτόχρονα υπολογίζεται και η τιμή του κριτηρίου t statistic ίση με 2,01957. Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 29 Έλεγχος ανεξαρτησίας (συσχέτισης) 2 κατηγορικών μεταβλητών Παράδειγμα «εξαρτάται το βρογχικό άσθμα από το κάπνισμα των γονέων; » «επηρεάζει η έντονη φυσική δραστηριότητα την κατηγορία σωματικού βάρους;» «οι υπερτασικοί ασθενείς διαφέρουν ανά φύλο;» Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 30 Έλεγχος ανεξαρτησίας 2 ποιοτικών χαρακτηριστικών Το κριτήριο Χ2 Το στατιστικό κριτήριο που χρησιμοποιείται είναι το Χ2 Είναι ένα μέτρο απόστασης δύο «καταστάσεων» 2 (  ) X  2  Π=παρατηρηθείσες συχνότητες, Α=αναμενόμενες συχνότητες Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 31 Το κριτήριο Χ2 Με βάση τη θεωρία το κριτήριο Χ2 είναι το ακόλουθο: (a  ' ) 2 (   ' ) 2 (  ' ) 2 (  ' ) 2 X2     ' ' ' ' Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 32 Έλεγχος ανεξαρτησίας 2 ποιοτικών χαρακτηριστικών Όσο πιο μεγάλες τιμές λαμβάνει το κριτήριο Χ2 (άρα p) τόσο πιο κοντά είμαστε στο να ΜΗΝ απορρίψουμε την Ηο, δηλαδή δεν υπάρχει συσχέτιση. Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 33 Προϋποθέσεις εφαρμογής του κριτηρίου Χ2 Τυχαίο δείγμα και ανεξαρτησία των παρατηρήσεων Κανένα κελί με μηδενική τιμή Όλες οι αναμενόμενες τιμές των κελιών 2x2 πινάκων συνάφειας >5 Το 80% των κελιών πινάκων r x c να έχουν αναμενόμενες τιμές >5 Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 34  Παράδειγμα Σε 500 μαθητές δημοτικού σχολείου μελετήθηκε η σχέση της υγείας του στόματος τους με τη χλωρίωση του νερού στην περιοχή διαμονής τους. Η κατανομή των 500 μαθητών ανάλογα με την υγεία του στόματος και τη χλωρίωση του νερού ήταν: Υγεία στόματος Χλωρίωση νερού Κακή Μέτρια Καλή Ανεπαρκής 80 120 75 Επαρκής 40 80 105 Σύνολο 120 200 180 Σχετίζεται η υγεία του στόματος των μαθητών με τη χλωρίωση του νερού; Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 35 Η μηδενική υπόθεση στην δοκιμασία αφορά στην ανεξαρτησία των μεταβλητών.. Αρχικά θα υπολογίσουμε τα θεωρητικά μεγέθη δηλ. τα «Expected », τα οποία συμβολίζονται με Ε στον κάτωθι τύπο. Με Ο συμβολίζονται τα παρατηρούμενα δηλ. τα «Observed». Εν συνεχεία με τον ανωτέρω τύπο υπολογίζουμε την τιμή του κριτηρίου (χι-τετράγωνο) και την συγκρίνουμε με την τιμή της 2 αποφανθούμε. R { Xνα κατανομής , προκειμένου  X2 } ( s  1)( k  1); a Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 36 Όπως φαίνεται στο παρακάτω παράθυρο «Frequency Table» τα θεωρητικά μεγέθη εμφανίζονται κάτω από τα παρατηρούμενα: Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 37 Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 38 Ε. ΠΑΠΑΓΕΩΡΓΙΟΥ 39

Use Quizgecko on...
Browser
Browser