Διάλεξη_9___Πιθανότητες_και_Αρχές_Στατιστικής PDF
Document Details
![HardierLyric5927](https://quizgecko.com/images/avatars/avatar-4.webp)
Uploaded by HardierLyric5927
Πανεπιστήμιο Πατρών
Σωτήρης Νικολετσέας
Tags
Summary
Lecture 9 notes on probabilities and statistics for the undergraduate level. The lecture covers point estimation, method of moments, method of least squares, and maximum likelihood estimation. It also covers examples of different estimation methods.
Full Transcript
“Πιθανότητες και Αρχές Στατιστικής” (9η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Σωτήρης Νικολετσέας, καθηγητής 1 / 47 Σημερινό μάθ...
“Πιθανότητες και Αρχές Στατιστικής” (9η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Σωτήρης Νικολετσέας, καθηγητής 1 / 47 Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις, σημειακή εκτίμηση παραμέτρων και γραμμική παλινδρόμηση Στατιστική συμπερασματολογία (ή “εκτιμητική”): εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού με βάση ένα (σχετικά μικρό) τυχαίο υποσύνολό του (δείγμα) - Γίνεται μελέτη των δειγματικών δεδομένων και επαγωγή τους στον (γεννήτορα) πληθυσμό (στατιστική επαγωγή), με μια ορισμένη πιθανότητα εμπιστοσύνης στην επιτυχία αυτής της επαγωγικής διαδικασίας. Αντιθέτως, η θεωρία Πιθανοτήτων είναι εγγενώς απαγωγική, δηλαδή ουσιαστικά γνώση για τον πληθυσμό (όλον) μεταφέρεται (απάγεται) στο τυχαίο δείγμα (μέρος). Παράδειγμα: - πιθανοθεωρία: ξέρω ότι ο χρόνος ζωής λαμπτήρων ακολουθεί εκθετική κατανομή με παράμετρο λ, και υπολογίζω την πιθανότητα συγκεκριμένων χρόνων ζωής σε κάποιους λαμπτήρες. - στατιστική επαγωγή: ξέρω ότι οι λαμπτήρες έχουν εκθετικά κατανεμημένο χρόνο ζωής, χωρίς να ξέρω την παράμετρο λ, και συμπεραίνω την λ από τους πραγματικούς χρόνους ζωής σε ένα τυχαίο δείγμα λαμπτήρων. Σωτήρης Νικολετσέας, καθηγητής 2 / 47 Βασικές μέθοδοι στατιστικής συμπερασματολογίας Σημειακές εκτιμήσεις: Στόχος είναι η κατασκευή μιας εκτίμησης για μία τιμή (δηλαδή ένα σημείο και όχι ένα διάστημα της άγνωστης παραμέτρου), μαζί με τον υπολογισμό του σφάλματος. Παράδειγμα: η εκτίμηση της παραμέτρου λ για τον (εκθετικά κατανεμημένο) χρόνο ζωής λαμπτήρων Διαστήματα εμπιστοσύνης: Αντί για μια τιμή, αναζητούμε ένα φάσμα τιμών (διάστημα). Αυτό είναι ιδιαίτερα χρήσιμο όταν το δείγμα είναι μικρό ή/και όταν το σφάλμα εκτίμησης είναι σχετικά μεγάλο. Παράδειγμα: οι φυσιολογικές τιμές ιατρικών εξετάσεων, το αποδεκτό εύρος τιμών κατά τη μέτρηση αστικών ρύπων ΄Ελεγχοι στατιστικών υποθέσεων: ελέγχεται αν μια πρόταση αναφορικά με κάποιο χαρακτηριστικό ενός πληθυσμού είναι σωστή Σωτήρης Νικολετσέας, καθηγητής 3 / 47 Σημειακές Εκτιμήσεις Σε αυτή τη διάλεξη θα ασχοληθούμε με σημειακές εκτιμήσεις. Η σημειακή εκτίμηση γίνεται μέσω εύρεσης και αξιολόγησης εκτιμητριών συναρτήσεων. Μέθοδοι εύρεσης εκτιμητριών συναρτήσεων: - Μέθοδος ροπών - Μέθοδος ελαχίστων τετραγώνων - Μέθοδος μέγιστης πιθανοφάνειας Βασικά κριτήρια αξιολόγησης εκτιμητριών συναρτήσεων: - αμεροληψία ή εγκυρότητα - αποτελεσματικότητα ή αξιοπιστία - συνέπεια Σωτήρης Νικολετσέας, καθηγητής 4 / 47 Τυχαίο Δείγμα - αντιστοιχία με Θεωρία Πιθανοτήτων Πληθυσμός: ένα σύνολο ανθρώπων, συσκευών κλπ (“στοιχεία”) των οποίων μελετώνται ορισμένα χαρακτηριστικά π.χ. το μηνιαίο εισόδημα των ανθρώπων, η διάρκεια ζωής των λαμπτήρων Σημαντική αντιστοιχία με Θεωρία Πιθανοτήτων: - πληθυσμός ↔ συνάρτηση κατανομής F - χαρακτηριστικό ↔ τυχαία μεταβλητή X δηλαδή, θεωρούμε ότι η θεωρητική συμπεριφορά του πληθυσμού ακολουθεί κάποια συνάρτηση κατανομής F , και ότι οι συγκεκριμένες τιμές του χαρακτηριστικού σε ένα τυχαίο δείγμα περιγράφονται από μια τυχαία μεταβλητή X που έχει την κατανομή F. Σωτήρης Νικολετσέας, καθηγητής 5 / 47 Πιθανοθεωρητική Απαγωγή και Στατιστική Επαγωγή Αν ξέραμε την F (π.χ. την παράμετρο λ για την εκθετική κατανομή του χρόνου ζωής των λαμπτήρων) θα μπορούσαμε να εκτιμήσουμε πλήρως την πιθανοθεωρητική συμπεριφορά ενός τυχαίου δείγματος π.χ. του χρόνου ζωής X ενός λαμπτήρα. Στην πράξη όμως, δεν ξέρουμε ακριβώς την F (δηλαδή, ξέρουμε ότι είναι εκθετική αλλά αγνοούμε την παράμετρο της λ) και έχουμε μόνο ορισμένες πραγματικές μετρήσεις (δηλαδή τιμές της μεταβλητής X), π.χ. παρατηρούμε τους χρόνους ζωής X1 , X2 ,... , Xν από ν λαμπτήρες. Σκοπός μας είναι να εκτιμήσουμε την άγνωστη παράμετρο λ. Σωτήρης Νικολετσέας, καθηγητής 6 / 47 Τυχαίο δείγμα Ορισμός: Αν ένας πληθυσμός έχει συνάρτηση κατανομής F , καλούμε τυχαίο δείγμα του ένα σύνολο ανεξάρτητων τυχαίων μεταβλητών X1 , X2 ,... , Xν που όλες ακολουθούν την συνάρτηση κατανομής F. Γράφουμε: X1 , X2 ,... , Xν ∼ F και καλούμε τον αριθμό ν μέγεθος του δείγματος. Παρατήρηση: Μετά τη δειγματοληψία, οι τ.μ. X1 , X2 ,... , Xν παίρνουν συγκεκριμένες τιμές (πραγματικές μετρήσεις) x1 , x2 ,... , xν. Οι στατιστικές μέθοδοι βασίζονται σε αυτές ακριβώς τις μετρήσεις xi. Σωτήρης Νικολετσέας, καθηγητής 7 / 47 Εκτιμήτριες Συναρτήσεις ΄Εστω τυχαίο δείγμα X1 , X2 ,... , Xν από μία συνάρτηση κατανομής F (x; θ) όπου η παράμετρος θ είναι άγνωστη, και την οποία προσπαθούμε να “εκτιμήσουμε” με βάση το δείγμα. Για το σκοπό αυτό θα χρησιμοποιήσουμε στατιστικές συναρτήσεις (συναρτήσεις ορισμένες στο δείγμα) που καλούνται εκτιμήτριες. Ορισμός: ΄Εστω τυχαίο δείγμα X1 , X2 ,... , Xν από τη συνάρτηση κατανομής F = F (x; θ), όπου θ άγνωστη παράμετρος της F. Οποιαδήποτε συνάρτηση T (X): T = T (X1 , X2 ,... , Xν ) ορισμένη στο δείγμα χωρίς να εξαρτάται από την άγνωστη παράμετρο θ καλείται εκτιμήτρια συνάρτηση της παραμέτρου. Παρατήρηση: Ακριβώς επειδή η T σκοπεύει στην εκτίμηση της άγνωστης παραμέτρου θ, δεν μπορεί να εξαρτάται από την θ (ή τυχόν άλλες άγνωστες παραμέτρους). Πολλές φορές η T (X) συμβολίζεται με θ̂ και οι αριθμητικές τιμές που παίρνει καλούνται εκτιμήσεις. Σωτήρης Νικολετσέας, καθηγητής 8 / 47 Παράδειγμα Εκτιμητριών Συναρτήσεων Παράδειγμα: ΄Εστω μηχανή που παράγει εξαρτήματα και υποθέτουμε ότι κάθε παραγόμενο εξάρτημα είναι λειτουργικό με πιθανότητα p και ελαττωματικό με πιθανότητα 1 − p (που χαρακτηρίζει την ποιότητα της μηχανής), στοχαστικά ανεξάρτητα για τα διάφορα εξαρτήματα. Θέλουμε να εκτιμήσουμε την άγνωστη παράμετρο θ = p επιτυχούς δημιουργίας εξαρτημάτων παρατηρώντας ένα τυχαίο δείγμα X1 , X2 ,... , Xν από ν εξαρτήματα. Προφανώς οι Xi ακολουθούν την κατανομή Bernoulli: ( X1 , X2 ,... , Xν ∼ b(θ), 0