Estatística Inferencial - Aulas PDF
Document Details
Uploaded by BetterScholarship4431
Instituto Federal de São Paulo
Roberta Caetano Fleira
Tags
Summary
Estas notas de aula cobrem conceitos fundamentais de inferência estatística e amostragem. Discutem os tipos de amostragem e métodos para extrair amostras representativas de uma população. O documento é direcionado para estudantes de graduação.
Full Transcript
# Estatística Inferencial ## Profa. Dra. Roberta Caetano Fleira ### Instituto Federal São Paulo ### Campus Pirituba ## Você sabe o que é inferência estatística? É uma área da Estatística cujo objetivo é fazer afirmações a partir de um conjunto de valores representativos (amostra) sobre um universo...
# Estatística Inferencial ## Profa. Dra. Roberta Caetano Fleira ### Instituto Federal São Paulo ### Campus Pirituba ## Você sabe o que é inferência estatística? É uma área da Estatística cujo objetivo é fazer afirmações a partir de um conjunto de valores representativos (amostra) sobre um universo e se assume que a amostra é muito maior do que o conjunto de dados observados. Esta afirmação deve sempre vir acompanhada de uma medida de precisão sobre sua veracidade. Para realizar este trabalho, o estatístico coleta informações de dois tipos: experimentais (as amostras) e aquelas que obtém na literatura. As duas principais escolas de inferência são a inferência frequentista (ou clássica) e a inferência bayesiana. ## Definições básicas ### Variável aleatória: - Característica numérica do resultado de um experimento. - É a função que associa a cada elemento do espaço amostral um número real. ### População e amostra: - **População:** é o conjunto de todos os elementos ou resultados de um problema que está sendo estudado. - **Amostra:** é qualquer subconjunto da população que contém os elementos que podem ser observados e é onde as quantidades de interesse podem ser medidas. ### Parâmetros: - Característica numérica (desconhecida) da distribuição dos elementos da população. ### Estimador: - É a função da amostra, construída com a finalidade de representar, ou estimar um parâmetro de interesse na população. ### Estimativa: - Valor numérico que um estimador assume ## Exemplo: A distribuição da altura da população brasileira adulta pode ser representada por um modelo normal (embora as alturas não possam assumir valores negativos). Neste caso, temos como interesse estimar os parâmetros média e variância dessa distribuição. - **Solução 1:** Medir a altura de todos os brasileiros adultos. - **Solução 2:** Selecionar de forma aleatória algumas pessoas (amostra), analisá-las e inferir propriedades para toda a população. ## Amostragem A amostragem é o processo pelo qual recolhemos dados. Isto dá-nos apenas uma imagem da população em estudo. No entanto, e independentemente da correção dos processos usados, para recolher a amostra, há sempre a considerar o chamado erro de amostragem. Devemos sempre esperar algumas diferenças entre a amostra e a população. Por outro lado, por exemplo, o erro pode residir não só na amostragem, mas também nos próprios dados. Erros não amostrais acontecem quando os valores recolhidos não pertencem aos valores possíveis da entidade (exemplo: registado o valor 21 para uma nota, quando deveria ter sido 12) ou quando apenas uma pequena proporção da população é recolhida. ## Tipos de amostragem De uma maneira geral, os tipos de amostragem podem ser de dois tipos: aleatórias e não aleatória. ## Técnicas de amostragem As Técnicas de Amostragem atuam no estudo de um pequeno grupo de elementos retirado de uma população que se pretende conhecer. Esses pequenos grupos retirados da população são chamados de Amostras. ## Técnicas probabilísticas (aleatórias) As técnicas probabilísticas garantem a possibilidade de realizar afirmações sobre a população com base nas amostras. Normalmente, todos os elementos da população possuem a mesma probabilidade de serem selecionados. Assim, considerando N como o tamanho da população, a probabilidade de cada elemento ser selecionado será 1/N. Estas técnicas garantem o acaso na escolha. ## Técnicas Probabilísticas: ### Amostragem aleatória simples Amostragem Aleatória Simples é o processo mais elementar e frequentemente utilizado. Ela pode ser realizada a partir da numeração dos elementos da população de 1 a n e sorteando, por meio de um dispositivo aleatório qualquer, X números dessa sequência, que corresponderão aos elementos pertencente à amostra. #### Exemplo: Obter uma amostra representativa de 10% de uma população de 200 alunos de uma escola. 1°) Numerar os alunos de 1 a 200; 2°) Escrever os números de 1 a 200 em pedaços de papel e colocá-los em uma urna; 3°) Retirar da urna 20 pedaços de papel, um a um, formando a amostra da população. Nesta técnica de amostragem, todos os elementos da população têm a mesma probabilidade de serem selecionados: 1/N, onde N é o número de elementos da população. ### Amostragem estratificada Quando a população possui características que permitem a criação de subconjuntos, as amostras extraídas por amostragem simples são menos representativas. Nesse caso, a amostragem estratificada é utilizada. Como a população se divide em subconjuntos, convém que o sorteio dos elementos leve em consideração tais divisões para que os elementos da amostra sejam proporcionais ao número de elementos desses subconjuntos. Observe a figura abaixo: **Figura 01: Relação entre população e amostra** | População | Amostra | |---|---| | 10% | 10% | | 20% | 20% | | 70% | 70% | | Alunos | Alunos | | Professores | Professores | | Colaboradores | Colaboradores | **Exemplo:** Em uma população de 400 alunos, há 240 meninos e 160 meninas. Extraia uma amostra representativa de 10% dessa população. Nesse exemplo, há uma característica que permite identificar 2 subconjuntos, a característica Sexo. Considerando essa divisão, vamos extrair a amostra da população. **Tabela-1: Relação entre População e Amostra.** | Sexo | População | Amostra (10%) | |---|---|---| | Masculino | 240 | 24 | | Feminino | 160 | 16 | | Total | 400 | 40 | Portanto, a amostra deve conter 24 alunos do sexo masculino e 16 do sexo feminino, totalizando 40 alunos, que correspondem a 10% da população. Para selecionar os elementos da população com o objetivo de formar a amostra, podemos executar os seguintes passos: 1°) Numerar os alunos de 1 a 400, sendo os meninos numerados de 1 a 240 e as meninas, de 241 a 400; 2°) Escrever os números de 1 a 240 em pedaços de papel e colocá-los em uma urna A; 3°) Escrever os números de 241 a 400 em pedaços de papel e colocá-los em uma urna B; 4°) Retirar da urna A 24 pedaços de papel, um a um, e 16 da urna B, formando a amostra da População. São exemplos desta técnica de amostragem as pesquisas eleitorais por região, cidades pequenas e grandes, área urbana e área rural, sexo, faixa etária, faixa de renda, etc. ### Amostragem sistemática Esta técnica de amostragem é aplicada em populações que possuem os elementos ordenados em que não há a necessidade de construir um sistema de referência. Nesta técnica, a seleção dos elementos que comporão a amostra pode ser feita por um sistema criado pelo pesquisador. #### Exemplo: Obter uma amostra de 80 casas de uma rua que contém 2000 casas. Nesta técnica de amostragem, podemos realizar o seguinte procedimento: 1°) Como 2000 dividido por 80 é igual a 25, escolhemos por um método aleatório qualquer um número entre 1 e 25, o que indica o primeiro elemento selecionado para a amostra. 2°) Consideramos os demais elementos, periodicamente, de 25 em 25. Se o número sorteado entre 1 e 25 for o número 8, a amostra será formada pelas casas: 8º, 33º, 58°, 83°, 108°, etc. Apesar de esta técnica ser de fácil execução, há a possibilidade de haver ciclos de variação, o que tornariam a amostra não-representativa da população. ### Amostragem por conglomerados Esta técnica é usada quando a identificação dos elementos da população é extremamente difícil. Todavia, pode ser relativamente fácil dividir a população em conglomerados (subgrupos) heterogêneos representativos da população global. A seguir, é descrito o procedimento de execução desta técnica: 1°) Seleciona uma amostra aleatória simples dos conglomerados existentes; 2°) Realizar o estudo sobre todos os elementos do conglomerado selecionado. São exemplos de conglomerados: quarteirões, famílias, organizações, agências, edifícios, etc. #### Exemplo: Estudar a população de uma cidade, dispondo apenas do mapa dos quarteirões da cidade. Neste caso, não temos a relação dos moradores da cidade, restando o uso dos subgrupos heterogêneos (conglomerados). Para realizar o estudo estatístico sobre a cidade, realizaremos os seguintes procedimentos: 1°) Numerar os quarteirões de 1 an; 2°) Escrever os números de 1 a nem pedaços de papel e colocá-los em uma urna; 3°) Retirar um pedaço de papel da urna e realizar o estudo sobre os elementos do conglomerado selecionado ## Você sabe o que é inferência estatística? A estatística inferencial, o segundo tipo de procedimentos em estatística, preocupa-se com o raciocínio necessário para, a partir dos dados, se obter conclusões gerais. O seu objetivo é obter uma afirmação acerca de uma população com base numa amostra. Estas inferências ou generalizações podem também ser de dois tipos: estimações ou decisões (testes de hipóteses). ## Técnicas não-probabilísticas (não-aleatórias) São técnicas em que há uma escolha deliberada dos elementos da população onde não permite generalizar os resultados das pesquisas para a população, pois amostras não garantem a representatividade desta. ## Amostragem acidental Trata-se da formação de amostras por aqueles elementos que vão aparecendo. Este método é utilizado, geralmente, em pesquisas de opinião em que os entrevistados são acidentalmente escolhidos. #### Exemplo: Pesquisas de opinião em shoppings, praças e locais públicos de grandes cidades, etc. ## Amostragem intencional De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que comporão a amostra. O pesquisador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. #### Exemplo: Em uma pesquisa sobre preferência por determinada cerveja, o pesquisador entrevista os frequentadores dos bares de uma cidade. ## Vamos definir alguns termos? - **Parâmetro:** Característica da população. - **Estatística:** Característica descritiva de elementos de uma amostra. - **Estimativa:** valor acusado por uma estatística que estima o valor de um parâmetro. *O cálculo do tamanho da amostra está diretamente ligado ao erro amostral tolerável. ## Amostragem por cotas É um método de amostragem não probabilístico, no qual os pesquisadores podem formar uma amostra de indivíduos que representam uma população e são escolhidos de acordo com suas características ou qualidades. ## Amostragem a esmo ou sem norma É aquela em que o amostrador, para simplificar o processo, procura ser aleatório sem, no entanto, realizar propriamente o sorteio usando algum dispositivo aleatório confiável. ## Lista de exercícios SAMPAIO, Nilo Antônio de Souza; ASSUMPÇÃO, Alzira Ramalho Pinheiro de; FONSECA, Bernardo Bastos da. Estatística inferencial. Belo Horizonte: Editora Poisson, 2018. 71 p. ISBN 9788570420282. Disponível em: <http://pergamum.ifsp.edu.br/pergamumweb/vinculos/00006a/00006af8.pdf>. Acesso em: 30 set. 2024.