Métodos de Investigação em Psicologia: Noções Básicas PDF
Document Details
Uploaded by SelfSatisfactionFriendship
Faculdade de Psicologia da Universidade de Lisboa
Tomás Palma
Tags
Summary
This document is a lecture presentation from a course on Research Methods in Psychology. It details various sampling methods, focusing on probabilistic and non-probabilistic sampling techniques, as well as concepts like internal and external validity and measurement qualities, such as construct validity and reliability. The presentation gives examples and uses charts and tables.
Full Transcript
1 Amostras & Amostragem Sumário Validade Interna & Validade Externa Qualidades Métricas das medidas: Validade Construto & Fidelidade Amostragem POPULAÇÃO...
1 Amostras & Amostragem Sumário Validade Interna & Validade Externa Qualidades Métricas das medidas: Validade Construto & Fidelidade Amostragem POPULAÇÃO Amostra ▪ Processo através do qual se constitui uma amostra da população alvo. ▪ Do tipo de amostragem dependem as possibilidades de generalização dos resultados. Teoria da Amostragem ▪ Inferências acerca da população alvo (e.g., todos os utilizadores de transportes públicos na cidade de Lisboa) com base no estudo feito Amostragem Inferência numa amostra (e.g., 1000 utilizadores de transportes públicos na cidade de Lisboa) ▪ Amostra deve refletir características da população alvo. 3 Amostra: Representatividade ▪ Uma amostra representativa é uma amostra que tem as características da população, e, por isso mesmo, pode ser tratada como a população. ▪ Uma amostra é representativa da população quando: — foi extraída aleatoriamente; — as proporções das diferentes categorias da população se mantêm na amostra. Amostragem aleatória – essencial para avaliar a Validade Externa de um estudo (seleção dos participantes de uma população) Distribuição aleatória – essencial para avaliar a Validade Interna de um estudo (distribuição dos participantes selecionados pelos grupos, se os houver) 4 Tipos de Amostras População de interesse Os membros da população Todos os membros da não têm todos a mesma população têm a mesma propobabilidade serem propobabilidade serem selecionados. selecionados. Não- Probabilisticas probabilisti cas Aleatória Sistemática Conveniência Seletiva simples Sobre- Bola de Clusters Cotas amostragem neve Estratificada Probabilísticas Descrição A forma mais básica de amostragem probabilística, onde cada indivíduo da população tem a mesma probabilidade de ser selecionado. Por exemplo, 1. Amostragem atribui-se um número a cada indivíduo da população e selecionam-se aleatória simples aleatoriamente alguns usando uma tabela ou software de números aleatórios. Quando a população já está dividida em grupos ou unidades (clusters), selecionam-se aleatoriamente alguns desses grupos e todos os indivíduos 2. Amostragem dentro de cada grupo escolhido são incluídos na amostra. Por exemplo, por clusters selecionar aleatoriamente n escolas secundárias em uma cidade e incluir todos os alunos dessas escolas. A população é dividida em subgrupos ou estratos com base em características comuns. Em seguida, seleciona-se aleatoriamente 3. Amostragem elementos de cada estrato, geralmente em proporção ao tamanho de estratificada cada estrato na população. Isso assegura que todos os subgrupos relevantes estejam representados na amostra. Exemplo de Estratificação e.g., Distribuição dos alunos da Universidade de Lisboa por ciclo estudos: N Licenciatura 35.196 Mestrado 8.465 Doutoramento 3.882 Total 47.543 Queremos selecionar 10% dos estudantes → Calcular % por ciclo de estudos N % n Licenciatura 35.196 74% 3518 Mestrado 8.465 18% 856 Doutoramento 3.882 8% 380 Total 47.543 100 % 4754 7 https://www.ulisboa.pt/sites/ulisboa.pt/files/publications/files/ulisboa_numeros_pt_site.pdf Probabilísticas Descrição Uma variação da amostragem estratificada, na qual o investigador intencionalmente seleciona um número maior de elementos 4. Sobre- (participantes) de certos estratos, a fim de garantir uma representação amostragem mais forte de grupos específicos. Isso é comum quando certos estratos são sub-representados na população ou quando é necessário estudar grupos menores em mais detalhe. Objetivo: Obter uma amostra de 1000 pessoas que vivem na cidade do Porto garantindo a inclusão de pessoas Asiáticas. Problema: Apenas 4% dos habitantes da cidade do Porto são Asiáticos. 4% = 40 indivíduos. Como 40 indivíduos podem não ser suficientes para fazer estimativas estatísticas precisas, os investigadores decidem que das 1000 pessoas que vão selecionar, 100 serão aleatoriamente selecionados da comunidade de Asiáticos. Neste exemplo, o grupo de pessoas Asiáticas constituirá 10% da amostra, embora represente apenas 4% da população alvo. 9 Probabilísticas Descrição O investigador escolhe o primeiro elemento da amostra de forma aleatória (por exemplo, selecionando a 4ª pessoa na fila), e depois escolhe sucessivamente o próximo indivíduo a cada intervalo fixo (por exemplo, a 5. Amostragem cada 7ª pessoa). Usando um computador ou uma tabela de números sistemática aleatórios, o investigador determina o ponto de partida e o intervalo (k) entre as escolhas, garantindo que todos os elementos da população tenham a mesma chance de ser selecionados. Tipos de Amostras População de interesse Os membros da Todos os membros da população têm todos a população têm a mesma mesma propobabilidade propobabilidade serem serem selecionados. selecionados. Não- Probabilisticas probabilisti cas Aleatória Conveniênc Sistemática Seletiva simples ia Clusters Sobre- Bola de Cotas amostragem neve Estratificada Não- Descrição probabilísticas 1. Amostragem As pessoas que incluem a amostra são voluntários ou convidados pelo por conveniência investigador. O investigador divide a população em subgrupos relevantes e define um 2. Amostragem número-alvo para cada grupo (ex.: 80 Médicos, 40 Psicólogos e 120 por cotas Enfermeiros), para garantir uma representação proporcional desses grupos na amostra final. O investigador escolhe intencionalmente participantes com base em 3. Amostragem características específicas que ele considera relevantes para a seletiva investigação, sem se preocupar com a distribuição proporcional desses grupos na amostra (ex.: 20 Médicos, 20 Psicólogos e 20 Enfermeiros) Variante da amostragem seletiva, usada para identificar indivíduos com 4. Amostragem características específicas. Aqui, cada participante sugere outras pessoas por bola de neve com o perfil desejado, expandindo a amostra em cadeia. Validade Interna e Validade Externa ‘Fora’ Estudo: Validade Externa O mesmo fenómeno ocorre noutros contextos/amostras? ‘Dentro’ Estudo: Validade Interna A investigação foi bem conduzida? Validade Interna Grau de certeza com que se podem tirar conclusões sobre a relação entre as variáveis independentes e dependente, remetendo para a solidez metodológica e o controlo experimental do estudo. Existem explicações alternativas para os resultados obtidos? Posso dizer que Y se deve a X, e não Z? Validade Interna: Ameaças Ameaça Descrição A relação observada entre duas variáveis (VI -> VD) pode ser explicada 1. Terceira por uma terceira variável não controlada, que é, na realidade, a variável verdadeira causa da relação entre as duas primeiras 15 O Problema da terceira variável 16 Não confundir com variáveis estranhas! Variáveis estranhas são variáveis não controladas ou negligenciadas que podem influenciar os resultados de um estudo, mas não fazem parte da relação causal entre a VI e a variável dependente VD. Elas afetam a interpretação, mas não são a causa principal do efeito observado. Exemplo: Em um estudo sobre o impacto do sono no desempenho académico, o nível de stress não controlado pode afetar o desempenho dos participantes. O stress é uma variável estranha porque não foi controlado, mas não é a causa principal do desempenho. Ameaça Descrição Eventos externos não planeados podem afetar as respostas dos participantes durante o estudo. Estes eventos podem ocorrer entre o início e o fim do estudo 2. História e interferir nas variáveis dependentes, dificultando a interpretação dos resultados. Processos de desenvolvimento associados à passagem do tempo, que podem causar mudanças duradouras (e.g., puberdade) ou temporárias (e.g., fadiga) nos 3. Maturação participantes, influenciando os resultados de forma não relacionada à intervenção experimental. Enviesamentos na distribuição dos participantes pelos grupos podem ocorrer, 4. Seleção levando a uma comparação entre grupos que não são homogéneos, o que compromete a interpretação causal dos resultados. 18 Objetivo: Testar uma nova terapia intensiva para o autismo, cle is intended solely for the personal use of the individual user and is not to be disseminated broadly. envolvendo sessões individuais com um terapeuta durante ocument is copyrighted by the American Psychological Association or one of its allied publishers. 40 horas por semana. Procedimento: Recrutaram 38 famílias que tinham crianças com autismo e providenciaram que algumas crianças recebessem o novo tratamento intensivo enquanto outras recebiam o tratamento normal. Atribuíram famílias ao grupo de tratamento intensivo vs. grupo de tratamento usual. No entanto, algumas famílias moravam demasiado longe para receber o novo tratamento; outros pais protestaram que preferiam fazer parte do grupo de tratamento intensivo. Assim, nem todas as famílias foram atribuídas aleatoriamente aos dois grupos. 19 20 Ameaça Descrição A desistência dos participantes tende a não ser aleatória, ocorrendo frequentemente de forma seletiva (por exemplo, participantes com 5. Mortalidade dificuldades podem desistir mais cedo). A mortalidade pode distorcer os resultados, especialmente se as desistências não ocorrerem de forma equilibrada entre os grupos. A mera experiência dos participantes ao fazerem o teste em várias fases 6. Avaliações pode mudar o desempenho. Por exemplo, os participantes podem repetidas/ aprender ou ficar mais familiarizados com o teste, o que pode resultar em aprendizagem um aumento do desempenho na segunda avaliação, independentemente do tratamento experimental. 7. Instrumentação Alterações nos instrumentos de medição entre o pré-teste e o pós-teste podem afetar os resultados. Além disso, o uso de instrumentos diferentes para medir os grupos ou a fidelidade dos observadores pode introduzir viés e comprometer a consistência dos dados. 21 Ameaça Descrição 8. Enviesamentos Quando o investigador não está cego às condições experimentais, pode do investigador haver enviesamento na recolha ou interpretação dos dados. Isto ocorre quando o investigador tem uma expectativa sobre os resultados, influenciando, intencionalmente ou não, a forma como observa ou interpreta os dados. 9. Difusão da A comunicação entre os participantes dos grupos experimentais e de intervenção controlo pode resultar na difusão da intervenção. Ou seja, os participantes de um grupo podem partilhar informações sobre a experiência com os do outro grupo, o que pode afetar a igualdade das condições experimentais e prejudicar a validade do estudo. 22 Validade Interna Estudos com maior validade interna são aqueles que têm: ▪ Maior controlo do experimentador ▪ Manipulação da variável independente ▪ Distribuição aleatória dos participantes pelas condições ▪ Controlo de variáveis externas ▪ Experimentador/avaliador é cego às condições experimentais ▪ Medidas objetivas e rigorosas 23 23 Validade Externa Grau de certeza com que se pode generalizar os resultados obtidos a outras amostras ou populações, contextos e momentos (i.e., posso dizer que teria os mesmos resultados com outra amostra, noutro contexto e noutra altura?). Critérios para avaliar a validade externa de um estudo: Representatividade dos participantes (amostras probabilísticas) Representatividade do contexto/situação ▪ Considerar validade ecológica: em que medida as tarefas e manipulações de um estudo são semelhantes aos contextos do mundo real 24 24 Validade Externa Estudos com maior validade externa são aqueles que têm: ▪ Amostras aleatórias ▪ Amostras representativas ▪ Meios naturalistas (contextos, problemas, variáveis) ▪ Observação ou descrição de fenómenos 25 25 Erro de Medição e Qualidades Métricas dos Instrumentos Qualquer operacionalização de um constructo contém erro. — Erro aleatório (e.g., indisposição temporária) — Erro sistemático (e.g., baixas expectativas do avaliador) É importante reduzir o erros sistemático! FIDELIDADE VALIDADE de CONSTRUTO Grau com que é possível medir de forma Grau com que uma medida reflete o consistente um determinado conceito conceito que se pretende medir. (precisão). 26 Fidelidade: Quão consistentes são os resultados de uma medida? Teste-Reteste Uma amostra de pessoas realiza um teste de QI hoje. (Consistência Temporal) Quando fazem o teste novamente um mês depois, espera- se que os resultados sejam consistentes. Ou seja, se uma Correlação entre os valores observados em pessoa obteve uma pontuação alta no momento 1, é dois momentos no tempo esperado que mantenha uma pontuação relativamente alta no momento 2. A consistência nas pontuações ao longo do tempo indica que o teste é confiável. Consistência Interna Uma amostra preenche uma escala de bem-estar subjetivo (e.g., alfa de Cronbach, α) composta por cinco itens. Apesar de os itens estarem formulados de maneira ligeiramente diferente, todos têm Medida em que valores registados em como objetivo medir o mesmo construto: o bem-estar diferentes itens/ensaios medem um mesmo subjetivo. Assim, espera-se que as pessoas que concordem conceito com o primeiro item também tendam a concordar com o segundo, terceiro, e assim por diante. Da mesma forma, quem discorde de um item provavelmente também 28 discordará dos restantes. Fidelidade: Quão consistentes são os resultados de uma medida? Consistência Dois observadores estão a observar o comportamento de Inter-observadores um grupo de crianças num parque para avaliar o número de sorrisos de cada criança. Se ambos observarem as Correlação entre cotações de diferentes mesmas crianças ao mesmo tempo, espera-se que observadores concordem nas suas observações, identificando as mesmas crianças como as que sorriram mais e as que sorriram menos. Se houver um alto grau de concordância entre os dois observadores, isso indica uma boa consistência inter- observadores. 29 Validade de Construto: Mede o que é suposto medir? Validade de critério Avalia se a medida está relacionada com um resultado comportamental concreto que teoricamente deveria estar associado a esse constructo. Esta validade pode ser estabelecida através de correlações com um critério conhecido que a medida deve prever. Exemplo: Se o teste de inteligência é válido, espera-se que os resultados neste teste estejam associados ao desempenho académico. Ou seja, os resultados do teste de inteligência devem correlacionar-se positivamente com as notas dos exames do 1º semestre (critério). 31 Validade de Construto: Mede o que é suposto medir? Validade convergente Refere-se ao grau em que uma medida se correlaciona com outras medidas que avaliam o mesmo constructo ou constructos muito semelhantes. Uma alta validade convergente indica que a medida é consistente com outras formas de medir o mesmo conceito. Exemplo: Uma escala de ansiedade deve correlacionar-se fortemente com outras escalas de ansiedade ou medidas que avaliem o mesmo constructo, demonstrando que ambas estão a medir de forma semelhante o mesmo conceito. 32 Validade de Construto: Mede o que é suposto medir? Validade discriminante/divergente Indica que a medida em questão não está fortemente correlacionada com medidas de constructos diferentes, mostrando que a medida avalia algo distinto e específico, e não um conceito relacionado. Exemplo: Uma escala de ansiedade não deve correlacionar-se fortemente com uma escala de autoestima, uma vez que se espera que estes sejam constructos distintos. Se a correlação entre ambas as escalas for baixa, isso é um indicador de validade discriminante. 33 Validade de Construto: Mede o que é suposto medir? Validade facial e Validade de Conteúdo Parece uma boa medida? Validade Facial Uma medida tem validade facial se for subjetivamente considerada uma operacionalização plausível do construto em questão. Exemplo: a velocidade de resolução de problemas, o tamanho do vocabulário, e a criatividade têm boa validade facial como operacionalizações da inteligência. A circunferência da cabeça, não! Uma boa estratégia para aferir a validade facial é consultar experts no tópico em questão (e.g., inteligência). 34 Validade de Construto: Mede o que é suposto medir? Validade facial e Validade de Conteúdo Parece uma boa medida? Validade de conteúdo Para garantir a validade do conteúdo, uma medida deve capturar todas as dimensões do construto em causa. Exemplo: a definição de inteligência inclui a capacidade de “raciocinar, planear, resolver problemas, pensar abstratamente, compreender ideias complexas, aprender rapidamente e aprender com a experiência” (Gottfredson, 1997, p.. 13). Para ter validade de conteúdo adequada, qualquer operacionalização de inteligência deve incluir perguntas ou itens para avaliar cada um desses sete componentes. 35 Relação entre Fidelidade e Validade A validade de uma medida não é o mesmo que sua fidelidade! Uma medida pode ser menos válida do que fiável, mas não mais válida do fiável. Fidelidade: tem a ver com quão bem uma medida se correlaciona consigo mesma. Exemplo: um teste de QI possui fidelidade se estiver correlacionado consigo mesmo ao longo do tempo. Validade tem a ver com o quão bem uma medida está associada a outra coisa, como um comportamento que indica inteligência. Exemplo: Um teste de QI é válido se estiver associado a outra variável tal como o sucesso académico. Se uma medida nem consigo mesma se correlaciona, como pode estar mais 36 fortemente associada com alguma outra variável? Relação entre Fidelidade e Validade A validade de uma medida não é o mesmo que sua fidelidade! Uma medida pode ser menos válida do que fiável, mas não mais válida do fiável. Fidelidade: tem a ver com quão bem uma medida se correlaciona consigo mesma. Exemplo: um teste de QI possui fidelidade se estiver correlacionado consigo mesmo ao longo do tempo. Validade tem a ver com o quão bem uma medida está associada a outra coisa, como um comportamento que indica inteligência. Exemplo: Um teste de QI é válido se estiver associado a outra variável tal como o sucesso académico. Se uma medida nem consigo mesma se correlaciona, como pode estar mais fortemente associada com alguma outra variável? 37 Bibliografia Howitt, D. & Cramer, D. (2016). Introduction to research methods in psychology (5th ed). Harlow, England: Pearson. Capítulo 3. Fundamentals of testing and measurement Capítulo13. Sampling and population surveys (Types of probability sampling) 38 39