TCC_Dionisia (2) - Comparação de Mediadas de Associação para Avaliar a Associação entre Cargas Virais HIV em Moçambique - PDF
Document Details
Uploaded by RespectableArchetype
Universidade Eduardo Mondlane
2022
Dionísia Rodrigues Demba
Tags
Summary
Este TCC apresenta uma análise da comparação de medidas de associação para avaliar a associação entre cargas virais de HIV em Moçambique. O estudo utilizou dados do MISAU e utilizou métodos estatísticos, como a regressão logística, para investigar a relação entre as cargas virais e outros fatores.
Full Transcript
Faculdade de Ciências Departamento de Matemática e Informática Licenciatura em Estatística Comparação de Mediadas de associação para avaliar a associação entre cargas virais de HIV em Moçambique Autora: Dionísia Rodrigues Demba Maputo, D...
Faculdade de Ciências Departamento de Matemática e Informática Licenciatura em Estatística Comparação de Mediadas de associação para avaliar a associação entre cargas virais de HIV em Moçambique Autora: Dionísia Rodrigues Demba Maputo, Dezembro de 2022 Faculdade de Ciências Departamento de Matemática e Informática Licenciatura em Estatística Comparação de Mediadas de associação para avaliar a associação entre cargas virais de HIV em Moçambique Autora: Dionísia Rodrigues Demba Supervisor: Maputo, Dezembro de 2022. DECLARAÇÃO DE HONRA Declaro por minha honra que o presente Trabalho de Licenciatura é resultado da minha investigação e que o processo foi concebido para ser submetido apenas para a obtenção do grau de Licenciado em Estatística, na Faculdade de Ciências da Universidade Eduardo Mondlane Maputo, Dezembro de 2022 (Dionísia Rodrigues Demba) i DEDICATÓRIA ii AGRADECIMENTOS iii Resumo. Palavras-chave: iv Abstract Key-Word: v Lista de Abreviaturas vi Índice 1 Introdução 1 1.1 Contextualização...................................... 1 1.1.1 Problematização.................................. 3 1.1.2 Objectivos...................................... 3 1.1.3 Relevância do Estudo............................... 4 1.1.4 Estrutura do trabalho............................... 4 2 Revisão da literatura 5 2.1 Conceitos.......................................... 5 2.1.1 AÇÕES PRIORITÁRIAS PARA MANEJO DA COINFECÇÃO TB-HIV.. 7 2.1.2 Manejo Clínico da PVHA com TB Ativa..................... 8 2.1.3 Estratégias de Adesão............................... 9 2.1.4 Noticação e Vigilância Epidemiológica..................... 9 2.1.5 Medidas de Controle da Transmissão da Tuberculose.............. 10 2.1.6 O Sintomático Respiratório............................ 11 2.1.7 Regressão logística................................. 13 2.1.8 Curva ROC..................................... 23 3 Material e Métodos 25 3.1 Material........................................... 25 3.2 Métodos.......................................... 26 3.2.1 Teste de independência............................... 26 3.2.2 Teste de signicância dos parâmetros....................... 27 3.2.3 Interpretação dos parãmetros do modelo..................... 29 3.2.4 Estratégia de análise................................ 30 4 Resultados 32 4.1 Análise descritiva e bivariada entre variáveis em estudo................. 32 vii 4.2 Análise de regressão Logística............................... 36 4.2.1 Inclusão de Variáveis independentes no Modelo................. 37 4.2.2 Analise do ajuste do modelo............................ 38 4.2.3 Validação do modelo............................... 40 5 Conclusão 41 5.1 Recomendações....................................... 41 Referências Bibliográcas 42 Anexos 44 viii Lista de Grácos 2.1 Medidas de controle da transmissão da tuberculose................... 12 2.2 Curva da função logística................................. 18 4.1 Distribuição percentual do sexo dos pacientes inquiridos................ 32 4.2 Distribuição percentual da idade dos pacientes inquiridos................ 33 4.3 Distribuição percentual dos pacientes coinfectados com HIV.............. 33 5.1 Curva ROC......................................... 44 ix Lista de Tabelas 2.1 Área abaixo da curva ROC................................ 23 2.2 Medida de qualidade de ajuste KS............................ 23 3.1 Variáveis Incluídas no estudo e suas descrições...................... 26 4.1 Distribuição das frequências absolutas e relativas; e I.C. das frequências relativas.. 34 4.2 Teste de Multicolinearidade................................ 36 4.3 Coeciente do Modelo apenas com a constante..................... 36 4.4 Classicação para o modelo com a constante...................... 37 4.5 Classicação para o modelo com a constante...................... 37 4.6 Resumo do Modelo..................................... 38 4.7 Parâmetros das variáveis no Modelo logístico...................... 39 4.8 Área sob a curva ROC e o respectivo IC......................... 40 x Capítulo 1 Introdução 1.1 Contextualização Segundo Guimarães et al. (2010), o HIV é um retrovírus com genoma RNA, da Família Retro- viridae (retrovírus) e subfamília Lentivirinae. Pertence ao grupo dos retrovírus citopáticos e não- oncogênicos que necessitam, para multiplicar-se, de uma enzima denominada transcriptase reversa, responsável pela transcrição do RNA viral para uma cópia DNA, que pode, então, integrar-se ao genoma do hospedeiro. Segundo a OMS (2010), em 1983, o HIV-1 foi isolado de pacientes com AIDS pelos pesquisadores Luc Montaigner, na França, e Robert Gallo, nos EUA, recebendo os nomes de LAV (Lymphadenopathy Associated Virus ou Virus Associado à Linfadenopatia) e HTLV-III (Human T-Lymphotrophic Virus ou Vírus T-Linfotrópico Humano tipo lll) respectivamente nos dois países. Em 1986, foi identi- cado um segundo agente etiológico, também retrovírus, com características semelhantes ao HIV-1, denominado HIV-2. Nesse mesmo ano, um comitê internacional recomendou o termo HIV (Human Immunodeciency Virus ou Vírus da Imunodeciência Humana) para denominá-lo, reconhecendo-o como capaz de infectar seres humanos. O HIV é bastante lábil no meio externo, sendo inativado por uma variedade de agentes físicos (ca- lor) e químicos (hipoclorito de sódio, glutaraldeído). Em condições experimentais controladas, as partículas virais intracelulares parecem sobreviver no meio externo por até, no máximo, um dia, enquanto partículas virais livres podem sobreviver por 15 dias, à temperatura ambiente, ou até 11 dias, a 37ºC. A Tuberculose (TB) ainda representa um sério e desaador problema de saúde pública global. Em 1 CAPÍTULO 1. INTRODUÇÃO 2 âmbito mundial, no ano de 2018, cerca de dez milhões de pessoas adoeceram por tuberculose e 1,5 milhão de pessoas morreram em decorrência dela, sendo a TB a principal causa de morte por um único agente infeccioso (WHO, 2019). Além de continuar endêmica nos países em desenvolvimento, a tuberculose ganhou força com o surgimento da SIDA, sendo a terceira doença oportunista mais prevalente em portadores do HIV (BENITON, et al., 2011). O HIV não só tem contribuído para um crescente número de casos de TB, como também tem sido um dos principais responsáveis pelo aumento da mortalidade, o que pode ser evidenciado pelo regis- tro de 400 mil mortes, no ano de 2015, entre os indivíduos coinfectados (BARBOSA IR e COSTA ICC, 2014; WHO, 2017). A interação entre o HIV e o Mycobacterium tuberculosis é complexa. A tuberculose pode causar elevação da carga viral e redução da contagem de CD4+ em pessoas que vivem com HIV. Por outro lado, a soropositividade ao HIV também pode modicar a patogênese da TB, levando a baciloscopias negativas, achados de imagem atípicos e manifestações extrapulmo- nares, tornando difícil o diagnóstico desta doença; (MONTALES MT, et al., 2015). Em pessoas coinfectadas por tuberculose e HIV, a forma extrapulmonar frequentemente ocorre de- vido à supressão imunológica associada a níveis de CD4 abaixo de 500 células/mm3 , o que viabiliza a disseminação do Mycobacterium tuberculosis para outros órgãos. Há, desta forma, uma maior probabilidade de evolução para formas graves de TB, a exemplo da TB meníngea, óssea, miliar, entre outras, que contribuem expressivamente para o aumento da morbimortalidade da TB em paci- entes infectados pelo HIV. Em contraste, é observada uma maior frequência da forma pulmonar em indivíduos com contagem de CD4 elevada, sem diferenças na apresentação clínica em comparação à população em geral (EFSEN AMW, et al., 2014). Segundo Kahn e Walker (1998), análise quantitativa direta da carga viral através de técnicas ba- seadas na amplicação de ácidos nucleicos, tais como a reação de polimerase em cadeia (PCR) quantitativa, amplicação de DNA em cadeia ramicada (branched-chain DNA ou bDNA) e am- plicação seqüencial de ácidos nucleicos (nucleic acid sequence-based amplication ou NASBA). Embora as técnicas sejam diferentes, o PCR quantitativo e o NASBA apresentam alta sensibili- dade, permitindo o acompanhamento da resposta terapêutica antiretroviral. Além disso, valores elevados de partículas virais detectados ao PCR quantitativo ou NASBA parecem estar relaciona- dos com um maior risco de progressão da doença, independente da contagem de células TCD4+. O presente estudo tem como principal objectivo analisar os factores associados a ocorrência da doença coronária na cidade de Maputo, de modo a sugerir medidas que possivelmente poderão ajudar na redução da incidência da mesma. Estatística-UEM 2 Dionísia Rodrigues Demba CAPÍTULO 1. INTRODUÇÃO 3 1.1.1 Problematização A OMS estima que 18 milhões de adultos e 1,5 milhão de crianças já foram infectados pelo HIV, trazendo como consequência 4.5 milhões de casos de SIDA em todo o mundo. Trata-se de uma epidemia global, ainda que mantidos determinados padrões de expansão e disseminação locais, con- forme a situação de cada país ou comunidade. Segundo a OMS (2010), a SIDA foi descrita inicialmente nos EUA, na Europa Ocidental e na África. 70% dos casos se concentram na África. Em menos de 20 anos transformou-se numa epidemia de grandes proporções com focos de disseminação e propagação em todos os continentes. Entretanto em pacientes com HIV, quando a contagem das células CD4 é baixa, a carga viral é normalmente alta. Esta situação não é boa. Quando a contagem das células CD4 é alta, a carga viral é normalmente baixa. Esta situação é boa. Se a contagem das células CD4 descer para 350 ou menos, é recomendado que se inicie o tratamento. O resultado do tratamento deve ser o aumento das células CD4 e a descida da carga viral. Os resultados da contagem das células CD4 e da medição da carga viral dá a informação necessária sobre o efeito da infecção pelo VIH. O objectivo do tratamento anti-retroviral é o de ter uma carga viral muito baixa (indetectável) e uma contagem de células CD4 alta. Deste modo é pertinente questionar: Qual é a associação entre as cargas virais em pacientes com HIV em Moçambique? 1.1.2 Objectivos Objectivo Geral Analisar a associação entre as cargas virais em pacientes com HIV em Moçambique. Objetivos especícos Descrever o perl demográco dos pacientes com HIV em Moçambique; Identicar a associação entre as cargas virais em pacientes com HIV em Moçambique; Vericar se a contagem de linfócitos T CD4+ e a carga viral do HIV têm inuência na presença de lesões intraepiteliais cervicais (SIL) ; Comparação de Medidas de associação para avaliar a associação entre cargas virais de HIV em Moçambique. Estatística-UEM 3 Dionísia Rodrigues Demba CAPÍTULO 1. INTRODUÇÃO 4 1.1.3 Relevância do Estudo A tuberculose é uma doença infecciosa que afeta principalmente o pulmão, porém qualquer outro órgão também pode ser afetado. Mas, é transmissível somente na sua forma pulmonar e, apesar de curável, são noticados anualmente cerca de 6.000.000 de novos casos em todo o mundo, levando mais de 1.000.000 de pessoas a óbito, dados da Organização Mundial de Saúde. O município de Alvorada/RS, segundo fonte presentes no espaço virtual do Ministério da Saúde, é o que apresenta as maiores taxas de incidência de Tuberculose do Brasil, sendo que neste ano apresen- tou 138,4 casos para cada 100.000 habitantes, quando a média nacional apresentada é de cerca de 30 casos por 100.000 habitantes, ou seja, a prevalência ser cerca de 4,5 vezes maior que a média nacional. Outro aspecto importante a ser mencionado é a baixa adesão ao tratamento das pessoas que possuem a patologia devido às falhas na terapêutica e abandono desta, de acordo com fonte da Secretaria Municipal de Saúde do município de Alvorada, e apesar do município possuir um programa de promoção de saúde com apoio de um centro de referência para casos de tuberculose. As equipes das UBSs do município têm diculdade em conseguir manter o tratamento corretamente destes pacientes e não existe nenhum protocolo de busca ativa de sintomáticos respiratórios. Dessa forma, sentiu-se necessidade de realizar uma atividade que visasse diminuir as prevalências da Tuberculose na área de abrangência da UBS Tijuca, e esclarecer a população sobre a impor- tância de buscar apoio em caso de sintomas assim como formas de evitar a proliferação da doença, além de capacitar a equipe da UBS para a realização da busca e a pesquisa de usuários sintomáticos. Também existe a necessidade de criar um banco de dados para cadastrar todos os usuários com sintomas respiratórios (tosse há mais de 3 semanas, com ou sem escarro) e sistêmicos (emagreci- mento, febre,19 inapetência.) e também os diagnosticados com Tuberculose, a m de auxiliar no acompanhamento do tratamento correto para essa patologia. 1.1.4 Estrutura do trabalho Estatística-UEM 4 Dionísia Rodrigues Demba Capítulo 2 Revisão da literatura Este capítulo tem como propósito apresentar as bases teóricas sobre o tema deste trabalho que são resultados das investigações desenvolvidas por diversos autores nas diferentes áreas de actividades relacionadas com a doação do leite materno e também apresentar os conceitos teóricos das principais técnicas estatísticas aplicadas nos estudos de genêro. 2.1 Conceitos A Sindrome da Imunodeciência Adquirida (SIDA) A SIDA é uma síndrome ( conjunto de sinais e sintomas ) causada pela ação de um vírus o (HIV) , que compromete o sistema imunológico , deixando-o desprotegido e vulnerável aos ataques de microorganismos ( Vírus , Fungos , Bactérias e Parasitas ) que provocam inúmeras doenças que são chamadas de oportunistas A SIDA , cujo agente etiológico é o vírus da imunodeciência humana ou (HIV/ VIH , prevalecendo a sigla da língua inglesa ) , pertencem à família dos retrovirus. Caracteriza-se por imunodepressão que resultam, principalmente da infecção e destruição de linfócitos T4 , que são as células que comandam a resposta imune do organismo. Graves infecções por agentes oportunistas e neoplasias poderão ocorrer no organismo, caracterizando a doença. Além do tropismo por células sangüíneas nervosas musculares, o HIV pode desempenhar papel predisponente ou determinante de graves le- sões nos sistemas , respiratórios e digestivo. Alguns factores podem contribuir para a diminuição do período de incubação e consequentemente, o desenvolvimento precoce da doença. São eles : aumento da carga viral , pela reexposição do HIV , que pode ocorrer por práticas sexuais sem o uso de preservativos e pelo compartilhamento de 5 CAPÍTULO 2. REVISÃO DA LITERATURA 6 seringas contaminadas no uso de drogas injetadas. A SIDA vem causando estado de pânico na população , com diculdades no estabelecimento de uma política adequada e viável , a ser aplicada nos pacientes , tendo em vista o elevado índice de letalidade nos primeiros anos de acometimento, evoluindo segundo o estágio atual de conhecimento, invariavelmente para o óbito. A SIDA denominada de A 3ª Epidemia , pelo Dr. Jonathan Mann , chefe do programa global da Organização Mundial da Saúde (OMS) , denominou-a assim pelas reações causadas por ela que são : economia , social , política e cultural. Do ponto de vista de Javier Peres de Cuellar , secretário geral das Nações Unidas , arma que a SIDA inseri questões sociais, humanitárias e jurídicas e que ameaça alterar estrutura de tolerância e entendimento que sustenta a vida de nossa sociedade. A sociedade está se tornando cruel e até com uma certa ignorância , discriminando os grupos sociais identicados como suscetíveis em maior grau à aquisição da doença.A população deve entender que simplesmente se tornando intolerável a estes grupos sociais , não irá conseguir controlar a expansão da doença , principalmente porque está comprovado cienticamente que a propagação da doença está no comportamento íntimo , censurado na maioria das sociedades , ex. : relações homossexuais , promiscuidade heterossexual , abuso de drogas por via endovenosa. O que tentamos combater não é a doença e sim a desinformação da população , pois necessitamos da colaboração do paciente infectado , e para com ele devemos Ter respeito e consideração , só assim poderemos contribuir para a redução da doença. O Programa Nacional de Doenças Sexualmente Transmissíveis e SIDA ( PN DST / SIDA ) do Ministério da Saúde tem por missão maior a redução da incidência e da mortalidade provocada pelo HIV e por outros agentes causadores de doenças transmissíveis facilitadoras da infecção pelo vírus da SIDA. Dentre os objetos gerais do Programa estão , portanto, benefícios que implicam , na melhoria da qualidade de vida das pessoas vivendo com HIV e SIDA , na garantia do diagnóstico e tratamento dos DST e da infecção pelo HIV , bem como na adoção de práticas seguras que reduzam a transmissão sexual e parenteral do HIV. Para alcançar tais metas , o PN DST / SIDA assume o compromisso de fortalecer as instituições públicas e as organizações comunitárias que , no país , lidam com as DST/SIDA. Também busca ampliar a participação do setor privado na luta contra a AIDS , estimulando o desenvolvimento de ações integradas. Estatística-UEM 6 Dionísia Rodrigues Demba CAPÍTULO 2. REVISÃO DA LITERATURA 7 2.1.1 AÇÕES PRIORITÁRIAS PARA MANEJO DA COINFEC- ÇÃO TB-HIV Conforme preconizado pela Organização Mundial de Saúde e pelo Ministério da Saúde, o controle da coinfecção TB-HIV deve estar entre as ações programáticas prioritárias realizadas pelos Serviços de Atenção Especializada em HIV e SIDA. Os serviços precisam se organizar, estruturando a equipe multiprossional, para tratar de ações especícas relacionadas à coinfecção TB-HIV. Investigação de TB em Todas as Consultas A tuberculose deve ser investigada em todas as consultas de PVHA, mediante o questionamento sobre a existência de um dos quatro sintomas: febre, tosse, sudorese noturna e emagrecimento. A presença de qualquer um dos sintomas indica a possibilidade de TB ativa e a necessidade de investigação do caso. Disponibilização de Prova Tuberculínica e Tratamento da Infecção Latente A prova tuberculínica (PT) deve estar disponível no SAE e excepcionalmente poderá ser realizada em outro serviço de referência estabelecida. O tratamento da infecção latente da tuberculose (ILTB) deve ser realizado sempre que indicado (BRASIL, 2011). A Unidade Dispensadora de Medicamentos (UDM) do Serviço de Atenção Espe- cializada (SAE) deve disponibilizar a isoniazida para o tratamento da ILTB. Nos estados em que a vigilância do tratamento da ILTB já foi implantada, recomendase a noticação do tratamento em cha própria. Acolhimento e Aconselhamento No acolhimento dos pacientes com coinfecção TB-HIV é importante abordar a forma de transmissão da TB e do HIV; a gravidade da coinfecção; a importância da adesão ao tratamento de ambas às doenças e da identicação dos contatos. Devem também ser abordados o estigma referente às duas doenças, os problemas sociais ou outras diculdades que possam interferir na evolução e adesão ao tratamento. Em todos os SAE a Abordagem Consentida (Anexo A) precisa ser adotada como rotina, para fortalecer a adesão e evitar abandono do tratamento (BRASIL, 2008). Atendimento Clínico Todos os pacientes deverão ser atendidos imediatamente por prossional de saúde capacitado a m de determinar a urgência da consulta médica. Estatística-UEM 7 Dionísia Rodrigues Demba CAPÍTULO 2. REVISÃO DA LITERATURA 8 Paciente com TB oriundo de outro serviço e com tratamento já iniciado deverá ter acesso à consulta médica em no máximo sete dias, considerando-se a gravidade. Paciente com TB oriundo de outro serviço e sem tratamento iniciado deverá ter acesso à consulta médica imediatamente e iniciar o tratamento da tuberculose no mesmo dia. Paciente com TB oriundo da rede privada deverá ter garantida a dispensação dos medica- mentos para tuberculose, mediante apresentação de receita médica adequada. O SAE deverá noticar o caso de TB no Sistema de Informação de Agravos de Noticação (Sinan). PVHA em acompanhamento no SAE com diagnóstico de TB deverá ter acesso ao tratamento da tuberculose e manejo da coinfecção no mesmo serviço. 2.1.2 Manejo Clínico da PVHA com TB Ativa Todas as pessoas que vivem com HIV/Aids com TB ativa devem iniciar terapia antirretroviral (TARV), independentemente da forma clínica da tuberculose e da contagem de linfócitos T-CD4+ (BRASIL, 2008, 2011). A TARV deve ser iniciada entre a 2ª e a 8ª semana após o início do tratamento para TB. Para ter impacto na mortalidade, pacientes com LT-CD4+ inferior a 200 cel/mm³ ou com sinais de imu- nodeciência avançada, devem começar a TARV na 2ª semana após o início do tratamento para tuberculose. Nos demais pacientes, a TARV pode ser iniciada na 8ª semana, após o término da fase intensiva do tratamento da TB. Ressalta-se que não se recomenda o início concomitante do tratamento para ambos os agravos (BRASIL, 2008; 2011). O ideal é que a contagem de LT-CD4+ seja solicitada antes do início da TARV. Contudo não se deve aguardar seu resultado para iniciar o tratamento (BRASIL, 2008, 2011). Como, na maioria dos casos, a contagem de LT-CD4+ não estará disponível no momento do diagnóstico de TB, o grau de imunodeciência poderá ser estimado pela clínica e pelos resultados laboratoriais, entre estes: perda ponderal > 10% do peso, candidíase, prurigo, diarreia crônica e contagem de linfócitos totais X(l−1)(c−1) 2. Rao e Scott (1984) propuseram um ajuste do teste Qui-Quadrado, de modo a incorporar as ca- racterísticas do plano amostral, que consiste em dividir o valor da sua estat±ística por um factor X2 generalizado do efeito do plano amostral (FGEPA), XR−S2 = , que representa o efeito do F GEP A −1 plano amostral. O FGEPA é tido como a média dos autovalores da matriz D = Vdesign − VRSR em que Vdesign é uma matriz de variância-covariância baseada no plano amostral para o vector −1 de proporções usadas na construção da estatística Qui-Quadrado é VRSR é a matriz de variância- covariância para as proporções estimadas dada uma amostra aleatória simples. Foi proposta uma correção de segunda ordem que consiste em dividir a estat±tica de Rao e Scott pela quantidade (1+a2) de modo a incorporar a variabilidade nos autovalores da matriz D, em que a representa o coeciente de variação dos autovalores. Thomas e Rao (1984), propuseram uma versão F-ajustado da correção de segunda ordem, que melhor controla o erro do tipo I, dada pela expressão em 3.2 2 XR−S FT −R = (3.2) (L − 1)(C − 1) 3.2.2 Teste de signicância dos parâmetros Após a estimação dos coecientes, tem-se interesse em vericar a signicância das variáveis no modelo. Isto geralmente envolve formulação e teste de uma hipótese estatística para determinar Estatística-UEM 27 Dionísia Rodrigues Demba CAPÍTULO 3. MATERIAL E MÉTODOS 28 se a variável independente no modelo é signicativamente relacionada com a variável resposta. Para isso, existem os testes de hipóteses. Neste trabalho, serão utilizados os testes de Razão de Verosimilhança de Rao-Scott e Wald Teste de Wald Segundo Silva (2011), o teste de Wald, descrito por Polit (1996) e Agresti (1990), é uma das poss veis formas de testar se o parâmetro associado toma o valor zero. Este teste é utilizado para avaliar se o parâmetro é estatisticamente signicativo. O teste de Wald é obtido por comparação entre a estimativa de máxima verosimilhança do parâmetro (β0 ) e a estimativa de seu erro-padrão. A razão resultante, sob as hipóteses em 3.3 tem distribuição normal padrão. H0 :βj =0 H1 :βj ̸= 0 A estatística de teste é dada por: βˆj Wj = ∩ N (0, 1) (3.3) V ar(βˆj ) Onde βˆj é o vector de estimativas para β e V ar(βˆj ) é a matriz de variâncias. De modo a testar a signicância dos parâmetros do modelo é usado um teste de Wald ajustado, baseado no plano amostral, dado pela equação 3.4: s−p+1 F = W (3.4) sp Pk Onde s = ( k=1 mk ) − K e o número total de unidades amostrais primárias amostradas menos o número de estratos, p é o número de variáveis explicativas e W é a versão multivarida do teste de Wald, dado pela equação 3.3. O p-valor é gerado usando a distribuição F com p e (s-p+1) graus de liberdade como P r[F (p, s − p + 1) ≥ F ]. Teste de Razão de Verosimilhança Uma vez estimado o modelo, é necessário testar a sua signicância. Um dos teste comummente usado para o testar essa signicância é o teste da razão de verosimilhanças. Este teste avalia a signicância dos coecientes estimados simultaneamente, ou seja verica se o modelo estimado é Estatística-UEM 28 Dionísia Rodrigues Demba CAPÍTULO 3. MATERIAL E MÉTODOS 29 globalmente signicativo (Cabral, 2013). Com este teste pretende-se testar simultaneamente se os coecientes de regressão associados a β são todos nulos com excepção de β0. As hipóteses á testar são: H0 :β1 = β2 = β3 = · · · = βn H1 :Pelo menos um dos parâmetros é diferente de zero. A estatística D tem como objectivo, comparar o modelo em análise e o modelo saturado, ou seja, a comparação dos valores observados e dos valores esperados usando a função de verosimilhança. 3.2.3 Interpretação dos parãmetros do modelo Hosmer e Lemeshow (1989), advoga que na regressão logística, o interesse não só consiste em modelar a probabilidade de ocorrência de um dado evento de interesse em função de um conjunto de variáveis explicativas, mas também em compreender quais dessas variáveis contribuem para a variação da tal probabilidade e em quanto é essa variação. Essa análise é feita com base no conceito de razão de chances, que é uma medida de intensidade de associação que proporciona informação sobre a probabilidade de ocorrência do evento de interesse quando sob inuência de uma dada variável explicativa. De acordo com Agresti (2002), para uma probabilidade de sucesso π , a chance é denida, de acordo com a equação 3.5, abaixo: π(x) g(x) = (3.5) 1 − π(x) A interpretação dos parâmetros de um modelo de regressão logística é obtida comparando a proba- bilidade de sucesso com a probabilidade de fracasso, usando a função de Chances. Um problema que surge frequentemente com as variáveis explicativas em um modelo de regressão logística, é a forma de interpretação dos parâmetros. Variâveis qualitativas que não são ordinais, não têm escala ordenada de medida. Desta forma, se forem codicadas de forma arbitrária as variáveis, o parâmetro estimado não terá interpretação. Variáveis qualitativas, devem ter categorias de referência para representar correctamente os efeitos (ausência ou presença) de tais variáveis em um modelo de regressão logística multivariado. (Queiroz, 2004). Estatística-UEM 29 Dionísia Rodrigues Demba CAPÍTULO 3. MATERIAL E MÉTODOS 30 3.2.4 Estratégia de análise Regra de Decisão Neste trabalho, para a tomada de decisão será considerado o nível de signicância de 5%, portanto, rejeita-se a hipótese nula se Sig < 0.05. Regressão Logística Binária Para alcançar o objectivo do trabalho, em primeiro lugar foi feita caracterização das variáveis em estudo, através de uma análise descritiva com ajuda de tabelas de frequências e grácos. Após a análise descritiva passou se aplicação da técnica estatística denominada Regressão Logística, porem esta técnica pressupõe ausência de multicolinearidade entre as variáveis preditoras e para vericar a multicolinearidade recorreu-se aos valores da tolerância e Inação da variância de um factor (VIF). Critérios de Selecção do Modelo Para a selecção do modelo, foi usado o método Forward que começa com o modelo nulo e a cada etapa vai incorporando no modelo as variáveis que apresentarem um p-value menor que o nível de signicância de remoção, ou seja, o α = 0.05 usado no estudo. Estimação do Modelo Logístico Para a estimação do modelo logístico foi usado o método da máxima verosimilhança. Para a estima- ção do modelo nal primeiro estimou-se um modelo inicial sem variáveis para fornecer um padrão para comparações. Após a estimação do modelo inicial, passa-se então, a considerar todas variáveis selecionadas, a m de identicar quais farão parte do modelo nal. A estatística utilizada para a inclusão denitiva das variáveis no modelo nal é a estatística de Wald com os níveis de signicância de 0.05, a qual fornece o indicativo de quais variáveis são estatisticamente signicativas dentro do modelo. A estatística de Wald tem como hipóteses: H0 : O coeciente da regressão logística é igual a zero. H1 : O coeciente da regressão logística é diferente de zero. Estatística-UEM 30 Dionísia Rodrigues Demba CAPÍTULO 3. MATERIAL E MÉTODOS 31 Avaliação do Modelo Segundo Hair et al. (2010), para a avaliação do ajuste geral do modelo primeiro recorre-se -2LL. O procedimento consiste em comparar o valor do modelo nal desta medida com o valor dos de mais modelos estimados no processo forword. Uma maior redução deste valor indica um bom ajuste do modelo. O poder explicativo do modelo é dado pelo valor de R2 de Nagelkerkee quanto maior este valor melhor será o ajusto. Outra medida de avaliação do ajuste geral do modelo usada é a estatística de Hosmer e Lemeshow, que tem como hipóteses: H0 : Não há diferenças signicativas entre os resultados previstos e os observados. H1 : Há diferenças signicativas entre os resultados previstos e os observados. Diagnostico do modelo logístico Segundo Hosmer et al., (2013), para avaliar o desempenho do modelo logístico usou-se a curva ROC. A área abaixo da curva de ROC, fornece uma medida de discriminação, que indica a possibilidade de uma mãe que não doa leite de peito, ter uma probabilidade estimada associada mais elevada do que um mãe que doa leite do peito. Seja A, o valor que corresponde à área abaixo da curva de ROC, como regra geral tem-se as seguintes linhas de orientação: Se A ⩽ 0, 5 Não há discriminação Se 0.6⩽ A < 0.7 A discriminação é fraca Se 0.7⩽ A < 0.8 A discriminação é aceitável Se 0.8 ⩽A < 0.9 Discriminação excelente Se A ≥ 0.9 Discriminação excepcional Estatística-UEM 31 Dionísia Rodrigues Demba Capítulo 4 Resultados Este capítulo tem como propósito apresentar os principais resultados alcançados ao longo do tra- balho. A análise dos resultados foi dividida em duas partes. Na primeira parte fez-se uma análise descritiva do perl sócio-demográco dos pacientes na base de dados e na segunda parte a análise da regressão logística. 4.1 Análise descritiva e bivariada entre variáveis em es- tudo A presente amostra analisada é composta por 197 pacientes de tuberculose, dos quais segundo a gura 4.1 abaixo verica-se que a maioria (71.07%) são do sexo masculino e uma parte consideravel dos pacientes são do sexo feminino (28.93% ). Figura 4.1: Distribuição percentual do sexo dos pacientes inquiridos 32 CAPÍTULO 4. RESULTADOS 33 Figura 4.2: Distribuição percentual da idade dos pacientes inquiridos Com base na gura 4.2 acima observa-se que a maioria (63.45%) dos pacientes possuem idades entre 25 a 40 anos de idade, cerca de 25.89% dos pacientes inquiridos possuem entre 18 a 25 anos de idades, cerca de 6% dos pacientes inquiridos possuem mais de 40 anos e cerca de 4.57% dos pacientes são menores de idades. Observando a gura 4.3 abaixo, verica-se que a maioria (56.35%) dos pacientes inquiridos com tuberculose estão coinfectados com HIV e uma parte consideravel dos pacientes não estam coinfectados com HIV. Figura 4.3: Distribuição percentual dos pacientes coinfectados com HIV Estatística-UEM 33 Dionísia Rodrigues Demba CAPÍTULO 4. RESULTADOS 34 Tabela 4.1: Distribuição das frequências absolutas e relativas; e I.C. das frequências relativas Coinfeção com HIV Não Sim Total Variáveis N % N % Total Peso Abaixo do peso minimo 8 33 16 67 24 Acima do peso minimo 78 45 95 55 173 vacina anti-tectanica Nao 56 42 77 58 133 Sim 30 47 34 53 64 F-infectado com HIV Seronegativa 71 58 51 42 122 Seropositiva 15 20 60 80 75 Anemia Nao 71 82 16 18 87 Sim 15 14 95 86 110 Doenca cronica Nao 24 38 39 62 63 Sim 62 46 72 54 134 C-alcool Nao consome 14 52 13 48 27 Consome 72 42 98 58 170 C-tabaco Nao consome 62 43 81 57 143 Consome 24 44 30 56 54 cal_de_ferro_proteinas C-abaixo do recomendado 19 59 13 41 32 C-acima do recomendado 67 41 98 59 165 T-tuberculose menos de 1 mes 4 40 6 60 10 de 1 a 2 Meses 62 42 86 58 148 3 a 4 Meses 13 52 12 48 25 5 a 6 Meses 1 33 2 67 3 Mais de 6 Meses 6 55 5 45 11 Amedicar Nao 58 45 72 55 130 Sim 28 42 39 58 67 Pode-se vericar que num universo de 197 pacientes, 24 possuem peso abaixo do peso miniomo recomendado para a sua idade e altura e 173 pacientes possuem peso acima do peso minimo reco- mendado para a sua idade e altura. Dos 24 pacientes com peso abaixo do peso minimo recomendado, cerca de 67% estão coinfectados com HIV e dos 173 pacientes com peso acima do peso minimo re- comendado, cerca de 55% estão coinfectados com HIV. Estatística-UEM 34 Dionísia Rodrigues Demba CAPÍTULO 4. RESULTADOS 35 Dentre 133 pacientes que não receberam Vacina anti-tectanica, cerca de 58% estão coinfectados com HIV e dos 64 pacientes que receberam a vacina anti-tectania, 53% dos pacientes estão coinfectados com HIV. Dos pacientes inquiridos 122 passientes não possuem um parente seropositivo e os restan- tes 75 pacientes possuem possuem pacientes proximos seroposetivos, destes cerca de 80% possuem coinfecao com HIV. É possível vericar, também, que num total de 197 pacientes inquiridos 110 têm anemia e o restante não têm anemia, Dos 110 pacientes com anemia, cerca de 86% estão coinfectados com HIV. Para os passientes sem anemia, apenas cerca de 18% estão coinfectados com HIV. Observa-se ainda que dos 197 pacientes inquiridos 134 possuem alguma outra doença crónica e o restantes não possuem nenhuma doença crónica. Dos passientes com alguma outra doênça crónica, cerca de 54% estão coinfectados com HIV. Observando assituação do alcool, verica-se que 170 pacientes consomem bebidas álcoolicas e destes cerca de 59% (98) estão coinfectados com HIV. Observando para a situação do Tabaco, verica-se que 143 do 197 pacientes não consomem tabaco e destes cerca de 57% estão coinfectados com HIV e dos 54 pacientes que consomem tabaco, cerca de 56% estão coinfectados com HIV. A maioria dos Pacientes inquiridos (165) consomem calorias de ferro e proteinas acima do recomendado, destes cerca de 59% (98) estão coinfectados com HIV e dos 42 pacientes que consomem calorias de ferro e proteinas abaixo do recomendado, cerca de 41% estão coinfectados com HIV. Dentre os 10 pacientes com menos de um mês com tuberculose, cerca de 60% estão coinfectados com HIV e dos 148 pacientes entre 1 a 2 meses de tuberculose, cerca de 58% estão coinfectados com HIV. Dos 25 pacientes inquiridos com 3 a 4 meses de tuberculose, cerca de 67% estão coinfectados com HIV. Dos 3 pacientes com 5 a 6 meses de tuberculose, cerca de 67% estão coinfectados com HIV e os restantes pacientes com mais de seis meses de tuberculose, cerca de 45% estão coinfectados com HIV. Observando a situação da medicação observa-se que cerca de 130 pacientes dos inquiridos não estão a medicar e destes cerca de 55% estão coinfectados com HIV. Teste de Multicolinearidade A multicolinearidade torna muitas vezes as estimativas dos coecientes dos parâmetros insigni- cantes, já que cada um pressupõe, por denição, a variação em Y dada uma variação unitária em X, mantendo-se constantes as demais informações. Ou seja, se duas variáveis independentes são Estatística-UEM 35 Dionísia Rodrigues Demba CAPÍTULO 4. RESULTADOS 36 fortemente correlacionadas, será muito difícil haver variação em uma sem que haja em outra. Tabela 4.2: Teste de Multicolinearidade Variáveis Tolerância VIF Sexo 0.891 1.122 Idade 0.890 1.123 Peso 0.932 1.073 vacina anti-tectanica 0.783 1.278 F-infectado com HIV 0.825 1.212 cronica ou doenca de sangue 0.798 1.254 C-alcool 0.925 1.081 C-tabaco 0.637 1.570 C- cafe com frequencia 0.646 1.548 C-calorias de ferro e proteinas 0.865 1.156 N-Escolaridade 0.871 1.147 T-tuberculose 0.898 1.113 Medicacao 0.928 1.078 Para a realização da regressão logística há pressupostos por vericar, onde da tabela 4.2 acima observa-se que não há multicolinearidade entre as variáveis preditoras dado que os valores de VIF são inferiores que 10 e os valores da tolerância para todas variáveis preditoras são inferires que a unidade. Deste modo procede-se com analise. 4.2 Análise de regressão Logística Vericados alguns pressupostos da regressão logística , e os mesmo mostrando que os dados podem ser aplicados na regressão logística, procede-se com a análise. Tabela 4.3: Coeciente do Modelo apenas com a constante B S.E Wald df Sig Exp(B) Passo 0 Constante 0.255 0.144 3.155 1 0.076 1.299 Computado o modelo de regressão logística apenas com a constante, a estatística de Wald (wald=3.155, sig>0.05) neste modelo de comparação mostrou que a constante não é signicativa permitindo a não rejeição da hipótese de que a constante é igual a zero. Estatística-UEM 36 Dionísia Rodrigues Demba CAPÍTULO 4. RESULTADOS 37 Tabela 4.4: Classicação para o modelo com a constante Previsto Coinfeção com HIV Observado Não Sim Porcentagem correta Passo 0 Coinfeção com HIV Não 0 86 0 Sim 0 111 100 Porcentagem global 56.3 A tabela 4.4 ilustram os resultados da classicação inicial somente com a constante, a partir do modelo reduzido. De acordo com a mesma, verica-se que todos os pacientes inquiridos foram classicados como pacientes coinfectados com HIV, este modelo classica os pacientes de forma correcta em cerca 56.3% das vezes. 4.2.1 Inclusão de Variáveis independentes no Modelo A tabela 5.1 em anexos, evidencia que algumas variáveis não presentes no modelo são signicativas para explicar a coinfeção com HIV. Deste modo foram incluídas as variáveis no modelo. Tabela 4.5: Classicação para o modelo com a constante Previsto Coinfeção com HIV Observado Não Sim Porcentagem correta Passo 0 Coinfeção com HIV Não 71 15 82.6 Sim 16 95 85.6 Porcentagem global 84.3 Da tabela 4.5, observa-se que: com a inclusão das variáveis preditoras no modelo houve um aumento em termos de percentagem de classicação correcta comparativamente com o modelo anterior sem variáveis, este aumento da percentagem de classicação correcta de 33.8%. Observa-se ainda que dos 86 pacientes que não estavam coinfectados, 15 foram classicadas de forma incorrecta e dos 111 pacientes coinfectados, 16 foram classicadas de forma incorrecta, sendo 84.3% a percentagem de acertos do modelo. Estatística-UEM 37 Dionísia Rodrigues Demba CAPÍTULO 4. RESULTADOS 38 4.2.2 Analise do ajuste do modelo Os testes de qui-quadrado de Pearson e deviance não serão aqui apresentados como medidas de distância ou diferença entre os dados observados e ajustados que visam avaliar a qualidade do modelo, pelo facto de ambos os testes não serem adequados quando existem covariáveis contínuas e por dependerem da dimensão da amostra de modo que as frequências esperadas sejam no mínimo 5, isto é, dependem do Teorema do Limite Central. Um teste que fornece uma indicação do quão bem o modelo se ajusta aos dados é o teste de Hosmer e Lemeshow que se apresenta na tabela a seguir. Tabela 4.6: Resumo do Modelo Qui-quadrado df Sig. Passo 4.327 1 0.038 Bloco 121.512 4 0.000 Modelo 121.512 4 0.000 Passo 1 Verossimilhança R quadrado R quadrado de log -2 Cox & Snell Nagelkerke 148.4 0.460 0.617 Teste de Hosmer e Lemeshow Passo 1 Qui-quadrado df Sig. 4.32 7 0.742 Introduzidas todas as variáveis no modelo, avaliou-se a signicância dos parâmetros para as variáveis, através dos testes passo, Bloco e Modelo que mostraram um valor de signicância (sig