Estatística e Probabilidade - 3ª Edição PDF

Summary

This book, Estatística e Probabilidade, by Jorge Luiz de Castro e Silva, Maria Wilda Fernandes, and Rosa Lívia Freitas de Almeida, is a 3rd edition textbook focused on statistics and probability. It covers topics like Variables, Scales of measurement, and Population.

Full Transcript

Matemática F iel a sua missão de interiorizar o ensino superior no estado Ceará, a UECE, como uma instituição que participa do Sistema Universidade Aberta do Estatística e Probabilidade Brasil, v...

Matemática F iel a sua missão de interiorizar o ensino superior no estado Ceará, a UECE, como uma instituição que participa do Sistema Universidade Aberta do Estatística e Probabilidade Brasil, vem ampliando a oferta de cursos de graduação e pós-graduação na modalidade de educação a distância, e gerando experiências e possibili- dades inovadoras com uso das novas plataformas tecnológicas decorren- Matemática tes da popularização da internet, funcionamento do cinturão digital e massificação dos computadores pessoais. Comprometida com a formação de professores em todos os níveis e a qualificação dos servidores públicos para bem servir ao Estado, Estatística e Probabilidade os cursos da UAB/UECE atendem aos padrões de qualidade estabelecidos pelos normativos legais do Governo Fede- ral e se articulam com as demandas de desenvolvi- mento das regiões do Ceará. Universidade Estadual do Ceará - Universidade Aberta do Brasil Jorge Luiz de Castro e Silva Maria Wilda Fernandes Rosa Lívia Freitas de Almeida Geografia 12 9 3 História Educação Física Ciências Artes Química Biológicas Plásticas Computação Física Matemática Pedagogia Matemática Estatística e Probabilidade Jorge Luiz de Castro e Silva Maria Wilda Fernandes Rosa Lívia Freitas de Almeida Geografia 3ª edição Fortaleza - Ceará 12 9 3 História 2015 Educação Física Ciências Artes Química Biológicas Plásticas Computação Física Matemática Pedagogia Copyright © 2015. Todos os direitos reservados desta edição à UAB/UECE. Nenhuma parte deste material poderá ser reproduzida, transmitida e gravada, por qualquer meio eletrônico, por fotocópia e outros, sem a prévia autorização, por escrito, dos autores. Editora Filiada à Presidenta da República Conselho Editorial Dilma Vana Rousseff Antônio Luciano Pontes Ministro da Educação Renato Janine Ribeiro Eduardo Diatahy Bezerra de Menezes Presidente da CAPES Emanuel Ângelo da Rocha Fragoso Carlos Afonso Nobre Francisco Horácio da Silva Frota Diretor de Educação a Distância da CAPES Francisco Josênio Camelo Parente Jean Marc Georges Mutzig Gisafran Nazareno Mota Jucá Governador do Estado do Ceará Camilo Sobreira de Santana José Ferreira Nunes Reitor da Universidade Estadual do Ceará Liduina Farias Almeida da Costa José Jackson Coelho Sampaio Lucili Grangeiro Cortez Vice-Reitor Hidelbrando dos Santos Soares Luiz Cruz Lima Pró-Reitor de Pós-Graduação Manfredo Ramos Jerffeson Teixeira de Souza Marcelo Gurgel Carlos da Silva Coordenador da SATE e UAB/UECE Marcony Silva Cunha Francisco Fábio Castelo Branco Maria do Socorro Ferreira Osterne Coordenadora Adjunta UAB/UECE Eloísa Maia Vidal Maria Salete Bessa Jorge Diretor do CCT/UECE Silvia Maria Nóbrega-Therrien Luciano Moura Cavalcante Conselho Consultivo Coordenador da Licenciatura em Computação Antônio Torres Montenegro (UFPE) Francisco Assis Amaral Bastos Eliane P. Zamith Brito (FGV) Coordenadora de Tutoria e Docência em Computação Homero Santiago (USP) Maria Wilda Fernandes Ieda Maria Alves (USP) Editor da EdUECE Manuel Domingos Neto (UFF) Erasmo Miessa Ruiz Maria do Socorro Silva Aragão (UFC) Coordenadora Editorial Rocylânia Isidio de Oliveira Maria Lírida Callou de Araújo e Mendonça (UNIFOR) Projeto Gráfico e Capa Pierre Salama (Universidade de Paris VIII) Roberto Santos Romeu Gomes (FIOCRUZ) Diagramador Túlio Batista Franco (UFF) Francisco José da Silva Saraiva Dados Internacionais de Catalogação na Publicação Sistema de Bibliotecas Luciana Oliveira – CRB-3 / 304 Bibliotecário S575e Silva, Jorge Luiz de Castro e. Estatística e Probabilidade / Jorge Luiz de Castro e Silva, Maria Wilda Fernandes , Rosa Lívia Freitas de Almeida. – 3. ed. – Fortaleza : EdUECE, 2015. 125 p. : il. ; 20,0cm x 25,5cm. (Computação) Inclui bibliografia. ISBN: 978-85-7826-439-0 1. Estatística. 2. Matemática – Probabilidade I. Fernan- des, Maria Wilda. II. Almeida, Rosa Lívia de. III. Título. CDD 519 Editora da Universidade Estadual do Ceará – EdUECE Av. Dr. Silas Munguba, 1700 – Campus do Itaperi – Reitoria – Fortaleza – Ceará CEP: 60714-903 – Fone: (85) 3101-9893 Internet: www.uece.br – E-mail: [email protected] Secretaria de Apoio às Tecnologias Educacionais Fone: (85) 3101-9962 Sumário Apresentação.......................................................................................... 5 Capítulo 1 – Introdução à Estatística.................................................... 7 1. A Estatística como campo de conhecimento.........................................9 2. Porque estudar Estatística...................................................................10 3. Método estatístico................................................................................11 Capítulo 2 – População e Amostra..................................................... 13 1. Variáveis...............................................................................................15 2. Escala de medidas..............................................................................15 3. População............................................................................................16 4. Censo...................................................................................................17 5. Amostra................................................................................................17 Capítulo 3 – Gráficos Estatísticos...................................................... 21 1. Apresentação gráfica...........................................................................23 2. Diagramas............................................................................................23 Capítulo 4 – Tabelas e Séries Estatísticas......................................... 29 1. Tabelas.................................................................................................31 2. Séries estatísticas................................................................................34 Capítulo 5 – Distribuição de frequência............................................. 37 1. Sintetizando dados qualitativos............................................................39 2. Sintetizando dados quantitativos..........................................................41 Capítulo 6 – Medidas de Posição........................................................ 57 1. Introdução............................................................................................59 2. Média aritmética ( x )............................................................................59 3. Mediana (Md).......................................................................................63 4. Moda (Mo)............................................................................................68 5. Aplicação das medidas de posição......................................................72 6. Separatrizes........................................................................................72 Capítulo 7 – Medidas de Dispensão ou de Variabilidade.................. 79 1. Dispersão ou variabilidade...................................................................81 2. Assimetria.............................................................................................87 3. Curtose.................................................................................................89 Capítulo 8 – Fundamentos de Probabilidade..................................... 93 1. Introdução............................................................................................95 2. Espaço Amostral e Eventos.................................................................97 3. Definição de probabilidade...................................................................98 4. Espaços amostrais finitos e infinitos..................................................100 5. Probabilidade condicional..................................................................101 6. Variáveis aleatórias, funções densidade de probabilidade................105 Capítulo 9 – Distribuições estatísticas............................................. 111 1. Distribuições discretas.......................................................................113 2. Distribuições contínuas.....................................................................116 3. Momentos de uma distribuição de probabilidade...............................121 Sobre os autores................................................................................ 125 Apresentação Esta publicação constitui-se como um importante recurso posto à disposição dos alunos do curso de licenciatura plena em Computação, na modalidade educação a distância da Universidade Estadual do Ceará, tendo como fina- lidade apresentar uma introdução aos princípios gerais da Estatística (seu campo de atuação) e aprofundar alguns conceitos importantes ao entendi- mento do seu campo de estudo. O livro está organizado em 9 capítulos. Os capítulos 1 a 5 tratam dos tópicos referentes à Estatística Descritiva, iniciando com a apresentação da Estatística como campo de conhecimento; explicando os significados de po- pulação e amostra; apresentando os diversos tipos de gráficos estatísticos, tabelas e séries. O capítulo 5 é dedicado a distribuição de frequência de dados qualitativos e quantitativos. Os capítulo 6 e 7 encerram a parte dedicada a Estatística Descritiva, apresentando medidas de posição e medidas de dispersão ou de variabilidade. Os capítulos 8 e 9 são dedicados ao estudo de probabilidade, abordan- do a definição conceitual, espaços amostrais finitos e infinitos, probabilidade condicional e distribuições estatísticas. Ao final de cada capítulo, são apresentadas atividades de avaliação que podem ser utilizadas como verificação de aprendizagem do aluno. Os autores Capítulo 1 Introdução à Estatística 9 Estatística e Probabilidade Objetivos Apresentar os conceitos básicos de Estatística, o seu campo de aplica- ção e as fases do método estatístico descritivo. Apresentar os conceitos de variáveis, população e amostra além dos mo- tivos para se fazer uso de amostragem e quais os seus tipos principais. 1. A Estatística como campo de conhecimento Em nosso dia a dia, frequentemente estamos fazendo observações de fenô- menos e gerando dados. Os professores analisam dados de alunos; analistas de sistemas analisam dados de desempenho de sistemas computacionais; médicos analisam resposta do paciente a tratamentos, e todos nós, ao lermos jornais e revistas, estamos vendo resultados estatísticos provenientes do cen- so demográfico, de pesquisas eleitorais, da bolsa de valores etc. Os dados podem provir de estudos observacionais ou de experimentos planejados. Ao acompanharmos o desempenho de um processo produtivo em sua forma natural, estamos fazendo um estudo observacional; ao alterar de forma proposital alguma variável do processo para verificar seus resulta- dos, estamos realizando um experimento. Estatística é um campo do estudo centrado na produção de metodolo- gia para coleta, organização, descrição, análise e interpretação de dados bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas em tais análises. Decidir qual é o melhor plano experimental e amostral para a realização da Pesquisa. Organizar e sumarizar dados obtidos por classificação, por contagem ou por mensuração. Fazer inferência sobre populações de unidades (indivíduos, objetos, ani- mais) quando apenas uma parte (amostra) é estudada (classificada, con- tada ou medida). A Estatística pode ser aplicada em praticamente todas as áreas do conhecimento humano, tais como administração, Economia, Farmácia, Educação, Agricultura, Informática, Psicologia, indústria, comércio, Medicina e várias outras. 10 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. Podemos dividir a estatística em dois grupos: descritiva e indutiva. A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial. A estatística envolve técnicas para coletar, organizar, descrever, anali- sar e interpretar dados provenientes de estudos experimentais e de estudos observacionais. A análise estatística de dados geralmente tem por objetivo a tomada de decisões, resolução de problemas ou produção de conhecimentos. Novos conhecimentos em geral nos levam a novos problemas, resultando em um processo interativo. Novos conhecimentos Pesquisa Dados Informações Novos problemas Visão geral do processo estatístico Definição Objetivo do problema Variáveis Planejamento Levantamento População dos dados Censo Amostra Apresentação Apresentação tabular dos dados Estatística descritiva Estatísticas Análise e interpretação dos dados 2. Porque estudar Estatística O interesse pelo estudo da estatística se justifica porque a natureza apresenta variabilidade. ocorrem variações de indivíduo para indivíduo. ocorrem variações no mesmo indivíduo. 11 Estatística e Probabilidade a Estatística estuda como controlar, minimizar e observar a variabilidade inevitável de todas as medidas e observações. sem métodos estatísticos, a validade científica ficaria comprometida. 3. Método estatístico 3.1 O método científico Podemos entender método científico como um conjunto de regras básicas para desenvolver uma experiência a fim de produzir um novo conhecimento, bem como corrigir e integrar conhecimentos pré-existentes. Dos métodos científicos, podemos destacar o método experimental e o estatístico. 3.2 O método experimental O método1 experimental baseia-se em manter constantes todas as causas 1 Método: é um conjunto (fatores), menos uma, e variar essa causa de modo que o pesquisador possa de meios dispostos descobrir seus efeitos, caso existam. É muito utilizado no estudo da Física, da convenientemente para se chegar a um fim que se Química etc. deseja. 3.3 O método estatístico É utilizado quando precisamos descobrir fatos em um campo em que o méto- do experimental não se aplica (como, nas Ciências Sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa. A de- terminação das causas que definem o preço de uma mercadoria seria um bom exemplo: para aplicarmos o método experimental, teríamos que variar a quanti- dade da mercadoria para saber se tal fato iria influenciar ou não no seu preço. Nesses casos, lançamos mão de outro método, o método estatístico. O método estatístico, diante da impossibilidade de manter as causas cons- tantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. 12 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. 3.4 Fases do método estatístico descritivo 2 Dado: é uma descrição limitada do real, a) Coleta de dados desvinculada de um referencial explicativo A coleta de dados2 é o meio pelo qual a informação3 sobre as variáveis é co- e difícil de ser utilizado letada. A coleta de dados pode ser direta, quando ela é feita diretamente na como informação por ser fonte, e indireta, quando é feita através de outras fontes. ininteligível Em relação ao fator tempo, a coleta de dados pode ser classificada em 3 Informação: é uma contínua, periódica ou ocasional. descrição mais completa Coleta de dados contínua: quando os eventos que acontecem durante do real associada a um referencial explicativo determinado estudo são registrados à medida que ocorrem. sistemático. Assim a Coleta de dados periódica: acontece em intervalos constantes de tem- informação é o dado, cuja forma e conteúdo são po, como nos censos. apropriados para um uso Coleta de dados ocasional: são aqueles realizados sem a preocupação específico de continuidade ou periodicidade, com o objetivo de atender a uma con- juntura ou emergência. b) Crítica dos dados A crítica dos dados é um processo de detecção de erros por inspeção cuida- dosa dos dados coletados. Em geral, é tida com a responsável por retardar a conclusão dos resultados da pesquisa. No entanto, trata-se de uma etapa fundamental para garantir a qualidade dos dados. c) Apuração dos dados Consiste em resumir os dados através de uma contagem e de um agrupa- mento. É um trabalho de coordenação e de tabulação. Pode ser manual, ele- tromecânica ou eletrônica. d) Exposição ou apresentação dos dados A apresentação dos dados é de fundamental importância para uma pesquisa. Estes devem ser apresentados de forma adequada, por meio de tabelas e/ou gráficos que permitam sintetizar grandes quantidades de dados, tornando mais fácil a compreensão do atributo em estudo e permitindo uma futura análise. e) Análise dos resultados O objetivo de uma análise estatística é tirar conclusões que ajudem o pesqui- sador a resolver o problema proposto. O significado exato de cada um dos valores obtidos através do cálculo das várias medidas estatísticas disponíveis deve ser bem interpretado. Capítulo 2 População e Amostra 15 Estatística e Probabilidade Objetivo Definir o que são variáveis, população e amostra. 1. Variáveis Chamamos de variável o conjunto de resultados possíveis de um fenômeno. Os símbolos utilizados para representar as variáveis são as letras maiúsculas do alfabeto, como X, Y, Z,... que podem assumir qualquer valor de um conjunto de dados. Podemos citar como exemplo: idade, sexo, estado civil etc. A escolha da variável dependerá dos objetivos do estudo estatístico. As variáveis podem ser classificadas dos seguintes modos. a) Qualitativas (ou atributos): são características de uma população que não podem ser medidas, não têm ordenamento nem hierarquia. Essas variáveis e podem ser: Nominais: quando os valores são expressos por atributos. Ex: sexo, cor da pele, curso de graduação, nacionalidade etc. Ordinais ou por postos: quando a variável segue uma ordem, mesmo não podendo ser medida. Ex: escolaridade, cargos em uma empresa, patente militar, etc. b) Quantitativa: quando os valores da variável forem expressos em números, podendo ser: Discreta: assume apenas valores pertencentes a um conjunto enume- rável e resultam de uma contagem. Ex: número de filhos, quantidade de cursos etc. 4 Observe que algumas Contínua: pode assumir qualquer valor num intervalo razoável de va- vezes são atribuídos riação. Ex: peso, altura, faixa etária etc. números aos dados para serem inseridas no computador: 0 - sim; 1 - 2. Escala de medidas não, 2 - indeciso. Neste caso são apenas rótulos e Escala é um conjunto de símbolos ou números4, construído com base numa não podem ser efetuados regra e aplica-se a indivíduos ou aos seus comportamentos ou atitudes. A cálculos com estes números. posição de um indivíduo na escala é baseada na posse pelo indivíduo do atri- buto que a escala deve medir. As principais escalas de medida são: nominal, ordinal, intervalar e razão. 16 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. Escala nominal Dá nome a uma categoria ou a uma classe. Os dados não podem ser dispostos em um esquema ordenado. Exemplos: respostas do tipo “sim”, “não” ou “indeciso” Escala ordinal5 Dá nome e uma ordem a uma categoria ou a uma classe. A diferença 5 Observe que na escala entre os valores dos dados não pode ser determinada ou não faz para ordinal não é possível a pesquisa sentido. Exemplos: grau de instrução: 1 = sem instrução; quantificar o quanto o nível 2 = primeiro grau; 3 = segundo grau, 4 = superior; 5 = Mestre; 6 = Doutor. 3 é melhor do que 2 ou o 4 é melhor do que 3. Escala intervalar É verdadeiramente quantitativa. A mensuração é feita diretamente em nú- meros reais, obtidos mediante a comparação com um determinado valor fixo, denominado unidade. O nome "intervalar" está ligado aos intervalos entre as categorias da variável e aqui se sabe exatamente o quanto uma categoria é menor ou maior que outra ou, ainda, se há igualdade entre elas. As operações aritméticas comuns (soma, subtração, multiplicação e divisão) são aplicáveis. Ex: os valores de idade, altura, peso, pressão arterial, frequência cardíaca, exames laboratoriais, medidas diversas etc. Escala proporcional ou nível de razão Tem todas as características das escalas apresentadas anteriormente e ainda fornece um zero absoluto ou uma origem significativa. Por haver um acordo universal acerca das localizações do ponto zero, as compa- rações entre magnitudes de valores na escala de razão são aceitáveis. Uma escala de razões reflete a quantidade real de uma variável. Todas as operações aritméticas são possíveis. Ex: peso. Peso Zero = ausência de peso. 60 kg é o dobro de 30 kg. 3. População É um conjunto de elementos com pelo menos uma característica em comum, que deve delimitar inequivocamente quais os elementos pertencem à popu- lação e quais não pertencem. Exemplos: os alunos de uma universidade, os clientes de um banco. Como definir uma população? A quem interessa esse resultado? 17 Estatística e Probabilidade Se o analista dos resultados for o responsável pelos cursos de educação a distância de uma universidade, será que interessa a ele o desempenho dos alunos dos cursos presenciais? Devemos procurar as características que interessam ao analista dos resultados. Os alunos de uma universidade em 2010. Os alunos dos cursos a distância da universidade em 2010. Perceba que a cada item, estamos especificando cada vez mais as características das pessoas a serem observadas, restringindo a população objeto de nossos estudos. 6 Parâmetro: é uma medida numérica que descreve A população pode ser uma característica da Finita: quando o número de unidades a observar pode ser contado e é população limitado. Ex: alunos matriculados nas escolas públicas, pessoas que pos- 7 Estimativa: é uma medida suem aparelho telefone celular, número de alunos que se matricularam na numérica que descreve disciplina “Estatística” na universidade em 2010 etc. uma característica da amostra Infinita: quando a quantidade de observação é ilimitada ou quando as unidades da população não podem ser contadas. Ex: conjunto de medi- das de determinado comprimento, gases, líquidos, em que as unidades não podem ser identificadas ou contadas. 4. Censo É uma coleção de dados relativos a todos os elementos de uma população. 5. Amostra Definida as características da população, o passo seguinte é o levantamento de dados acerca das características do objeto em estudo. Mas será que sempre é possível o levantamento de dados de toda a população que devemos analisar? A maioria das vezes não é conveniente e em algumas é impossível devi- do aos seguintes fatores. Tempo: as informações devem ser obtidas com rapidez Precisão: as informações devem ser corretas Custo: no processo de coleta, sistematização, análise e interpretação, o custo deve ser o menor possível. 18 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. Por impossibilidade ou inviabilidade econômica ou temporal, devemos, então, delimitar nossas observações a uma parte da população, isto é, a uma 8 Amostra: é um amostra8 proveniente dessa população. subconjunto de uma população, necessariamente finito, pois todos os População Amostra seus elementos serão examinados para efeito da realização do estudo estatístico desejado. Amostragem é uma técnica especial usada para recolher amostras que garante o acaso na escolha de modo a garantir à amostra o caráter de repre- 9 Tabelas de números sentatividade. aleatórios: você pode gerar uma tabela de números Vejamos três dos principais tipos de amostragem. aleatórios fazendo uso do Amostragem casual simples: composta de elementos retirados ao Excel ou do Br.Office Calc por intermédio da função acaso da população, ou seja, consiste em selecionar a amostra através ALEATÓRIO() de um sorteio. Dessa maneira, todos os elementos da população terão igual probabilidade de serem escolhidos. Para realizar esse sorteio, pode- mos utilizar urnas, tabelas de números aleatórios9 ou algum software que gere números aleatórios. Amostragem sistemática: É utilizada quando a população está natu- ralmente ordenada, como listas telefônicas, fichas de cadastramento etc. Amostragem estratificada: composta por elementos provenientes da di- visão da população em subgrupos denominados estratos (por exemplo, por sexo, renda, bairro etc.) Atividades de avaliação 1. Faça uma pesquisa sobre a evolução da Estatística. 2. Cite algumas áreas em que a Estatística é aplicada. 3. Como podemos classificar a Estatística? 4. Qual a diferença existente entre Estatística Descritiva e Estatística Indutiva? 5. Quais as fases do método estatístico? 6. Com o objetivo de fazer um estudo sobre o sobre o número de irmãos dos alunos de uma escola, foi feita uma pesquisa em que responderam 60 alunos. 19 Estatística e Probabilidade Identifique a) a população em estudo. b) a amostra escolhida. c) a variável em estudo classificando-a. 7. Foi feito um estudo em uma universidade e recolheram-se dados referen- tes às variáveis idade, sexo, curso, ano de ingresso. a) Das variáveis indicadas, quais são as quantitativas e quais são as qualitativas? b) Das variáveis quantitativas, quais são contínuas?   Referências COSTA, F. S. Introdução Ilustrada à Estatística. São Paulo: Harbra, 1998. CRESPO, A. Estatística Fácil. Rio de Janeiro: Saraiva, 1996. MARTINS G. A. Estatística Geral e Aplicada. São Paulo: Atlas, 2001. MORETTIN, L. G. Estatística Básica – Probabilidade. São Paulo: Makron Books, 1993. TRIOLA M. F. – Introdução à Estatística e Probabilidade – Exercícios Re- solvidos e Propostos. Rio de Janeiro: LTC, 1999. VIEIRA, S. Estatística Experimental. São Paulo: Atlas, 1999. Capítulo 3 Gráficos Estatísticos 23 Estatística e Probabilidade Objetivos Descrever a importância de gráficos e de tabelas para compreensão da informação. Apresentar as diversas maneiras de representação dos dados. Construir gráficos e tabelas usando as técnicas adequadas e seguindo normas vigentes e boas práticas. 1. Apresentação gráfica Os dados podem ser apresentados em gráficos, com a finalidade de proporcio- nar ao interessado uma visão rápida do comportamento do fenômeno. Representa qualquer tabela de maneira simples, legível e interessante, tornando claras as informações que poderiam passar despercebidos em da- dos apenas tabulados. É importante que os gráficos sejam simples; as informações contidas devem ser diretas, e detalhes secundários, omitidos, devem ser claros para possibilitar uma correta interpretação e devem expressar a verdade sobre o caso em estudo. Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas. 2. Diagramas Os diagramas são gráficos geométricos que possuem no máximo duas di- mensões. O sistema cartesiano é utilizado na sua construção. 2.1 Gráfico em barras ou em colunas Um gráfico em barras horizontais representa a série de dados através de re- tângulos dispostos horizontalmente com mesma altura e comprimentos pro- porcionais à frequência de cada dado. Esse gráfico é muito apropriado para representar graficamente os dados qualitativos, porém pode, ser utilizado tam- bém para representar dados quantitativos discretos. Veja o exemplo a seguir. 24 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. Tipos de filmes preferidos pelos jovens No gráfico em colunas, os retângulos são dispostos verticalmente com a mesma base e alturas proporcionais à frequência de cada dado. Os valores da variável são colocados no eixo horizontal, e a frequência no eixo vertical. Produção de uma empresa de janeiro a junho de 2009 2.2 Gráfico em linhas Neste gráfico é usada uma linha para representar a série estatística. Seu prin- cipal objetivo é evidenciar a tendência do fenômeno ou a forma como o ele está crescendo ou decrescendo através de um período de tempo. Seu traça- do deve ser realizado considerando o eixo “x”, horizontal, que representa a escala de tempo e o eixo “y”, vertical, que representa a frequência observada dos valores. Veja o exemplo a seguir 25 Estatística e Probabilidade Produção de arroz 2.3 Gráfico em setores O gráfico de setor ou "pizza" como também é chamado, mostra o tamanho proporcional de itens que constituem uma série de dados para a sua soma. É utilizado principalmente quando se pretende comparar cada valor da série com o total. Esporte preferido dos alunos de uma escola 7% 10% Futebol Natação 20% Vôlei 63% Basquete 2.4 Gráfico polar Neste tipo de gráfico, a série de dados é representada por meio de um po- lígono. Ideal para representar séries temporais cíclicas, como a variação da precipitação pluviométrica ao longo do ano. Para sua construção, divide-se uma circunferência em tantos arcos quantos forem os dados a representar. Pelos pontos de divisas traçam-se raios. Em cada raio é representado um valor da série, marcando-se um ponto cuja distância ao centro é diretamente proporcional a esse valor e, em seguida, unem-se os pontos. No Excel, o nome da ferramenta a ser utilizada é RADAR e o traçado do gráfico é interno à circunferência. 26 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. Precipitação pluviométrica em uma cidade - 2008 Fonte: Dados Hipotéticos 2.5 Cartograma O cartograma é a representação sobre uma carta geográfica (mapa). Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados a áreas geográficas ou políticas. Volume Armazenado(%) De 0 a 9% De 10 a 19% De 20 a 29% De 30 a 39% De 40 a 49% De 50 a 59% De 60 a 69% De 70 a 79% De 80 a 89% De 90 a 99% De 100 - acima 2.6 Pictogramas É a apresentação de uma série estatística por meio de símbolos representati- vos de um fenômeno. A representação gráfica consta de figuras. Veja o exemplo a seguir 27 Estatística e Probabilidade Frutas preferidas pelas crianças de uma escola 12 10 8 6 4 2 0 Banana Maçã Laranja Uva Manga Saiba Mais Importante. Ao construir um gráfico, evitar muitas linhas, para não ficar muito poluído; legendas e símbolos dos eixos muito pequenos; símbolos em tamanhos diferentes; desperdício de espaço; muitas marcas de escala. Atividades de avaliação 1. Segundo a Revista Y, o número de supermercados (em 100 unidades) em algumas cidades brasileiras em 2005 foi o seguinte: 80 em Belo Horizonte, 47 em Brasília, 69 em Curitiba, 72 em Porto Alegre, 144 no Rio de Janeiro e 399 em São Paulo. Organize os dados numa tabela e represente-os graficamente com um gráfico de colunas. 2. O quadro a seguir é o resultado de uma pesquisa sobre a preferência de atividade física em uma academia. Construa um gráfico de setores para representar o resultado. 28 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. ATIVIDADE FÍSICA DA ACADEMIA Atividade física Quantidade de alunos Musculação 30 Futebol 20 Natação 25 Hidroginástica 10 Ginástica 15 Dados Hipotéticos 3. Usando gráfico em barras, represente as tabelas a seguir PRODUÇÃO DE ARROZ POR REGIÃO 2009 Regiões Quantidade (em toneladas) Norte 946,2 Nordeste 1145,8 Centro-Oeste 1157,1 Sudeste 195,7 Sudeste 8571,5 Dados Hipotéticos PRODUÇÃO DE PETRÓLEO BRUTO DO BRASIL 2000 - 2004 Anos Quantidade (em 1000m3) 2000 36180 2001 36410 2002 37164 2003 38011 2004 38200 Dados Hipotéticos 4. Em um Restaurante X, o número de clientes no segundo semestre de 2009 foi o seguinte, (respectivamente, de julho a dezembro): 930, 820, 1080, 1230, 1190, 1740. Represente os dados através do gráfico em linhas. 5. Pesquise em jornais e em revistas dois exemplos de pictograma e cartograma. Capítulo 4 Tabelas e Séries Estatísticas 31 Estatística e Probabilidade Objetivos Explicitar a importância das tabelas e os seus principais elementos. Apresentar as principais séries estatísticas. 1. Tabelas Um dos objetivos da estatística é sintetizar os valores que uma ou mais vari- áveis podem assumir para que possamos ter uma visão global de um varia- ção. Para isso, a Estatística apresenta esses valores em forma de tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, o que permite decisões administrativas e pedagógicas mais coerentes e científicas. Os elementos de uma tabela são os seguintes. Título: deve responder às seguintes questões: O que? (assunto ou fato a ser representado). Onde? (o local onde ocorreu o fenômeno). Quando? (a época ou tempo em que se verificou o fenômeno). Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada coluna. Corpo: parte da tabela composta por linhas e colunas. Linhas: parte do corpo que contém uma sequência horizontal de informações. Colunas: parte do corpo que contém uma sequência vertical de informações. Coluna Indicadora: coluna que contém as discriminações corresponden- tes aos valores distribuídos pelas colunas numéricas Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna. Rodapé: espaço aproveitado em seguida ao fecho da tabela, em que são colocadas as notas de natureza informativa (fonte, notas e chamadas). Fonte: refere-se à entidade que organizou ou forneceu os dados expostos. 32 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. Notas e Chamadas: são esclarecimentos contidos na tabela (nota - con- ceituação geral; chamada - esclarecer minúcias em relação a uma célula). por área de Dados Hipotéticos A apresentação de quadros e tabelas está regida pelas Normas de Apresentação Tabular (IBGE, 1979) e pelas Normas de Apresentação Tabular (Conselho Nacional de Estatística, 1958). 1.1 Quadros Denomina-se quadro a apresentação de dados de forma organizada, para cuja compreensão não seria necessária qualquer elaboração matemático-estatística. Qualquer que seja seu tipo, sua identificação aparece na parte inferior precedida da palavra “Quadro”, seguida de seu número de ordem, de ocor- rência de algarismos arábicos, do respectivo título, da legenda explicativa e da fonte, se necessário. 1.2 Tabelas São conjuntos de dados estatísticos, associados a um fenômeno, dispostos numa determinada ordem de classificação. Expressam as variações qualita- tivas e quantitativas de um fenômeno. A finalidade básica da tabela é resumir ou sintetizar dados de maneira a fornecer o máximo de informação num mínimo de espaço. 33 Estatística e Probabilidade São ainda caracteristicas das tabelas Toda tabela deve ter significado próprio, dispensando consultas ao texto. Não devem ser apresentadas tabelas nas quais a maior parte dos casos indiquem inexistência do fenômeno. Caso sejam utilizadas tabelas reproduzidas de outros documentos, a pré- via autorização do autor se faz necessária, não sendo mencionada na mesma. O título é colocado na parte superior precedido da palavra “Tabela” e de seu número de ordem em algarismos arábicos, bem como do respectivo título, centrados na largura útil das páginas. As fontes citadas na construção de tabelas e notas eventuais aparecem no rodapé após a linha de fechamento; utilizam-se traços horizontais para fechar as linhas externas, separando os cabeçalhos do conteúdo da ta- bela e fechando a tabela. Evitam-se traços verticais para separar as colunas e traços horizontais para separar as linhas. A tabela deve ser colocada em posição vertical, para facilitar a leitura dos dados. No caso em que isso seja impossível, deve ser colocada em posição ho- rizontal, com o título voltado para a margem esquerda da folha. Se a tabela (ou quadro) não couber em uma página, deve ser continuado na página seguinte; nesse caso, o final não será delimitado por traço ho- rizontal na parte inferior, e o cabeçalho será repetido na página seguinte. Tabela 1 TABELA FACULDADES Faculdade Novos alunos Alunos de graduação Alteração Universidade Cedar 110 103 +7 Faculdade Elm 223 214 +9 Academia Maple 197 120 +77 Faculdade Pine 134 121 +13 Instituto Oak 202 210 -8 Universidade xxx 24 20 +4 Faculdade Eee 43 53 -10 Academia Mmm 3 11 -8 Faculdade Ppp 9 4 +5 Instituto Okk 53 52 +1 Dados hipotéticos 34 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. 2. Séries estatísticas É toda tabela que apresenta a distribuição de um conjunto de dados estatísti- cos em função da época, do local e da espécie e que determina o surgimento de quatro tipos fundamentais de séries estatísticas: Série temporal ou cronológica: é a série cujos dados estão dispostos em correspondência com o tempo, ou seja, varia o tempo e permanece constante o fato e o local. Exemplo: Tabela 2 ALUNOS MATRICULADOS NOS CURSOS DE GRADUAÇÃO DA UNIVERSIDADE A Ano Alunos matriculados 2007 17.300 2008 17.500 2009 16.837 2010 18.200 Dados Hipotéticos Série geográfica ou territorial: é a série cujos dados estão dispostos em correspondência com o local, ou seja, varia o local e permanecem cons- tantes a época e o fato. Tabela 3 ALUNOS MATRICULADOS NAS UNIDADES DO INTERIOR NOS CURSOS DE GRADUAÇÃO DA UNIVERSIDADE A - 2009 Cidades Alunos matriculados Cidade A 550 Cidade B 1.605 Cidade C 610 Cidade D 689 Cidade E 1.288 Cidade F 340 Fonte: Dados Hipotéticos Série específica ou qualitativa: é a série cujos dados estão dispostos em correspondência com a espécie ou qualidade, ou seja, varia o fato e permanecem constantes a época e o local. 35 Estatística e Probabilidade Veja o exemplo a seguir. Tabela 4 ALUNOS MATRICULADOS NA UNIVERSIDADE A - 2009 Alunos Alunos matriculados Graduação 16.837 Pós-graduação 1.048 Dados Hipotéticos Série mista ou composta: a combinação entre duas ou mais séries constituem novas séries denominadas "compostas" e apresentadas em tabelas de dupla entrada. O nome da série mista surge de acordo com a combinação de pelo menos dois elementos. Tabela 5 EVOLUÇÃO DAS MATRICULAS DOS ALUNOS DA UNIVERSIDADE A - 2007 - 2009 Anos Alunos 2007 2008 2009 Graduação 17.300 17.500 16.837 Pós-graduação 997 1.010 1.048 Dados Hipotéticos Referências BARBETA, P.A., REIS, M.M.,BORNIA, A.C. Estatística para Cursos de En- genharia e Informática, São Paulo: Atlas, 2004. BOLFARINE, Heleno & BUSSAB, Wilton O. Elementos de Amostragem. 1. ed. São Paulo: Edgard Blücher, 2005. BUSSAB, Wilton de Ol., MORETTIN, Pedro A. Estatística Básica. São Paulo: Sa- raiva, 2002. COSTA, F.S. Introdução Ilustrada à Estatística. São Paulo: Harbra, 1998. CRESPO, A. Estatística Fácil. Rio de Janeiro: Saraiva, 1996. FONSECA, Jairo Simon da. Introdução a Estatística. Rio de Janeiro: LTC. 1993.   JAIRO, Simon da Fonseca, MARTINS, Gilberto de Andrade. Curso de Esta- tística, São Paulo: Atlas, 1996. MARTINS G.A. Estatística Geral e Aplicada. São Paulo: Atlas, 2001. MEYER, Paul L. Aplicações a Estatística. Rio de Janeiro: LTC. 1992. 36 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. MIRSHAWKA, V. Probabilidade e Estatística para Engenharia, São Paulo: Nobel, 1978. MORETTIN, Pedro A. Estatística Básica. São Paulo: Saraiva.2008. PEREIRA, Wilson., TANAKA, Oswaldo K. Estatística - Conceitos Básicos, São Paulo: Makron Books, 1990. ROSS, Sheldon. A First Course in Probability. 7. ed. New Jersey: Prentice Hall, 2005. SPIEGEL M. R. Estatística. (Coleção Schaum). São Paulo: Editora Afiliada 1993. TRIOLA M. F. Introdução à Estatística e Probabilidade Exercícios Resol- vidos e Propostos. Rio de Janeiro: LTC, 1999. TRIOLA, Mario F. Introdução a Estatística. Rio de Janeiro: LTC. 2005. VIEIRA, S. Estatística Experimental. São Paulo: Atlas, 1999. Capítulo 5 Distribuição de frequência 39 Estatística e Probabilidade Objetivos Apresentar a forma de sintetizar dados qualitativos quantitativos. Fornecer o passo a passo da construção das tabelas de distribuição de frequência simples e para dados agrupados. Mostrar representações gráficas: histograma, polígono de frequência e ogiva. 1. Sintetizando dados qualitativos Os dados qualitativos são o resultado da análise de variáveis qualitativas. A análise estatística desse tipo de dados resume-se à contagem do número de indivíduos em cada categoria e ao cálculo das respectivas porcentagens. Quadro 1 Coca-cola Sprite Coca-cola Pepsi-cola Coca-cola zero Coca-cola Coca-cola Coca-cola Pepsi-cola Sprite Pepsi-cola Pepsi-cola Coca-cola Pepsi-cola Coca-cola Sprite Coca-cola zero Coca-cola Sprite Coca-cola zero Pepsi-cola Pepsi-cola Sprite Coca-cola zero 1.1 Distribuição de frequência para dados qualitativos Uma distribuição de frequência agrupa os dados por classes de ocorrência, resumindo a análise de conjunto de dados grandes. Vejamos um exemplo. Adotemos o conjunto de dados do quadro anterior que representa o consumo de refrigerantes de um grupo de amigos. Para construirmos a tabela de frequências, organizamos os dados em 3 colunas: coluna das categorias ou classes – onde se indicam todas as ca- tegorias da variável em estudo; coluna das frequências absolutas – onde se registra o total de elementos da amostra que pertencem a cada categoria – e coluna das frequências relativas (ou percentagens) – onde se coloca, para cada categoria, o valor que se obtém dividindo a respectiva frequência abso- luta pela dimensão da amostra. 40 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. Tabela 1 DISTRIBUIÇÃO DE FREQUÊNCIA DAS COMPRAS DE REFRIGERANTES Refrigerantes Frequência Absoluta Frequência Relativa Coca-cola 8 0,3333 Coca-cola zero 4 0,1667 Pepsi-cola 7 0,2917 Sprite 5 0,2083 Total 24 1 Dados Hipotéticos 10 Em alguns casos, as Ao organizarmos os dados de uma amostra numa tabela de frequên- frequências relativas cias, é bom verificarmos se as frequências estão bem calculadas. Para isso é são dízimas infinitas suficiente somá-las para todas as classes e verificar que a soma das frequên- obrigando, por isso, a arredondamentos. Estes cias absolutas é igual à dimensão da amostra e que a soma das frequências podem ser feitos desde relativas10 é igual a 1. que o total seja igual a 1. Saiba Mais Arredondamento de Dados Regras: Portaria 36 de 06/07/1965 - INPM - Instituto Nacional de Pesos e Medidas. Se o primeiro algarismo após aquele que formos arredondar for de 0 a 4, conservamos o algarismo a ser arredondado e desprezamos os seguintes. Ex.: 7,34856 (para décimos) 7,3 Se o primeiro algarismo após aquele que formos arredondar for de 6 a 9, acrescenta-se uma unidade no algarismo a ser arredondado e desprezamos os seguintes. Ex.: 1,2734 (para décimos) 1,3 Se o primeiro algarismo após aquele que formos arredondar for 5, seguido apenas de zeros, conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for ímpar, des- prezando os seguintes. Ex.: 6,2500 (para décimos) 6,2 12,350 (para décimos) 12,4 Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero, au- mentamos uma unidade no algarismo e desprezamos os seguintes. Ex.: 8,2502 (para déci- mos) 8,3 8,4503 (para décimos) 8,5 41 Estatística e Probabilidade 1.2 Representação gráfica para dados qualitativos O gráfico estatístico11 é uma forma de apresentação/visualização dos dados 11 Requisitos fundamentais estatísticos, que permite que a pessoa que está analisando esses dados te- para a construção de um nha uma impressão mais rápida e mais viva do fenômeno em estudo, uma vez gráfico: Simplicidade: o gráfico deve que os gráficos falam mais à compreensão do que as séries. ser destituído de detalhes A grande vantagem dos gráficos em relação às tabelas de frequências de importância secundária, está na rapidez da leitura, em que não só há uma percepção imediata de evitando-se, também, traços desnecessários que qual a categoria de maior frequência, como também se evidencia com mais possam levar a pessoa clareza a ordem de grandeza de cada categoria relativamente às restantes. que está analisando a uma Vejamos um exemplo de gráfico em colunas usando como base a nos- interpretação equivocada dos dados. sa tabela de distribuição de frequência das compras de refrigerantes Clareza: o gráfico deve possibilitar uma correta Gráfico 1 interpretação dos valores DISTRIBUIÇÃO DAS COMPRAS DE REFRIGERANTES representativos do caso em estudo. Veracidade: o gráfico deve 8 ser a verdadeira expressão 6 do fenômeno em estudo. Frequência 4 2 0 Coca-Cola Coca-Cola Pepsi-Cola Sprite zero 2. Sintetizando dados quantitativos O dado quantitativo faz referência aos números no sentido de quantidade e podem se dividir em duas categorias. Quantitativo discreto: aquele que pode assumir apenas valores per- tencentes a um conjunto enumerável. Ex: população: habitações de uma cidade (variável: número de cômo- dos); população: casais em uma cidade (variável: número de filhos) Quantitativo contínuo: pode assumir qualquer valor em certo interva- lo de variação. Exemplo: população: pessoas residentes em uma cidade (variável: idade); es- tudantes: alunos de uma universidade (variável: estatura dos alunos) 42 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. 2.1 Distribuição de frequência Vamos imaginar uma pesquisa referente às estaturas de quarenta alunos que compõem uma amostra dos alunos de uma universidade, o que resultou na tabela de valores a seguir: Tabela 2 ESTATURA DOS ALUNOS DE UMA UNIVERSIDADE 166 160 161 150 162 160 165 167 164 160 162 168 161 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Fonte: Dados Hipotéticos A tabela anterior é denominada de "tabela primitiva" por considerar que os elementos ainda não foram numericamente organizados. Visualizando a tabela anterior percebemos que fica difícil saber em tor- no de que valor tende a se concentrar as estaturas dos alunos, qual a menor ou qual a maior estatura ou, ainda, quantos alunos se acham abaixo ou acima de uma determinada estatura. Logo, é importante organizar os dados, e a ma- neira mais simples de fazer isso é através de uma certa ordenação (crescente ou decrescente). A tabela obtida através da ordenação dos dados recebe o nome de rol. Tabela 3 ESTATURA DOS ALUNOS DE UMA UNIVERSIDADE 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Dados Hipotéticos Depois de feita ests ordenação, ficou fácil visualizar que a menor estatu- ra é 150 cm, que a amplitude de variação foi de 173 – 150 = 23 cm e, ainda, a ordem que um valor particular da variável ocupa no conjunto. Com um exame mais minucioso, vemos que há uma concentração das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm. 43 Estatística e Probabilidade Construindo a tabela de frequência absoluta teremos: Tabela 4 Distribuição de frequência da estatura de 40 alunos de uma universidade Estatura (cm) Frequência 150 1 151 1 152 1 153 1 154 1 155 4 156 3 157 1 158 2 160 5 161 4 162 2 163 2 164 3 165 1 166 1 167 1 168 2 169 1 170 1 172 1 173 1 Total 40 Dados Hipotéticos Observando a tabela anterior, percebemos que a sua construção não é adequada quando o número de valores da variável (n) é de tamanho razoável. Então, é importante fazermos o agrupamento dos valores em vários intervalos que, em Estatística, chamamos de classes. A tabela a seguir foi construída considerando a frequência de uma clas- se o número de valores da variável pertencente à classe. Essa tabela é deno- minada "distribuição de frequência com intervalos de classe". 44 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. 12 154 ├ 158 (é um Tabela 5 intervalo fechado à esquerda e aberto à direita, DISTRIBUIÇÃO DE FREQUÊNCIA DA ESTATURA DE 40 ALUNOS DE UMA UNIVERSIDADE tal que: 154 ≤ x < 158), Classes Frequência em vez de dizermos que 150 ├ 154 4 a estatura de 1 aluno é 154 ├ 15812 9 de 154 cm; de 4 alunos, 155 cm; de 3 alunos, 156 158 ├ 162 11 cm; e de 1 aluno, 157 cm, 162 ├ 166 8 dizemos que 9 alunos 166 ├ 170 5 têm estaturas entre 154, 170 ├ 174 3 inclusive, e 158 cm. Dados Hipotéticos É importante salientar que, ao agruparmos os valores da variável em clas- ses, ganhamos em simplicidade para perdermos os detalhes. Perceba que, na Tabela 3, é fácil verificar que quatro alunos têm 161 cm de altura e que na Tabela 4, não podemos ver se algum aluno tem a estatura de 159 cm. No entan- to, sabemos com segurança que onze alunos têm estatura compreendida entre 158 e 162 cm. Porém a nova tabela realça o que há de essencial nos dados e, também, torna possível o uso de técnicas analíticas para sua total descrição, o que vem ao encontro da finalidade da estatística, que é especificar e analisar o conjunto de valores, desinteressando-se por casos isolados. 13 Na distribuição de 2.2 Elementos de uma distribuição de frequência13 frequência com classe, o hi será igual em todas as Classe: são os intervalos de variação da variável; é simbolizada por i e o classes. número total de classes, simbolizada por k. Ex: na tabela anterior, k = 6 e A amplitude total da distribuição jamais 158 = 162 é a 3ª classe, onde i = 3. coincide com a amplitude Limites de classe: são os extremos de cada classe. O menor número é amostral, AT é sempre maior que AA. o limite inferior de classe ( li ) e o maior número, limite superior de classe (Li). Ex: em 158 =162, l3 = 158 e L3 = 162. Amplitude do intervalo de classe: é obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por hi = Li - li. Ex: na tabela anterior, hi = 162 - 158 = 4. Amplitude total da distribuição: é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = L(max) - l(min). No nosso exemplo, AT = 174 - 150= 24. Amplitude total da amostra (ROL): é a diferença entre o valor máximo e o valor mínimo da amostra (ROL), onde AA = Xmax - Xmin. Em nosso exemplo, AA = 173 - 150 = 23. 45 Estatística e Probabilidade Ponto médio de classe: é o ponto que divide o intervalo da classe em duas partes iguais. No nosso exemplo, em 158 = 162, xi = (li + Li)/2 ⇒ 14 A Regra de Sturges nos dá o número de classes x2 = (158 + 162)/2 = 160 em função do tamanho da amostra 2.3 Passos para construção das categorias em classes k ≈ 1 + 3,3.logn Onde: 1. Organize os dados brutos em um ROL. k é o número de classe; n é o tamanho da amostra. 2. Calcule a amplitude amostral AA (no nosso exemplo, AA = 173 - 150 = 23) No cálculo da amplitude do 3. Calcule o número de classes através da “Regra de Sturges14” (no nosso intervalo de classe, quando o resultado não é exato, exemplo: n = 40 dados, então, a princípio, a regra sugere a adoção de 6 devemos arredondá-lo classes) para mais. 4. Decidido o número de classes, calcule a amplitude do intervalo de classe dividindo a amplitude total da amostra pelo número de classes h ≈ AA / k (no nosso exemplo h ≈23/6 = 3,8 ≈ 4) 5. Temos então o menor número da amostra, o número de classes e a am- plitude do intervalo; com isso, é possível montar a tabela, com o cuida- do para não aparecer em classes com frequência = 0 (zero). No nosso exemplo, o menor número da amostra = 150 + 4 = 154, logo a primeira classe será representada por 150 ‫ —׀‬154. As classes seguintes respeita- rão o mesmo procedimento.      2.4 Tipos de frequências Frequência simples ou absoluta (fi): são os valores que realmente re- presentam o número de dados de cada classe. A soma das frequências simples é igual ao número total dos dados da distribuição. ∑ fi = n Frequência relativa (fri): são os valores das razões entre as frequências absolutas de cada classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 (100 %). fri = fi /∑ fi Frequência acumulada (Fi): é o total das frequências de todos os va- lores inferiores ao limite superior do intervalo de uma dada classe.. Fk = f1 + f2 +... + fk   ou   Fk = ∑ fi (i = 1, 2,..., k) Frequência acumulada relativa (Fri): é a frequência acumulada da clas- se dividida pela frequência total da distribuição. Fri = Fi / ∑ fi 46 SILVA, J. L. C; FERNANDES, M. W; ALMEIDA, R. L. F. Podemos agora construir a tabela a seguir com as frequências estuda- das considerando o nosso exemplo. Tabela 11 DISTRIBUIÇÃO DE FREQUÊNCIA DA ESTATURA DE 40 ALUNOS DE UMA UNIVERSIDADE i Estaturas (cm) fi xi fri Fi Fri 1 150 ‫ —׀‬154 4 152 0,100 4 0,100 2 154 ‫ —׀‬158 9 156 0,225 13 0,325 3 158 ‫ —׀‬162 11 160 0,275 24 0,600 4 162 ‫ —׀‬166 8 164 0,200 32 0,800 5 166 ‫ —׀‬170 5 168 0,125 37 0,925 6 170 ‫ —׀‬174 3 172 0,075 40 1,000 ∑ = 40 ∑ = 1,000 Dados Hipotéticos De acordo com o estudo dessas frequências, podemos responder às questões a seguir: 1. Quantos alunos têm estatura entre 158 cm, inclusive, e 156 cm? Resposta: 11 – esses são os valores que formam a terceira classe (f3 = 11) 2. Qual a porcentagem de alunos cujas estaturas são inferiores a 154 cm? Resposta: 10% – esses valores são os que formam a primeira classe (fr1 = 0,100). Obtemos a resposta multiplicando a frequência relativa por 100:0,100 x 100 = 10 3. Quantos alunos têm estatura abaixo de 162? Resposta: 24 – as estaturas abaixo de 162 são aquelas que formam as classes de ordem 1, 2 e 3. Assim, o número de alunos é dado por F3 = (i=1 → 3) fi = f1 + f2 + f3 ⇒ F3 = 24 4. Quantos alunos têm estatura maior ou igual a 158 cm? Resposta: 27 – as estaturas maior ou igual a 158 são aquelas que for- mam as classes de ordem 3,4,5 e 6. Assim, o número de alunos é dado por (i=1 → 6) fi = f3 + f4 + f5 + f6 = 11 + 8 + 5 + 3 = 27 2.5 Distribuição de frequências e sua representação gráfica para variáveis quantitativas contínuas As variáveis quantitativas contínuas diferem um pouco das discretas na sua for- ma de representação gráfica. A diferença mais

Use Quizgecko on...
Browser
Browser