Apostila de Estatística básica para alunos com dificuldade

Apostila de Estatística básica para alunos com dificuldade

(Parte 1 de 3)

linha

INTRODUÇÃO A ESTATÍSTICA Para alunos com dificuldade

EDITORAÇÃOELETRÔNICAEARTEFINALDACAPA Diego Oliveira

Vitória da Conquista – Bahia – Brasil – 2017 –

Sumário

1 A ESTATÍSTICA 5 2 PESQUISA E A COLETA DE DADOS 5

3.1 AMOSTRAGEM CASUAL OU ALEATÓRIA7
3.2 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA8
3.3 AMOSTRAGEM SISTEMÁTICA8

3 O PROCESSO DE AMOSTRAGEM 7

4.1 PERCENTAGENS12
4.2 ÍNDICES13
4.3 COEFICIENTES14
4.4 TAXAS14

4 DADOS ABSOLUTOS E DADOS RELATIVOS 12

5.1 TABELAS14
5.1.1 TABELA PRIMITIVA15
5.1.2 SÉRIE ESTATÍSTICA16
5.1.3 DISTRIBUIÇÃO DE FREQUÊNCIAS19
5.2 GRÁFICOS23
5.2.1 DIAGRAMAS23
5.2.2 GÁFICO EM SETORES26
5.2.3 GRÁFICO POLAR28
5.2.4 CARTOGRAMA29
5.2.5 PICTOGRAMA30

5 APRESENTAÇÃO DOS DADOS 14

6.1 FREQUÊNCIA SIMPLES OU ABSOLUTA32
6.2 FREQUÊNCIA RELATIVA32
6.3 FREQUÊNCIA ABSOLUTA ACUMULADA3
6.4 FREQUÊNCIA RELATIVA ACUMULADA34
8.1 MÉDIAS40
8.1.1 MÉDIA ARITMÉTICA SIMPLES40
8.1.2 MÉDIA ARITMÉTICA PONDERADA41
8.1.3 MÉDIA GEOMÉTRICA SIMPLES42
8.1.4 MÉDIA GEOMÉTRICA PONDERADA43
8.1.5 MÉDIA HARMÔNICA SIMPLES4
8.1.6 MÉDIA HARMÔNICA PONDERADA4
8.2 MEDIANA45
8.2.1 MEDIANA A PARTIR DE UM ROL45
CIAS46
8.3 MODA47
8.3.1 MODA A PARTIR DE UM ROL47
SIMPLES47
DE CLASSE48

8 MEDIDAS DE TENDÊNCIA CENTRAL 40 8.2.2 MEDIANA NUMA TABELA DE DISTRIBUIÇÃO DE FREQUÊN- 8.3.2 MODA A PARTIR DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS 8.3.3 MODA A PARTIR DE UMA DISTRIBUIÇÃO COM INTERVALO 8.4 CURVAS DE FREQUÊNCIA E MEDIDAS DE TENDÊNCIA CENTRAL . 49

9.1 QUARTIS51
9.2 QUARTIS EM DADOS NÃO AGRUPADOS51

9 SEPARATRIZES 50

10.1DESVIO MÉDIO SIMPLES52
10.1.1DMS A PARTIR DE DADOS BRUTOS OU ROL52
10.1.2DMS A PARTIR DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA53
COM INTERVALO DE CLASSE54
10.2VARIÂNCIA54
10.2.1VARIANÇA A PARTIR DE DADOS BRUTOS OU ROL5
CIAS5
CIAS COM INTERVALO DE CLASSE5
10.3DESVIO PADRÃO5
10.4COEFICIENTE DE VARIAÇÃO56
10.5VARIÂNCIA RELATICA57

10MEDIDAS DE DISPERSÃO 52 10.1.3DMS A PARTIR DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA 10.2.2VARIANÇA A PARTIR DE UMA DISTRIBUIÇÃO DE FREQUÊN- 10.2.3VARIANÇA A PARTIR DE UMA DISTRIBUIÇÃO DE FREQUÊN-

1.1ALGUMAS DEFINIÇÕES58
12.1CAMPO DE VARIAÇÃO DAS PROBABILIDADES61
12.2PROBABILIDADE DO ESPAÇO AMOSTRAL61
12.3ADIÇÃO DE PROBABILIDADES61

12REGRA BÁSICA DA PROBABILIDADE 60 13PROBABILIDADE DE UM EVENTO COMPLEMENTAR 63 14INDEPENDÊNCIA ESTATÍSTICA 64

15.1TEOREMA DO PRODUTO68
15.2TEOREMA DE BAYES69

15PROBABILIDADE CONDICIONAL 67

16.1DISTRIBUIÇÃO BINOMIAL75
16.2DISTRIBUIÇÃO DE POISSON78
16.3APROXIMAÇÃO DA DISTRIBUIÇÃO BINOMIAL POR POISSON81
16.4DISTRIBUIÇÃO NORMAL82
16.5CARACTERÍSTICAS DA DISTRIBUIÇÃO NORMAL83
PADRÃO83
16.7DISTRIBUIÇÃO NORMAL PADRONIZADA84

16DISTRIBUIÇÃO DE PROBABILIDADE 73 16.6ANALISANDOADISTRIBUIÇÃOCONFORMEAMÃL’DIAEODESVIO 17REFERÊNCIA 86

UNIDADE 1 - A PESQUISA ESTATÍSTICA

1 A ESTATÍSTICA

A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados bem como a utilização dos mesmos na tomada de decisões. Se divide em descritiva e inferencial.

A estatística descritiva envolve a organização, resumo e representação dos dados. As ferramentas utilizadas para isso são as bem conhecidas tabelas de frequência; gráficos; cálculo de medidas de tendência central como média, mediana e moda; e cálculo de medidas de variação como variância e desvio padrão.

Já na estatística inferencial estamos sempre interessados em utilizar as informações de uma amostra para chegar a conclusões sobre um grupo maior, ao qual não temos acesso. Uma ferramenta muito utilizada na estatística inferencial é a probabilidade.

2 PESQUISA E A COLETA DE DADOS

Uma pesquisa estatística, assim como toda pesquisa científica, busca a resposta para uma determinada pergunta, como por exemplo: qual o perfil dos compradores de imóveis na cidade A? Ou mesmo, qual a margem de lucro das imobiliárias na cidade B nos três últimos meses?

Uma vez definida a pegunta que motiva a pesquisa o próximo passo é a coleta dos dados que após analise irão nos dar a resposta ao problema. No processo de coleta de dados três conceitos se destacam: população, amostra e variáveis.

População: ou população estatística ou mesmo universo estatístico é o nome dado ao conjunto composto de entes portadores de, pelo menos, uma característica comum.

Se estivéssemos realmente tentando responder a pergunta qual o perfil dos compradores de imóveis na cidade A, então a nossa população seria todos os compradores de imóveis da cidade A.

Você deve lembrar-se que embora a população numa pesquisa estatística normalmente seja composta de seres humanos é perfeitamente possível que a população seja composta por máquinas, animais, peças, ferramentas e etc.

Algumas vezes por falta de tempo, dinheiro ou material torna-se impossível realizar o estudo estatístico com toda a população. Se o nosso objetivo fosse determinar a altura média dos habitantes da cidade de São Paulo, por exemplo, na prática jamais conseguiríamos medir todos os habitantes. Em casos como esse (em que é inviável trabalhar com toda a população) ao invés de realizar a pesquisa com toda a população, poderíamos selecionar apenas uma parte dela (normalmente a maior possível) e então, apenas sobre essa parte, realizarmos o estudo. Essa fração da população é chamada de amostra. Nos livros mais formais a amostra é definida mais ou menos assim:

Amostra: é qualquer subconjunto finito de uma população exceto a própria população.

Finalmente, os dados obtidos do estudo estatístico (ou os dados que podem ser obtidos no estudo) são chamados de variável estatística. Existem dois tipos de variáveis estatísticas qualitativa e quantitativa.

Qualitativa: quando seus valores são expressos por atributos tal como: sexo (masculino / feminino), cor de pele (branca / preta / parda), etc.

Quantitativa: quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma escola, etc.). As variáveis quantitativas podem ainda ser classificadas em:

Continua: quando a variável puder assumir, teoricamente, qualquer valor num certo intervalo. Como, por exemplo, tempo que um atleta leva para correr 200 metros, "peso" de um indivíduo, etc.

Discreta: quando a variável puder assumir apenas valores pertencentes a um conjunto enumerável. Como, por exemplo, gols em um jogo de futebol, idade em anos e etc.

Embora essa distinção entre variáveis seja importante nas pesquisas estatísticas, nas aplicações do cotidiano é muito tênue a fronteira entre o discreto e o contínuo. A altura das pessoas, por exemplo, é contínua, mas como é medida por uma aproximação em centímetros, torna-se discreta.

UNIDADE2-AMOSTRAGEM

3 O PROCESSO DE AMOSTRAGEM

Como já dito anteriormente, as vezes, quando queremos realizar um estudo estatístico, não é possível analisar toda a população envolvida com o fato que pretendemos investigar. Quando isso ocorre somos obrigados a utilizar apenas uma parte da população, isto é, uma amostra.

Embora formalmente uma amostra seja definida apenas como um "pedaço" da população na prática temos de tomar cuidado para que esse "pedaço" seja um representativo do todo. Por exemplo, se quiséssemos determinar a escolaridade média de um brasileiro e tomássemos como amostra 100 mil estudantes universitários nossa pesquisa apontaria que todos os brasileiros possuem a educação básica (ensino fundamental e médio) completa, o que obviamente é uma grande mentira. Mas, se tomássemos como amostra 100 mil brasileiros escolhidos aleatoriamente em cada estado do país o resultado seria mais realista, pois entre esses habitantes certamente haveriam analfabetos, indivíduos com apenas a educação infantil, doutores, etc., exatamente como ocorre na prática com a população (indivíduos com diferentes tipos de escolaridade).

Uma amostra representativa significa que esta possui as mesmas características básicas da população no que diz respeito aos fenômenos que desejamos investigar.

Existem algumas técnicas para garantir que os indivíduos coletados para a composição de uma amostra garantam a representatividade da mesma. Essas técnicas são chamadas de amostragem.

3.1 AMOSTRAGEM CASUAL OU ALEATÓRIA

Esse tipo de amostragem é equivalente a um sorteio lotérico. Na prática, a amostragem casual ou aleatória simples pode ser realizada numerandose a população de 1 a n, onde n é o número de elementos da população, e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequencia, os quais corresponderão aos elementos pertencentes à amostra.

Exemplo: Uma pesquisa do censo na qual o número de pessoas entrevistadas foi numerada de 01 à 80 e em seguida fora sorteado 40 números para representar as classes econômicas de uma população de certa região.

3.2 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA

Muitas vezes a população em estudo divide-se em grupos que apresentam, um em relação ao outro, um comportamento heterogêneo. Esses grupos são chamados de extratos, assim a amostragem estratificada consiste em realizar uma amostragem aleatória dentro de cada extrato separadamente.

Exemplo: Suponha no exemplo anterior que das 80 pessoas, 35 sejam solteiros, 2 casados e 23 divorciados queremos obter uma amostra estratificada de 15% da população. Nesse caso a amostra deve manter essa mesma proporção de solteiros, divorciados e casados. Veja a tabela:

CONDIÇÕES CIVIS POPULAÇÃO 15% AMOSTRA

Portanto, dos 80 entrevistado devemos escolher aleatoriamente 5 solteiros, 3 casados e 4 divorciados.

3.3 AMOSTRAGEM SISTEMÁTICA

Nesse caso os elementos da população já estão ordenados, não precisando construir sistema de referencia, como exemplos de prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção etc. sendo um sistema imposto pelo pesquisador.

Exemplo: Suponha no exemplo anterior que das 80 pessoas queremos obter uma amostra de 20 pessoas. Nesse caso podemos escolher os 20 primeiros por ordem alfabética ou por idade levando em conta os anos e meses.

Exemplos Resolvidos:

Se quisermos uma amostra estratificada de 40 alunos quantos alunos de cada série deverão ser sorteados?

Resolução:

Assim, deve ser sorteado 6 alunos da primeira série, 5 da segunda, 5 da terceira, 4 alunos da quarta série e assim por diante.

2. Uma escola de 1◦ grau abriga 124 alunos. Obtenha uma amostra representativa correspondendo a 15% da população.

Resolução:

Usando regra de três simples descobrimos que 15% de 124 é exatamente 18,6.

Como o menor inteiro mais próximo, e maior que 18.6 é 19 então devemos tomar uma amostra composta de 19 pessoas escolhidas aleatoriamente. Para essa escolha podemos usar uma tabela de números aleatórios.

3. O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extra-escolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra.

Resolução:

Ao todo temos 600 alunos e queremos uma amostra de 10%. Assim, bastaria nos obter 10% do número de meninos e 10% do número de meninas que obteríamos 10% do total. Veja:

Ou seja, do grupo de 280 meninos devem ser escolhidos aleatoriamente 28 alunos e 32 alunas.

4. Uma cidade X apresenta o seguinte quadro relativo ás suas escolas de1◦ grau:

Obtenha uma amostra proporcional estratificada de 120 estudantes.

Resolução:

O total de indivíduos da população é de 1834 (879 + 955). Sendo assim uma amostra de 120 indivíduos representa cerca de 6,54% da população.

Assim, basta retirar de cada grupo essa percentagem.

Do grupo de 80 meninos (representado por 80) da turma A deverão ser retirados:

e para os demais grupos:

De posse desses valores o diretor deve fazer a escolha dos alunos de forma aleatória.

5. Uma população encontra-se dividida em três estratos, com taman-

amostra foram retirados do 3◦ estrato, determine o número total de elementos da amostra.

Resolução:

Sabemos que do terceiro extrato (n3) foram utilizados apenas 9 elementos, então com base nesses dados temos a seguinte proporção:

Amostr

que implica numa amostra igual a:

Ou seja, a amostra é de 30 indivíduos.

UNIDADE3-DADOS

4 DADOS ABSOLUTOS E DADOS RELATIVOS

Dados absolutos são dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida. Já os dados relativos são o resultado de comparações por quociente (razões) que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Esses dados relativos, em geral, são representados por meio de percentagens, índices, coeficientes e taxas.

4.1 PERCENTAGENS

Em estatística, os cálculos com percentagem (ou porcentagem) são bastante utilizados. Por isso, vamos relembrar o significado de porcentagem e algumas situações que a envolvem. Considere as frases:

A loja Preço Bom cobra 6% de juros sobre o valor de eletrodomésticos em compras a prazo.

Houve uma queda de 12% na produção das toneladas de grãos

A primeira frase significa que a cada R$ 10,0 pagos por um mercadoria, haverá um acréscimo de R$ 6,0.

A segunda frase significa que a cada 100 toneladas de grãos, 12 toneladas deixaram de ser produzidas.

Matematicamente, podemos representar 6% por 6

É uma grande valia quando o intuito é destacar a participação da parte no todo.

Exemplo Resolvido:

1. Dada a tabela a seguir expresse o seu número de alunos em percentagem.

CIDADE A - 1995 CATEGORIAS NÚMERODEALUNOS

Dados fictícios

Resolução:

Para determinar as percentagens podemos recorrer a regra de três:

Dados fictícios

Assim, temos que de cada 100 alunos da cidade A, 91 estão matriculados no 1◦ grau, oito (aproximadamente) no 2◦ grau e um (também aproximadamente) no 3◦ grau.

4.2 ÍNDICES

São razões entre duas grandezas, tais que uma não inclui a outra, multiplicado por uma centena.

Exemplos:

Índice cefálico = diâmetro transversal do crânio

Quociente intelectual = idade mental

4.3 COEFICIENTES

São razões entre o número de ocorrências e o número total (número de ocorrências e número de não-ocorrência).

Exemplos:

coeficiente de natalidade = número de nascimentos população

Coeficiente de evasão escolar = número de alunos evadidos número inicial de matrículas

Coeficiente de mortalidade = número de obitos população

Coeficiente de aproveitamento escolar = número de alunos aprovados número final de matriculados

Coeficiente de mortalidade = número de alunos recuperados número de alunos em recuperação

São os coeficientes multiplicados por uma potência de 10 (10, 100, 1.0, etc.) para tornar o resultado mais inteligível.

Exemplos: Taxa de mortalidade = coeficiente de mortalidade × 1.0;

Taxa de natalidade = coeficiente de natalidade × 1.0; Taxa de evasão escolar = coeficiente de evasão escolar × 100.

5 APRESENTAÇÃO DOS DADOS

A representação de dados em Estatística tem como objetivo sintetizar os valores que uma ou mais variáveis podem assumir e facilitar a percepção de sua variação. Há basicamente duas formas de representação: a tabela e os gráficos.

Existem três tipos de tabelas estatística que se diferenciam pela forma que organizam os dados. Essas tabelas são: a tabela primitiva, a série estatística e a distibuição de frequência.

5.1.1 TABELA PRIMITIVA

A tabela primitiva é o tipo mais simples de apresentação dos dados. Consiste simplesmente num quadro com os dados reunidos anotados em qualquer ordem.

Suponha, por exemplo, termos feito uma coleta de dados relativos as estaturas de quarenta alunos, que compõem uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores.

ESTATURA DE 40 ALUNOS DO COLÉGIO A

Note que a tabela primitiva é bastante simples e constitui-se basicamente de título e corpo. Nos casos em que a tabela é construída com dados de terceiros é necessário também citar a fonte abaixo da tabela. Outra característica é que os elementos nela apresentados não dispõem de nenhuma organização numérica, isto é, do maior para o menor ou vice-versa o que gera certa dificuldade em averiguar em torno de que valor tendem a se concentrar as estaturas ou mesmo qual a menor ou a maior estatura. Para resolver esse problema costuma-se organizar a tabela primitiva a partir de uma certa ordenação (crescente ou decrescente).

ESTATURA DE 40 ALUNOS DO COLÉGIO A

Essa nova tabela organizada é chamada de ROL. E com ela podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173 cm); que a amplitude de variação foi de 173 - 150 = 23 cm; e, ainda, a ordem que um valor particular da variável ocupa no conjunto. Com um examemaisacurado, vemosqueháumaconcentraçãodaestaturaemalgum valor entre 160 cm e 165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm.

O rol é uma sequencia ordenada dos dados brutos, na qual organiza-se na forma crescente ou decrescente.

Exemplo Resolvido:

1. Um atleta ao saltar de um trampolim em uma competição obteve dos dez jurados as seguintes notas 8, 7, 8, 9, 6, 7, 6, 7, 5, 9. Estabeleça o rol desses dados.

(Parte 1 de 3)

Comentários