princípios básicos de estatística

princípios básicos de estatística

(Parte 1 de 12)

Estatística Básica Versão Preliminar

Clause Fátima de Brum Piana

Amauri de Almeida Machado Lisiane Priscila Roldão Selau

Sumário

1.1. Considerações gerais5
1.2. População e amostra5
1.3. Conceito e divisão5
1.4. Informações históricas6
1.5. Conceitos fundamentais7
1.5.1. Característica e variável7
1.5.2. Escalas de medida7
1.5.3. Classificação de variáveis10
1.5.4. Observação e conjunto de dados10
1.6. Bibliografia12

Unidade I. Introdução

2.1. Apresentação de dados14
2.1.1. Séries estatísticas14
2.1.2. Tabelas18
2.1.3. Gráficos21
2.2. Distribuições de freqüências e gráficos24
2.2.1. Tabelas de classificação simples24
2.2.2. Tabelas de classificação cruzada3
2.3. Medidas descritivas36
2.3.1. Medidas de localização ou tendência central37
2.3.2. Medidas separatrizes43
2.3.3. Medidas de variação ou dispersão45
2.3.4. Medidas de formato49
2.3.6. Medidas descritivas para dados agrupados em classe52
2.4. Análise exploratória de dados57
3.1. Introdução à teoria das probabilidades6
3.1.1. Introdução6
3.1.2. Conceitos fundamentais68
3.1.3. Conceitos de probabilidade69
3.1.4. Teoremas para o cálculo de probabilidades69
3.1.5. Probabilidade condicional e independência73
3.2. Variáveis aleatórias7
3.2.1. Introdução e conceito7
3.2.2. Variáveis aleatórias discretas79
3.2.3. Variáveis aleatórias contínuas86
3.3. Distribuições de probabilidade92
3.3.1. Distribuições de probabilidade de variáveis discretas92
3.3.2. Distribuições de probabilidade de variáveis contínuas104
3.3. Bibliografia117

Unidade I. Elementos de Probabilidade

4.1. Introdução e histórico119
4.2. Conceitos fundamentais121
4.3. Distribuições amostrais124
4.3.1. Distribuições amostrais de algumas estatísticas importantes130
4.4. Estimação de parâmetros137
4.4.1. Conceitos fundamentais137
4.4.2. Propriedades dos estimadores134
4.4.3. Processos de estimação135
4.5. Testes de hipóteses155
4.5.1. Testes para a média populacional155
4.5.2. Testes para a variância populacional166
4.5.3. Testes para a proporção populacional171
4.6. Quebras nas pressuposições adotadas no processo de inferência174
4.6.1. Heterogeneidade de variâncias174
4.6.2. Dependência entre as amostras175
4.7. Regressão linear simples179
4.7.1. Introdução……179
4.8.1. Considerações gerais196
4.8.2. Estatística do teste196
4.8.3. Classificação simples197
4.8.4. Classificação dupla197
4.8.5. Critério de decisão198
4.9. Bibliografia203
1. Notação somatório205
2. Noções sobre conjuntos206
3. Notação fatorial209
4. Análise combinatória209
5. Noções sobre derivação e integração211
6. Tabelas estatísticas213

Unidade I Introdução

1.1. Considerações gerais5
1.2. População e amostra5
1.3. Conceito e divisão5
1.4. Informações históricas6
1.5. Conceitos fundamentais7
1.5.1. Característica e variável7
1.5.2. Escalas de medida7
1.5.3. Classificação de variáveis10
1.5.4. Observação e conjunto de dados10

Piana, Machado e Selau Introdução

1.1. Considerações gerais

A coleta, o processamento, a interpretação e a apresentação de dados numéricos pertencem todos aos domínios da estatística. Essas atribuições compreendem desde o cálculo de pontos em esportes, a coleta de dados sobre nascimentos e mortes, a avaliação da eficiência de produtos comerciais, até a previsão do tempo. A informação estatística é apresentada constantemente em todos os meios de comunicação de massa: jornais, televisão, rádio e internet.

Observamos uma abordagem crescentemente quantitativa utilizada em todas as ciências, na administração e em muitas atividades que afetam diretamente nossas vidas. Isto inclui o uso de técnicas matemáticas nas decisões econômicas, públicas ou privadas; na avaliação de controles de poluição; na análise de problemas de tráfego; no estudo dos efeitos de vários medicamentos; na adoção de novas técnicas agrícolas e novas cultivares; em estudos demográficos como crescimento populacional e migração.

A partir destes poucos exemplos, podemos notar a importância da Estatística como ferramenta necessária para a compreensão dos fenômenos que ocorrem nas mais diferentes áreas.

1.2. População e amostra

É difícil encontrar duas coisas exatamente iguais. Há um pouco de variabilidade em quase tudo. De modo bem geral, podemos dizer que o objetivo da Estatística é fornecer métodos para se conviver, de modo racional, com a variabilidade. Isto é feito através da descoberta de regularidade nos dados relativos às situações em estudo. Para isso, duas ideias são de fundamental importância. Primeiramente, embora as observações sejam variáveis é sempre possível associar a elas a ideia de regularidade e expressar essa regularidade matematicamente. Por outro lado, devido à variabilidade inerente aos indivíduos, os pontos de interesse da Estatística são referentes aos grupos de indivíduos, ou seja, estudamos os indivíduos através dos grupos.

Quando estudamos uma determinada característica, geralmente, queremos obter conclusões para o conjunto de todos os indivíduos que apresentam tal característica. Chamamos de população o conjunto de todos os indivíduos ou objetos que apresentam uma característica em comum. Na maioria dos casos, ao estudarmos uma população, não temos acesso a todos os seus elementos. O estudo é feito, então, a partir de uma parte desta população, denominada amostra, que tem por objetivo representá-la.

1.3. Conceito e divisão

A Estatística, durante muitos séculos, esteve relacionada apenas com as informações a respeito do Estado. Hoje em dia, o conjunto de teorias, conceitos e métodos denominado Estatística está associado ao processo de descrição e inferência, debruçando-se, de modo particular, sobre questões relativas a sumarização eficiente de dados, planejamento e análise de experimentos e levantamentos e natureza de erros de medida e de outras causas de variação em um conjunto de dados.

A estatística pode ser dividida em duas partes principais: a Estatística Descritiva e a

Inferência Estatística ou Estatística Analítica.

Enquanto a Estatística Descritiva cuida do resumo e da apresentação de dados de observação por meio de tabelas, gráficos e medidas, sem se preocupar com as populações de onde esses dados foram retirados, a Inferência Estatística tem como objetivo fornecer métodos que possibilitem a realização de inferência sobre populações a partir de amostras delas provenientes. A Inferência Estatística tem por base o cálculo de probabilidades e compreende dois grandes tópicos: a estimação de parâmetros e os testes de hipóteses.

Embora a Estatística Descritiva seja um ramo fundamental da Estatística, em muitos casos ela se torna insuficiente. Isto ocorre porque quase sempre as informações são obtidas de amostras e, consequentemente, sua análise exige generalizações que ultrapassam os

Piana, Machado e Selau Introdução dados disponíveis. Essa necessidade, aliada ao desenvolvimento dos métodos probabilísticos, promoveu o crescimento da Estatística pela ênfase aos métodos generalizadores (Inferência Estatística), em acréscimo aos métodos puramente descritivos. Alguns exemplos ilustram a necessidade dos métodos generalizadores:

− prever a duração média da vida útil de uma calculadora, com base no desempenho de muitas dessas calculadoras;

− comparar a eficiência de duas dietas para reduzir peso, com base nas perdas de peso de pessoas que se submeteram às dietas;

− determinar a dosagem ideal de um novo medicamento, com base em testes feitos em pacientes voluntários de hospitais selecionados aleatoriamente;

− prever o fluxo de tráfego de uma rodovia ainda em construção, com base no tráfego observado em rodovias alternativas.

Em todas essas situações existe incerteza porque dispomos apenas de informações parciais, incompletas ou indiretas. A Inferência Estatística trata de problemas onde a incerteza é inerente, utilizando métodos que se fundamentam na teoria das probabilidades. Os métodos de inferência tornam-se necessários para avaliar a confiabilidade dos resultados observados.

1.4. Informações históricas

Embora a palavra estatística ainda não existisse, existem indícios de que há 3000 anos a.C. já se faziam censos na Babilônia, China e Egito.

A própria Bíblia leva-nos a esse resgate histórico:

− o livro quarto do Velho Testamento, intitulado “Números”, começa com a seguinte instrução a Moisés: ”Fazer um levantamento dos homens de Israel que estivessem aptos para guerrear”;

− na época do Imperador César Augusto, saiu um edito para que se fizesse o censo em todo o Império Romano. Por isso Maria e José teriam viajado para Belém.

A Estatística teve origem na necessidade do Estado Político em conhecer os seus domínios. Sob a palavra estatística, provavelmente derivada da palavra “status” (estado, em latim), acumularam-se descrições e dados relativos ao Estado. Nas mãos dos governantes, a Estatística passou a constituir-se verdadeira ferramenta administrativa.

Em 1085, Guilherme, o Conquistador, ordenou que se fizesse um levantamento estatístico da Inglaterra, que deveria incluir informações sobre terras, proprietários, uso da terra, empregados, animais e que serviria também de base para o cálculo de impostos. Esse levantamento originou um volume intitulado “Domesday Book” (Livro do dia do juízo final).

No século XVII, ganhou destaque na Inglaterra, a partir das Tábuas de mortalidade de Jonh Graunt e William Petty, a aritmética política que consistiu de exaustivas análises de nascimentos e mortes. Dessas análises resultou a conclusão, entre outras, de que a percentagem de nascimentos de crianças do sexo masculino era ligeiramente superior à

de crianças do sexo feminino.

Em 1708, foi organizado o primeiro curso de Estatística na Universidade de Yena, na Alemanha.

William Petty

Piana, Machado e Selau Introdução

A palavra estatística foi cunhada pelo acadêmico alemão Gottfried Achenwall, em 1740. Também é ele quem estabelece as relações da Estatística com outras áreas, definindolhe o campo de ação.

Contudo, foi o casamento entre o cálculo das probabilidades e a Estatística, em meados do século XIX, que permitiu que a Estatística fosse organicamente estruturada e ampliasse largamente o seu campo de ação. O avanço na teoria das probabilidades possibilitou a descoberta das distribuições de probabilidade e, como consequência, a criação de técnicas de amostragem mais adequadas e de formas de relacionar as amostras com as populações de onde provieram.

Outro marco decisivo no desenvolvimento dos métodos estatísticos foi o advento da computação eletrônica, ferramenta valiosíssima que permitiu que a Estatística alargasse ainda mais os seus horizontes.

1.5. Conceitos fundamentais

1.5.1. Característica e variável

As unidades de uma população se distinguem e se caracterizam por um conjunto de particularidades, propriedades ou atributos. Cada uma dessas particularidades ou propriedades é uma característica ou atributo da população e de suas unidades. Cada característica pode manifestar-se nas unidades sob diferentes alternativas ou níveis. Por exemplo, sexo e grau de instrução são características de indivíduos de uma população. Os níveis (alternativas) para a característica sexo são dois: masculino e feminino, e para a característica grau de instrução poderiam ser quatro: fundamental, médio, graduação e pós-graduação.

Em geral, o conjunto de características das unidades de uma população é demasiadamente vasto e não totalmente conhecido para ser completamente descrito. Assim, apenas as características relevantes numa pesquisa específica é que são consideradas. O conjunto dessas características irá depender dos objetivos e das condições de realização da pesquisa. Desse modo, o interesse estará sempre focalizado não nas unidades em si, mas nas suas características relevantes.

O termo variável é utilizado genericamente para indicar aquilo que é sujeito à variação ou à inconstância. No contexto da pesquisa científica, uma variável é definida como a função que estabelece uma correspondência entre os níveis de uma característica e os valores de um conjunto numérico segundo uma escala de medida. Em outras palavras, uma variável é uma característica populacional que pode ser medida de acordo com alguma escala.

1.5.2. Escalas de medida

O termo escala de medida é usualmente relacionado com instrumentos como régua, balança, copos de medida, utilizados para determinar comprimento, peso, volume, etc. Ou seja, comumente tende-se a associar a mensuração com um processo de medida física com escala bem definida que possui uma origem ou ponto zero natural e uma unidade de medida constante. Frequentemente, entretanto, características devem ser representadas por escalas menos informativas, que não possuem as propriedades associadas com a maioria das medidas físicas.

Podemos classificar as escalas de medida em quatro categorias: escala nominal, escala ordinal, escala intervalar e escala de razão ou racional. Cada escala de medida possui seu próprio conjunto de pressuposições referentes à correspondência de números com entidades do mundo real e ao significado da realização das várias operações matemáticas sobre esses números. A complexidade e a informação aumentam conforme aumenta o nível da escala de medida.

Piana, Machado e Selau Introdução

(Parte 1 de 12)

Comentários