Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Material de Estudo-Probabilidade-2017, Notas de estudo de Engenharia Elétrica

Material de estudo Probabilidade e estatistica

Tipologia: Notas de estudo

2017

Compartilhado em 16/08/2017

vinicius-da-cunha-porto-5
vinicius-da-cunha-porto-5 🇧🇷

1 documento

Pré-visualização parcial do texto

Baixe Material de Estudo-Probabilidade-2017 e outras Notas de estudo em PDF para Engenharia Elétrica, somente na Docsity! SISTEMA FAESA DE EDUCAÇÃO ASSOCIAÇÃO EDUCACIONAL DE VITÓRIA MATERIAL DE ESTUDO para acompanhamento na sala de aula PROBABILIDADE E ESTATÍSTICA Professora Lúcia Helena Sagrillo Pimassoni Agosto, 2017. 2 APRESENTAÇÃO DA DISCIPLINA UNIDADE I – INTRODUÇÃO I.1 Definição: O Que é Estatística? É um conjunto de métodos para planejar experimentos, obter dados, organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões. I.2 Divisão da Estatística A estatística pode ser dividida em três grupos para seu estudo:  A estatística descritiva Compreende a organização, o resumo e, em geral, a simplificação de informações. A finalidade é tornar as informações mais fáceis de entender, de relatar e de discutir.  A teoria da probabilidade É uma ferramenta útil para analisar situações que envolvem o acaso. Ex.: Jogos de azar, decisão quanto a investimentos em determinados fundos e outros.  A estatística inferencial - Diz respeito à análise e interpretação de dados amostrais. - É um processo pelo qual podemos conhecer uma população a partir de uma amostra desta mesma população (“não preciso comer um bolo inteiro para saber se é bom”). - A idéia básica é efetuar determinada mensuração sobre uma parcela pequena, mas típica, de determinada “população” e utilizar essa informação para fazer inferência sobre a população toda. I.3 Uso da Estatística A estatística no curso de Engenharia tem como objetivo principal: Desenvolver a habilidade na resolução de problemas, o que inclui a capacidade de reconhecer qual técnica se aplica à determinada situação e utilizá-la eficazmente na resolução do problema. I.4 Histórico da Estatística O histórico da estatística deve ser lido no seguinte endereço eletrônico: ftp://ftp.usjt.br/pub/revint/191_41.pdf 5 “A amostragem é, sem dúvida, uma das operações mais complexas e passíveis de introduzir erros, principalmente nas indústrias da mineração e metalurgia”. “Uma boa amostragem não é obtida tendo-se como base apenas o juízo de valor e a experiência prática do operador”. EXEMPLO DE APLICAÇÃO NA INDÚSTRIA: amostragem de material em vagões, caminhões ou containers, material em polpa onde ocorra sedimentação e não seja possível a homogeneização, amostragem de minério oriundo de diferentes frentes de lavra etc. II.3 Tipos de Amostragem 1. Amostragem Intencional (não probabilística): Seleciona elementos ou amostras que consideramos serem típicas ou representativas da população. Amostras de água poluída e não poluída. 2. Amostragem Probabilística: Associa a cada elemento da população uma chance (probabilidade) de fazer parte da amostra. Os resultados podem ser estendidos para a população com um determinado grau de confiança. Tipos de amostragem probabilística 2.1 Amostragem Aleatória Simples: Todo elemento tem a mesma chance de ser escolhido. Faz-se uma lista dos elementos da população e sorteiam- se os elementos que farão parte da amostra. Pode-se utilizar a tabela de números aleatórios. 2.2 Amostragem Sistemática: os elementos da população apresentam-se ordenados e são retirados periodicamente, ou seja, são selecionados elementos de ordem k da população. Geralmente são se relacionam com as características da população. Exemplo: Suponha que é necessário constituir uma amostra de 30 alunos de uma sala de 90. Poderiam ser escolhidos, sequencialmente, os alunos cujo número na lista de 6 chamada é de ordem k = 3 (pois 90/30 = 3). Seriam escolhidos: 3, 6, 9, …, 90 (1.k, 2.k, 3.k, ...., 30.k). Em outro exemplo imagine que se queira escolher as famílias residentes a cada k casas, até compor o total necessário. Assim, começando por uma extremidade de uma rua do bairro, poderiam ser tomadas das casas de ordem 5, o que corresponderia a entrevistar a primeira família, pular 4 casas novamente e entrevistar a segunda família, e assim por diante. 2.3 Amostragem Estratificada: consiste em dividir a população em grupos homogêneos e proceder a retirada de uma amostra aleatória simples ou sistemática dentro de cada estrato. 2.4 Amostragem por Conglomerados: É aquela na qual as unidades de amostragem estão geograficamente reunidas em grupos e seleciona-se amostras aleatórias dentro do cluster. 7 PRIMEIRA LISTA DE EXERCÍCIOS 1. Identifique o tipo de amostragem (aleatória, estratificada, sistemática e conglomerados) utilizada em cada um dos casos seguintes: a) Um psicólogo da FAESA faz uma pesquisa sobre o nível de agressividade dos alunos. Para o estudo o psicólogo escolheu 1000 alunos através de um sorteio pelo nº da matrícula. b) A indústria de chocolate seleciona um a cada 1000° bombom de sua linha de produção e faz um teste em relação ao sabor. c) Para estudar a satisfação dos alunos da FAESA foi coletada uma amostra de 30 alunos por curso. d) Para estudar a percepção de certa população em relação a uma indústria, foram sorteados alguns bairros com características similares e depois foram selecionados os elementos aleatoriamente. 2. Suponha que em uma escola se queira tomar uma amostra sistemática de alunos do ensino fundamental. A quantidade de alunos no ensino fundamental é de 5000 alunos. Considere um tamanho de amostra de 200. Explique como faria todo o levantamento da amostra. 3. Suponha que do total das empresas no setor de mármore do ES, 1500 estão com certificação ambiental e 500 não. Para realizar um estudo sobre as empresas será necessária uma coleta de amostra. Considere uma amostra de 150 empresas. Como seria a distribuição da amostra se fosse realizada uma amostragem estratificada proporcional ao tamanho do estrato? UNIDADE 3 – ESTATÍSTICA DESCRITIVA A Estatística Descritiva permite-nos organizar, resumir, descrever e compreender um conjunto de dados. 3.1 Variáveis As características que observadas (ou medidas) em cada elemento da população, sob as mesmas condições são Variáveis. As variáveis originam valores que tendem a exibir certo grau de variabilidade quando se fazem mensurações repetidas. Ex.: quantidade de café servida no copo por uma máquina, idade dos estudantes de 10  Polígono de frequências  Curvas de frequências e outros. 3.2.1 Tabela de Frequências É uma tabela na qual numa das colunas aparecem os valores observados da variável aleatória e nas demais colunas aparecem às frequências de ocorrência dos respectivos valores. Essas colunas contêm as seguintes frequências:  Frequências observadas.  Frequências acumuladas.  Frequências relativas.  Frequências relativas acumuladas.  Frequência observada (fi) é o número de vezes que cada valor se repete.  A Frequência relativa (fri) fornece a relação entre a frequência observada de um determinado valor e o número total de observações realizadas no experimento, ou seja, é a frequência observada divida pelo total de elementos. Exemplo: Suponha que foi realizado um estudo com as “classes taxonômicas” de algas planctônicas encontradas em 20 amostras de um corpo receptor da ETE de Jardim Camburi. O resultado foi o seguinte: Bacillariophyceae Bacillariophyceae Cyanophyceae Euglenophyceae Cyanophyceae Euglenophyceae Bacillariophyceae Bacillariophyceae Bacillariophyceae Cyanophyceae Euglenophyceae Bacillariophyceae Cyanophyceae Bacillariophyceae Cyanophyceae Euglenophyceae Bacillariophyceae Bacillariophyceae Bacillariophyceae Bacillariophyceae A Tabela de distribuição de frequências ficará assim:  Frequência acumulada (Fi) contabiliza as observações até o valor considerado. Pode ser calculada somente para variáveis numéricas. 11 55,0 5 25,0 4 20,0 20 100,0 Classes Bacil lariophyceae Cyanophyceae Euglenophyceae Total Frequência % 11 Exemplo: Nº de livros por aluno  Frequência relativa acumulada (Fri) fornece a relação entre a frequência acumulada e o nº. Total de observações realizadas. 3. 2.2 Gráfico de Barras/Colunas  No eixo horizontal deve ser colocada a variável sob estudo.  No eixo vertical a frequência (observada, acumulada ou relativa).  É traçada, para cada valor (atributo) da variável, uma barra com comprimento proporcional à frequência.  O eixo vertical e horizontal pode ser invertido, ou seja, a variável pode ser colocada no eixo vertical e a frequência no eixo horizontal (gráfico de barras). Exemplo: Figura 1. Título da figura. Classes Euglenophyceae Cyanophyceae Bacillariophyceae F re q u ê n c ia 12 10 8 6 4 2 3.2.3 Gráfico de Setores  Consta de um círculo dividido em setores, cada setor relacionado a um valor da variável a ser representada. Nº de livros frequência observada (fi) frequência acumulada (Fi) 3 2 2 5 1 2+1 = 3 6 3 3 + 3 = 6 8 1 6 + 1 = 7 Total 7 - 12  A abertura angular de cada setor é proporcional à frequência observada para cada valor. Abaixo é mostrado um exemplo do gráfico de setores (pizza). Figura 2. Classe socioeconômica. 3.2.4 Tabela de Frequências para dados agrupados em classe É constituída da mesma forma que para dados não agrupados, com a diferença de que agora os valores da variável a ser descrita passam a ser organizados por classes.  O nº de classes deve ficar entre 5 e 20;  Se menor do que 5, aproximar para 5;  Se maior do que 20, aproximar para 20. Exemplo de dados agrupados em classe para estaturas de alunos do curso de engenharia ambiental/FAESA: Tabela 1. Estatura de alunos do curso de engenharia ambiental*. *Amostra de 8 alunos da FAESA. Dada à seqüência: 1, 2, 3, 4, 5, 6, 7, 8. Podem-se representar intervalos das seguintes formas:  Intervalo aberto: 1 --- 8 = 2, 3, 4, 5, 6, 7 13% 20% 27% 40% A B C D Estaturas (cm) fi 150 |-- 154 2 154 |-- 158 3 158 |-- 162 1 162 |-- 166 2 Total 8 15 3.2.6 Polígono de Frequências  Nesse gráfico as classes são representadas pelos seus pontos médios.  O polígono é formado pela união, por retas, dos pontos médios das partes superiores de cada retângulo do histograma. A Figura abaixo mostra um exemplo de polígono de frequência. 3.2.7 Diagrama de Pareto É recurso gráfico utilizado para estabelecer uma ordenação nas causas de perdas que devem ser sanadas, ou seja, prioriza a ação que trará o melhor resultado. O diagrama é uma ferramenta da qualidade e baseia-se no princípio de que a maioria das perdas tem poucas causas. Princípio 80-20: 80% das consequências decorrem de 20% das causas. Exemplo: Analisando as reclamações dos clientes obtidas pelo SAC da empresa MSM alimentos, percebemos que o maior número de reclamações decorre de problemas com o atendimento de nossos funcionários e atrasos nas entregas e que ao sanar 2 problemas resolve-se 80% das nossas falhas. A idéia é: “a maior parte dos defeitos, falhas, reclamações e seus custos provêm de um número pequeno de causas”. 16 SEGUNDA LISTA DE EXERCÍCIOS 1) Classifique cada uma das variáveis abaixo e indique uma forma de representação gráfica: a) Tipos de defeitos em placas de aço. b) Resistência de certo tipo de cimento. c) Grau de satisfação da população em relação à reimplantação da Samarco no Município de Anchieta (muito satisfeito, satisfeito, pouco satisfeito, insatisfeito). d) Nº de amostras de água contaminadas em um lote coletado pela Cesan. e) Tempo para fazer um teste (min) f) Número de alunos aprovados por turma g) Nível de escolaridade h) Material particulado na atmosfera (µg/m3) i) Gastos com alimentação (R$) j) Nº de acertos em uma prova objetiva k) Religião l) Valor de um imóvel (R$) m) Nº de peças defeituosas por lote n) Classificação em um concurso. 2) A força de remoção para um conector é medida em um teste de laboratório. Dados para 40 corpos de prova são mostrados a seguir. 150 185 195 205 212 225 241 249 165 190 195 205 213 235 245 250 168 190 198 205 218 236 245 260 170 194 199 210 220 237 245 270 180 194 200 210 220 238 248 280 Monte uma distribuição de frequências em classe. Desenhe o histograma e o polígono de frequências. 17 3) Considerando a distribuição de frequência da viscosidade para um produto químico observado de hora em hora (amostra de 250 horas). Calcule a frequência observada, frequência acumulada e a frequência relativa acumulada. Viscosidade f i (%) 40 |-- 44 20 44 |-- 48 10 48 |-- 52 37 52 |-- 56 18 56 |-- 60 15 Total 100 4) Elabore uma tabela de frequência baseada no gráfico abaixo: 5) Elabore uma tabela de frequência baseada no histograma e considerando uma amostra de estaturas (cm) de 20 alunos da turma: 20     n i i n i ii w w wX X 1 1 Onde,   n i iiwX 1 é a soma dos produtos de cada x pelo seu peso correspondente   n i iw 1 é a soma dos pesos. EX.: notas de alunos 3. A média geométrica Sejam X1, X2, X3, ..., Xn. A média geométrica de X é definida por: n nxxxxMg ...... 321 Exemplo: Calcular a média geométrica dos valores: 3, 6, 12, 24, 48 1224883248241263 55 Mg Exame inicial Peso 1 =3 Trabalho 1 Peso 2 =1 Trabalho 2 Peso 3=2 Prova final Peso 4 =4 Média ponderada 21 A Média Geométrica é frequentemente usada quando discutimos taxas de rendimento em investimento e também em padrões de poluição atmosférica, etc. Exemplo de aplicação de médias: 4. A moda A moda é o valor que possui a maior frequência de observação.  Caso ocorra dois valores com a mesma maior frequência de observação, teremos um processo bimodal.  Caso ocorra vários valores com frequência maior de observação, teremos um processo multimodal. 22  Caso todos os valores tenham a mesma frequência de observação, teremos um processo amodal. Algumas propriedades:  Fácil de calcular;  Não é afetada por valores extremos;  Pode estar afastada do centro dos valores;  Não utiliza todos os valores da variável;  Nem sempre ela existe e pode existir mais de uma moda. Exemplo: Indique a moda para os seguintes conjuntos de dados: a) 8; 10; 13; 13; 17; 29  moda = 13 b) 1; 3; 7; 9; 15; 20; 5  processo amodal, ou seja, a moda não existe c) 2; 4; 6; 2; 4; 8; 10; 12; 14; 16  moda = 2 e 4 d) 1; 1; 1; 2; 2; 2; 3; 3; 3; 4; 5; 6; 7; 8; 9; 10  moda = 1, 2 e 3 Classe modal é a classe com a maior frequência de observação. As mesmas observações feitas para a moda para dados nominais continuam válidas, isto é:  Processo bimodal: duas classes com a mesma frequência de observação;  Processo multimodal: várias classes com a mesma frequência de observação;  Processo amodal: todas as classes com a mesma frequência de observação. Determinação de valores pontuais representativos da moda: Fórmula de King :   pa p mo ff fh la   mod Fórmula de Czuber:      pam am mo fff ffh la    2 mod Considere: • = limite inferior da classe modal; • = intervalo de classe; • = frequência da classe modal; • = frequência da classe anterior à classe modal; • = frequência da classe posterior à classe modal. mol h mf af pf 25 2. Quartis  25% das observações estão à esquerda do 1º quartil (Q1).  50% estão à esquerda do 2º quartil (Q2) e 75% à esquerda do 3º quartil (Q3).  Regra prática para determinar o elemento que corresponde ao i-ésimo quartil: Sendo n = o nº. de observações Exemplo: Para os dados abaixo calcule o 1º, 2º e 3º quartil. 5, 8, 9, 10, 11, 13, 14, 16, 17, 18, 20, 21 O Quartil para dados em classe é dado por: 3. Percentis  Os i % das observações estão a esquerda do i-ésimo percentil. Assim, 68% das observações estão à esquerda (são menores) do 68º percentil e 32% à direita (são maiores).  Regra prática para se determinar o elemento correspondente ao i-ésimo percentil:  5,0 100    ni Pos iP Sendo n o nº. de observações. Q1 Q2 Q3 25% 25% 25% 25% 5,0 4    ni Pos iQ   4 ; ni Pos f FPosh lQ qi ant qii     26 O percentil para dados em classe é dado por:   100 ; ni Pos f FPosh lP pi ant pii     Representação gráfica dos Quartis: Box-plot ou Gráfico de Caixas O boxplot (gráfico de caixa) é um gráfico utilizado para avaliar a distribuição empírica do dados. É formado pelo primeiro e terceiro quartil e pela mediana. Exemplo 3.3.3 Medidas de Variabilidade ou Dispersão Medidas de dispersão dizem respeito à descrição de um grupo de valores em termos da variabilidade existente entre os itens incluídos dentro do grupo, ou seja, essas GRUPO Grupo 2Grupo1 Id a d e ( a n o s) 50 40 30 20 10 27 medidas indicam se os valores estão relativamente próximos uns dos outros, ou separados. 1. Amplitude A amplitude pode ser expressa pela diferença entre o maior e o menor número num conjunto de dados. Exemplos a) 1, 5, 7, 13 Amplitude = 13-1=12 b) 14, 3, 17, 4, 8, 73, 36, 48 Amplitude = 73-3=70 c) 1, 2, 2, 3, 5, 7, 8, 9, 10 Amplitude = 9 d) 0, 70, 70, 70, 70, 70 Amplitude = 70 2. Variância e Desvio padrão Para melhorar o resumo dos dados, podemos apresentar uma medida de dispersão destes dados, como a variância ou desvio padrão. Considere as notas do provão de alunos de três faculdades de Vitória: As notas das três faculdades apontam para a mesma nota média, mas as notas estão distribuídas diferentemente em cada Faculdade. Comparando as notas de A com B e C, notamos que as notas de B são bem mais dispersas, indicando que B é mais heterogênea em termos de notas obtidas. Em C observamos um ponto discrepante Amplitude = Maior valor - menor valor Faculdade Notas dos alunos Média da Faculdade 6 6 6 6 6 6 6 6 1 2 4 6 6 9 10 10 0 6 7 7 7 6 8 7 A B C 6,0 6,0 6,0 Pequena dispersão Grande dispersão 30 i 1 14 14-16,5 = -2,5 6,25 2 6 6-16,5 = -10,5 110,25 3 8 8-16,5 = -8,5 72,25 4 22 22-16,5 = 5,5 30,25 5 18 18-16,5 = 1,5 2,25 6 14 14-16,5 = -2,5 6,25 7 16 16-16,5 = -0,5 0,25 8 14 14-16,5 = -2,5 6,25 9 24 24-16,5 = 7,5 56,25 10 32 32-16,5 = 15,5 240,25 11 14 14-16,5 = -2,5 6,25 12 16 16-16,5 = -0,5 0,25 Total 0 537 A Variância será a seguinte: 75,44 12 5372 s O desvio padrão é: 7,675,44 s Para o cálculo da variância e desvio padrão com tabelas de frequências aplicar as fórmulas: 11 )( 22 1 2 2        n xnfx n fxx s ii n i ii 11 )( 22 1 2        n xnfx n fxx s ii n i ii ix xxi  2)( xxi   Onde  x é a média amostral  n é o tamanho da amostra  s é o desvio padrão amostral  fi é a frequência da classe  se os dados estão agrupados em classe xi é ponto médio da classe. 31 Exemplo: para o exemplo anterior calcule o desvio padrão amostral: Valores ($) fi $10,00 a $ 20,00 62 20,00 a $ 30,00 84 $ 30,00 a $ 40,00 123 $ 40,00 a $ 50,00 93 $ 50,00 a $ 60,00 52 $ 60,00 a $ 70,00 36 Total 3. Coeficiente de variação (cv) O coeficiente de variação é uma medida relativa da variabilidade. Ele é útil quando queremos comparar a variabilidade de dois conjuntos de dados que tenham diferentes desvios padrões e diferentes médias. Para o exemplo anterior o coeficiente de variação seria: %6,40100 5,16 7,6 CV 100 Média padrãoDesvio CV De uma maneira geral: se CV: menor ou igual a 15% - Baixa dispersão – homogênea, estável. Entre 15 e 30% - Média dispersão. Maior que 30% - Alta dispersão – heterogênea. É bom lembrar que dizer se a variabilidade é grande ou pequena depende o objeto que está sendo estudado. TERCEIRA LISTA DE EXERCÍCIOS 1) Calcule a média, mediana, moda, o desvio padrão populacional e o coeficiente de variação dos valores de contratos (R$) de uma micro empresa que presta consultorias ambientais: 32 102, 305, 405, 550, 760, 567, 100, 459 2) Suponha que suas notas do segundo semestre em estatística sejam as seguintes: 5,0; 6,5 e 9,5. A primeira nota valem 15% a segunda vale 25% e a última vale 60%. Qual a sua nota semestral? 3) Dada às distribuições abaixo, calcule a média, mediana, a moda e o desvio padrão amostral na letra a e desvio padrão populacional na letra b. Tabela. Pesos (kg) Pesos fi 40 |-- 44 2 44 |-- 48 5 48 |-- 52 9 52 |-- 56 6 56 |-- 60 4 Total 26 4) Os valores de ferro (mg/L) de 7 amostras de água subterrâneas foram os seguintes: 1,70; 1,97; 2,62; 2,30; 3,12; 2,53 e 1,95. Calcule a média, mediana e o terceiro quartil. Interprete os resultados. 5) Calcule o desvio padrão amostral dos dados apresentados abaixo: Xi fi fri Fi 0 1 0,05 1 0,15 4 2 4 3 0,25 13 4 3 0,15 5 2 18 6 19 7 Total Soma = 20 1,00 UNIDADE IV – NOÇÕES DE PROBABILIDADE IV.1 Introdução Encontramos na natureza dois tipos de fenômenos: determinísticos e aleatórios. Os fenômenos determinísticos são aqueles em que os resultados são sempre os mesmos, qualquer que seja o numero de ocorrências verificadas. Se tomarmos um determinado sólido, sabemos que a certa temperatura haverá a passagem para o líquido. Esse exemplo caracteriza um fenômeno determinístico. 35 %7878,0 600 468  Exemplo 2: Lote de N peças, com D defeituosas: Fração defeituosa do lote P = D/N P é o nível de qualidade do lote, expresso em (%) Ao calcularmos a probabilidade pelo método da frequência relativa, obtemos uma aproximação no lugar de um valor exato. À medida que o número de observações aumenta, as aproximações tendem a ficar mais próximas da probabilidade efetiva. Esta propriedade é enunciada pelo teorema conhecido como lei dos grandes números. Lei dos Grandes Números: “Se repete-se um experimento um grande número de vezes a probabilidade pela frequência relativa de um evento tende para a probabilidade teórica”. Na abordagem subjetiva a probabilidade associada a um evento irá basear-se na opinião pessoal do analista sobre as chances de sua ocorrência. Pode-se usar qualquer informação disponível para atribuir probabilidade ao evento, tal como nossa experiência ou intuição. Exemplo: Um investidor decide aplicar em ações porque seu “feeling” indica que a probabilidade de ganho é de 60% ao ano. IV. 4 Propriedades da Probabilidade  para qualquer evento A.  A probabilidade de um evento cuja ocorrência é certa é igual a 1, ou seja, P(S) =1.  A probabilidade de um evento impossível é 0, ou seja, . Exemplos: • A probabilidade de obter um número menor ou igual a 6 no lançamento de um dado. • Probabilidade de obter um número maior que 6 no lançamento de um dado. - Eventos Complementares: Um evento ou conjunto de eventos é complementar a outro quando, juntos, formam o espaço amostral. 1)(0  AP 0)( P 36 Cálculo da probabilidade usando o complemento: Exemplo: Sendo A: obter a face 5 no lançamento de um dado, calcule a probabilidade do complementar de A. IV. 5 Eventos compostos Evento composto é qualquer evento que combina dois ou mais eventos simples. Ex.: Lançamento de duas moedas, retirar um ÁS de um baralho e obter a face 6 no lançamento de um dado. União de dois eventos (AUB): A união de A e B é o evento contendo todos os pontos amostrais que pertencem a A a B ou a ambos. Interseção de dois eventos (A ∩ B): A interseção de A e B é o evento que contém os pontos amostrais que pertencem tanto a A como a B. A A Onde é o complementar de A. A )(1)( APAP  S A B A B S 37 IV. 5.1 Regra da Adição É usada quando estamos interessados em conhecer a probabilidade de que pelo menos um deles ocorra. Isto é, estamos interessados na ocorrência de A, de B ou ambos. A probabilidade de ocorrer “A” ou “B” é fornecida aplicando-se a regra da adição de probabilidades: P(AB) = P(A) + P(B) – P(A e B) Para o caso de eventos mutuamente excludentes (a ocorrência de um resultado exclui o outro), então: P(AB) = P(A) + P(B) Diagrama de Venn para Eventos Mutuamente Excludentes Observe que não existe área de intercessão entre os círculos A e B. Exemplo de eventos mutuamente excludentes: Em um baralho, qual a probabilidade de se tirar uma carta de “ás” ou uma de “reis”? Neste caso, não existe uma carta no baralho que seja “ás” e “reis” ao mesmo tempo. Então, a intercessão é nula. Como existem 4 “ás” e 4 “reis” no baralho (uma de cada naipe), a probabilidade será igual a: Exemplo de eventos não mutuamente excludentes: Qual a probabilidade de se tirar do mesmo baralho uma carta de “ás” ou uma de “espadas”? Neste caso existe uma carta que é „ás” e “espadas” simultaneamente. Assim sendo, existe intercessão. A probabilidade será, então, igual a: A B 52 16 52 1 52 13 52 4  52 8 52 4 52 4  40 A probabilidade da 1ª peça ser boa é igual a 8/10. Como o experimento é com reposição, a probabilidade da 2ª peça ser boa será também igual a 8/10 quer a 1ª peça tenha sido boa ou não. Então: P(2ª peça boa) = P(2ª peça boa/1ª peça foi boa) Dessa forma, os eventos “1ª peça boa” e “2ª peça boa” são independentes entre si. 2º caso: Experimento sem reposição Neste caso, a probabilidade da 2ª peça ser boa vai depender da 1ª peça ter sido boa ou não. Se a 1ª peça foi boa, a P(2ª peça boa) é igual a 7/9. Se a 1ª peça foi ruim, a P(2ª peça boa) é igual a 8/9. Então, a probabilidade de “2ª peça boa” vai depender do que ocorreu com a 1ª peça. Assim, esses eventos (“1ª peça boa” e “2ª peça boa”) são dependentes entre si. Exemplo: Suponha que de cada 100 automóveis que trafegam pelas ruas, 70 sejam de fabricação nacional e 30 sejam importados. Suponha também que 60% dos automóveis nacionais sejam de cor clara e 40% de cor escura. Dos importados, 35% são de cor clara e 65% de cor escura. Determine a probabilidade de se escolher aleatoriamente um automóvel nacional e escuro.  O que se deseja calcular é P(nacional  escuro)  Usando a forma geral da multiplicação: P(nacional  escuro) = P(nacional) x P(escuro/nacional)  Aplicando os dados constantes do enunciado do problema: P(nacional  escuro) = 0,70 x 0,40 = 0,28 QUARTA LISTA DE EXERCÍCIOS 1) De 1000 amostras de água de certo manancial do norte do estado, 200 estão contaminadas por mercúrio e 300 com coliformes fecais. Estes dados incluem 150 amostras que possuem ambos contaminantes. Qual a probabilidade de que uma amostra escolhida aleatoriamente esteja contaminada por mercúrio (A) ou por coliformes (B)? 2) Suponha que quatro cartas são escolhidas aleatoriamente e sem reposição de um baralho de 52 cartas. Qual a probabilidade de que todas as quatro cartas sejam reis? 41 3) Suponha que quatro cartas são retiradas aleatoriamente de um baralho de 52 cartas, após cada retirada a carta é recolocada no maço e todas as cartas são embaralhadas novamente antes da seleção da próxima carta. Qual a probabilidade de que todas as quatro cartas sejam reis? 4) Uma urna contém 5 bolas brancas, 4 vermelhas e 3 azuis. Extraem-se 3 bolas sem reposição. Achar a probabilidade de que: a) nenhuma vermelha; b) exatamente uma vermelha; c) todas sejam da mesma cor. 5) A empresa M & tem M tem 15800 empregados, classificados de acordo com a tabela abaixo: IDADE Sexo Homens Mulheres Total < 25 anos 2000 800 2800 25 – 40 anos 4500 2500 7000 > 40 anos 1800 4200 6000 Total 8300 7500 15800 Um empregado e sorteado ao acaso, calcular a probabilidade de ser ele: a) um empregado com 40 anos de idade ou menos; b) um empregado com mais de 40 anos de idade e que seja homem; c) um empregado com 40 anos de idade ou menos, e mulher; d) uma mulher, dado que é um empregado com menos de 25 anos. 7) Em uma indústria há 10% pessoas que ganham mais de 20 salários mínimos (s.m.), 20% que ganham entre 10 e 20 s.m. e 70% que ganham menos de 10 s.m. Três pessoas desta industria são selecionadas com reposição. Determinar a probabilidade de que pelo menos uma ganhe menos de 10 s.m. 8) P(A) = 1/3, P(B) = 3/4 e P(AUB) = 11/12, calcular P(A/B). UNIDADE V – VARIÁVEL ALEATÓRIA Variável aleatória (v.a) é uma variável que tem um valor numérico único, para cada resultado de um experimento. Seja E um experimento e S o espaço amostral associado ao experimento. Uma função X, que associe a cada elemento s  S um número real X(s) é denominada variável aleatória. Variável aleatória s• • X(s) S X R 42 EXEMPLO: E: lançamento de duas moedas X: número de caras obtidas nas duas moedas S = {(ca,ca),(ca,co),(co,ca),(co,co)} X = 0: corresponde ao evento (co,co) X = 1: corresponde ao evento (co,ca), (ca,co) X = 2: corresponde ao evento (ca,ca) V.1 VARIÁVEL ALEATÓRIA DISCRETA Uma variável aleatória X será discreta se assumir valores em um conjunto finito ou infinito numerável. V. 1.1 Função de probabilidade da variável aleatória discreta É uma função que associa a cada valor assumido pela variável aleatória a probabilidade do evento correspondente. Seja X uma v. a. discreta. A probabilidade da variável aleatória X assumir um valor particular x, é a função de probabilidade X que se representa por P(X = x). A função P(X = x) determina a distribuição de probabilidades da v.a. Condições para uma distribuição de probabilidades 1.  1)(xP , onde x toma todos os valores possíveis. 2. xxP  ,1)(0 Exemplo: E: lançamento de duas moedas. X: Nº de caras obtidas. A distribuição de probabilidade da v. a. X é dada por: O gráfico de P(x) em função de X do exemplo anterior acima é: X P(x) 0 1 2 0,25 0, 5 0,25 45 QUINTA LISTA DE EXERCÍCIOS 1. Uma seguradora paga R$ 30.000,00 em caso de acidente de carro e cobra uma taxa de R$ 1000,00. Sabendo que a probabilidade de que um carro sofra acidente é de 3%. Quanto espera a seguradora ganhar por carro segurado? Resposta: R$100,00 2. Um negociante espera vender um automóvel até sexta-feira. A expectativa de venda na segunda-feira é de 50%. Na terça-feira é de 30%, na quarta-feira é de 10%, na quinta-feira é de 5% e na sexta-feira é de 5%. Se lucro é de R$ 3000,00 se vender na segunda-feira e diminui 40% a cada dia. a) Calcule o valor esperado do lucro deste negociante nesta venda. b) Calcule o desvio padrão do lucro. Resposta: 2199,84 e 881,98 3. Uma máquina de apostas tem 2 discos que funcionam independentemente um do outro. Cada disco tem 10 figuras: 4 maçãs, 3 bananas, 2 peras e uma laranja. Uma pessoa paga R$ 80,00 e aciona a máquina. Se aparecerem 2 maçãs, ganha R$ 40,00. Se aparecerem 2 bananas ganha R$ 80,00, ganha R$140,00 se aparecerem 2 peras e ganha R$ 180,00 se aparecerem duas laranjas. Se não aparecerem duas frutas iguais o jogador não tem ganho. Qual a esperança de ganho numa única jogada? Resposta: -59,00 4. Num jogo de dados, A paga R$20,00 a B e lança 3 dados. Se sair a face 1 em um dos dados apenas, A ganha R$20,00. Se sair a face 1 em dois dados apenas, A ganha R$50,00, e se sair 1 nos três dados dados, A ganha R$80,00. Calcular o lucro líquido médio de A em uma jogada. (Morettim pág 47). Resposta: -9,21 V. 1.3 Função de Distribuição Acumulada (fda) da v.a. discreta Definição: É a probabilidade de variável aleatória X assumir um valor menor ou igual a X, ou seja, função acumulada que fornece, para cada ponto considerado, a probabilidade de que a variável assuma um valor menor ou igual que a correspondente a esse ponto (definição prof. Wofgam – controle de qualidade). F(x) = P(X  x) =  xix ixp )( Exemplo: Seja X a variável aleatória número de caras obtidas no lançamento de 2 moedas, determine F(x) e construa o gráfico de F(x). x P(x) F(x) 0 1/4 1/4 1 1/2 3/4 2 1/4 1 46 Temos então: 4/1)0()0()0(  XPXPF 4/3)1()0()1()1(  XPXPXPF 4/4)2()1()0()2()2(  XPXPXPXPF Portanto os valores para F(x) são: zero, quando: x < 0·. 1/4, quando: 0  x < 1. F(x) = 3/4, quando: 1  x < 2. 1, quando: x  2. V.2 VARIÁVEL ALEATÓRIA CONTÍNUA Uma variável aleatória X contínua pode assumir qualquer valor no intervalo de sua definição. EX.: medida da corrente de um fio delgado de cobre. V. 2. 1 Função de Densidade de Probabilidade Assim como as variáveis discretas possuem suas funções de probabilidade, as variáveis contínuas possuem suas funções densidade de probabilidade. A diferença entre as duas é que enquanto a função de probabilidade fornece diretamente a probabilidade da v.a. discreta assumir um determinado valor, tal não acontece com a função de densidade. A probabilidade de uma v.a. contínua assumir um valor localizado dentro de um determinado intervalo é igual à área embaixo da função densidade, limitada pelos pontos extremos do intervalo. Assim a probabilidade de uma v. a. contínua assumir um determinado valor (probabilidade no ponto) é nula, pois a 47 área embaixo de um ponto é igual a zero. Uma função densidade de probabilidade f(x) pode ser usada para descrever uma distribuição de probabilidades de uma variável aleatória contínua X. Funções de densidade são usadas na engenharia para descrever sistemas físicos, como por exemplo, a densidade de uma carga em uma viga longa e delgada. Definição: Para uma variável aleatória contínua X, uma função densidade de probabilidade (fdp) é uma função tal que: a) 0)( xf para todo x; b) 1)(    dxxf ; c)  b a dxxfbXaP )()( = a área sob f(x) para quaisquer a, b, com  ba . Obs.: * 1)(0  bXaP * 0)(  xXP * )()()()( bXaPbXaPbXaPbXaP  V. 2. 2 Média (ou valor esperado) e variância de uma variável aleatória contínua A média e a variância de uma v.a. contínua são definidas de modo similar a uma v.a. discreta. A integração substitui a soma nas definições. Definição: Suponha que X seja uma v. a. contínua com uma função densidade de probabilidade f(x). A média ou o valor esperado de X, denotado por μ ou E(X) é     dxxfxXE )()( A variância de X, denotada por 2 ou VAR(X), é    222 )(XEXE  50 processos industriais as peças falham ou não falham; em medicina o paciente sobrevive ou morre; em marketing o consumidor reconhece um produto ou não. Definição: um experimento binomial satisfaz as seguintes condições:  O experimento deve ser repetido, sob as mesmas condições um nº finito de vezes (n);  As repetições devem ocorrer de forma independente;  Cada repetição possui dois resultados possíveis: sucesso (p) e fracasso (q = 1- p);  As probabilidades devem permanecer constantes para cada repetição.  Descreve a amostragem COM REPOSIÇÃO.  Tende para a distribuição Normal quando n cresce. Exemplo: Imagine uma máquina de confeccionar parafusos. Dos parafusos fabricados por essa máquina, 2% saem com algum tipo de defeito (esta é uma característica da máquina). Suponha que a produção dessa máquina é lançada ininterruptamente em uma esteira, e que dessa esteira são retirados 10 parafusos.  Para variáveis com essa distribuição resolvemos problemas do tipo: determinar a probabilidade de se obter “k” sucessos em “n” tentativas.  Seja “X” número de sucessos em “n” tentativas. A função de probabilidade da variável X é dada por:  Notação: X: B (n, p). p: probabilidade de sucesso em uma das repetições; (1-p): probabilidade de fracasso em uma das “n” repetições; n: número de repetições; k: nº de sucessos em “n” repetições, pode ser qualquer inteiro entre 0 e n, inclusive; P (X = k): é a probabilidade de obter “k” sucessos em “n” repetições.  Média e desvio padrão de uma variável binomial: Média = n.p Desvio padrão = )!(! ! ;)1()( xnx n k n pp k n kXP knk                )1( ppn  51 Exemplo 1: Uma partida tem a fração defeituosa p=0,04. Calcular a probabilidade de aceitação da partida, com amostra de n = 50 peças, e sendo que a aceitação ocorrerá se menos de uma estiver defeituosa. R: 0,3999 Exemplo 2: Cada amostra de ar tem 10% de chance de conter uma certa molécula rara. Considere que as amostras sejam independentes com relação à presença da molécula rara. Encontre a probabilidade de que nas próximas 18 amostras, exatamente 2 contenham a molécula rara. R: 0,28 VI. 1. 2 Distribuição Hipergeométrica Consideram-se uma população com N elementos, dos quais r tem uma determinada característica (a retirada de um desses elementos corresponde ao sucesso). Retira-se dessa população, sem reposição, uma amostra de tamanho n. Seja X: número de sucessos na amostra (saída do elemento com a característica). Para sabermos a função de probabilidade, consideramos que podemos tirar       n N amostras sem reposição. Os sucessos na amostra podem ocorrer com       k r maneiras e fracassos de         kn rN maneiras. Logo:                      n N kn rN k r kXP )( , rkenk 0 A variável X assim definida tem distribuição hipergeométrica. Exemplo 1: Seja uma partida de N = 50 peças, com 2 defeituosos. Qual a probabilidade de aceitação da partida, inspecionando-se uma amostra de n = 10, com número de aceitação a=1 (vai aceitar se tiver no máximo uma defeituosa)? Solução: X: nº de motores defeituosos da amostra. N = 50; r = 2; n = 10 52 963,0326,0637,0 10 50 110 250 1 2 10 50 010 250 0 2 )1()0(                                            XPXP Exemplo 2: Pequenos motores são guardados em caixas de 50 unidades. Um inspetor de qualidade examina cada caixa, antes da posterior remessa, testando 5 motores. Se nenhum motor for defeituoso, a caixa é aceita. Se pelo menos um for defeituoso, todos os 50 motores são testados. Há 6 motores defeituosos numa caixa. Qual a probabilidade de que seja necessário examinar todos os motores dessa caixa? Solução: X: nº de motores defeituosos da amostra. N = 50; r = 6; n = 5 Inspecionar todos se pelo menos um é defeituoso  P(Pelo menos um defeituoso)= P(X  1) = 1 – P(X < 1) = 1 - P(X = 0) = 4874,05127,01 5 50 05 650 0 6 1                       VI. 1. 3 Distribuição de Poisson É freqüentemente usada para estimar o número de ocorrências sobre um intervalo de tempo ou espaço. Exemplo: Número de defeitos por centímetro quadrado, clientes atendidos por hora, chegada de navios por dia no porto de Vitória.  Propriedades do experimento de Poisson:  A probabilidade de ocorrência é a mesma para quaisquer dois intervalos de igual comprimento.  O número de ocorrências em qualquer intervalo é independente do número de ocorrências em outros intervalos. EXEMPLO 1: Suponha que em uma agência bancária entrem, em média, 60 clientes por hora. Qual a probabilidade de, em 10 minutos, entrarem 4 clientes? Observe que o “sucesso” é à entrada do cliente. A probabilidade desejada é a de 4 sucessos, isto é, 4 entradas de clientes, dentro de um período de tempo de 10 minutos. 55 035232,0)20,01(20,0 14 110 )10( 4104          XP SÉTIMA LISTA DE EXERCÍCIOS 1) Ontem, 80% das ações mais negociadas na Bolsa de Valores Alpha caíram de preço. Suponha que você tenha uma carteira com 20 dessas ações e que as ações que perderam valor possuam distribuição binomial. Pede-se calcular: a) quantas ações de sua carteira você espera que tenham caído de preço; R: 16 b) o valor do desvio padrão das ações que tem na carteira; R: 1,79 c) a probabilidade de que tenham caído de preço exatamente 15 dessas ações. R: 0,17 3) Um lote de equipamentos novos é recebido pela empresa que você trabalha como gerente. 10 equipamentos são inspecionados. O lote é rejeitado se pelo menos 2 equipamentos forem defeituosos. Sabendo-se que 1% dos equipamentos é defeituoso, determinar a probabilidade de a firma rejeitar o lote. R: 0,0043 4) Uma firma recebe 720 mensagens em seu fax em 8 horas de funcionamento. Qual a probabilidade de que: a) em seis minutos receba pelo menos 4 mensagens? R: 0,979 b) Em 4 min não receba nenhuma mensagem? R: 0,00248 5) Numa linha adutora de água, de 60 km de extensão, ocorrem 30 vazamentos no período de um mês. a) Qual a probabilidade de ocorrer, durante o mês, pelo menos 3 vazamentos num certo setor de 3 km de extensão? R: 0,1913 b) A ocorrência de 10 vazamentos em num certo setor de 3 km de extensão é muito rara? Explique. R: 0,0000035. É rara. 6) Numa linha de montagem, 10% das peças são defeituosas.Qual a probabilidade da quinta peça que se analisa ser a segunda defeituosa? R: 0,02916 7) Qual a probabilidade de que no 25º lançamento de um dado ocorra a face 4 pela 5ª vez? R: 0,0356 8) Uma uran tem 10 bolas brancas e 40 pretas. a) Qual a probabilidade de que a 15ª bola extraída com reposicao seja a 6ª branca? R: 0,0172 b) Qual a probabilidade de que em 30 bolas retiradas com reposição ocorram no máximo 2 brancas? R: 0,0442 9) Uma firma compra lâmpadas por centenas. Examina sempre uma amostra de 15 lâmpadas para verificar se estão boas. Se uma centena inclui 12 lâmpadas queimadas, qual a probabilidade de se escolher uma amostra com pelo menos uma lâmpada queimada? R: 0,8747 10) Uma fábrica de motores para máquinas de lavar roupas separa de sua linha de produção diária de 350 peças uma amostra de 30 itens para inspeção. O número de peças defeituosas é de 14 por dia. Qual a probabilidade de que a amostra contenha pelo menos 3 motores defeituosos? R: 0,108453 56 VI. 2 Distribuições Contínuas de Probabilidades Serão estudadas as seguintes Distribuições Contínuas de Probabilidades: - Distribuição Normal - Distribuição Exponencial - Distribuição Uniforme - Outros modelos importantes: Gama, qui-quadrado, t-Student e F-Snedecor. VI. 2.1 Distribuição Normal  A Distribuição Normal é uma das mais importantes distribuições, se não a mais importante, da Estatística.  Ela é aplicada a um grande número de processos aleatórios relacionados com o ser humano.  Ela também é intensamente utilizada ao longo da Estatística Inferencial. Características da Distribuição Normal  A v.a. de distr. normal pode assumir todo e qualquer valor real, é definida de   a  .  A Distribuição Normal é uma distribuição simétrica. Assim sendo, a média, a mediana e a moda assumem o mesmo valor.  A forma assumida pela função densidade de probabilidade Normal é a de um sino.  O ponto mais elevado da curva corresponde ao seu valor médio.  A curva é assintótica.  Cada distribuição normal fica especificada por sua média e seu desvio padrão.  A área total sob a curva é 1 e a probabilidade de ocorrer um valor maior que a média é igual a probabilidade de ocorrer um valor menor do que a média.  O desvio padrão da distribuição determinará a abertura dessa curva, assim: Média Mediana Moda - + Desvio padrão grande 57  Em uma Distribuição Normal observa-se que:  68% das observações são localizadas dentro de ± 1 desvio padrão em torno da média;  95% das observações são localizadas dentro de ± 2 desvios padrão em torno da média;  99,7% das observações são localizadas dentro de ±3 desvios padrão em torno da média. Função Densidade de Probabilidade Média Mediana Moda + - Desvio padrão pequeno 2 2 1 2 1 )(             x exf 60  A variável aleatória é o intervalo de tempo ou espaço entre dois eventos consecutivos. Função Densidade de Probabilidade é igual a: onde  = tempo (ou espaço) médio  O cálculo de uma probabilidade exponencial é feito da seguinte forma : o x xxdevaloresparaexxP    ,1)( 0 0 EXEMPLO: Um banco está implementando um serviço de atendimento a clientes especiais após o término do expediente. O gerente da agência fez um estudo a respeito da demanda por esses serviços e constatou que, em média, a agência era procurada por cerca de seis clientes por hora. Qual a probabilidade de um cliente chegar pelo menos 10 minutos após o anterior ter chegado? Neste caso, o período de tempo entre os dois eventos consecutivos é de 10 minutos: 6 clientes em 1 hora ou 10 minutos entre dois clientes consecutivos. A probabilidade que se deseja calcular é a de P(t  10 minutos) Aplicando-se a fórmula apropriada, teremos: Veja no gráfico abaixo a área correspondente à probabilidade calculada. Qual a probabilidade um cliente chegar, no máximo, 8 minutos após a chegada do cliente anterior?   x exf   1 )( 3679,0)10( 10 10   eP 0 t P(t 10 ) minutos)=0,3679 10 o x xxdevaloresparaexxP    ,)( 0 0 61 A probabilidade que se deseja calcular, neste caso, é P (t  8 minutos). Tem-se então que: 5507,01)8( 10 8   etp Veja no gráfico abaixo a área correspondente à probabilidade calculada: Qual a probabilidade do período de tempo entre duas chegadas consecutivas de cliente ficar entre 5 minutos e 9 minutos? Nesse caso, a probabilidade que se deseja é p ( 5‟  t  ‟ . )5()9()95(  tptptp 20,0)1()1()95( 10 5 10 9   eetp VI. 2.3 Distribuição Uniforme  É aplicada às Variáveis Aleatórias Contínuas nas quais todos os resultados localizados no intervalo de sua definição possuem a mesma probabilidade de ocorrer.  O gráfico apresentado a seguir mostra uma distribuição uniforme definida no intervalo de “a” a “b”. 0 t 5 9 P(5  t  9) 99)=0,20 8 0 t P(t  8 ) )minutos)=0,5507 62 Função Densidade de Probabilidade:  Para valores de “x” tais que a  x  b:  Para outros valores: EXEMPLO: O valor de uma compra em uma loja de discos é uma variável aleatória uniformemente distribuída no intervalo entre $ 10,00 e $ 35,00. Qual a probabilidade de um cliente realizar uma compra cujo valor se situe entre $ 15,00 e $ 28,00? Observem no gráfico a seguir os valores envolvidos no problema. A probabilidade procurada será igual à: VI. 2.4 Distribuição log-normal Características: Xa b X10 28 3515       10-35 1 Probabilidade Desejada       a-b 1 Esta área é igual a 1 ab xf   1 )( 0)( xf   52,01528 1035 1        p 65 Após a análise da manutenibilidade, foram identificados diversos problemas que estavam conduzindo a altos tempos de reparo, tornando-se preciso modificar o sistema de manutenção. Como exemplo, de problemas identificados, podemos citar:  Algumas falhas, devido ao treinamento inadequado para as equipes de manutenção, estavam conduzindo a tempos de reparo excessivamente altos.  Os procedimentos de diagnose não estavam corretos na grande maioria dos reparos. O estudo para determinar a maneira precisa, como os dois parâmetros da distribuição log-normal α e β estão relacionados com os fatores de manutenção que os determinam, permitem obter predições apuradas da distribuição dos tempos de paralisação de sistemas ou equipamentos. De importância particular no estudo, é a descoberta e avaliação do efeito preciso do desempenho da manutenção devido aos vários fatores humanos. A análise dos tempos de reparo de sistemas ou equipamentos conduzem a(o): melhoramento da qualidade dos serviços, aumento da disponibilidade, diminuição dos custos de mão-de-obra e redução dos custos de perda de produção. EXEMPLOS: 1. A concentração de poluentes produzidos por indústrias químicas é conhecida por exibir comportamento que lembra uma distribuição log-normal. Isso é importante quando considerarmos assuntos relacionados ao cumprimento das regulamentações governamentais. Suponha que assumimos que a concentração de certo poluente, em ppm, tem distribuição log-normal com parâmetros µ=3,2 e σ=1. Qual é a probabilidade de que a concentração exceda oito partes por milhão? R: 0,8686 66 2. Em um estudo de Marketing, os dados referentes ao número de minutos diários que 100 indivíduos selecionados aleatoriamente passam em frente à TV foram tabulados; após algumas análises chegou-se a conclusão de que o Ln (X) apresentava-se como uma v.a. Y normalmente distribuída com média igual a 5 e desvio padrão de 1,5. a) Qual a probabilidade de selecionarmos um indivíduo que assista no máximo 95 min diários de televisão? R: 0,3821 b) Qual o tempo médio que um indivíduo passa diante da TV? R: E(X) = 457,14 VI. 2.5 Distribuição de Weibull É usada para modelar o tempo até uma falha. Os parâmetros da distribuição permitem modelar sistemas onde o número de falhas aumenta com o tempo (desgaste do mancal), diminui com o tempo (alguns semicondutores) ou permanece constante. A variável aleatória X com função densidade de probabilidade com parâmetros α e β: x x xparaexxf x                00 0,),;( 1      tem uma distribuição de Weibull com parâmetro de escala α >0 e parâmetro de forma β > 0. Quando α=1, a distribuição de Weibull é idêntica à distribuição exponencial. A flexibilidade da distribuição é mostrada na Figura abaixo: 67 Função densidade de probabilidade de Weibull para valores selecionados de β e α. A função de distribuição acumulada é frequentemente usada para calcular as probabilidades. O seguinte resultado pode ser obtido:               01)( 00 ),;( xexXP x xF x    A média e a variância da v.a. X que tem distribuição de Weibull é:          1 1)(XE 2 222 11 2 1)(                       XVAR Onde   )!1(  rr se r for um inteiro positivo.   )1()1(  rrr de uma maneira geral.    2/1 e dxxe x   0 1)(  70 VII.1 Distribuição Amostral da Média As distribuições de probabilidade das estatísticas amostrais são chamadas de distribuições amostrais. A média, bem como todas as demais estatísticas de uma amostra, são variáveis aleatórias. Dessa forma, possuem distribuições de probabilidade como qualquer outra variável aleatória. Uma distribuição amostral de médias é uma distribuição de probabilidade que mostra a variabilidade das médias amostrais.  A média de uma distribuição amostral é sempre igual à média populacional  Quando a população é infinita, o desvio padrão da distribuição amostral da média é: EXEMPLO: Uma amostra aleatória de 100 observações dos valores das vendas realizadas em determinada loja apresentou uma média igual a $ 328,40 e um desvio padrão de $ 87,43. Qual o valor estimado da média, da variância e do desvio padrão amostrais? A média amostral será igual a: a $ 328,40 O desvio padrão amostral será igual a: 87,43/10 = 8,743 Teorema do Limite Central Informações 1. A variável aleatória x tem distribuição (que pode ser normal ou não), com média µ e desvio padrão σ . 2. Amostras de tamanho n são extraídas aleatoriamente dessa população. Conclusão 1. Na medida em que o tamanho da amostra aumenta a distribuição das médias amostrais  x , tende para uma distribuição normal. 2. A média das médias amostrais será a média populacional µ. 3. O desvio padrão das médias amostrais será n   x n x    71 Regras práticas de uso comum 1. Para amostras de tamanho n>=30, a distribuição das médias amostrais pode ser aproximada satisfatoriamente por uma distribuição normal. A aproximação melhora na medida em que aumenta o tamanho da amostra n. 2. Se a própria distribuição original tem distribuição normal, então as médias amostrais terão distribuição normal para qualquer tamanho amostral n. EXEMPLO: Considere uma população com estatura média de 170 cm de altura e desvio padrão de 9 cm. A. Selecionada uma pessoa aleatoriamente, determine a probabilidade de sua estatura estar entre 170 cm e 175 cm: B. Selecionada aleatoriamente 35 pessoas, determine a probabilidade de suas estatura terem média entre 170 cm e 175 cm: VII.2 Distribuição Amostral da Proporção A média (proporção ou percentagem média) da distribuição amostral p é sempre igual à proporção populacional. Isto é, Onde: p = proporção populacional = média da distribuição amostral das proporções. Quando a população é muito grande ou infinita, o desvio padrão da distribuição amostral se calcula pela fórmula: pp  p 72 Exemplo: Um varejista compra copos diretamente da fábrica em grandes lotes. Periodicamente o varejista inspeciona os lotes para determinar a proporção dos quebrados. Se um grande lote contém 10% de quebrados, qual a probabilidade do varejista obter uma amostra de 100 copos com 17% ou mais defeituosos? Solução: O primeiro passo é calcular o desvio padrão da população: Usando a padronização temos: Olhando na tabela normal padrão temos que a probabilidade procurada é 0,0099. OITAVA LISTA DE EXERCÍCIOS 1) A população das importâncias das compras em certo supermercado 24 horas tem média de R$ 5,20 e desvio de R$ 4,10. Qual a probabilidade de um total de 100 compras o valor médio exceder R$ 6,00? R= 0,0256 2) A distribuição do peso de homens que viajam de avião de Vitória para São Paulo tem média de 163 libras e desvio padrão de 18 libras, qual é a probabilidade do peso médio de 36 homens tomados aleatoriamente ser menor que 167 libras.R=0,9082 3) Se vamos extrair amostras de n = 100 observações de uma população muito grande, em que a proporção populacional é 20%, qual a probabilidade das proporções amostrais podemos esperar nos intervalos abaixo? (Stevenson, pag, 188) a) maior que 24% R =0,1587 b) 16% a 24% R =0,6826 c) 12% a 28% R= 0,9544 d) menos de 12% ou mais de 28% R = 0,0456 n pp p )1(   03,0 100 )90,0(10,0)1(    n pp p 33,2 03,0 10,017,0 ?)17,0ˆ(     z pP
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved