









Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Este documento aborda conceitos básicos de distribuições de probabilidade contínuas, incluindo função de densidade de probabilidade, função de distribuição acumulada, esperança e variância de variáveis aleatórias contínuas e a distribuição uniforme contínua. Além disso, é feita uma comparação entre histogramas com diferentes números de classes e é apresentada a relação entre a função de densidade de probabilidade e a função de distribuição acumulada.
Tipologia: Notas de estudo
1 / 17
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Aula 1 – Variáveis aleatórias contínuas
Objetivos: Nesta aula iremos estudar as variáveis aleatórias contínuas e você aprenderá os seguintes conceitos:
Noções básicas No estudo das distribuições de frequência para variáveis quantitativas contínuas, vimos que, para resumir os dados, era necessário agrupar os valores em classes. O histograma e o polígono de frequências eram os gráficos apropriados para representar tal distribuição. Para apresentar os conceitos básicos relativos às variáveis aleatórias contínuas, vamos considerar os histogramas e respectivos polígonos de frequência apresentados na Figura 1.1. Esses gráficos representam as distribuições de frequências de um mesmo conjunto de dados, cada uma com um número
de classes diferente − no histograma superior, há menos classes do que no histograma inferior. Suponhamos, também, que as áreas de cada retângulo sejam iguais às frequências relativas das respectivas classes (essa é a definição mais precisa de um histograma). Pelos resultados vistos anteriormente, sabemos que a soma das áreas dos retângulos é 1 (as frequências relativas devem somar 1 ou 100%) e que cada frequência relativa é uma aproximação para a probabilidade de um elemento pertencer a determinada classe. Analisando atentamente os dois gráficos, podemos ver o seguinte: à medida que aumentamos o número de classes, diminui a diferença entre a área total dos retângulos e a área abaixo do polígono de frequência. A divisão em classes se fez pelo simples motivo de que uma variável contínua pode assumir infinitos (não- enumeráveis) valores. Faz sentido, então, pensarmos em reduzir, cada vez mais, o comprimento de classe δ, até a situação limite em que δ → 0. Nessa situação limite, o polígono de frequências se transforma em uma curva na parte positiva (ou não-negativa) do eixo vertical, tal que a área sob ela é igual a 1. Essa curva será chamada curva de densidade de probabilidade.
Figura 1.1: Histogramas e respectivos polígonos de frequência. Considere, agora, a Figura 1.2, em que é apresentado o histograma superior da figura anterior, mas agora ilustramos um fato visto anteriormente: para estimar a frequência de valores da distribuição entre os pontos a e b, podemos usar a área dos retângulos sombreados de cinza-claro.
Figura 1.2: Cálculo da frequência entre dois pontos a e b.
Conforme ilustrado na Figura 1.3, a diferença entre essa área e a área sob o polígono de frequências tende a diminuir à medida que se aumenta o número de classes. Essa diferença é a parte sombreada de cinza mais escuro. Isso nos permite concluir o seguinte: no limite, quando δ → 0, podemos estimar a probabilidade de a variável de interesse estar entre dois valores A e B pela área sob a curva de densidade de probabilidade, delimitada pelos pontos A e B.
Figura 1.3: Diferença entre as áreas dos retângulos e a área sob o polígono de frequência.
Variável aleatória contínua Embora já visto anteriormente, voltamos a apresentar o conceito de variável aleatória, por ser esse um dos conceitos mais importantes deste curso. Definição
de um experimento aleatório. Dito de outra forma, uma variável aleatória é uma função que associa a cada evento
Já estudamos também as variáveis aleatórias discretas e agora vamos introduzir as variáveis aleatórias contínuas e para isso apresentamos novamente esses conceitos. Definição Uma variável aleatória é discreta se sua imagem (ou conjunto de valores que ela assume) for um conjunto finito ou enumerável. Se a imagem for um conjunto não-enumerável, dizemos que a variável aleatória é contínua.
Função de densidade de probabilidade Os valores de uma v.a. contínua são definidos a partir do espaço amostral de um experimento aleatório. Sendo assim, é natural o interesse na probabilidade de obtenção de diferentes valores dessa variável. O comportamento probabilístico de uma variável aleatória contínua será descrito pela sua função de densidade de probabilidade. Definição Uma função de densidade de probabilidade é uma função f(x) que satisfaz as seguintes propriedades:
Figura 1.4: Probabilidade como área.
Da interpretação de probabilidade como área, resulta que FX(x) é a área à esquerda de x sob a curva de densidade fX. Veja a Figura 1.6:
Figura 1.6: Função de distribuição acumulada - cálculo a partir da área sob a curva de densidade.
Existe uma relação entre a função de densidade de probabilidade e a função de distribuição acumulada, que é resultante do Teorema Fundamental do Cálculo. Por definição, temos o seguinte resultado:
e do Teorema Fundamental do Cálculo resulta que
isto é, a função de densidade de probabilidade é a derivada da função de distribuição acumulada.
Esperança e variância de variáveis aleatórias contínuas Nas distribuições de frequências agrupadas em classes de variáveis quantitativas contínuas, vimos que a média e a variância da distribuição, medidas de centro e de dispersão, respectivamente, podiam ser calculadas como
e onde fi era a frequência relativa da classe i e xi era o ponto médio da classe i. Continuando com a idéia inicial da aula de tomar classes de comprimento cada vez menor, isto é, fazendo δ → 0, chegamos às seguintes definições de esperança e variância de uma variável aleatória contínua. Definições Seja X uma variável aleatória contínua com função de densidade de probabilidade fX. A esperança (ou média ou valor esperado) de X é definida como
e a variância de X é definida como
O desvio padrão é definido como
Não entraremos em detalhes de cálculo dessas fórmulas; nosso enfoque será na interpretação da média e da variância como medidas de centro e de dispersão. Para algumas distribuições específicas, apresentaremos os valores de E(X) e V ar(X), mostrando a sua influência sobre a distribuição.
As mesmas propriedades vistas para variáveis aleatórias discretas continuam valendo no caso contínuo:
Se interpretamos a função de densidade de probabilidade de X como uma distribuição de massa na reta real, então E(X) é o centro de massa desta distribuição. Essa interpretação nos permite concluir, por exemplo, que se fX é simétrica, então E(X) é o valor central, que define o eixo de simetria.
Exemplo 1.1 — Distribuição uniforme Considere a função fX apresentada na Figura 1.7:
Figura 1.7: Função de densidade de probabilidade para o Exemplo 13.1.
Figura 1.8: Cálculo de Pr(2 ≤ X ≤ 3) para o Exemplo 13.1.
Figura 1.12: Função de densidade de probabilidade para o Exemplo 13.2.
Figura 1.13: Cálculo de k para o Exemplo 13.2.
Subtraindo a primeira equação da segunda, obtemos 0, 3 − 0, 1 = 5b ⇒ b = 0, 04
Substituindo este valor na primeira equação, obtemos que a = 0, 1 − 0, 04 = 0, 06. Logo,
0,
0,
Figura 1.14: Cálculo de Pr(2 ≤ X ≤ 3) para o Exemplo 13.2.
Figura 1.15: Função de distribuição acumulada para o Exemplo 13.2.
A raiz que fornece resultado dentro do domínio de variação de X é
Exemplo 1.3 - Distribuição triangular Considere a função fX apresentada na Figura 1.16:
Figura 1.16: Função de densidade de probabilidade para o Exemplo 13.3.
Figura 1.18: Cálculo de k tal que Pr(X ≤ k) = 0, 6. Novamente, vamos usar a regra do complementar: como a área (probabilidade) abaixo de k tem de ser 0,6, resulta que a área (probabilidade) acima de k tem de ser 0,4; então, a área do triângulo superior tem de ser 0, 4. A altura desse triângulo é obtida substituindo-se o valor x = k na equação da segunda reta, o que nos dá h = 1 – k/4. Substituindo na fórmula que dá a área de um triângulo, resulta:
A raiz está fora do domínio de definição da função; logo, essa solução não serve. A solução para o problema, então, é:
Figura 1.19: Cálculo de FX(x) para 0 ≤ x ≤ 2. Para x ∈ [2, 4], Fx(x) é a área sombreada na Figura 1.20, que pode ser calculada subtraindo-se de 1 (área total) a área do triângulo superior. Logo, FX(x) = 1 – (1/2)(4 − x)( 1 – x/ 4 ).
Figura 1.20: Cálculo de FX(x) para 2 ≤ x ≤ 4. Combinando os resultados obtidos, resulta a seguinte expressão para FX :
Veja a Figura 1.21; para 0 ≤ x < 2, o gráfico de FX é uma parábola côncava para cima; para 2 ≤ x ≤ 4, o gráfico de FX é uma parábola côncava para baixo.
Figura 1.21: Função de distribuição acumulada do Exemplo 13.3.
Distribuição uniforme Uma v.a. contínua X tem distribuição uniforme no intervalo [a, b] (finito) se sua função de densidade é constante nesse intervalo, ou seja, temos de ter f(x) = k ∀x ∈ [a, b] Então, o gráfico da fdp. de X é como o ilustrado na Figura 1.22. Para que tal função seja uma fdp, temos de ter k > 0 e a área do retângulo tem de ser 1, ou seja, (b − a) × k = 1 ⇒ k =1/(b – a)
Figura 1.22: Densidade da distribuição uniforme no intervalo [a, b].
Resumo da Aula Nesta aula você iniciou o estudo sobre variáveis aleatórias contínuas, aprendendo os seguintes conceitos:
E (X) = (a + b)/ Var (X) =(b − a)^2 /
Exercícios
(a) Esboce o gráfico de g(x). (b) Encontre o valor de K para que g(x) seja uma função de densidade de probabilidade. (c) Encontre a função de distribuição acumulada. (d) Calcule os quartis da distribuição.
(a) Qual é a probabilidade de se vender mais de 150 kg num dia escolhido ao acaso? (b) Qual a quantidade de arroz que deve ser deixada à disposição dos clientes diariamente para que não falte arroz em 95% dos dias?
Calcule Pr(X ≤ 1 /2 |1/ 3 ≤ X ≤ 2 / 3 ).
Solução dos Exercícios
(b) A área total, que deve ser igual a 1, é a área de um trapézio com altura h = 1, base maior igual a 2K e base menor igual a K. Logo,1 =(K + 2K)/2 × 1 ⇒ K =2/ 3
Figura 1.25: Solução do Exercício 13.1 - gráfico de g(x). (c) Para cada x ∈ [0, 1], FX(x) é a área de um trapézio de altura x, base menor igual a fX(x) = (2/3)(2 − x) e base maior igual a 4/3. Veja a Figura 1.26. Logo,
Figura 1.26: Cálculo da fda para o Exercício 13.1. Resulta que
(d) Sejam Q1,Q2 e Q3 os três quartis:
A raiz que fornece solução no domínio de X é:
A raiz que fornece solução no domínio de X é:
Figura 1.28: Solução do Exercício 13.2 - Cálculo do tamanho do estoque.
Veja a Figura 1.29. Ambos os termos referem-se a áreas de trapézios. O numerador refere-se à área do trapézio sombreado de cinza-escuro e o denominador refere-se ao trapézio correspondente a toda a área sombreada (cinza-claro e cinza-escuro). O trapézio cinza-escuro tem altura 1/2 − 1 /3=1/6, base maior igual a f( 1 / 2 )= 2 × 1 /2= 1 e base menor igual a f( 1 / 3 )= 2× 1 /3=2/3. O trapézio sombreado completo tem altura 2 / 3 − 1 /3=1/3, base
maior igual a f( 2 / 3 )= 2 × 2 /3=4/ 3 e base menor igual a f( 1 / 3 )= 2 × 1 /3=2/3. Logo,
Figura 1.29: Solução do Exercício 13.3.
(b) Pede-se Pr(X < 346) = Pr(X ≤ 346) = FX(346) = ( 346 – 345 )/( 355 – 345 )= 0, 1 (c) Pede-se Pr(350 − 4 < X < 350 + 4) = Pr(346 < X < 354) = Pr(346 < X ≤ 354) = Pr(X ≤ 354) − Pr(X ≤ 346) = ( 354 – 345 )/( 355 – 345 ) – ( 346 – 345 )/( 355 – 345 ) = 0, 8 Logo, a proporção de latas rejeitadas é 1−0, 8 = 0, 2, ou seja, 20% das latas são rejeitadas pelo processo de controle de qualidade. É uma proporção bastante alta.
Bibliografia [1] ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística Aplicada à Administração e à Economia. São Paulo: Pioneira Thomson Learning, 2002 [2] MOORE, David S.; McCabe, George P.; DUCKWORTH, William M.; SCLOVE, Stanley L. A Prática da Estatística Empresarial – Como Usar Dados para Tomar Decisões. Rio de Janeiro: LTC Editora, 2006 [3] MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística Básica, 5a Edição. São Paulo: Saraiva, 2006 [4] TRIOLA, Mario F. Introdução à Estatística, 9a. Edição. Rio de Janeiro: LTC Editora, 2005 [5] FARIAS, Ana M.; Métodos Estatísticos I. Rio de Janeiro. Fundação CECIERJ, 2009.