Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Estatística e Probabilidades: Cálculo de Médias, Medianas, Moda e Variância, Exercícios de Estatística

Este documento aborda temas relacionados à estatística e probabilidades, com foco em cálculo de médias, medianas, moda e variância. São apresentados exemplos e fórmulas para o cálculo de tais parâmetros, bem como a interpretação dos resultados. Além disso, são abordados conceitos como frequência absoluta, frequência relativa, probabilidade condicionada e probabilidade de um evento em um conjunto.

Tipologia: Exercícios

2013

Compartilhado em 03/01/2022

joao-pedro-mota-6
joao-pedro-mota-6 🇧🇷

8 documentos

1 / 36

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Aula 01/10/2013
Apresentação
A matéria só vai até às Distribuições (Normal)
Os Intervalos de Confiança e Testes de Hipótese não serão dados
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24

Pré-visualização parcial do texto

Baixe Estatística e Probabilidades: Cálculo de Médias, Medianas, Moda e Variância e outras Exercícios em PDF para Estatística, somente na Docsity!

Aula 01/10/

Apresentação A matéria só vai até às Distribuições ( Normal ) Os Intervalos de Confiança e Testes de Hipótese não serão dados

Aula 03/10/

ESTATÍSTICA DESCRITIVA

Termos e conceitos estatísticos fundamentais

  • Estatística : é uma área científica cujo principal objectivo é observar um fenómeno, recolher, analisar e interpretar os dados e auxiliar a formulação de decisões.
  • Estatística descritiva : é um conjunto de métodos cujo objectivo é sintetizar e representar de forma compreensível a informação contida nos dados.
  • População : é o conjunto de todos os objectos cuja (s) característica (s) pretendemos estudar (finita e infinita).
  • Amostra : é um subconjunto da população; (economia de dinheiro e tempo) (tamanho da amostra).
  • Inferência Estatística : é um conjunto de métodos que permitem fazer estimativas e tirar conclusões sobre uma população a partir da informação contida numa amostra.
  • Censo : é um estudo que inclui todos os elementos de uma população (só se pode realizar a populações finitas).
  • Sondagens : é um estudo (da população ) efectuado a partir da análise de uma amostra (subconjunto da população).
  • Variável : é uma característica da população que pode tomar vários valores possíveis.
  • Variável qualitativa : é uma característica não numérica da população. o Exemplo: cor dos olhos, estado civil , religião que professa, etc.
  • Variável quantitativa : é uma característica numérica da população. o Exemplo: altura , n.º de irmãos, horas de voo, etc.
  • Variável discreta : é uma variável que pode tomar apenas um conjunto finito ou uma infinidade numerável de valores. o Exemplo: n.º de irmãos, tamanho ( n.º ) dos sapatos, diâmetro de tubos ( polegadas ), etc.
  • Variável contínua : é uma variável que pode tomar todos os valores dum intervalo real. o Exemplo: altura , idade , peso , distância , valor , etc.
  • Experiência estatística (ou aleatória ): é qualquer processo que gera um conjunto de dados que pode ser diferente de cada vez que este é executado em condições iguais.
  • Observação : é qualquer registo de informação (numérica ou não) associado a uma variável.

Organização e apresentação de dados

  • Os dados recolhidos, na sua forma original, normalmente têm pouco interesse: dificuldade de manuseamento, e grande volume de dados.
  • É preciso sintetizá-los ( reduzi-los ) e representá-los de forma compreensível usando metodologias de estatística descritiva.
  • A representação de dados qualitativos envolve o recurso a tabelas de frequências , diagramas de barras ou diagramas circulares.
  • A descrição de dados quantitativos pode ser feita recorrendo a tabelas de frequências , a várias formas de representação gráfica e a medidas sumárias.

Dados Qualitativos (não numéricos) (Distribuição de Frequências)

  • Distribuição de Frequências : consiste numa tabela na qual os dados estão agrupados em classes (ou categorias).
  • Classe (ou categoria) : é cada um dos valores que a variável pode tomar. As classes terão de ser exaustivas (todas) e mutuamente exclusivas (não se interceptam) (cada indivíduo numa só classe).
  • Frequência Absoluta : número de indivíduos que pertencem a uma classe.
  • Frequência Relativa : proporção de indivíduos que pertencem a uma classe (em relação ao total).

Dados Qualitativos (não numéricos) (Diagrama ou gráfico de Barras)

2 - No quadro seguinte apresenta-se o absentismo dos 50 colaboradores de uma empresa de serviços, registado durante o período de um ano (foram excluídas as faltas por motivos justificáveis). 6 4 4 6 0 6 5 13 11 6 4 3 3 11 4 4 8 4 7 7 8 6 6 5 6 6 8 3 3 6 6 1 0 10 6 3 3 2 3 2 2 3 1 8 6 2 2 3 2 0 2.1 -Sendo X a variável em causa, como pode defini-la? E como a classifica? Definição : X — nº de dias de absentismo dos colaboradores da empresa de serviços; Classificação : é uma variável discreta.

2.2 - Organize os dados num quadro de distribuição de frequências, com as frequências observadas, relativas e acumuladas. i - é o índice do grupo de valores; x - é cada um dos valores que a variável pode tomar; i = 1 significa “o primeiro valor da variável” e esse valor é “x = 0 ” i x Fi fi CumFi Cumfi 1 0 3 0,06 3 0, 2 1 2 0,04 5 0, 3 2 6 0,12 11 0, 4 3 9 0,18 20 0, 5 4 6 0,12 26 0, 6 5 2 0,04 28 0, 7 6 12 0,24 40 0, 8 7 2 0,04 42 0, 9 8 4 0,08 46 0, 10 9 0 0 46 0, 11 10 1 0,0 2 47 0, 12 11 2 0,04 49 0, 13 12 0 0 49 0, 14 13 1 0,02 50 1 N = (^) ∑ Fi = 50

Do x 21 até ao x 26 todos valem 4 De i até i = 4

Aula 08/10/

2.3 - Determine a proporção de empregados que faltaram mais de 3 dias por ano. Proporção de colaboradores que faltaram mais de 3 dias/ano = 1 - Cumf 4 = 1 – 0,4 = 0,. Cumf 4 ► é a proporção de indivíduos que faltaram desde i = 1 até i = 4 , isto é, desde x = 0 até x = 3 que significa de 0 a 3 dias de faltas. Se à totalidade ( 100% ou “ 1 ”) for retirado Cumf 4 ficamos com a proporção dos que faltaram mais de 3 dias.

2.4 - Calcule e diga o respectivo significado de (^) ∑

4 i 1

Fi , (^) ∑

14 i 6

Fi , (^) ∑

5 i 1

f (^) i.

4 1

∑ = + + + =^ =

=

F F F F F CumF i

i ( número^ de colaboradores que faltaram até^^3 vezes, inclusive.

Repare-se que i = 4 corresponde a x = 3 );

6 7 8 9 10 11 12 13 14 14 5 50 26 24

14 6

∑ = + + + + + + + + = − = −^ =

=

F F F F F F F F F F CumF CumF i

i ( número^ de

colaboradores com 5 ou mais faltas. Repare-se que i = 6 corresponde a x = 5 );

1 2 3 4 5 5 0 ,^52

5 1

∑ = + + + + =^ =

=

f f f f f f Cumf i

i ( proporção^ de^ colaboradores.^ que^ faltaram^ até^^4 vezes,

inclusive);

2.5 - Construa o diagrama de barras e o gráfico de frequências relativas acumuladas Diagrama de barras:

Gráfico de frequências relativas acumuladas:

2.6 - Calcule a média, o desvio padrão e o coeficiente de variação. Média:

μ = ∑ ( x × fi )== 0 × 0 , 06 + 1 × 0 , 04 + 2 × 0 , 12 + 3 × 0 , 18 + 4 × 0 , 12 + 5 × 0 , 04 + 6 × 0 , 24 + 7 × 0 , 04 + 8 × 0 , 08 + 9 × 0 , 00 + 10 × 0 , 02

  • 11 × 0 , 04 + 12 × 0 + 13 × 0 , 02 = 4 , 76 faltas; Desvio padrão:

2 2 2 2 2 2 2 2 (^2 8) , 34 50

× + × + + × + × − ×

× − ×

n

Fi x n μ σ faltas

σ 2 = σ^2 = 8 , 34 = 2 , 89 faltas

Coeficiente de variação:

100 % 60 , 7 % 4 , 76

= × 100 % = × =

cv

Aula 10/10/

Agrupados por valores ► quando há muitos valores que se repetem Agrupados por classes ► quando os valores estão muito dispersos

3 - Os rendimentos médios mensais (€) de 48 famílias do sector do calçado estão registados no quadro seguinte. 999 1210 870 1360 1330 1340 1485 830 986 1265 1267 1227 1267 826 865 1278 1250 848 1170 1459 1190 956 1345 1436 823 1393 1350 1243 868 1267 800 1339 1235 1336 935 950 1132 905 1376 923 896 1267 847 921 1465 800 871 1235 ∑ 5152 5999 5564 5879 5418 5761 6088 5061 4410 4914 54236 3.1 - Construa o quadro de distribuição de frequências. O primeiro passo para construção do quadro de distribuição de frequências é definir o número de classes. Para isso vamos usar a expressão da regra de Sturges.

Número de classes

log 2

log 48 1 log 2

log ≈ 1 + = + =

N

m

Assim, o número de classes será, em princípio, 6 ou 7_. Analisando os dados verificamos que a amplitude dos mesmos é:_ Amplitude dos dados = Max ( x )− Min ( x )= 1. 485 − 800 = 685 Ao estabelecer o número de classes e ao atribuir a cada classe uma dada amplitude definimos um intervalo onde todos os nossos valores deverão estar dentro. Se a nossa amplitude de dados é de 685 então o intervalo resultante da definição das classes terá que ter uma amplitude sempre maior que a anterior. Devemos, tanto quanto possível, criar classes que tenham uma amplitude “simpática”, facilmente manipulável, cujo centro seja também um valor “amigável” (ver diapositivos 27 a 29 da apresentação 1). Assim, e analisando os nossos dados, podemos verificar que, se usarmos 7 classes com amplitude de 100 unidades cada, criamos um intervalo com amplitude de 700 (maior que 685 ). Se a primeira classe começar em 790 [ valor inferior ao menor valor dos dados (800)] a última classe acaba em 1.490 [ valor superior ao maior valor dos dados (1.485)]. As classes terão assim valores com os quais é “simpático” trabalhar. Classe i Fi fi CumFi Cumfi [790 , 890[ 11 0,229 11 0, [890 , 990[ 8 0,167 19 0, [990 , 1090[ 1 0,021 20 0, [1090 , 1190[ 2 0,042 22 0, [1190 , 1290[ 13 0,271 35 0 , [1290 , 1390[ 8 0,167 43 0, [1390 , 1490[ 5 0,104 48 1, N =

3.2 - Represente graficamente os dados através de um histograma, do polígono de frequências e do gráfico das frequências relativas acumuladas. Histograma e polígono de frequências:

Gráfico das frequências relativas acumuladas:

3.3 - Determine a média e a variância dos dados simples. Para dados simples vamos trabalhar com os 48 dados tal qual: Média:

  1. 129 , 92 48

xi x

Variância:

( ) ( ) ( )

+ + + + + + − ×

∑ − ×

2 2 2 n

x n x s

= 48. 565 , 202

3.4 - Determine a média, a mediana, a moda e a variância dos dados agrupados. Para trabalhar com dados agrupados temos que partir do pressuposto de que, dentro de cada classe, os valores se encontram distribuídos uniformemente. Partindo desse pressuposto resulta que, a média dos valores de cada classe, é o valor médio dessa classe. Assim, temos: Classe i Fi CumFi fi Cumfi Ci

[790 , 890[ 11 11 0 , 228 48

[890 , 990[ 8 19 0 , 167

[990 , 1090[ 1 20 0 , 021

[1090 , 1190[ 2 22 0 , 042

[1190 , 1290[ 13 35 0 , 271

[1290 , 1390[ 8 43 0 , 167

[1390 , 1490[ 5 48 0 , 104

N =48 1

Média:

× + × + + × + ×

×

n

F C

x i i

Mediana: N / 2 = 48 / 2 = 24 , portanto a classe mediana é a classe 5 ( ) (^1001). 205 , 50 0 , 271

inf 1 × =

× = +

= + −^ h f

Cumf Me L i

i i

L inf (^) i► Fronteira inferior da classe que contém a mediana Cumf (^) ( i − 1 ) ► Frequência acumulada da classe anterior à classe que contém a mediana h ► Amplitude do intervalo de classe que contém a mediana

Aula 15/10/

Exercício 1 Ao fim de um dia de colheita de ervilhas analisaram-se 80 vagens escolhidas ao acaso e contou-se o número de ervilhas em cada uma. Os resultados foram reunidos no seguinte quadro.

Nº de Ervilhas por vagem Frequência Absoluta 1 2 2 4 3 21 4 18 5 10 6 4 7 1

a) Complete o quadro de distribuição de frequências com as frequências relativas e as frequências acumuladas. (diapositivo seguinte) Nº de ervilhas

Frequência Frequência Frequência Frequência por Absoluta Relativa Absoluta Relativa vagem Acumulada Acumulada ( Fi ) ( fi = Fi / N ) ( cumFi = SFi ) ( cumfi = Sfi ) 1 2 0,025 2 0, 2 6 0,075 8 0, 3 20 0,250 28 0, 4 24 0,300 52 0, 5 12 0,150 64 0, 6 12 0,150 76 0, 7 4 0,050 80 1, N = 80 1,

b) Construa o diagrama de barras e o gráfico das frequências absolutas acumuladas. Gráfico de Barras

0

5

10

15

20

25

0 1 2 3 4 5 6 7 8 Nº de ervilhas por vagem

Frequência Absoluta

Gráfico de Frequência Absoluta Acum ulada

0

10

20

30

40

50

60

70

80

90

-3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11 Nº de ervilhas por vagem

Freq. Absoluta Acumulada

Dados Quantitativos (numéricos) Dados Simples Dados Agrupados

  • Como foi referido anteriormente, o tratamento dos dados de modo agrupado tanto se destina a variáveis discretas como a variáveis contínuas.
  • Tanto para construir tabelas de frequências como gráficos, o tratamento dos dados agrupados compreende 2 fases: a definição das classes e a contagem dos valores pertencentes a cada classe.

Dados Quantitativos (numéricos) Dados Agrupados – Definição das classes 1ª Fase:

  • As classes são constituídas por intervalos e limitadas pelos chamados “ limites das classes ”.
  • O número de classesm ” a estabelecer não é rígido e deve estabelecer um compromisso entre não perder informação (fazendo poucas classes) e não conseguir perceber o que se passa dentro dos dados (fazendo muitas classes).
  • O número de classes ( m ) deve obedecer a algumas regras:  Deve situar-se entre 4 e 15 ;  Nenhuma classe deverá ter frequência nula ;  Os pontos médios de cada classe deverão ser de cálculo rápido.  A regra de Sturges aponta para: log 2

log 1

N

m ≈ + ou m ≈ 1 + 3 , 32 x log N , sendo N o número

de valores (observações).

  • Consideremos Ij como sendo o j -ésimo intervalo de classe das m classes existentes (com j = 1, 2, 3, …, m ).
  • Não pode haver intercepção entre classes I (^) jIk ={ }com jk
  • O domínio da variável, D , tem que estar contido no conjunto união de todos os intervalos.
  • Os m intervalos de classe são definidos assim: I (^) jIk ={^ } com l (^) 0 < min( xi )= x ( 1 ) elm >max( xi )= x ( N )[nota: x 1 ► 1º valor colhido; x (1) ► 1º valor depois de ordenados]
  • A j -ésima classe terá de amplitude ( hj ) dada por hj = lj- lj-1 , com j= 1, 2 , …, m.
  • As classes devem ter, sempre que possível, amplitudes constantes.
  • O ponto médio da classe j é dado por 2

j 1 j j

I I

C

− , Cj é a média aritmética entre os valores extremos das classes.

  • Nalguns casos é necessário considerar que todos os valores de uma classe estão concentrados no ponto médio dessa classe.

Dados Quantitativos (numéricos) Dados Agrupados – Contagem dos valores

2ª Fase:

  • Uma vez estabelecidas as classes contam-se as observações da variável que caem dentro de cada classe.
  • Essa contagem conduz à determinação das frequências absolutas de cada classe, Fj , e

consequentemente às frequências relativas, Fj , pois N

F

f j j =^ com^ j^ = 1, 2, …,^ m.

Dados Quantitativos (numéricos) Dados Agrupados – Gráficos

  • Histograma : é formado por uma sucessão de rectângulos adjacentes, tendo cada um por base o intervalo da respectiva classe e por altura a respectiva frequência , absoluta ou relativa, dividida pela amplitude do intervalo dessa classe.
  • Se os intervalos possuírem a mesma amplitude pode tomar-se a altura dos rectângulos igual (ou proporcional) à frequência de ocorrência dos valores da variável que pertencem a cada classe.
  • Polígono de frequências : é um gráfico de linhas , as quais unem a frequência de cada classe referida ao respectivo ponto médio.

0

2

4

6

8

10

12

[150-180[ [180-210[ [210-240[ [240-270[ [270-300[ [300-330[ [330-360[

Frequência Absoluta

Colesterol (mg/ml)

Histograma e Polígono de Frequências

Frequência Relativa Acumulada

0

0,

0,

0,

0,

1

1,

120 150 180 210 240 270 300 330 360 390 420 450 480 Colesterol (m g/m l)

Freq. Relativa Acumulada

Dados Quantitativos (numéricos) Medidas Descritivas

  • As Medidas Descritivas dividem-se em: o Medidas de localização : sumariam (resumem) os dados, dando uma ideia de algumas das suas características. o Medidas de dispersão : medem a variação existente nas observações e complementam a informação das medidas anteriores. o Medidas de assimetria : informam se uma distribuição de frequência é enviesada, deformada ou assimétrica. o Medidas de curtose : medem o grau de achatamento de uma distribuição em relação a uma distribuição padrão.

Dados Quantitativos (numéricos) Medidas Descritivas – Medidas de localização

  • Estas medidas têm o nome de “ parâmetro ” ( letra grega ) quando se referem a populações e “ estatísticas ” ( letra romana ) quando se referem a amostras.
  • As medidas de localização podem ser de duas naturezas: o Medidas de tendência central (média, mediana e moda); o Medidas de tendência não central ou quantis.

Aula 17/10/

Medidas de Localização - Medidas de tendência central

  • Média : corresponde ao “centro de gravidade” das observações. É fácil de calcular e baseia- se na totalidade das observações. Por esse motivo é muito sensível a valores extremos.  O cálculo da média só é legítimo quando os valores em causa são da mesma ordem de grandeza.
  • O cálculo da média depende do tipo de dados: dados simples (variáveis discretas ou contínuas) ou dados agrupados (variáveis discretas ou contínuas).  Com N igual ao número de observações (dados simples) e m o número de classe (dados agrupados), vem:

 Dados Simples : N

x x

N i

i = =^1 com i =1, …, N

 Dados agrupados : = ∑

=

= m j

j j

m j

j j f x N

Fx x 1

1 com j =1, …, m

  • Para os dados agrupados por classes, xj corresponde ao ponto médio da classe j (por vezes representado c j )
  • A Mediana é o valor da variável que tem, depois de ordenadas, acima e abaixo , o mesmo número de observações depois de ordenadas.

 A mediana ocupa o lugar central na sucessão dos valores ordenados tornando-se insensível à existência de valores extremos.  A mediana pode ser determinada graficamente no gráfico das Frequências Relativas Acumuladas ( cumfi = 50%) ou através do Histograma (2 áreas iguais).

  • Para calcular algebricamente a mediana tem que se atender ao tratamento da variável (dados simples ou agrupados):  Dados simples:

 Nº de observações ímpar =∑

=

= m j j j

m j j j f x N

Fx x 1

1

 Nº de observações par 2

( 2 )^ + ( 2 + 1 )

xN x N Me

 Dados Agrupados:

h F

cumF Me l i

i N inf^2 −^1 x

  • A moda de um conjunto de dados é o valor com maior frequência (variáveis qualitativas ou quantitativas).  Pode não haver moda , haver uma só moda ou mais do que uma moda.  Se os dados forem tratados de modo não agrupado (dados simples) a moda é o valor da variável com maior número de observações.  Se os dados forem tratados de modo agrupado, a classe modal é aquela que tem maior frequência absoluta.  Por diferença de frequências absolutas

 h d d

d Mo l ×

1 2

1 inf

l inf – limite inferior da classe mediana; cumF i-1 – freq. abs. acum. Até à classe mediana; Fi – freq. Abs. da classe mediana; h – amplitude da classe mediana.

d 1 – diferença entre as freq. Abs. das classes modal e da anterior; d 2 – diferença entre as freq. Abs. das classes modal e da seguinte.

m  nº de classes

  • Amplitude totalAt = máx ( xi ) - mín ( xi ) = x ( N ) - x (1)
  • Amplitude Interquartílica - AIQ = Q 3 - Q 1
  • Amplitude Semi-interquartílica - ASIQ = ( Q 3 - Q 1 ) / 2
  • Amplitude Percentílica (amplitude dos 90% centrais) ― AP = P 95 - P 5
  • Desvio Médio :

 Dados simples  N

x x d

N i i

= =^1

 Dados agrupados  N

F x x d

m j j i

= =^1

  • Variância não corrigida :

 Dados simples 

( )

N

N

x x

N

x x s

N i

N i

i i

N i

i

= = 1

2

2 1 1

2 2

 Dados agrupados ―

( )

N

Fx N x

N

N

Fx Fx

N

F x x s

m j

j j

m j

m j

j j j j

m j

j j ∑^ −

= = 1

2 2 1

2

2 1 1

2 (^2) ,

com j = 1, 2, …, m, (o nº de classes)

  • Variância corrigida (utilizada em inferência estatística):

 Dados simples 

( )

1 1

2

2 1 1

2 2 −

=

n

n

x x

n

x x s

n i

n i

i i

n i

i

 Dados agrupados ―

( )

1 1 1

2 2 1

2

2 1 1

2 2 −

=

n

Fx N x

n

N

Fx Fx

n

F x x s

m j

j j

m j

m j

j j j j

m j

j j

  • Desvio Padrão: Desvio Padrão =+ variância
  • Diagrama de Extremos e Quartis  É uma representação gráfica que reúne informação sobre:  Uma medida de tendência central: a mediana representada por uma linha ou pequeno quadrado;  A dispersão ou variabilidade: através do 1º e 3º quartis representados pelos limites de um rectângulo (amplitude interquartílica – 50% das observações);  Extremos: valores mínimo e máximo, unidos por 2 segmentos de recta aos valores do 1º e 3 quartis, respectivamente.  Ajuda a analisar a dispersão/concentração dos valores de uma variável e comparação de 2 conjuntos de dados.

Medidas de dispersão - Medidas de dispersão relativa

  • O coeficiente de variação é a medida de dispersão relativa que mede a dispersão dos dados em relação à média. % x

s cv = × 100

Continuação do Exercício 1 c) Calcule a média, a mediana e a moda.

s – desvio padrão da amostra; x - média amostral.

Para os dados agrupados por classes, xj corresponde ao ponto médio da classe j (por vezes representado Cj )

Média : 4 , 125 80

x =^2 ×^1 +^6 ×^2 +^20 ×^3 +...+^12 ×^6 +^4 ×^7 = ervilhas

Mediana : 4 2

Me = x (^80 /^2 )^ + x (^80 /^2 +^1 ) = x (^40 )^ + x (^41 )= + = ervilhas

Moda : Mo = 4 ervilhas

d) Determine o desvio padrão e o coeficiente de variação.

( ) 1 , 40 80

s = ervilhas

cv = × =

Desvio Padrão calculado através dos desvios:

Desvio Padrão calculado através da 2ª expressão:

Continuação do Exercício 2 c) Considerando os dados agrupados, qual o valor mais frequente da variável?

Mo 30 222 mg / ml ( 10 8 ) ( 10 7 )

210 × =

d) Calcular a média e o desvio padrão dos dados simples e dos dados agrupados?

Dados simples Dados agrupados Média Desvio Padrão Média Desvio Padrão 239,58 50,40 238,29 51,

e) Construa o Diagrama de Extremos e Quartis.

Aula 22 e 24/10/

TEORIA DAS PROBABILIDADES

Fenómenos Probabilísticos

  • Quando se estudam fenómenos há interesse em prever o seu comportamento.
  • Os fenómenos podem dividir-se em dois tipos: o Determinísticos (previsíveis com exactidão); o Probabilísticos ou estocásticos (sem relação funcional entre as variáveis independentes e dependentes).
  • São estes últimos que interessam à estatística.
  • Os fenómenos probabilísticos são impossíveis de prever e por isso ditos incertos ou ligados ao acaso. Por esse motivo se dizem fenómenos aleatórios.

Experiência Aleatória

  • Uma experiência aleatória é todo o procedimento de observação do resultado de um fenómeno aleatório que, sendo imprevisível, pode ser diferente de cada vez que o mesmo é executado em iguais condições.
  • Uma experiência aleatória pode ser caracterizada por: o Poder ser repetida um grande número de vezes nas mesmas condições; o Não poder garantir o resultado de uma experiência futura embora se possa enunciar o conjunto dos resultados possíveis ; o Haver regularidade no conjunto dos dados quando a experiência é repetida inúmeras vezes.
  • Da regularidade enunciada resulta que a frequência relativa de cada um dos resultados tenda a estabilizar quando a experiência aleatória é repetida inúmeras vezes.
  • A teoria das probabilidades e os modelos probabilísticos foram desenvolvidos apoiados nessa característica para explicar os fenómenos aleatórios e dar uma indicação da probabilidade da sua ocorrência.

Algumas definições

  • Espaço de Resultados Ω (ou Espaço Amostra) é o conjunto de todos os resultados possíveis de uma experiência aleatória. o Ω pode ser discreto ou contínuo (exemplos).
  • Acontecimento é todo o subconjunto de Ω. o Acontecimento elementar, impossível, certo, reunião, intercepção , …(dar exemplos). o Acontecimentos disjuntos , incompatíveis ou mutuamente exclusivos (diagrama de Venn). o Acontecimento contrário ou complementar e Acontecimento diferença (diagrama de Venn).

O que é a Probabilidade?

  • A probabilidade de um acontecimento é um valor numérico que traduz o “nível de certeza” da ocorrência desse acontecimento.
  • Quando um acontecimento é impossível tem probabilidade ZERO.
  • Quando um acontecimento é certo tem probabilidade UM.
  • A probabilidade de ocorrência de um acontecimento está entre 0 e 1.

Definição de Probabilidade

  • A probabilidade de um acontecimento A é o quociente entre o número de resultados favoráveis a esse acontecimento e o número total de resultados possíveis, desde que equiprováveis.

númerototaldecasos possíveis

númerodecasosfavoráveisaA P(A) =

Exemplo: Qual a probabilidade de tirar uma carta de paus num baralho de cartas? O número de casos favoráveis é 13. O número de casos possíveis é 52.

0 , 25 52

P(A) = =

Definição Frequencista de Probabilidade

  • Quando uma experiência aleatória se repete muitas vezes, a frequência relativa de um acontecimento dessa experiência dá-nos o valor da sua probabilidade. o Se numa dada experiência aleatória repetida n vezes, o acontecimento A tiver frequência absoluta nA , a sua frequência relativa é dada por: fA = nA / n o Se a experiência for repetida muitas vezes a fA tende para a probabilidade de A: P( A )= limn  +fA
  • Pediu-se ao Excel para sortear aleatoriamente 10.000 vezes os números 1 e 2 n fA n fA n fA 1 1,000 40 0,525 700 0, 2 1,000 50 0,440 800 0, 3 0,667 60 0,467 900 0, 4 0,500 70 0,471 1000 0, 5 0,400 80 0,450 2000 0, 6 0,500 90 0,467 3000 0, 7 0,571 100 0,460 4000 0, 8 0,500 150 0,507 5000 0, 9 0,444 200 0,495 6000 0, 10 0,500 300 0,517 7000 0, 15 0,333 400 0,520 8000 0, 20 0,400 500 0,528 9000 0, 30 0,500 600 0,528 10000 0,

Propriedades das Probabilidades

  • Seja A um acontecimento do espaço de resultados Ω : a cada valor de A associa-se um valor real P(A) em Função P(A) 

( i)

fAi

Ai (^) → PA

o Propriedades:  P(A)≥0 , ou seja, nunca toma valores negativos. O número de casos favoráveis a A não pode ser negativo;  P(A)≤1 , ou seja, nunca toma valores superiores a P(Ω) que é 1. O número de casos favoráveis a A não pode ser maior que o número de casos possíveis;  P(A)=1-P(A) , ou seja a probabilidade de “não ser A” (ou probabilidade do “complementar de A”) é a probabilidade total [P(Ω) que é 1] deduzida da probabilidade de A;  P()=0 , ou seja, a probabilidade de um acontecimento que não pode acontecer (número de casos possíveis igual a 0) é =0.  ABP(A) ≤ P(B) , ou seja, a probabilidade de um acontecimento que está contido noutro acontecimento, terá uma probabilidade menor ou igual;  P(A-B) = P(A\B) = P(A) - P(AB) = P(AB) - P(B) , (A-B) representa o acontecimento que corresponde ao que fica de A depois de perder a parte que o acontecimento B pode tirar a A: a parte comum aos dois (A∩B).

Variação da Frequência relativa do "1" com o número de lançamentos

0,

0,

0,

0,

1 ,

(^1 4 7 10 30 60) n 90 200 500 800 2000 5000 8000

fA fA