Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Estatística Básica, Notas de estudo de Engenharia Naval

estatistica

Tipologia: Notas de estudo

2012

Compartilhado em 11/10/2012

irislaine-goncalves-5
irislaine-goncalves-5 🇧🇷

5

(2)

1 documento

1 / 66

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Universidade de Pernambuco – Escola Politécnica -Estatística Básica - Profª. Mônica Barradas 1
ESTATÍSTICA
BÁSICA
(Profª Mônica Barradas)
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42

Pré-visualização parcial do texto

Baixe Estatística Básica e outras Notas de estudo em PDF para Engenharia Naval, somente na Docsity!

ESTATÍSTICA

BÁSICA

(Profª Mônica Barradas)

ÍNDICE

    1. Introdução Geral à Compreensão Estatística........................................................................
    1. Distribuição de Freqüência.................................................................................................
    1. Medidas de Centralidade ou de Tendência Central............................................................
    1. Medidas de Assimetria e Curtose.......................................................................................
    1. Principais Tipos de Representação Gráfica........................................................................
    1. Medidas de Dispersão ou de Variabilidade........................................................................
    1. Correlação e Regressão.......................................................................................................
    1. Introdução à Amostragem...................................................................................................
    1. Probabilidade......................................................................................................................
    1. Variáveis Aleatórias Discretas ........................................................................................
    1. Distribuições de Variáveis Aleatórias Discretas..............................................................
    1. Distribuições de Variáveis Aleatórias Contínuas............................................................

2.2 Onde se aplica a Estatística na Engenharia?

As aplicações concentram-se fundamentalmente em dois campos de ação: o Controle Estatístico do Processo e o Controle Estatístico da Qualidade.

Definições segundo JURAN:

  1. Processo: é qualquer combinação específica de máquinas, ferramentas, métodos, materiais e/ou pessoas empregadas para atingir qualidades específicas num produto ou serviço. Estas qualidades são chamadas de “características de qualidade”, que podem ser uma dimensão, propriedade do material, aparência, etc.
  2. Controle: é um ciclo de feedback (realimentação) através da qual medimos o desempenho real, comparando-o com o padrão, e agimos sobre a diferença.
  3. Controle Estatístico do Processo (CEP): aplicação de técnicas estatísticas para medir e analisar a variação nos processos.
  4. Controle Estatístico da Qualidade (CEQ): aplicação de técnicas estatísticas para medir e aprimorar a qualidade dos processos. CEQ inclui CEP, ferramentas de diagnóstico, planos de amostragem e outras técnicas estatísticas. Segundo FEIGENBAUM, provavelmente, mais importante do que os próprios métodos estatísticos têm sido o impacto causado sobre o pensamento industrial pela filosofia que representam. O “ponto de vista estatístico” resume-se essencialmente nisto: a variabilidade na qualidade do produto deve ser constantemente estudada:

1. Dentro de lotes de produto; 2. Em equipamentos de processo; 3. Entre lotes diferentes de um mesmo produto; 4. Em características críticas e em padrões;

  1. Em produção piloto, no caso de novos produtos.

Esse ponto de vista, que enfatiza o estudo da variação, exerce efeito significativo sobre certas atividades no controle da qualidade. Ainda segundo FEIGENBAUM, cinco ferramentas estatísticas tornaram-se amplamente utilizadas nas tarefas de controle da qualidade:

  1. Distribuição de freqüências;
  2. Gráficos de controle;
  3. Aceitação por amostragem;
  4. Métodos especiais;
  5. Confiabilidade.

Na abordagem do papel dos métodos estatísticos no gerenciamento de processos de produção, KUME também faz referência à variabilidade. Diz que, “(...) independentemente dos tipos de produtos ou de métodos de produção usados, as causas de produtos defeituosos são universais. Variação, esta é a causa.”, “Variações nos materiais, na condição dos equipamentos, no método de trabalho e na inspeção são as causas dos defeitos.” Ainda segundo KUME, “(...) os métodos estatísticos são ferramentas eficazes para a melhoria do processo produtivo e redução de seus defeitos”.

O primeiro passo na busca da verdadeira causa de um defeito é a cuidadosa observação do fenômeno do defeito. Após tal observação cuidadosa, a verdadeira causa torna-se evidente.

As ferramentas estatísticas, diz KUME, conferem objetividade e exatidão à observação. As máximas da forma estatística de pensar são:

  1. Dar maior importância aos fatos do que os conceitos abstratos;
  2. Não expressar fatos em termos de intuição ou idéias. Usar evidências obtidas a partir de resultados específicos da observação;
  3. Os resultados da observação, sujeitos como são a erros e variações, são partes de um todo obscuro. A principal meta da observação é descobrir esse todo obscuro;
  4. Aceitar o padrão regular que aparece em grande parte dos resultados observados como uma informação confiável.
  5. O conhecimento dominado ato o presente momento não é nada mais que um embasamento para hipóteses futuras. Uma vez que isso tenha sido compreendido, a forma de pensar mencionada pode ser aproveitada para aprofundar a compreensão do processo produtivo e dos meios para melhorá-lo.

2.3 Definições Básicas da Estatística

1) FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar, cujo estudo seja possível da aplicação do método estatístico. São divididos em três grupos: Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma simples observação. A estatística dedica-se ao estudo desses fenômenos.

Fenômenos individuais : são aqueles que irão compor os fenômenos de massa. Fenômenos de multidão : quando as características observadas para a massa não se verificam para o particular.

2) DADO ESTATÍSTICO: é um dado numérico e é considerado a matéria-prima sobre a qual iremos aplicar os métodos estatísticos. 3) POPULAÇÃO: é o conjunto total de elementos portadores de, pelo menos, uma característica comum. 4) AMOSTRA: é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre a essa população. 5) PARÂMETROS: São valores singulares que existem na população e que servem para caracterizá-la.Para definirmos um parâmetro devemos examinar toda a população. 6) ESTIMATIVA: é um valor aproximado do parâmetro e é calculado com o uso da amostra. 7) ATRIBUTO: quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo. 8) VARIÁVEL: É, convencionalmente, o conjunto de resultados possíveis de um fenômeno.

Variável Qualitativa : Quando seus valores são expressos por atributos Variável Quantitativa : Quando os dados são de caráter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura numérica, trata-se, portanto da estatística de variável e se dividem em: Variável Discreta ou Descontínua: Seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens. Ex: Nº de alunos presentes às aulas de introdução à estatística econômica no 1º semestre de 1997: mar = 18, abr = 30 , mai = 35 , jun = 36.

e. Realizar “análises de sensibilidade” variando estimativas amostrais importantes e outros fatores na análise e observando o efeito sobre as conclusões finais.

5. Rever as conclusões da análise de dados para determinar se o problema técnico original foi avaliado ou se foi modificado para se enquadrar nos métodos estatísticos. 6. Apresentar os resultados: a. Estabelecer as conclusões de forma significativa, enfatizando os resultados nos termos do problema original, e não na forma dos índices estatísticos usados na análise; b. Apresentar graficamente os resultados quando apropriado. Usar métodos estatísticos simples no corpo do relatório e colocar as análises complexas em um apêndice. 7. Determinar se as conclusões do problema específico são aplicáveis a outros problemas ou se os dados e cálculos poderiam ser úteis para outros problemas.

3. ESTATÍSTICA DESCRITIVA

Viu-se anteriormente um roteiro para coleta e análise de dados. As séries de dados, basicamente, são provenientes de duas fontes: os “dados históricos” e os “dados de experimentos planejados”.

Os dados históricos são séries de dados existentes e, em geral, analisar estatisticamente esses dados é mais econômico (tempo e despesas) se comparado com dados obtidos a partir de experimentos planejados. Mesmo com uma análise estatística complexa, em geral, pouco sucesso se obtém com tais dados. No controle de um processo, algumas razões para esse insucesso ocorrer são: 1.As variáveis do processo podem estar altamente correlacionadas entre si, tornando impossível distinguir a origem de um determinado efeito. 2.As variáveis do processo podem ter sido manipuladas para controlar o resultado do processo. 3.As variáveis do processo têm abrangência pequena em relação ao intervalo de operação do processo. 4.Outras variáveis que afetam o resultado do processo podem não ter sido mantidas constantes, e serem as reais causadoras dos efeitos observados no processo. Por essas razões, recomenda-se a análise de séries de dados históricos apenas para a indicação de variáveis importantes a serem observadas em um experimento planejado.

Os dados de experimentos planejados são coletados com o objetivo estudar e analisar um problema. São dados reunidos em diversas séries de variáveis com aparente importância em um processo, enquanto se mantém constantes (com valores registrados) todas as outras variáveis que possivelmente poderiam alterar o resultado. Aqui tratar-se-á de métodos práticos de organização de dados. Segundo SPIEGEL4: “A parte da estatística que procura somente descrever e analisar um certo grupo, sem tirar quaisquer conclusões ou inferências sobre um grupo maior, é chamada estatística descritiva ou dedutiva. ” Freqüentemente dois ou mais métodos de organização são utilizados para descrever com clareza dados coletados. Alguns desses métodos são: gráficos dos dados na ordem cronológica, distribuição e histogramas de freqüência, características amostrais, medidas de tendência central e medidas de dispersão.

4. SÉRIES ESTATÍSTICAS

TABELA: Resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática.

De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar:

  • um traço horizontal ( - ) quando o valor é zero;
  • três pontos ( ... ) quando não temos os dados;
  • zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada;
  • um ponto de interrogação (? ) quando temos dúvida quanto à exatidão de determinado valor.

Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. "Salientamos que nestes documentos as tabelas não serão abertas devido a limitações do editor html".

É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie.

Séries Homógradas : são aquelas em que a variável descrita apresenta variação discreta ou descontínua. Podem ser do tipo temporal, geográfica ou específica.

a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de histórica ou evolutiva.

ABC VEÍCULOS LTDA.

Vendas no 1º bimestre de 2002

PERÍODO UNIDADES VENDIDAS *

JAN/2002 2 0 FEV/2002 1 0 TOTAL 3 0

  • Em mil unidades

.

CAPÍTULO 2 – DISTRIBUIÇÃO DE FREQUÊNCIAS

É uma ferramenta estatística apropriada para a apresentação de grandes massas de dados numa forma que torna mais clara a tendência central e a dispersão dos valores ao longo da escala de medição, bem como a freqüência relativa de ocorrência dos diferentes valores.

Quando da análise de dados, é comum procurar conferir certa ordem aos números tornando- os visualmente mais amigáveis. O procedimento mais comum é o de divisão por classes ou categorias, verificando-se o número de indivíduos pertencentes a cada classe.

É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores).

Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados.

Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

ROL: Tem-se um rol após a ordenação dos dados (crescente ou decrescente).

Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

Distribuição de frequência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seus valores. Para um tabela de tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. Veja exemplo abaixo:

Tabela 1

Dados Frequência 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 Total 20

Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe.

Tabela 2

Classes Frequências 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20

2.1 Elementos de uma Distribuição de Freqüência com classes

CLASSE : são os intervalos da variável simbolizada por i e o número total de classes simbolizada por k. Ex: na tabela anterior k =5 e 49 |------- 53 é a 3ª classe, onde i =3. Para a construção de uma tabela a partir de um dado bruto calcularemos o k através da Regra de

Sturges" k=1+3,3logn (para n<25) ou k= √ n (para n>25).

LIMITES DE CLASSE : são os extremos de cada classe. O menor número é o limite inferior de classe (li) e o maior número, limite superior de classe (Ls). Ex: em 49 |--- 53 Li 3 = 49 e Ls 3 = 53. O símbolo |--- representa um intervalo fechado à esquerda e aberto à direita. O dado 53 não pertence à classe 3 e sim a classe 4 representada por 53 |--- 57.

AMPLITUDE DO INTERVALO DE CLASSE : é obtida através da diferença entre o limite superior e inferior da classe simbolizada por a = Ls - li. Ex: na tabela anterior a = 53 - 49 = 4. Obs: Na distribuição de frequência c/ classe o c será igual em todas as classes. Para a construção de uma tabela a partir de um dado bruto temos: a=Ls-Li/K

AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o valor máximo e o valor mínimo da amostra. Onde At = Xmax - Xmin. Em nosso exemplo At = 60 - 41 = 19.

PONTO MÉDIO DE CLASSE : é o ponto que divide o intervalo de classe em duas partes iguais. Ex: em 49 |------- 53 o ponto médio x 3 = (53+49)/2 = 51, ou seja, x 3 =(Li+Ls)/2.

Obs: Agrupar os dados em classes é uma importante ferramenta para resumir grandes massas de dados brutos, no entanto acarreta perda de alguns detalhes.

Frequências simples ou absolutas (fi): são os valores que realmente representam o número de dados de cada classe. A soma das frequências simples é igual ao número total dos dados da distribuição.

Frequências relativas (fr): são os valores das razões entre as frequências absolutas de cada classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 ( %).

Frequência simples acumulada de uma classe (Fi): é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma determida classe.

Frequência relativa acumulada de um classe (Fr): é a frequência acumulada da classe, dividida pela frequência total da distribuição.

CAPÍTULO 3 – MEDIDAS DE CENTRALIDADE

Há várias medidas de tendência central, entretanto nesta apostila, será abordado o estudo de apenas aquelas que são mais significativas. As mais importante medidas de tendência central são: a média aritmética, média aritmética para dados agrupados, média aritmética ponderada, mediana, moda.

3. Medidas de Centralidade

3.1 Média Aritmética=

Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua utilização, pois pode dar uma imagem distorcida dos dados.

A média possui uma particularidade bastante interessante, que consiste no seguinte: se calcularmos os desvios de todas as observações relativamente à média e somarmos esses desvios o resultado obtido é igual a zero.

A média tem uma outra característica, que torna a sua utilização vantajosa em certas aplicações: Quando o que se pretende representar é a quantidade total expressa pelos dados, utiliza-se a média.

Na realidade, ao multiplicar a média pelo número total de elementos, obtemos a quantidade pretendida.

É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.

...onde xi são os valores da variável e n o número de valores.

. Dados não-agrupados:

Quando desejamos conhecer a média dos dados não-agrupados em tabelas de frequências, determinamos a média aritmética simples.

Exemplo: Os dados a seguir apresentam leituras de concentração de um processo químico feitas a cada duas horas 10, 14, 13, 15, 16, 18 e 12, temos, uma concentração média de:

Desvio em relação à média: é a diferença entre cada elemento de um conjunto de valores e

a média aritmética, ou seja:.. di = Xi -

Como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada , dada pela fórmula:

..xi. ..fi. ..xi.fi. 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 total 34 78

onde 78 / 34 = 2,3 erros

Com intervalos de classe

Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula:

..onde Xi é o ponto médio da classe.

Exemplo: Calcular o número de molas fora de conformidade, em cada batelada de produção, com um tamanho igual a 40 conforme a tabela abaixo.

Nº de molas frequência = fi ponto médio = xi ..xi.fi. 50 |---- 54 4 52 208 54 |---- 58 9 56 504 58 |---- 62 11 60 660 62 |---- 66 8 64 512 66 |---- 70 5 68 340 70 |---- 74 3 72 216 Total 40 2.

Aplicando a fórmula acima temos: 2.440 / 40.= 61. logo... = 61 molas

MODA

É o valor que ocorre com maior frequência em uma série de valores.

Mo é o símbolo da moda.

Desse modo, a força modal de remoção para um conector é a força mais comum, isto é, a força de remoção medida em um teste de laboratório para um conector.

.

A Moda quando os dados não estão agrupados

  • A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete.

Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.

  • Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros.

Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.

  • .Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais.

Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal.

. A Moda quando os dados estão agrupados

a) Sem intervalos de classe

Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior frequência.

Exemplo: Qual a temperatura mais comum medida no mês abaixo:

Temperaturas Frequência 0º C 3 1º C 9 2º C 12 3º C 6

Resp: 2º C é a temperatura modal, pois é a de maior frequência.

MEDIANA

A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.

Símbolo da mediana: Md

. A mediana em dados não-agrupados

Dada uma série de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 }

De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }

O valor que divide a série acima em duas partes iguais é igual a 9 , logo a Md = 9.

Método prático para o cálculo da Mediana

Se a série dada tiver número ímpar de termos:

O valor mediano será o termo de ordem dado pela fórmula :

O elemento mediano será:.. EMd = n + 1 / 2

Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }

1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }

n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a mediana.

A mediana será o 5º elemento, ou seja, Md = 2

Se a série dada tiver número par de termos:

O elemento mediano será:.. EMd = n / 2

Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }

1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }

n = 10 logo a fórmula ficará: :.. EMd = 10 / 2 = 5

Será na realidade (5º termo + 6º termo) / 2

A mediana será = (2+3) / 2, ou seja, Md = 2,5. A mediana no exemplo será a média aritmética do 5º e 6º termos da série.

Notas:

  • Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série.
  • Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série.
  • Em um série a mediana, a média e a moda não têm, necessariamente, o mesmo valor.
  • A mediana, depende da posição e não dos valores dos elementos na série ordenada. Essa é uma da diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos). Vejamos:

Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10

Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10

Isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma.

.

A mediana em dados agrupados

a) Sem intervalos de classe

Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada.

Exemplo conforme tabela abaixo:

Variável xi Frequência fi Frequência acumulada 0 2 2 1 6 8 2 9 17 3 13 30 4 5 35 Total 35 -

Quando o somatório das frequências for ímpar o valor mediano será o termo de ordem dado pela fórmula :.