


















Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
aula discursiva, preparativa para as provas de AV1 - AV2
Tipologia: Exercícios
1 / 26
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Você está na unidade estatística inferencial. Conheça aqui a definição sobre probabilidade e como calculá-la, tanto para eventos dependentes quanto independentes. Entenda, ainda, as distribuições gaussianas e suas definições e a distribuição dos dados, além do intervalo de confiança ou aqueles dois pontos percentuais para mais ou para menos nas pesquisas eleitorais. Saiba o que significa o teste de hipótese e como podemos utiliza-los na bioestatística. Bons estudos!
1.1 Definição de probabilidade
Alguns elementos relacionados à bioestatística fazem parte do nosso cotidiano. Certamente, se alguém perguntar a você o que é probabilidade, você vai saber o que significa esta palavra, porém, se pedirem para você explicar o que é, você saberia? A probabilidade, por definição, é um ramo da matemática no qual é possível calcular a chance que ocorra determinado evento (TAYLOR; BLAIR, 2013). Com o uso da probabilidade, é possível saber qual a chance de se ter cara ou coroa ao lançar uma moeda, por exemplo. A probabilidade de que saia cara é de e a probabilidade de sair coroa é de. Outra maneira na qual podemos representar é falando que a probabilidade de sair cara ou coroa ao lançar a moeda pra cima é de 0,5 respectivamente (FARBER; LARSON,
Se forem possíveis n eventos mutuamente exclusivos e igualmente prováveis e , se m desses eventos tiverem a característica que chamaremos A, a probabilidade de que ocorra um evento com a característica A é indicada por P(A) e é dada pela razão m/n.
Podemos, então, representar a probabilidade pela seguinte formula:
Esta formula é lida da seguinte maneira, P() pode ser lido como “a probabilidade de...”. No nosso exemplo, podemos ler como: a probabilidade de retira uma bola verde do balde. NAé o número de eventos que atende ao critério desejado (bolas verdes) e Né o número de eventos totais (todas as bolas) (TAYLOR; BLAIR, 2013). A probabilidade, na bioestatística e, principalmente, na área da saúde, estima a frequência relativa sobre os eventos que foram obtidos de uma série de dados. Ao estimar a probabilidade de ocorrer determinado evento, a
probabilidade é dada como frequência relativa, como podemos observar na tabela sobre “Frequência de pacientes infectados com protozoários intestinais”, onde podemos observar a frequência relativa dos infectados por algum protozoário intestinal e a frequência acumulada.
Tabela 1 - Frequência de pacientes com infectados protozoários intestinais. Fonte: Oliveira et al., 2018
#PraCegoVer : na imagem, vemos uma tabela de frequência de pacientes infectados por protozoários intestinais, com 4 colunas, sendo, respectivamente, de protozoários intestinais, frequência, frequência relativa e frequência relativa acumulada. Neste estudo, 256 pessoas foram investigadas para saber se estavam infectados por algum protozoário intestinal. Com base nessa amostra, podemos dizer que a probabilidade de uma pessoa, que reside nesta localidade, de estar infectado por algum protozoário intestinal é de 0,445.
A tabela “Frequência de pacientes infectados por Schistosoma mansoni e protozoários intestinais” mostra uma amostra composta por duas doenças associadas, composta por um grupo de 256 pessoas. Essa população amostral é composta por pessoas com parasitose intestinal (A), sem parasitose intestinal ( , com S. mansoni) (B) e sem S. mansoni ( ou indivíduos com mais de uma dessas característica).
Fique de olho
As probabilidades podem ser escritas como frações, números decimais (entre zero e 1) ou percentagens. Os números decimais podem ser arredondados, quando necessário, para duas ou três casas decimais. Para expressar, em porcentagem, basta multiplicar o valor decimal por
1.2 Eventos independentes
Não é raro ouvir alguém dizer que algo não tem nada a ver com outra coisa, ou que não tem nada a ver ter chovido hoje e eu ter ganhado na loteria. Neste exemplo, temos uma condição independente. Para termos um evento independente, precisamos saber se um evento é capaz de influenciar outro. Alguns exemplos podem ser claros, mas, no nosso exemplo, podemos dizer que estar infectado por parasitose intestinal e S. mansonisão eventos independentes ou não? Para sabermos se um evento é independente ou não, podemos utilizar a seguinte equação: , logo. Assim, para calcularmos se os eventos são intendentes, conforme Ferber e Larson (2015, p. 142), primeiro calcule a probabilidade do evento B, P(B). Então, calcule a probabilidade de B, dado A, P(B|A). Se os valores forem iguais, os eventos são independentes. Se P(B) ≠ P(B|A) , então A e B são eventos dependentes. Sabendo disto, temos a seguinte formula e, para este caso:
Como os resultados não são iguais, temos que o fato de ocorrer A não muda a probabilidade da ocorrência de B. Assim, os eventos são independentes
Fique de olho
Não confunda eventos independentes com eventos mutuamente exclusivos. Mutuamente exclusivos é considerado quando um evento ocorre e outro não pode ocorrer. Um exemplo é que não se pode ter cara e coroa ao mesmo tempo. Assim, esses eventos são mutuamente exclusivos e não são eventos independentes. A probabilidade de sair cara muda ao sair coroa.
Nós podemos utilizar uma regra para identificar que dois eventos podem ocorrer em sequência, que chamamos de regra da multiplicação, dada pela equação:
Nós também podemos calcular as probabilidades que envolvem ambas as doenças. Qual a probabilidade (chance) de escolher uma pessoa aleatória com parasitose intestinal (A) e com S. mansoni(B)? Com isto, temos a seguinte formula. Então, podemos ler que a probabilidade de selecionar um paciente que com parasitose intestinal (A) e com S. mansoni (B) é de 0,207 ou 20,7%. Assim, podemos determinar, também, a probabilidade de uma pessoa não estar com nenhuma doença com:
. Podemos, então, falar que, nesta população, a chance de selecionar alguém sem nenhuma doença estudada (parasitose intestinal e S. mansoni) é de 0,297 ou 29,7%. No exemplo que estamos utilizando, os eventos observados são independentes entre si, porém, se os eventos forem dependentes , a fórmula é um pouco mais elaborada e é dada pela seguinte equação:
Para podermos calcular, vamos utilizar os seguintes dados disponível na tabela 2, onde temos alunos que se inscreveram em duas residências, da mesma instituição.
Tabela 3 - Frequência de alunos de medicina que são aprovados em suas residências médicas. Fonte: Elaborado pelo autor, 2020
#PraCegoVer : Na imagem, vemos uma tabela de frequência de alunos de medicina que são aprovados em suas residências médicas. Observa-se que os dados são dependentes, em que:
Assim, , o que característica que os valores são dependentes. Sendo assim, utiliza-de a equação: , onde. Desta forma, temos a probabilidade de 0,45 ou 45% de aprovação nas residências em oftalmologia e clínica médica.
1.5 Probabilidade condicional
A probabilidade condicional é baseada em “qual a chance um evento ocorre sendo que outro evento já tenha ocorrido”. Vamos imaginar que a probabilidade de chover na cidade de São Paulo é diferente da probabilidade de no deserto do Saara. A probabilidade de chover depende da primeira condição. A probabilidade condicional é definida por Vieira (2011, p. 170) como: “a probabilidade de ocorrer determinado evento sob uma dada condição.” Farber e Larson (2015, p. 141) definem a probabilidade condicional como: “a probabilidade de um evento ocorrer, dado que outro evento já tenha ocorrido.” Em outras palavras, qual a probabilidade de um evento ocorrer sendo uma determinada condição. A probabilidade condicional pode ser expressa pela seguinte formula , onde podemos ler da seguinte maneira: qual a probabilidade de B, dado A. Outro exemplo em que nos habituamos a observar probabilidade condicional, principalmente na área da saúde, é: “quem possui a condição de obeso, possui uma probabilidade maior de ter uma condição de doença cardíaca”. Outro exemplo comum é: a condição de motorista embriagado aumenta a probabilidade da condição de acidente no trânsito em 3 ou 4 vezes. Diversas pesquisas são feitas para buscar conhecer quais probabilidades são modificadas quando uma condição é imposta. Voltando ao nosso exemplo apresentado na tabela 2, sobre a frequência de pacientes infectados porSchistosoma mansonie protozoários intestinais, qual a probabilidade que uma pessoa com parasitose intestinal também esteja infectada peloSchistosoma mansoni? Nós podemos resolver a questão da seguinte maneira: , ou seja, a probabilidade de uma pessoa já infectada por alguma parasitose intestinal e também por Schistosoma mansonié de 0,465 ou simplesmente 46,5%.
Fique de olho
No universo amostral de 256 pacientes, com a probabilidade condicional, houve uma redução para 114 pacientes. Como a probabilidade condiciona considera um evento ocorre após outro evento, temos o primeiro evento a parasitose intestinal e o segundo evento a infecção por S. mansoni. Nesse universo amostral, apenas 114 pacientes tinham alguma parasitose intestinal, sendo esse o nosso n amostral.
Outro exemplo que podemos utilizar sobre a probabilidade condicional é pensando se a probabilidade de estar com alguma parasitose intestinal é igual a probabilidade de estar infectado por S. mansoni. Para descobrir isto, pensaremos o seguinte: Em ambos os exemplos temos um universo amostra de 256 pacientes e, em ambos os casos, a probabilidade de estar infectado por S. mansoni é de 0,445 e a probabilidade de estar infectado por protozoários é de 0,465. Agora, podemos ver a relação entre as duas estimativas: . Assim, podemos afirmar que a probabilidade de ter parasitose intestinal é um pouco maior que a probabilidade de estar infectado por S. mansoni, ou podemos dizer que a probabilidade de estar infetado por parasitose intestinal 1,04 vezes maior que a probabilidade de estar infectado porS. mansoni. Se o valor apresentado fosse 2,4, poderia dizer que a probabilidade de uma pessoa ter sido infectada com parasitose intestinal seria 2,4 vezes maior, ou teria 2,4 vezes mais chance de encontrar uma pessoa infectada por parasitose intestinal queS. mansoni.
2.1 Tipos de distribuição normal
Distribuição normal uniforme (ou retangular): quando tem apenas um valor em toda a distribuição. Um exemplo onde podemos encontrar uma distribuição uniforme é quando vamos a uma sala de aula. Nela, todos os alunos têm a mesma idade ou elas são praticamente iguais. O gráfico de distribuição uniforme nos permite identificar isso. No gráfico abaixo, observamos como a linha é uniforme (FARBER; LARSON, 2015) e (VON HIPPEL, 2005).
Figura 1 - Distribuição uniforme. Fonte: Elaborado pelo autor, 2020
#PraCegoVer : Na imagem, vemos um gráfico com barras e uma linha passando horizontalmente em suas extremidades. A distribuição uniforme é considerada simétrica quando a média e mediana são valores iguais. Neste caso, ambos são 9. Distribuição normal assimétrica : quando, no gráfico de frequência, ocorre uma cauda, o que permite que ela se alongue para um dos lados. A distribuição assimétrica pode ser positiva ou negativa : Negativa : quando a cauda alonga para a esquerda. Positiva : quando a sua cauda alonga para a direita. No gráfico “Distribuição assimétrica à esquerda (negativo) e à direita (positivo)” é possível ver a cauda das distribuições:
Fonte: Elaborado pelo autor, 2020
#PraCegoVer : Na imagem, vemos um gráfico com barras que diminuem de tamanho da esquerda para direita, com uma linha horizontal em suas extremidades. O que determina um gráfico ter uma distribuição normal assimétrica é que a média e mediana são valores diferentes entre si.
2.3 Curva normal reduzida
É também conhecida como distribuição normal reduzida, distribuição normal padronizada, escore padrão ou, ainda, estatística Z. O uso da curva normal reduzida surgiu em decorrência da possibilidade de existência de uma série infinita de curvas normais, representando a distribuição normal de probabilidade, onde cada uma é definida pelos valores que a média e o desvio-padrão podem assumir para cada caso em particular. Essa particularidade faz surgir a distribuição de referência, aqui denominada distribuição normal padronizada, cuja característica fundamental é assumir que a média é igual a zero e o desvio-padrão é igual a 1. Como resultado dessa transformação aplicada a cada valor de x, temos o surgimento de uma nova variável, que é denominada Z. Essa variável mede quanto um determinado valor de xafasta da média, em unidades de desvio-padrão (SAMPAIO, 2015). É possível ver na figura que, se o valor coincide com a média, seu escore é zero. A variação estatística Z ocorre comumente no intervalo de ±3 desvio-padrão, onde, neste intervalo, incluem praticamente toda a amostra estudada, mais precisamente 99,74%.
O cálculo da estatística Z , ou escore padrão, ou curva normal reduzida, é dado pela expressão:
Onde: Z : afastamento dos valores de x em relação à média em número de desvio padrão; X : valor de qualquer variável aleatória. : média da distribuição. : desvio-padrão da distribuição. Quando Z=1, a área entre este valor e a média é de 0,3413 ou 34,13%. Já a área entre Z=±1 é de 0,6826 ou 68,26%. Suponhamos que, em uma distribuição de glicose plasmática em jejum, de homens com idade entre 30 e 39 anos, encontrou-se uma média ( ) de 100mg/dl e um desvio-padrão ( ) de 15mg/dl. Qual a proporção de pessoas com glicose plasmática entre 100mg/dl e 120mg/dl?
Fique de olho
Qual a diferença entre x e z? A variável x é conhecido como resultado bruto, cujo representa o valor da distribuição normal não reduzida ou não padrão. Já o valor de z representa o valor da distribuição normal reduzida ou padrão (FARBER; LARSON, 2015)
Para este caso basta aplicarmos a equação , onde teremos:
Agora, podemos encontrar, na tabela da curva normal, para o intervalo z=0 e z=1,33, que é igual a 0,4082 ou 40,82%.
Tabela 4 - Distribuição de frequência normal acumulada de z (área sob a curva norma de 0 a z). Fonte: SAMPAIO, 2015
#PraCegoVer : na imagem, vemos uma tabela de distribuição de frequência normal acumulada de Z, com várias colunas e linhas, cada uma com um número inserido.
Os testes estatísticos trazem uma análise inferencial sobre determinado evento. Assim, ele retira o viés subjetivo do analisador e, qualquer um que analisar o conjunto de dados, poderá obter a mesma resposta, desde que se tenha a mesma pergunta.
3.1 Intervalo de confiança
Um problema comum nas análises estatísticas é estimar parâmetros que possam auxiliar na caracterização de uma variável. Como exemplo, podemos citar a porcentagem de pacientes que se recuperam em um certo tratamento ou o tempo médio que demanda um anestésico para ter o efeito desejável. Os intervalos de confiança constituem uma série de métodos que permitem obter conclusões acerca de uma população, a partir de uma amostra representativa. O intervalo de confiança é um meio de expressar a precisão estatística de maneira útil, sob o ponto de vista estatístico. É comum pensar que o intervalo de confiança é a probabilidade e que o verdadeiro parâmetro que estamos buscando esteja dentro desse intervalo. Os intervalos de confiança são úteis porque definem um limite superior e inferior, que são consistentes com os dados do nosso estudo, porém, não nos informam de nenhuma probabilidade de se achar onde está o verdadeiro parâmetro que buscamos. Uma das utilidades dos intervalos de confiança é dar uma ideia da amplitude da dispersão ou da variabilidade das estimativas obtidas pelas amostras. Um intervalo de confiança muito grande implica na suspeição de que o resultado obtido é de baixa acurácia ou de pouca credibilidade. Já intervalos de confiança cujas amplitudes de variação são pequenas possuem maior acurácia e credibilidade (FARBER; LARSON, 2015) (TAYLOR; BLAIR, 2013). O intervalo de confiança deve conter uma probabilidade de erro, que surge do conhecimento do modelo de distribuição de frequência do fenômeno que se deseja investigar. Geralmente, os modelos biológicos se aplicam à distribuição de normalidade, que exige o conhecimento da variância e, por consequência, do desvio-padrão. Universalmente, os intervalos de confiança usados em pesquisas médicas utilizam coeficientes de 95% ou 99%, os quais nos dão a probabilidade com que o método resultará em uma resposta correta e compatível com a expectativa do pesquisador. Um coeficiente de 95% permite concluir que, se repetimos 100 vezes a mesma pesquisa, a margem de erro é de apenas 5% ou, em outras palavras, um erro a cada 20. Isto é o que se deseja em 95% do intervalo de confiança e que o verdadeiro valor da população não esteja dentro do intervalo de confiança em apenas 5%. O nível de significância (1-α) pode ser igual a 99%, 95%, 90%, entre outros. Comumente, nos artigos científicos é comum observar que o nível de significância utilizado é de 95% ou α é igual a 0,05. Ao estimarmos o parâmetro, podemos estar utilizando uma daquelas amostras dentre as 5% que geram estimativas intervalares, com erro amostrais acima do desejável. Um intervalo de confiança de 95% de segurança somente é válido quando todos os integrantes da amostra são independentes uns dos outros. Quando este princípio é violado, provoca o erro amostral, que compromete a utilização do intervalo de confiança para inferências dos parâmetros populacionais (SAMPAIO, 2015).