























Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Conceptos básicos sobre tipos de variables, cuantitativas y cualitativas, y medidas de dispersión como rango, cuartiles, varianza y desviación típica. Además, se abordan variables aleatorias discretas y continuas, y se explica la importancia de la función de densidad de probabilidad y la curva de densidad.
Qué aprenderás
Tipo: Apuntes
1 / 31
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
Población conjunto completo de individuos sobre los que deseamos obtener información Muestra parte de la población que verdaderamente estudiamos. Siempre debe ser representativa de la población objeto de estudio, sino los resultados podrían acabar en error. Individuo cada integrante de un conjunto de datos Variable cualquier característica de un individuo. Una variable puede tomar valores diferentes para individuos diferentes Parámetro cualquier característica numérica de una población Estadístico cualquier característica numérica de una muestra.
Cualitativas o categóricas naturaleza no numérica Cuantitativas o numéricas expresadas por un número Discretas sólo adoptan ciertos valores. Las podemos contar. Continuas toman cualquier valor dentro de un intervalo específico. Las podemos medir.
Nivel nominal se nombran, identifican o clasifican las observaciones. Nivel ordinal hay ordenación por rango u orden. Nivel de intervalo se ofrecen las distancias o intervalos entre los números, pero no se conoce la distancia de cero. Nivel de razón cada número se expresa como una distancia a partir de cero.
Variables cualitativas o categóricas
- Diagrama de Barras - Diagramas de Pastel o Sectores Variables cuantitativas o numéricas - Histograma - Diagrama de tronco y hojas - Gráficos de series temporales - Diagrama de caja - También el diagrama de barras o de pastel.
Concentración hacia la derecha – asimetría hacia la izquierda Concentración hacia la izquierda – asimetría hacia la derecha
- Ignora la distribución - Resulta sensible a observaciones atípicas (outliers)
- Primer cuartil 25% de las observaciones - Segundo cuartil 50% de las observaciones - Tercer cuartil 75% de las observaciones - Cuarto cuartil 100% de las observaciones (valor máximo) - Rango intercuartílico Q3-Q
- Los 5 números resumen constituyen la descripción numérica útil de una
- La manera más habitual de describir numéricamente una distribución es
- La suma de todas las observaciones respecto de la media muestral es igual a
- La varianza es el promedio de las desviaciones de cada observación respecto a
- La desviación típica mide la dispersión de los datos respecto a la media.
- La varianza NO tiene las mismas unidades de medida que las observaciones de
- S=0 cuando no hay dispersión de los datos. En este caso, todas las
- S≥0 siempre (no puede ser negativa, porque es la raíz cuadrada de un número
- S, al igual que la media muestral, está influenciada por la presencia de
- Si la distribución es asimétrica: descripción numérica a través de los cinco
- Si la distribución es razonablemente simétrica: descripción numérica a través
- Grados de libertad. ¿Por qué razón a la hora de calcular S2, dividimos por (n-1)
- Número de restricciones lineales que deben satisfacerse: el sumatorio de las
- Es la desviación típica (s) dividida por la media muestral (X). - Mide (y permite comparar) la variabilidad escalando por el valor de la media
- Mayor / menor coeficiente de variación Mayor/menor heterogeneidad - No tiene unidades. Transformaciones de los datos
- Todas las medidas de centro y de dispersión
- Si cambiamos de unidad de medida los valores de
- No es posible comparar estadísticos descritos o calculados con unidades de
- Variable cualquier característica de la población que se esté estudiando - Experimento aleatorio (E.A.) proceso que puede concretarse en, al menos, dos resultados posibles, con incertidumbre en cuanto a cuál de ellos tendrá lugar. - Resultados básicos resultados posibles de un experimento aleatorio (no pueden ocurrir simultáneamente). - Espacio muestral (Ω) conjunto de todos los resultados básicos. - Suceso cada uno de los posibles diversos resultados de un experimento aleatorio (simples o combinados). Ejemplo: lanzamiento 1 vez de un dado: Resultados básicos: 1,2,3,4,5,6. Espacio muestral: Ω = [1,2,3,4,5,6] Sucesos: sacar un 1, sacar un número par, sacar más de un 2… - Probabilidad medida numérica de la verosimilitud de ocurrencia de un suceso (para medir la incertidumbre). A distinguir entre: o Probabilidad poblacional o Probabilidad muestral (frecuencia relativa)
La probabilidad asociada a cualquier suceso debe de ser igual a cero o positiva, pero con valores inferiores a la unidad. La suma de las probabilidades asociadas a todos los resultados básicos debe de ser igual a uno.
- Variable aleatoria es una función que asocia un número a cada uno de los resultados posibles de un experimento aleatorio. Con mayúsculas designaremos las v.a. y con letras minúsculas los valores que puedan coger. Ejemplo 1: Experimento aleatorio: Tiramos una moneda 1 vez V.A. número de caras que podemos obtener: 2 posibles resultados del experimento (0,1)
Tipos de variables aleatorias
- Discretas solo pueden coger una cantidad numerable de valores - Continuas pueden coger todos los valores de un intervalo Variables aleatorias discretas
Ejemplo: Experimento aleatorio: Tirar una moneda 1 vez V.A. número de caras que se pueden obtener: 2 posibles resultados del experimento (0,1) x: v.a. número de caras puede tomar 2 valores (x1=0 o x2=1) x = {0,1} P(X=x1) = P(x=0) = ½ P(X=x2) = P(X=1) = ½ Para cada posible valor de una v.a. discreta podemos asignar una probabilidad a que la v.a. tome ese valor FUNCIÓN DE PROBABILIDAD Función de distribución (Probabilidad acumulada)
¿Cuál es la probabilidad (acumulada) de que la variable aleatoria X tome valores hasta
Las variables aleatorias discretas más utilizadas en estadística:
- Distribución de Bernouilli. Experimento aleatorio con sólo dos resultados posibles. - Distribución Binomial. Se realizan n repeticiones independientes del experimento anterior. - Distribución de Poisson. Número de ocurrencias de cierto suceso cada cierto tiempo. Variables aleatorias continuas
Cuando una v.a. es continua puede tomar infinitos valores y para cada posible valore podemos asignar una probabilidad: Función de densidad de probabilidad : recoge la probabilidad de que una v.a. continua X tome un valor concreto x. Atendiendo a que la v.a. continua puede tomar infinitos valores: P(X=xi) = 0 para cualquier valor de xi. La probabilidad se describe: P(X=xi) = f(xi)
- Si la v.a. es continua y tenemos un gran número de observaciones, la función de densidad de probabilidad genera una curva lisa (CURVA DE DENSIDAD) - La curva de densidad es una curva que:
- La media y la mediana coinciden en las curvas de densidad simétricas. - La media de una distribución asimétrica se encuentra desplazada hacia la cola más larga (más desplazada que la mediana). - Los cuartiles dividen el área que se encuentra por debajo de la curva de densidad en 4 partes iguales. - La curva de densidad es una descripción idealizada de la distribución de datos. - Por ello, cabe distinguir entre la media (μ) y la desviación típica (σ) de una curva de ) de una curva de densidad y la media (X) y la desviación típica (s) calculadas a partir de observaciones reales (muestrales). - Así pues, hay que distinguir entre la información de carácter poblacional información y la muestral - Dificultad de construir una curva de densidad que se adecúe a perfectamente a un problema concreto. En la práctica se usa alguna de las curvas de densidad existentes (la que mejor se adapte/describa a la variable aleatoria estudiada.
Diremos que una variable aleatoria continua tiene una distribución normal cuando su curva de densidad tenga las siguientes PARTICULARIDADES:
- Puede tomar cualquier valor en un intervalo su dominio (-∞, +∞) - Tiene una asístonta horizontal en el eje. - Tiene forma de campana - Es simétrica - El área comprendida entre la curva y el eje es igual a 1. La curva de densidad de una distribución normal concreta se describe ofreciendo su media (μ) y su desviación típica (σ) de una curva de ). - La media se sitúa en el centro de la dispersión – centro de la curva simétrica y coincide con la mediana. - La desviación típica (σ) de una curva de ) controla el grado de la dispersión de la curva normal (a mayores valores de σ) de una curva de , mayor dispersión de datos). Si cambia la media (sin que cambie la desviación típica), se produce un desplazamiento de la curva a lo largo del eje de abscisas. Si cambia la desviación típica sin que cambie la media, se obtienen curvas de densidad con el mismo centro y diferentes niveles de concentración en sus colas.
Todas las distribuciones normales verifican las propiedades siguientes:
X N (μ, σ) de una curva de )
La distribución normal estandarizada
Todas las distribuciones normales son iguales si:
- P (Z=a) = - P(Z ≤ a) =P(Z<a) - P(a ≤ Z ≤ b) =P(Z ≤ b)-P(Z ≤ a) - P(Z ≥ a) =P(Z ≤ -a) - P(/Z/ ≤ a) =P(-a ≤ Z ≤ a)
Cálculo de probabilidades
Las probabilidades asociadas a una distribución normal pueden calcularse, tras la correspondiente estandarización, mediante el uso de la tabla de la N (0,1).
Cuando se desean calcular probabilidades asociadas a una variable X que sigue una distribución N (μ, σ) de una curva de ), la metodología a seguir es:
La decisión de describir una distribución de datos mediante una curva normal condiciona el análisis posterior que se haga de esos datos. En la descripción de una distribución o al hacer inferencia estadística bastará con que la distribución sea aproximadamente normal.
Necesidad de tener una medida numérica complementaria para medir la fuerza y la dirección de la relación entre dos variables cuantitativas. Correlación El coeficiente de correlación es una medida numérica que pone de relieve la fuerza – según el valor (rango entre -1 y 1) y la dirección – según el signo.
- Un valor positivo de r indica una asociación positiva entre las dos variables (evolucionan en el mismo sentido). - Un valor negativo de r pone de evidencia una relación negativa entre las dos variables
Promedio del producto de valores estandarizados de X y de Y elimina la potencial distorsión de la escala de medida de las variables Se denota con la letra r
Los valores de r (rango) oscilan entre -1 y 1. Si el valor de r tiende a cero, la relación lineal entre las dos variables es muy débil. Valores de r cercanos a -1 o a 1, ponen de manifiesto una intensa relación lineal entre 2 variables (X e Y) positiva o negativa La recta de regresión
Análisis de los errores
Observaciones atípicas
Ejemplo 1 (variable categórica) Edad de los hijos de parejas registradas en un municipio variables cuantitativa que se agrupa en categórica artificial Variable: edad (cuantitativa) / tramos de edad (categórica) Observaciones: edad de 97 hijos Tabla de contingencia: Ejemplo 2 (variables categóricas) Integrantes de una clase según el centro educativo del que proceden y sexo. Variables: centro educativo (categórica) / sexo (categórica) Observaciones: 96 estudiantes Tabla de contingencia
Área rural Área urbana TOTAL Sin hijos 20 50 70(10,60%) 1 hijo 70 150 220(33,33%) 2 hijos 140 130 270(40,91%) 3 o más hijos 80 20 100(15,16%) TOTAL 310(43,97%) 350(53,03%) 660
Área rural Área urbana TOTAL Sin hijos 20(28,57%) 50(71,43%) 70 1 hijo 70(31,82%) 150(68,19%) 220 2 hijos 140(51,85%) 130(48,15%) 270 3 o más hijos 80(80,00%) 20(20,00%) 100 TOTAL 310 350 660