Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Diagramas Dispersión, coeficiente correlación y modelo lineal en R, Ejercicios de Econometría

Diagramas Dispersión, coeficiente correlación y modelo lineal en R

Tipo: Ejercicios

2024/2025

Subido el 22/04/2025

cristian-puerto-1
cristian-puerto-1 🇨🇴

1 documento

1 / 12

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
ECONOMETRIA DIAGRAMAS DIPERSION, COEFICIENTE CORRELACION Y MODELO LINEAL
EN R
TAREA DIAGRAMAS DIPERSION, COEFICIENTE CORRELACION Y
MODELO LINEAL EN R
CRISTIAN ANDRÉS PUERTO CARRIÓN - 20212025083
UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS
INGENIERÍA CATASTRAL Y GEODESIA
ASIGNATURA: ECONOMETRIA
DOCENTE: JAIME VERGARA HINCAPIE
GR. 61
BOGOTÁ, MARZO DE 2025
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Diagramas Dispersión, coeficiente correlación y modelo lineal en R y más Ejercicios en PDF de Econometría solo en Docsity!

ECONOMETRIA DIAGRAMAS DIPERSION, COEFICIENTE CORRELACION Y MODELO LINEAL

TAREA DIAGRAMAS DIPERSION, COEFICIENTE CORRELACION Y

MODELO LINEAL EN R

CRISTIAN ANDRÉS PUERTO CARRIÓN - 20212025083

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS

INGENIERÍA CATASTRAL Y GEODESIA

ASIGNATURA: ECONOMETRIA

DOCENTE: JAIME VERGARA HINCAPIE

GR. 6 1

BOGOTÁ, MARZO DE 2025

ECONOMETRIA DIAGRAMAS DIPERSION, COEFICIENTE CORRELACION Y MODELO LINEAL Introducción Este trabajo analiza la relación entre las ventas (ingresos operacionales) y el total de activos de un conjunto de empresas de un sector económico específico en Colombia durante el año

  1. Utilizando técnicas econométricas en el software R, se busca determinar la existencia de una relación lineal entre estas dos variables, cuantificar la fuerza de dicha relación y evaluar la calidad del ajuste del modelo de regresión lineal estimado. El análisis incluye la exploración de estadísticos descriptivos, la construcción de un diagrama de dispersión, el cálculo del coeficiente de correlación y la estimación de un modelo de regresión lineal, junto con la validación de sus supuestos a través de gráficos de diagnóstico. La investigación pretende identificar patrones de comportamiento financiero en las empresas del sector seleccionado y determinar la capacidad explicativa de los activos sobre las ventas. Objetivo General Analizar la relación entre los ingresos operacionales (VENTAS) y el total de activos (ACTIVOS) de un sector económico específico en Colombia para el año 2015, utilizando herramientas estadísticas y modelos de regresión en R, con el fin de evaluar la existencia de patrones de comportamiento financiero en las empresas de dicho sector. Objetivos Específicos
  2. Cargar y procesar la información financiera de las empresas seleccionadas, asegurando que el sector elegido cuente con al menos 30 empresas reportadas en la base de datos de la Superintendencia de Sociedades para el año 2015.
  3. Calcular y analizar los estadísticos descriptivos (media, mínimo, máximo, varianza, asimetría y curtosis) para las variables de interés: Ingresos Operacionales (VENTAS) y Total de Activos (ACTIVOS).
  4. Visualizar la relación entre las variables mediante un diagrama de dispersión , identificando tendencias generales, patrones de concentración y posibles valores atípicos en la distribución de los datos.

ECONOMETRIA DIAGRAMAS DIPERSION, COEFICIENTE CORRELACION Y MODELO LINEAL

6. Modelo de regresión lineal - Estimar modelo lineal - Extraer coeficientes del modelo - Graficar y validar los supuestos del modelo Resultados

3.

ECONOMETRIA DIAGRAMAS DIPERSION, COEFICIENTE CORRELACION Y MODELO LINEAL

Análisis del Diagrama de Dispersión: Ventas vs. Activos Se observa una relación positiva entre los activos y las ventas. A medida que los activos aumentan, los ingresos operacionales también tienden a aumentar. Esto sugiere que las empresas con más activos suelen generar más ventas, lo cual es lógico, ya que más recursos pueden facilitar una mayor producción o mejores operaciones. Parece que el modelo se ajusta bien en la parte inicial de los datos (cuando los activos son pequeños), pero hay algunos puntos alejados (outliers) en la parte superior derecha. Hay algunos puntos que se alejan de la tendencia general. Estas empresas pueden tener activos grandes, pero ventas más bajas de lo esperado (o viceversa). Se podría analizar qué tipo de empresas son y si hay factores específicos que expliquen estas desviaciones. La mayoría de los puntos están concentrados en la parte inferior izquierda del gráfico, lo que indica que muchas empresas tienen valores relativamente bajos de activos y ventas. Pocas empresas tienen valores muy altos, lo que genera cierta asimetría en la distribución de los datos.

ECONOMETRIA DIAGRAMAS DIPERSION, COEFICIENTE CORRELACION Y MODELO LINEAL Las cuatro gráficas de diagnóstico muestran lo siguiente:

  1. Residuos vs. Ajustados: Esta gráfica muestra los residuos (errores del modelo) en función de los valores ajustados (predicciones del modelo). Un patrón aleatorio alrededor de cero indica que el modelo se ajusta bien a los datos. En este caso, se observa una ligera curvatura, sugiriendo una posible no linealidad en la relación entre las variables o la presencia de heterocedasticidad. Los puntos 149, 157 y 46 parecen ser puntos influyentes.
  2. QQ-Plot (Gráfico Q-Q): Este gráfico compara la distribución de los residuos con una distribución normal teórica. Si los puntos se aproximan a la línea diagonal, indica que los residuos siguen aproximadamente una distribución normal. En este caso, la mayoría de los puntos se encuentran cerca de la línea, pero hay desviaciones en las colas, lo que sugiere que la normalidad de los residuos podría no ser perfecta.

ECONOMETRIA DIAGRAMAS DIPERSION, COEFICIENTE CORRELACION Y MODELO LINEAL

  1. Escala-Ubicación: Esta gráfica muestra la raíz cuadrada de los residuos estandarizados en función de los valores ajustados. Una línea horizontal indica homocedasticidad (varianza constante de los errores). En este caso, se observa una ligera tendencia ascendente, lo que sugiere la presencia de heterocedasticidad (la varianza de los errores aumenta con los valores ajustados).
  2. Residuos vs. Apalancamiento: Esta gráfica muestra los residuos estandarizados en función del apalancamiento. El apalancamiento mide la influencia de cada observación en los valores ajustados. Los puntos con alto apalancamiento y residuos grandes son influyentes y pueden distorsionar los resultados del modelo. Los puntos 149 y 28 parecen ser puntos influyentes que merecen una investigación más a fondo. Conclusiones El análisis econométrico realizado revela una fuerte relación positiva entre el total de activos y las ventas de las empresas estudiadas. El coeficiente de correlación de 0.933 indica una asociación lineal muy significativa entre ambas variables, sugiriendo que un aumento en los activos tiende a ir acompañado de un aumento proporcional en las ventas. El modelo de regresión lineal estimado, aunque muestra un alto R-cuadrado, presenta algunas deficiencias. Los gráficos de diagnóstico revelan la presencia de heterocedasticidad, posibles problemas de no linealidad y la influencia de algunos puntos atípicos. Estas deficiencias sugieren que el modelo, si bien describe una relación general, podría no ser el más adecuado para capturar la complejidad de la relación entre activos y ventas en todas las empresas del conjunto de datos. Para mejorar la precisión y la robustez del modelo, se recomienda explorar transformaciones de variables, la consideración de modelos no lineales o la eliminación de los puntos influyentes identificados. Un análisis más profundo, incluyendo la consideración de otras variables explicativas y la evaluación de modelos más complejos, podría proporcionar una comprensión más completa de los determinantes de las ventas en el sector estudiado. SCRIP DE R-STUDIO

Cargar librerías que se utilizaran

ECONOMETRIA DIAGRAMAS DIPERSION, COEFICIENTE CORRELACION Y MODELO LINEAL

Contar cuántas empresas tiene cada CIIU

conteo_ciiu <- datos_completos %>% group_by(CIIU.x) %>% summarise(num_empresas = n()) %>% filter(num_empresas >= 30) # Filtrar solo los que tienen al menos 30 empresas

Seleccionar un CIIU aleatorio de los que cumplen la condición

set.seed(150) # Fijar semilla para reproducibilidad ciiu_seleccionado <- sample(conteo_ciiu$CIIU.x, 1)

Filtrar las empresas del CIIU seleccionado y seleccionar las columnas clave

datos_filtrados <- datos_completos %>% filter(CIIU.x == ciiu_seleccionado) %>% select( SECTOR.x, VENTAS = 41 INGRESOS OPERACIONALES, ACTIVOS = TOTAL ACTIVO)

Mostrar CIIU seleccionado y resumen de los datos filtrados

print(paste("CIIU seleccionado:", ciiu_seleccionado))

Revisar estructura

str(datos_filtrados) summary(datos_filtrados)

Calcular estadísticos descriptivos

ECONOMETRIA DIAGRAMAS DIPERSION, COEFICIENTE CORRELACION Y MODELO LINEAL estadisticas <- data.frame( Variable = c("VENTAS", "ACTIVOS"), Media = c(mean(datos_filtrados$VENTAS, na.rm = TRUE), mean(datos_filtrados$ACTIVOS, na.rm = TRUE)), Minimo = c(min(datos_filtrados$VENTAS, na.rm = TRUE), min(datos_filtrados$ACTIVOS, na.rm = TRUE)), Maximo = c(max(datos_filtrados$VENTAS, na.rm = TRUE), max(datos_filtrados$ACTIVOS, na.rm = TRUE)), Varianza = c(var(datos_filtrados$VENTAS, na.rm = TRUE), var(datos_filtrados$ACTIVOS, na.rm = TRUE)), Asimetria = c(skewness(datos_filtrados$VENTAS, na.rm = TRUE), skewness(datos_filtrados$ACTIVOS, na.rm = TRUE)), Curtosis = c(kurtosis(datos_filtrados$VENTAS, na.rm = TRUE), kurtosis(datos_filtrados$ACTIVOS, na.rm = TRUE)) ) print(estadisticas)

Gráfico de dispersión entre Ventas y Activos

ggplot(datos_filtrados, aes(x = ACTIVOS, y = VENTAS)) + geom_point(color = "blue") + geom_smooth(method = "lm", se = FALSE, color = "red") + labs(title = "Diagrama de Dispersión: Ventas vs Activos", x = "Total Activos", y = "Ventas (Ingresos operacionales)") + theme_minimal()