Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Taller de Manejo de Herramientas Computacionales R: Análisis de Datos de Vinos, Ejercicios de Estadística Inferencial

Este taller práctico explora el análisis de datos de vinos utilizando el lenguaje de programación r. Se realiza un análisis exploratorio de datos, incluyendo la descripción de variables cuantitativas y cualitativas, así como la visualización de relaciones bidimensionales entre variables como la calidad del vino y su aroma, cuerpo, sabor y claridad. Se analizan las diferencias en la calidad del vino según la región de origen. El taller proporciona una introducción al uso de herramientas computacionales para el análisis de datos en el contexto de la enología.

Tipo: Ejercicios

2024/2025

A la venta desde 10/03/2025

ruben-maya
ruben-maya 🇨🇴

16 documentos

1 / 14

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Taller mero 2 Manejo de
Herramientas Computacionales R.
David Alejandro Rodríguez, Juan Felipe Erazo, Gabriel Esteban Lara, Jhojan
Sebastián Jojoa, Rubén Darío Maya, Stefania Muriel y Yuliana Alejandra
Guerrero
2025-03-09
Primer Punto
Primero cargamos la base de datos dentro del chunk. Luego, dentro del
mismo se cambiaron los nombres de las variables segun el orden requerido.
Se ocultaron los códigos con la función echo=FALSE, warning=FALSE e
inlcude=FALSE.
Mediante el uso de la función kable se realizó una tabla de frecuencias con el
fin de describir de mejor manera la variable región e identificar la distribución
de datos en las regiones.
clarida
d
arom
a
cuerp
o
sabo
r
aroma
c
calida
d
regio
n
1 3.3 2.8 3.1 4.1 9.8 1
1 4.4 4.9 3.5 3.9 12.6 1
1 3.9 5.3 4.8 4.7 11.9 1
1 3.9 2.6 3.1 3.6 11.1 1
1 5.6 5.1 5.5 5.1 13.3 1
1 4.6 4.7 5.0 4.1 12.8 1
Posteriormente, se utilizó la función kable(head) para poder visualizar
sólamente en encabezado de los datos con los cambios solicitados.
Segundo Punto
Para realizar este punto se utilizó la función kable, donde, inicialmente se
analizó de forma unidimensional cada una de las variables. Posteriormente,
mediante el uso de las funciones del paquete ggplot2, se realizó el análisis
bidimensional de la variable calidad con el resto de variables del estudio.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Vista previa parcial del texto

¡Descarga Taller de Manejo de Herramientas Computacionales R: Análisis de Datos de Vinos y más Ejercicios en PDF de Estadística Inferencial solo en Docsity!

Taller Número 2 Manejo de

Herramientas Computacionales R.

David Alejandro Rodríguez, Juan Felipe Erazo, Gabriel Esteban Lara, Jhojan Sebastián Jojoa, Rubén Darío Maya, Stefania Muriel y Yuliana Alejandra Guerrero 2025-03-

Primer Punto

Primero cargamos la base de datos dentro del chunk. Luego, dentro del mismo se cambiaron los nombres de las variables segun el orden requerido. Se ocultaron los códigos con la función echo=FALSE, warning=FALSE e inlcude=FALSE. Mediante el uso de la función kable se realizó una tabla de frecuencias con el fin de describir de mejor manera la variable región e identificar la distribución de datos en las regiones. clarida d arom a cuerp o sabo r aroma c calida d regio n 1 3.3 2.8 3.1 4.1 9.8 1 1 4.4 4.9 3.5 3.9 12.6 1 1 3.9 5.3 4.8 4.7 11.9 1 1 3.9 2.6 3.1 3.6 11.1 1 1 5.6 5.1 5.5 5.1 13.3 1 1 4.6 4.7 5.0 4.1 12.8 1 Posteriormente, se utilizó la función kable(head) para poder visualizar sólamente en encabezado de los datos con los cambios solicitados.

Segundo Punto

Para realizar este punto se utilizó la función kable , donde, inicialmente se analizó de forma unidimensional cada una de las variables. Posteriormente, mediante el uso de las funciones del paquete ggplot2 , se realizó el análisis bidimensional de la variable calidad con el resto de variables del estudio.

Análisis Unidimensional de Variables Cuantitativas

Resumen de la Base de Datos Vinos (Variables Cuantitativas) claridad aroma cuerpo sabor aromac calidad Min. :0. 0 Min. :3. 0 Min. :2. 0 Min. :2. 0 Min. :2. 0 Min. : 7. 1st Qu.:0. 1st Qu.:4. 1st Qu.:4. 1st Qu.:4. 1st Qu.:3. 1st Qu.:11. Median :1. 0000 Median :4. 650 Median :4. 750 Median :4. 800 Median :4. 100 Median :

Mean :0. 37 Mean :4. 47 Mean :4. 84 Mean :4. 68 Mean :4. 55 Mean :12. 44 3rd Qu.:1. 3rd Qu.:5. 3rd Qu.:5. 3rd Qu.:5. 3rd Qu.:4. 3rd Qu.:13. Max. :1. 0 Max. :7. 0 Max. :6. 0 Max. :7. 0 Max. :6. 0 Max. :16. 0 Se realizó un resumen estadístico de la base de datos. En relación con la claridad de los vinos, se observa que la mayoría de los valores son cercanos a

  1. En cuanto al aroma, la media (4.85) y la mediana (4.65) son similares, lo que indica una distribución simétrica sin sesgo notable. Los valores del cuerpo del vino se concentran cerca de la media (4.68), lo que sugiere que esta característica es relativamente uniforme. El promedio del sabor es 4.76 y la mediana 4.8, lo que indica que la mayoría de los vinos tienen un sabor dentro de este rango. El aroma complementario presenta una ligera dispersión, sin valores extremos. Por último, la media de la calidad de los vinos es 12.44, con un mínimo de 7.9 y un máximo de 16.1. Dado que el primer y tercer cuartil se encuentran en 11.15 y 13.75, respectivamente, se puede decir que la mayoría de los vinos tienen una calidad moderada-alta.

Análisis Unidimensional de Variables Cualitativas

Tabla de Frecuencias para la Variable Región (Variable Cualitativa) Regió n Frecuenci a 1 17 2 9 3 12

Calidad vs Aroma

El gráfico muestra la relación entre el aroma del vino y su calidad, con un área sombreada en verde y una línea de tendencia. Se observa una dirección ascendente, donde la calidad tiende a aumentar a medida que el aroma mejora. Sin embargo, en niveles bajos de aroma (entre 3 y 5), la calidad presenta fluctuaciones con picos y caídas abruptas, lo que indica una mayor variabilidad. A partir de un aroma de 5 en adelante, la calidad se estabiliza y sigue una tendencia ascendente más clara. Esto sugiere que los vinos con mejor aroma suelen recibir una mejor valoración en calidad, aunque en los niveles más bajos podrían estar influyendo otros factores.

Calidad vs Cuerpo

El gráfico muestra la relación entre el cuerpo del vino y su calidad, evidenciando una tendencia positiva. A medida que el cuerpo del vino aumenta, la calidad también tiende a incrementarse, lo que sugiere que esta característica influye de manera significativa en la percepción de la calidad del vino. La línea azul también sugiere esta relación mostrando una orientación ascendente, indicando que, en términos generales, los vinos con mayor cuerpo tienden a tener mayor calidad. Además, se observa cierta dispersión en los datos, con valores que se desvían de la tendencia principal, esto podria estar relacionado con la poca cantidad de datos o con otras variables no contempladas en el estudio.

Calidad vs Aromac

El gráfico muestra la relación entre el aroma del y la calidad de los vinos, evidenciando un patrón no lineal. Se observa que, a medida que el aromac aumenta, la calidad del vino no varía significativamente. pero más allá de ese punto, el efecto podría no ser notorio. Sin embargo, la dispersión de los datos indica que la relación no es completamente concluyente por lo cual, no se puede establecer una influencia clara entre ambas variables.

Tercer Punto

Calidad vs Región

La gráfica anterior, sugiere que los vinos de la Región 3 tienen la mejor calidad, con una mediana cercana a 15 y una media similar, mientras que la Región 2 presenta los valores más bajos, con una media y mediana cercanas a

  1. La Región 1 se encuentra en un punto intermedio, con una mediana aproximada a 12 y una distribución relativamente simétrica en comparación a las demás. Aunque todas las regiones muestran cierta variabilidad en la calidad, la tendencia general indica que la Región 3 produce vinos de mayor calidad al compararla con las otras regiones.

Quinto Punto

El análisis muestra una relación positiva entre el sabor, la calidad del vino y el aroma, lo que se evidencia por la tendencia ascendente de la curva de ajuste, además la distribución del aroma se representa a través de los colores azul rosado y rojo en orden creciente. Sin embargo, existe una alta dispersión en los datos, indicando que otros factores también pueden influir en la calidad. El color de los puntos revela que los vinos con mayor aroma (tonos rojos) tienden a tener una mejor calidad, mientras que aquellos con menor aroma (tonos azules) se concentran en la parte inferior del gráfico. Se concluye que, existe una asociación positiva entre la calidad, el sabor y el aroma de los vinos. No obstante, la dispersión de los datos indica que la calidad no depende únicamente de estas variables.

Sexto Punto

Conclusiones

A continuación, se presentan de manera general las conclusiones de los puntos previamente desarrollados:

La claridad del vino no tiene una relación directa con su calidad, aunque la mayoría de los vinos son claros, la calidad varía ampliamente, lo que indica que otros factores pueden influir más en el producto final. No obstante, aroma y la calidad del vino están directamente relacionados; a medida que el aroma aumenta, la calidad del vino tiende a mejorar. De manera similar, se observa una relación positiva entre el cuerpo del vino y su calidad: a mayores puntuaciones en cuerpo, mayor es la calidad percibida. Asimismo, los datos indican que existe una relación positiva entre el sabor y la calidad del vino; a medida que la puntuación del sabor mejora, la calidad también tiende a aumentar. En contraste, no se observa una relación clara entre el aromac y la calidad debido a la dispersión de los datos. En cuanto a la región, la calidad del vino varía significativamente entre diferentes zonas.; la Región 3 produce vinos de mayor calidad en comparación con las Regiones 1 y 2, lo que podría deberse a factores como el clima, el tipo de suelo o prácticas específicas de vinificación en cada región. El análisis muestra que la influencia de la claridad del vino en su calidad no es uniforme y varía según la región. Mientras que en algunas zonas la calidad se mantiene estable o mejora con mayor claridad, en otras se observa una disminución en ciertos niveles intermedios. Esto sugiere que la relación entre claridad y calidad puede estar condicionada por factores externos no contemplados en el estudio, lo que resalta la importancia del contexto específico en la producción y valoración del vino. En cuanto a la relación entre la calidad del vino con su sabor y aroma, se observa una tendencia positiva: los vinos con mayor aroma tienden a tener mejor calidad. Sin embargo, la alta dispersión en los datos indica que la calidad del vino no depende exclusivamente de estas variables. Con base en estos hallazgos, se concluye que la calidad del vino es un atributo complejo influenciado por múltiples factores. Sin embargo, otros aspectos no considerados en este estudio podrían tener un impacto significativo, lo que sugiere que la evaluación de la calidad del vino requiere un enfoque integral que contemple diversas características y variables. Además, la dispersión general de los datos, posiblemente debido al reducido tamaño de la muestra, es un elemento clave a considerar en futuras investigaciones sobre la calidad del vino.

“Calidad”) + theme_minimal() + theme( plot.title = element_text(hjust = 0.5, face = “bold”, size = 14), axis.title = element_text(face = “bold”, size = 12) ) #Calidad vs Aroma ggplot(Vinos, aes(x = aroma, y = calidad)) + geom_area(fill = “#7FFF00”, alpha = 0.6) + geom_line(color = “#458B00”, size = 1.2) + labs(title = “Tendencia de Calidad según Aroma”, x = “Aroma”, y = “Calidad”) + theme_minimal() #Calidad vs Cuerpo ggplot(vinos, aes(x = cuerpo, y = calidad)) + geom_line(color = “cyan3”, alpha = 0.6) + geom_smooth(method = “lm”, se = FALSE, color = “blue”) + labs(title = “Relacion entre Cuerpo y Calidad del Vino”, x = “Cuerpo”, y = “Calidad”) +geom_point(color=“darkblue”)+ theme_minimal() #Calidad vs Sabor ggplot(vinos, aes(x = sabor, y = calidad, color = calidad)) + geom_point(alpha = 0.7, size = 3) + scale_color_gradient(low = “orange”, high = “red”) + labs(title = “Relacion entre Calidad y Sabor”, x = “Sabor”, y = “Calidad”) + theme_minimal()

  • theme(legend.position = “none”) + geom_smooth() #Calidad vs Aromac ggplot(vinos, aes(x = aromac, y = sabor)) + geom_point(alpha = 0.8, size = 3, color = “blue”) + geom_line(stat = “smooth”, method = “loess”, color = “green”) + labs(title = “Relacion entre Aroma del Barril y Sabor”, x = “Aroma del Barril (aromac)”, y = “Sabor”) + theme_minimal()

Tercer Punto

g_boxplot <- ggplot(Vinos, aes(x = factor(region), y = calidad)) + geom_boxplot(fill = “#00BFFF”, color = “#1E90FF”, alpha = 0.9, outlier.color = “#7B68EE”, outlier.size = 3) + # Azul celeste con bordes azul fuerte y outliers en morado stat_summary(fun = mean, geom = “point”, shape = 18, size = 5, color = “#00FFFF”) + # Media en cyan brillante labs(title = “Distribución de la Calidad por Región”, x = “Región”, y = “Calidad”) + theme_minimal() + theme( plot.title = element_text(hjust = 0.5, face = “bold”, size = 16, color = “#4682B4”), # Título en azul acero axis.title = element_text(face = “bold”, size = 14, color = “#5F9EA0”), # Etiquetas de ejes en azul verdoso axis.text = element_text(size =

12, color = “#1E90FF”), # Texto de ejes en azul fuerte panel.background = element_rect(fill = “#F0F8FF”, color = NA) # Fondo azul muy claro ) g_boxplot

Cuarto Punto

#Grafico de Perfiles Medios: Claridad vs Calidad vs Región ggplot(Vinos, aes(x = claridad, y = calidad, group = as.factor(region), color = as.factor(region))) + stat_summary(fun = mean, geom = “line”, size = 1) + stat_summary(fun = mean, geom = “point”, size = 3) + scale_color_manual(values = c(“#E63946”, “#457B9D”, “#2A9D8F”)) + labs(title = “Gráfico de Perfiles Medio de Calidad por Claridad y Región”, x = “Claridad”, y = “Calidad Media”, color = “Región”) + theme_minimal() + theme( legend.title = element_text(color = “blue”, face = “bold”), axis.title.x = element_text(size = 12, face = “bold”, color = “black”), axis.title.y = element_text(size = 12, face = “bold”, color = “black”) )

Quinto Punto

#Calidad vs Aroma vs Sabor ggplot(vinos, aes(x = sabor, y = calidad, color = aroma)) + geom_point(size = 3, shape = 17) + # Cambia la forma de los puntos (ejemplo: triángulo) geom_smooth(method = “loess”, fill = “gray”, linetype = “dashed”, alpha = 0.3)

  • Agrega la línea de suavizado scale_color_gradientn(colors = c(“blue”,

“hotpink”, “red”)) + labs(title = “Relación entre Sabor, Aroma y Calidad del Vino”, x = “Sabor”, y = “Calidad”, color = “Aroma”) + theme_minimal(base_size = 15) + theme( plot.title = element_text(size = 20, face = “bold”), axis.title = element_text(size = 14, face = “italic”) )