Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Aplicación de ML a un sistema eléctrico, Tesis de Minería de Datos

Aplicación de machine learning a un sistema de distribución local

Tipo: Tesis

2024/2025

Subido el 03/06/2025

cristhian-camilo-correa-ordonez
cristhian-camilo-correa-ordonez 🇨🇴

1 documento

1 / 66

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
Integración de series de tiempo y Random Forest para la predicción de disponibilidad de
activos eléctricos
Juan Camilo Velasquez Molina
Cristhian Camilo Correa Ordoñez
Asesor
José Laureano Cruz Cardozo
Universidad Nacional Abierta y a Distancia UNAD
Escuela de Ciencias Básicas, Tecnología e Ingeniería ECBTI
Especialización en Ciencia de Datos y Analítica
2024
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42

Vista previa parcial del texto

¡Descarga Aplicación de ML a un sistema eléctrico y más Tesis en PDF de Minería de Datos solo en Docsity!

Integración de series de tiempo y Random Forest para la predicción de disponibilidad de activos eléctricos Juan Camilo Velasquez Molina Cristhian Camilo Correa Ordoñez Asesor José Laureano Cruz Cardozo Universidad Nacional Abierta y a Distancia UNAD Escuela de Ciencias Básicas, Tecnología e Ingeniería ECBTI Especialización en Ciencia de Datos y Analítica 2024

Agradecimientos Camilo Correa Agradezco a mi esposa Laura Artunduaga por acompañarme en este proceso y darme ese apoyo incondicional para seguir adelante, a mi compañero Juan Camilo por su disposición y compromiso. Juan Camilo Velasquez Expreso mi más sincero agradecimiento a mi familia, cuyo apoyo incondicional ha sido fundamental en este proceso. A mi pareja, Valentina Martínez, por su paciencia, motivación y compañía en cada etapa de este camino. A mis amigos, por su respaldo y palabras de aliento. Finalmente, agradezco a Dios, por darme la fortaleza y sabiduría necesarias para alcanzar este logro. A todos ustedes, gracias por ser parte de este importante capítulo de mi vida.

Abstract Asset planning and management in electric power distribution systems are essential for network operators (ROs), especially in a context of increasing energy demand. The main objective of the project is to use machine learning techniques, such as Random Forest and time series, to enable better forecasting of demand growth and lifetime of electrical assets. Demographic and economic growth has led companies to face challenges related to system capacity and service continuity. Conventional forecasting methods, based on historical data, are not always effective in this dynamic environment, which can result in suboptimal decisions. This work emphasizes the need to use historical demand data (2021-2023) and asset operation records (2019-2024) to generate more accurate forecasts. Through data analysis and the implementation of predictive models, it seeks to provide reliable demand projections for the period 2024-2026 and a georeferenced map showing the useful life of electrical assets. Specific objectives include preprocessing data to feed the models, predicting peak demand on circuits, and estimating the life cycle of the assets. This research is aligned with regulatory standards, emphasizing the importance of ensuring a good quality of energy service. The results obtained could be decisive for ROs to optimize the management of their assets, reduce operating costs, and improve preventive maintenance, in favor of a more efficient and reliable electrical system, in addition to making changes in assets that have reached their useful life or repowering them to obtain a better rated capacity. Keywords: Useful life, energy demand prediction, Random Forest, LSTM.

Tabla de Contenido

  • Introducción
  • Justificación
  • Objetivos
    • Objetivo General
    • Objetivos Específicos
  • Marco Conceptual y Teórico
    • Marco Referencial
    • Antecedentes
      • Gestión de la Demanda..........................................................................................................
      • Utilización de Información de la Base de Datos
      • Aplicación de Métodos Estadísticos para Predecir el Crecimiento de la Demanda
      • Disponibilidad de Componentes Activos del Sistema Eléctrico de Distribución
      • Crecimiento de la Demanda por Subestaciones.
      • Predicción de Vida Útil en Activos Eléctricos.
      • Modelo LSTM
      • Estructura de una Celda LSTM
      • Modelo ARIMA
      • Pruebas ADF (Augmented Dickey-Fuller)............................................................................
      • Interpretación de resultados...................................................................................................
      • Modelo SARIMA (Seasonal ARIMA)
      • Modelo SARIMAX
      • Adaptabilidad y Escalabilidad
      • Eficiencia Operacional y Planificación
      • Redes Neuronales Recurrentes
      • Árbol de Decisión
      • Modelo Random Forest
      • Modelo holtwinters................................................................................................................
  • Metodología
  • Resultados
    • Demanda Energética Vista desde Subestación
      • Distribución de Datos
    • Modelos de Predicción Utilizados
      • Modelo LSTM
    • Análisis de las Métricas de Evaluación
    • Observaciones Clave del Análisis Comparativo
    • Descripción del Gráfico de Cargabilidad
    • Cargabilidad Futura...................................................................................................................
    • Activos de red eléctrica (estimación de vida útil)
      • Distribución de Datos
    • Modelos de Predicción Utilizados Vida útil
  • Conclusiones
  • Referencias Bibliográficas
  • Tabla 1 Métricas de Evaluación Modelo LSTM. Lista de Tablas
  • Tabla 2 Resumen estadístico variables categóricas activos eléctricos
  • Tabla 3 Resumen estadístico variables enteras o flotantes activos eléctricos
  • Tabla 4 Modelos predictivos. Desempeño de métodos para encontrar la vida útil del activo
  • Figura 1 Distribución de Valores de Potencia Lista de Figuras
  • Figura 2 Potencia Promedio a lo Largo de los Años
  • Figura 3 Predicción de la Demanda con el Modelo LSTM
  • Figura 4 Comparación de Modelos SARIMAX y LSTM
  • Figura 5 Cargabilidad del Circuito con los Datos Históricos
  • Figura 6 Cargabilidad Predicha
  • Figura 7 Matriz de Correlación Variables Operativas Mensuales Acumuladas
  • Mantenimientos Figura 8 Gráfico de Barras, Comportamiento Histórico de Cantidades de Fallas y
  • Figura 9 Gráfico de Torta, Relación de Cargabilidad de los Activos Instalados en el SDL
  • Figura 10 Activos de Red Reemplazados Mensualmente en Periodo 2019-
  • Figura 11 Equipos de Red Georreferenciado con una Estimación de Vida Baja
  • Figura 12 Gráfica Estimada de Vida de Útil Baja Activo
  • Figura 13 Equipos de Red Georreferenciados con un Estimado de Vida de Útil Media
  • Figura 14 Gráfica Estimada de Vida de Útil Media Activo
  • Figura 15 Equipos de Red Georreferenciados con un Estimado de Vida de Útil Alta
  • Figura 16 Gráfica Estimada de Vida de Útil Baja Activo

en criterios de sensibilidad relacionados con la vida útil de los equipos, sus condiciones eléctricas, afectaciones, costo de intervención, impacto en los indicadores según la ubicación jerárquica y, finalmente, la estimación de su criticidad. En este contexto, el aprendizaje automático se presenta como una solución prometedora para mejorar la precisión de las predicciones sobre el crecimiento de la demanda y la vida útil de los activos. Sin embargo, la implementación de estas técnicas conlleva varios desafíos. En primer lugar, es esencial integrar y procesar adecuadamente grandes volúmenes de datos históricos, tales como solicitudes de conexión, demanda acumulada, registros de elementos de la red y novedades en el sistema de distribución eléctrica. En segundo lugar, es necesario seleccionar y aplicar métodos estadísticos y algoritmos de aprendizaje automático capaces de manejar esta complejidad, para proporcionar predicciones precisas y confiables.

Justificación La correcta planificación y gestión del sistema de distribución de energía eléctrica es esencial para cualquier sistema eléctrico en crecimiento, como se da para el OR. El aumento constante en la demanda de energía debido al crecimiento demográfico y económico donde a su vez aumentan los elementos de la infraestructura, requieren de una capacidad de previsión robusta para evitar problemas de capacidad o límite energético o fallas en el sistema, con la finalidad de asegurar un suministro ininterrumpido. Las técnicas tradicionales de predicción basadas en datos históricos no siempre son adecuadas para capturar la complejidad y la dinámica de los datos de consumo energético y registros de eventos en el sistema, así como las características de cada activo, lo que puede llevar a estimaciones imprecisas y, en consecuencia, a decisiones no óptimas. La necesidad de una herramienta predictiva precisa es evidente ante la problemática actual de gestión y aprovechamiento de datos: sin una estimación adecuada del crecimiento de la demanda y aprovechamiento de los registros de los activos eléctricos, el operador de red (OR) corre el riesgo de enfrentar sobrecargas en el sistema, interrupciones en el suministro y costos elevados debido a inversiones urgentes e imprevistas. En este contexto, el aprendizaje automático ofrece una alternativa prometedora, ya que es capaz de manejar grandes volúmenes de datos y captar patrones complejos de los reportes de los activos y la dinámica de los consumos energéticos. Implementar técnicas de aprendizaje automático para predecir si un elemento puede fallar o generar una alerta, así como predecir el crecimiento del sistema de distribución local no solo promete una mayor precisión en las predicciones, sino que también mejora la capacidad de la empresa para planificar estratégicamente y tomar decisiones informadas a corto y mediano plazo. Esto incluye la identificación de áreas específicas que alimenta el prestador del servicio de energía, en el cual pueden requerir más atención y recursos,

Objetivos Objetivo General Gestionar la disponibilidad técnica de los activos eléctricos asociados a un circuito de distribución (visto desde una subestación eléctrica), utilizando Random Forest y time series. Objetivos Específicos Realizar el preprocesamiento de la base de datos que alimentará los modelos de predicción. Predecir el crecimiento de la demanda máxima presentada en un circuito para los próximos 3 años mediante técnicas de time series. Pronosticar la vida útil de los activos eléctricos del circuito según sus características técnicas dadas sus condiciones operativas mediante Random Forest Publicar un mapa georreferenciado con las predicciones gráficas de vida útil de los activos eléctricos para los próximos 2 años y de la cargabilidad anual para los próximos 3 años.

Marco Conceptual y Teórico Marco Referencial El desarrollo de modelos predictivos en la gestión de la demanda energética y el mantenimiento de activos eléctricos exige un análisis profundo de los datos históricos, tanto de la demanda de energía como del comportamiento de los equipos y sistemas que integran la infraestructura eléctrica. En este marco, se emplearán diversas herramientas de aprendizaje automático para abordar dos áreas clave: la predicción de la demanda eléctrica del operador de red para los próximos tres años y el análisis de la vida útil de los activos eléctricos de seccionamiento. Con el objetivo de crear un modelo predictivo que describa su vida útil en función de su condición operativa y comportamiento a lo largo del tiempo, en esta sección se abordarán los antecedentes y marco legal. Antecedentes Gestión de la Demanda Consiste en verificar las cargas para operar de manera óptima el sistema y obtener el máximo provecho de este; para ello se deberá tener en cuenta varios criterios de optimización relacionados con la curva de demanda, el mayor aprovechamiento de las redes de distribución, transformadores, y capacidades de las subestaciones. Uno de los principales objetivos de la gestión de la demanda es predecir la demanda, para lograr un perfil deseado. Además de anticipar la potencia máxima mensual y anual para poder establecer planes de contingencia en la prestación del servicio eléctrico. Con la implementación de metodologías para la gestión de demanda, existe canales directos e indirectos que cuyo objetivo principal es gestionarla, utilizando medidores inteligentes, incentivos tarifarios, consumo en periodos en la cual exista menor demanda; esto para los controles directos. Por otro lado, existen los controles indirectos,

dispuesto una cantidad considerable de resoluciones las cuales deben cumplir a cabalidad los OR; entre ellas, está la resolución CREG 015 de 2018; la cual habla de las inversiones que deben realizar los OR para asegurar una calidad optima e ininterrumpida del servicio del fluido eléctrico, además, de que el sistema de distribución local (SDL), tenga la capacidad de albergar nueva demanda; lo anterior, lográndolo a través de reposición de elementos obsoletos y que ya cumplieron su vida útil y además, de la instalación de activos eléctricos nuevos, que puedan atender la nueva demanda que entra a operar al SDL; estas inversiones se realizan al nivel de subestaciones, y también al nivel de las redes que se despliegan a lo largo de la zona urbana y rural la cual se encarga de alimentar a los nuevos usuarios. (Comisión Regulatoria de Energía y Gas [CREG], 2018) Para el caso de los activos eléctricos, las actividades ejecutadas en años previos al 2019 no contienen data, no existía un plan de mantenimiento para las etapas de verificación del ciclo de vida del activo, por lo que para este trabajo se tiene como referencia los datos recopilados a partir de la fecha. Actualmente en algunas compañías utilizan hojas de datos mediante herramientas ofimáticas, en donde bajo una estructuración aprobada por el sistema de gestión de la compañía se registran los datos de las características de los activos, mantenimientos ejecutados entre observaciones del personal de campo. En la industria se tienen software para mantenimiento de subestaciones, sistemas industriales, redes de transmisión y distribución. Por ejemplo, se cuenta con Infraspeak que es una de las soluciones más avanzadas de gestión del mantenimiento que ofrece una amplia gama de funciones, incluida la gestión centralizada de activos e inventarios, utiliza la inteligencia artificial para optimizar tus operaciones. De igual forma, existen en el mercado Fracttal, Rosmiman entre otros softwares que guardan la esencia de las metas establecidas en el trabajo de grado.

Utilización de Información de la Base de Datos El registro histórico de demanda de energía disponible abarca datos hora a hora desde el año 2021 hasta el año 2023. Este conjunto de datos se utilizará para implementar un modelo que interprete y analice el comportamiento registrado, con el objetivo de predecir la demanda futura en el circuito bajo análisis. Esto permitirá evaluar si dicho circuito tendrá la capacidad necesaria para soportar nuevas cargas que se deseen conectar al Sistema de Distribución Local (SDL) que lo alimenta. La demanda acumulada de los circuitos muestra un comportamiento característico a lo largo del tiempo. Este patrón puede ser aprovechado por el modelo a implementar, proporcionando suficiente información para aprender y predecir la demanda máxima mensual, así como su crecimiento año tras año. Dado el gran volumen de datos históricos disponibles, el análisis eficiente de esta información resulta crucial para el entrenamiento de modelos de aprendizaje automático. Las redes neuronales artificiales (RNA) destacan como una herramienta efectiva en la predicción de la demanda eléctrica, gracias a su capacidad para identificar patrones complejos en los datos. Sin embargo, también existen otros modelos estadísticos que pueden ser empleados para realizar predicciones en conjuntos de datos de gran magnitud. (Arévalo & Hernández, 2023). Aplicación de Métodos Estadísticos para Predecir el Crecimiento de la Demanda El uso de métodos estadísticos para la predicción de la demanda eléctrica es crucial para la planificación y operación del sistema de distribución, además, para la planeación del crecimiento de la demanda, y el fortalecimiento del mismo sistema de distribución para que se prevea que este tenga la capacidad de soportar la nueva demanda, además de la verificación del estado de activos eléctrico que no cumplan con las condiciones técnicas operativas para abastecer dicha demanda; esto pensado en la expansión de nuevos circuitos y subestaciones que

Aislamiento. Comprende el elemento que aísla el potencial de tierra con la línea energizada, entre ellos se catalogan elementos de suspensión (linepost, pin) y retención (cadenas de aisladores, aisladores elastoméricos). Herrajería y Crucetería. Comprende los elementos de fijación a estructura, los soportes de peso y forma de las diferentes configuraciones de la red, estas disposiciones se amplían en la norma de cada compañía, para nuestro caso en la norma del operador de red (OR). Equipos de Protección. Elementos que sirven para aislar una falla definitiva en un elemento de red, entre las causadas por daño en elemento, rayos, aterrizajes, perdida de aislamiento entre otras. Interruptores. Elemento inteligente que contiene a través de un relé la información de variable del sistema eléctrico, actúa ante fallas transitorias y eventuales de mayor envergadura. Se comporta como la protección principal en una red de distribución. Apoyos de Media Tensión. Soporte físico de la red eléctrica con la finalidad de proporcionar distancias de seguridad a los seres vivos, naturales y seres vivos. Con la clasificación de los elementos de red se proporciona una visión de los elementos asociados a los equipos de seccionamiento evaluados, por lo que su gestión dependerá del estado de cada uno de estos elementos en cuanto aplique, es decir que, un seccionamiento contiene un grupo de herrajes, crucetas aislamientos, protecciones, apoyos de media tensión distribuidos aguas abajo del equipo, al fallar uno de estos genera una condición operativa. El sistema de gestión de activos, alineado con la normativa ISO 55000, juega un papel fundamental en la evaluación y la predicción de la vida útil de los activos eléctricos (Quiñones, Moncada, & Montenegro, 2022). En este contexto, el proyecto contempla la recopilación de datos históricos de operaciones, fallas y mantenimientos de activos eléctricos entre 2019 y 2024,

lo que permite obtener una visión más completa de su comportamiento a lo largo del tiempo. Este enfoque está relacionado con el trabajo de Karthick, Ravivarman y Priyanka (2024), que muestran cómo los enfoques basados en ML son esenciales para optimizar procesos predictivos, como la estimación de la vida útil de los componentes eléctricos. Crecimiento de la Demanda por Subestaciones. La demanda eléctrica puede variar significativamente entre diferentes subestaciones debido a factores locales como la densidad de población, el tipo de consumidor, nuevas demandas comerciales o industriales), y las condiciones socioeconómicas y climáticas; además, de las condiciones en las que se encuentran las redes de distribución que prestan el servicio, sus condiciones técnicas, y vida útil de la misma; por otro lado, las zonas de no interconexión que aún no se encuentran conectadas al sistema de distribución ya sea por una mala práctica en cuanto a la planeación energética a través de los diferentes circuitos alimentados por una subestación y la cual no podría suplir la necesidad energética de estas nuevas demanda. (Instituto de Ingeniería Eléctrica, 2022) El análisis del crecimiento de la demanda por subestaciones permite identificar áreas de alta demanda y planificar mejoras en la infraestructura de distribución. Este enfoque segmentado ayuda a mejorar la precisión de las predicciones y a optimizar los recursos del sistema en el documento (Implementación de una Red Neuronal Artificial para la predicción de la Demanda Eléctrica a corto plazo) este tipo de análisis facilita la identificación de patrones de consumo específicos de cada subestación, lo cual resulta vital para la planificación y gestión eficiente del sistema de distribución. Por lo cual, para el análisis de este proyecto, es crucial tener el valor histórico, desde el año 2021 hasta el año 2023, de la demanda de la ciudad de Pereira; para revisar el comportamiento de esta. (Ramírez & Torres, 2021)