Mantenimiento Turbinas de Gas

INSTITUTO POLITECNICO NACIONAL ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA Y ELÉCTRICA UNIDAD CULHUACAN SECCION DE ESTUDIOS

Views 741 Downloads 256 File size 5MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Turbinas de Gas Mantenimiento

98 62 54KB Read more

Mantenimiento Predictivo de Turbinas de Gas

0 0 5MB Read more

Mantenimiento En Turbinas De Vapor Y Gas

65 2 4MB Read more

Tesis Estrategias de Mantenimiento Turbinas a Gas

87 7 2MB Read more

Mantenimiento turbinas

36 9 2MB Read more

Turbinas de Gas

Turbinas de Gas. El ciclo de turbina de gas abierto pueden modelarse como un ciclo abierto o cerrado. Se introduce air

36 3 269KB Read more

U3 TURBINAS DE GAS

67 0 555KB Read more

Turbinas de Gas SIEMENS

48 0 243KB Read more

Turbinas de Gas

56 0 1012KB Read more

Turbinas de Gas

51 4 2MB Read more

Author / Uploaded
Danny 'Lex Vera

Citation preview

INSTITUTO POLITECNICO NACIONAL ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA Y ELÉCTRICA UNIDAD CULHUACAN SECCION DE ESTUDIOS DE POSGRADO E INVESTIGACION ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES. T E S I S QUE PARA OBTENER EL GRADO DE: MAESTRA EN CIENCIAS DE INGENIERIA EN MICROELECTRONICA

PRESENTA: ING. CLAUDIA FERNANDA VILLARREAL GONZÁLEZ DIRECTOR: DR. IGOR LOBODA

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

I

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

II

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

AGRADECIMIENTOS. Antes que todo quiero agradecer a dios por estar viva y sana para poder lograr mis objetivos, también agradezco a mis padres Patricia González García y Fernando Villarreal Sánchez por el apoyo; además sin la disciplina que ellos me enseñaron, sería más difícil concluir mis estudios. Gracias al Instituto Politécnico Nacional, institución donde estoy estudiando desde el nivel medio superior, por abrirme las puertas para estudiar y trabajar. En particular agradezco a la ESIME Culhuacán por el apoyo económico de un semestre y al apoyo académico en la realización de mi trabajo de tesis. Gracias al Dr. Igor Loboda y a mis compañeros: Ivan, Abelardo, Adrian y Jesús por el apoyo y paciencia que me brindaron durante mis estudios de posgrado.

III

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Resumen El trabajo descrito en esta tesis intenta mejorar el modelo de estado normal de un motor de turbina de gas. Podemos definir una turbina de gas como un objeto complejo que basa su funcionamiento en las leyes de termodinámica y mecánica de fluidos y necesita un diagnóstico detallado. Enfocamos nuestra investigación a los métodos del diagnóstico paramétrico. La primera etapa de este diagnóstico es encontrar el modelo matemático que describe a la turbina de gas en buen estado y que permite describir las fallas repentinas y mecanismos graduales de envejecimiento de las turbinas de gas. Este modelo de estado normal, mejor conocido como la función de referencia, es una función en la cual variables monitoreadas en turbinas de gas dependen de las variables controladas y las ambientales. Sin embargo, no es tarea fácil determinar una función adecuada de referencia a partir de mediciones, debido a la cantidad de errores en las mismas. En esta tesis se estudian y se comparan dos métodos diferentes para obtener la función de referencia. El primero usa polinomios. Después de encontrar los coeficientes desconocidos con los datos de entrenamiento de un motor de turbina de gas, probamos la función polinomial encontrada con otra porción de datos registrados en el mismo motor. El segundo incluye una red neuronal artificial para describir la función de referencia. Se eligió una red perceptrón multicapa con tres capas de neuronas: una de entrada, una oculta y una de salida. La red es supervisada y se entrenó con un conjunto de datos de entrada y de salida. Durante el entrenamiento se modifican las conexiones (pesos) entre neuronas de diferentes capas de tal manera que se minimiza la distancia entre la salida actual de la red y la salida deseada. Así, la red entrenada obtiene la capacidad de describir el comportamiento del motor. Cabe mencionar que con el objetivo de optimizar la red se hicieron cálculos numerosos con diferentes condiciones de entrenamiento y varias estructuras de la red. En particular, en estos cálculos modificamos los datos de entrada, el tipo de su normalización, el algoritmo de entrenamiento, número de épocas de entrenamiento, número de nodos en la capa oculta y funciones de transferencia de las señales en la red. Al comparar las variaciones mencionadas, hemos encontrado la mejor variación de la red, en particular el algoritmo de entrenamiento: Levenberg-Marquardt con la regularización bayesiana. La comparación de los dos métodos mencionados en los datos de validación ha demostrado que está mejor variación de la red neuronal no tiene una exactitud mejor que los polinomios. Sin embargo, la función de referencia con los polinomios es más simple y por eso se recomienda para el uso práctico en los sistemas reales de monitoreo de turbinas de gas. IV

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Abstract The study presented in this thesis tries to enhance a model of a healthy gas turbine. A gas turbine can be defined as a complex system based on thermodynamics and flow mechanics and as a machine that requires to be diagnosed as profound as possible. The study is devoted to the methods of so called parametric diagnostics, the first stage of which is to define the model of the motor in a good (healthy) condition. Such model allows describing gas turbine abrupt faults and gradual degradation mechanisms. The model known as a baseline model is a function in which monitored gas path variables depend on engine controlled variables and ambient conditions. However, it is a challenging problem to create an adequate baseline model on the basis of measured data because of a number of measurement errors. In this thesis two different methods to obtain the baseline function are studied and compared. The first method uses polynomials. After finding their unknown coefficients with training data of a gas turbine engine, the determined polynomial function is validated on another data portion of the same engine. The second includes an artificial neural network for baseline function description. The perceptron with three layers: an input, hidden layer, and an output, has been chosen. This network was trained on known input and output data. During the training process, the connections (weights) between neurons of different layers were modified in the manner that minimizes the distance between the actual network output and the desired output (target). Thus, the trained network obtains the capacity to describe the engine behavior. It is worth to mention that numerous calculations under different training conditions and with various network structures have been made with the objective to optimize the network. In particular, in these calculations we varied input data, their normalization mode, training algorithm, number of training epochs, a hidden layer neuron quantity, and network signals’ transfer functions. As a result of the comparison of different network variations, the best network variation with optimal values for each factor mentioned before was found. In particular, the Levenberg-Marquardt algorithm with Bayesian regularization was selected as the best training option. The comparison of two chosen methods on validation data has demonstrated that the best network variation does not exceed the polynomials in diagnosis accuracy. Moreover, the polynomial baseline function is easier to compute. That is why it is recommended for practical use in real gas turbine monitoring systems.

V

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Introducción Las turbinas de gas son máquinas térmicas complejas que convierten energía química a mecánica. El objetivo de la turbina de gas es producir grandes cantidades de energía, por ejemplo, para mover un generador eléctrico o impulsar un avión. El motor de turbina de gas tiene tres elementos principales que son el compresor, la cámara de combustión y la turbina que en conjunto tienen un cierto rango de operación. Sí trabajan fuera del límite de operación pueden sufrir daños severos en sus componentes, como por ejemplo grietas y fisuras en los alabes del compresor y de la turbina. Se puede evitar estos problemas realizando mantenimiento preventivo y correctivo; el primer mantenimiento es capaz de prevenir accidentes o fallas posibles; por lo tanto hay que darle mayor importancia. Sin embargo, para realizar ambos mantenimientos hay que detener la maquina donde los paros implican excesivos gastos económicos ya que estos pueden durar hasta semanas. Una solución a este problemas es el monitoreo permanente de variables como la temperatura en la salida de la turbina. Con el conjunto de mediciones podemos realizar un análisis y manipulación de datos para identificar donde está la falla y ahorrar un tiempo considerable de revisión en el paro. Esta herramienta se conoce como diagnostico paramétrico. [21], [23], [24] y [29]. El presente trabajo consiste en obtener un modelo del comportamiento de la turbina de gas en buenas condiciones. Este modelo se determina con el uso de dos herramientas: polinomios y redes neuronales artificiales. Para entrenar la red neuronal se usan los datos simulados por un modelo termodinámico y los reales. Después, las herramientas se comparan con nuevos datos reales. El objetivo es escoger entre polinomios y la red neuronal una herramienta que es mejor para aproximar los datos del motor de turbina de gas en buen estado. Se mantiene la hipótesis que la red puede arrojar mejores resultados por su alta flexibilidad. [19], [20] y [27]

VI

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

CONTENIDO CAPITULO 1. Turbinas de gas, diagnóstico y mantenimiento. 1.1. Descripción de turbinas de gas. 1.2. Aplicaciones de las turbinas de gas. 1.3. Aplicaciones en México. 1.4. Mantenimiento de turbinas de gas. 1.5. Diagnóstico de turbinas de gas. 1.5.1. Métodos Físicos. 1.5.2. Métodos paramétricos.

1 2 13 14 15 18 19 21

CAPÍTULO 2. Redes Neuronales Artificiales. 2.1. Introducción. 2.2. Estructura de las redes neuronales. 2.3. Clasificación. 2.4. Perceptrón multicapa.

30 31 32 40 41

CAPÍTULO 3. Desarrollo de los algoritmos. 3.1. Introducción. 3.2. Planteamiento del problema. 3.3. Función de referencia. 3.3.1. Modelo descrito por polinomios. 3.3.2. Modelo descrito por redes neuronales. 3.4. Matlab como herramienta de aplicación.

44 45 47 48 49 52 62

CAPITULO 4. Discusión de resultados. 4.1. Prueba de las herramientas. 4.2. Tarea 1: Búsqueda de la estructura de la red. 4.3. Tarea 2: Métodos de ajuste de pesos. 4.4. Tarea 3: Modificación de las funciones de transferencia. 4.5. Tarea 4: Modificación de los parámetros de salida. 4.6. Tarea 5: Influencia del método de inicialización de pesos y umbrales. 4.7. Tarea 6: Opción de paro automático. 4.8. Tarea 7: Entrenamiento con datos reales.

80 81 81 83 86 90 92 93 95

CONCLUSIONES.

97

ANEXOS.

101

VII

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

CAPITULO 1. TURBINA DE MONITOREO Y DIAGNÓSTICO.

1

GAS,

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

1.1. Descripción de turbinas de gas La turbina de gas es una planta de potencia, la cual produce una gran cantidad de energía con un tamaño y peso relativamente pequeños. Durante más de 15 años se han aplicado en la industria petroquímica. Actualmente funcionan con gas natural, diesel, nafta, metano, aceites vaporizados e incluso basura. Las primeras turbinas de gas tenían una eficiencia muy baja, aproximadamente 15%, sin embargo por su peso reducido y tamaño compacto fueron atractivas para ciertas aplicaciones. Este límite en la eficiencia se debe a la temperatura de entrada a la turbina. Actualmente se tienen temperaturas más altas porque los alabes se construyen con un material más resistente. En la figura 1.1 podemos distinguir los componentes principales de la turbina de gas: el compresor, la cámara de combustión y la turbina. [1]

Figura 1.1. Partes principales de la turbina de gas.

El compresor es un dispositivo que aumenta la presión en un fluido de trabajo. Los compresores se clasifican como centrífugos y axiales. Algunas turbinas de gas pequeñas emplean una combinación de ambos tipos de compresores. En el compresor centrífugo el aire entra en dirección axial y sale en dirección radial por un difusor. Un difusor es un dispositivo que aumenta la presión de un fluido a costa de una pérdida de velocidad, el fluido pasa de un área mayor a una menor; la figura 1.2 2

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

ilustra la imagen de un difusor. En el compresor centrifugo la combinación de un alabe rotatorio y un alabe estacionario (difusor) forma una etapa como se muestra en la figura 1.3. A la relación de presión de salida entre presión de entrada se le denomina razón del compresor. El compresor de tipo centrífugo tiene una razón de 1:3 por etapa. La operación exitosa de las plantas de potencia depende de la eficiencia del compresor, es por eso que tenemos que escoger el compresor más adecuado en el que intervienen diferentes disciplinas de la ingeniería. El trabajo que realiza el compresor consiste en convertir la energía cinética de los alabes rotatorios a energía potencial en los alabes estacionarios. Para el uso en plantas de potencia se prefiere un compresor axial cuyo funcionamiento detallaremos a continuación. [2]

Figura 1.2. Difusor cónico

Figura 1.3: Componentes de un compresor

El compresor axial acelera un fluido de trabajo (aire) para que después pase por un difusor donde saldrá con un nivel de presión bastante alto. Al fluido lo acelera un alabe rotatorio conocido como rotor, e incrementa su presión un alabe estacionario conocido como estator. Lo anterior se desarrolla en una sola etapa, pero el compresor tiene 3

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

bastantes etapas. Se tiene una fila adicional de alabes guía (alabes de entrada) para que el flujo siga una dirección axial y no se vaya a desviar entrando con un ángulo de ataque a la primera etapa del compresor. Existen también alabes estacionarios a la salida del compresor cuyo objetivo es controlar la velocidad que entra a la cámara de combustión. En el compresor axial el aire pasa de una etapa a la siguiente, en cada etapa se incrementa la presión. Aproximadamente se logra una relación final de presiones de 17:1. Como toda turbo-maquina, un compresor axial puede ser descrito por coordenadas polares (figura 1.4); donde Z representa la longitud de la flecha, r es el radio de la flecha y q es el ángulo de rotación del alabe.

Figura 1.4: Coordenadas polares de un compresor axial.

La superficie del alabe es curva con una zona convexa y una zona cóncava. A la zona cóncava se le conoce como zona de presión y la zona convexa es la zona de succión. La línea de cuerda del alabe es la línea dibujada sobre el eje vertical en la dirección de la cuerda (figura 1.6). En esta imagen podemos apreciar las diferentes variables que intervienen en el giro del alabe El ángulo de inclinación q es el ángulo de rotación del alabe. La distancia S es la distancia entre alabes. La solidez es la razón entre la cuerda y la distancia entre alabes (c/s) y es una medida de indicación entre los efectos de interferencia entre alabes. Un rango de exactitud aceptable de solidez es de 0.5 a 0.7. b1, es el ángulo de entrada y b2 es el ángulo de salida de flujo formados por la vertical y la línea de inclinación. Aunque idealmente el aire entra y sale con los mismos ángulos a los que giran los alabes, en la práctica esto no ocurre así y el aire saldrá a un ángulo a1 y a2 conocidos como Angulo de ataque de entrada y salida respectivamente que si alcanzan un valor máximo ocasionarán inestabilidad a lo largo del compresor. 4

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Figura 1.5: Elementos del perfil de un alabe

La velocidad de entrada del flujo que atraviesa al compresor se puede entender mejor si nos auxiliamos de un diagrama (figura 1.6) conocido como triangulo de velocidades. El aire atraviesa el alabe rotatorio con una velocidad V y un ángulo a1 que actúa junto con la velocidad tangencial (U) para producir la velocidad relativa W que forma un ángulo a2 con la vertical. Al pasar por el estator entrara con una velocidad V2 formando un ángulo a3 con la vertical, las componentes de esta velocidad tangencial U y la velocidad relativa W2.

5

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Figura 1.6: Triangulo de velocidades.

La cámara de combustión es el dispositivo que sigue, su tarea consiste en incrementar la temperatura del gas de alta presión que sale del compresor. En la cámara de combustión se desarrolla un proceso conocido como combustión que consiste en mezclar aire con combustible. Los productos de la combustión son mezclados con aire para salir con una temperatura adecuada hacia la turbina. La combustión de los gases naturales es una reacción que ocurre entre carbono, hidrógeno y oxígeno. Después de la reacción se produce calor y sus productos son: CH 4 + 4O ¾ ¾® CO2 + 2 H 2O + Calor

(1.1).

Se requieren cuatro partículas de oxígeno para quemar una de metano. Los productos de la combustión son una partícula de dióxido de carbono y una de agua. La cámara de combustión está compuesta por tres zonas: § La zona de recirculación. Su función es evaporar, parcialmente calentar y preparar el combustible. § Zona de llama. Idealmente todo el combustible estará quemado al final de esta zona. § Zona de dilución. Su función es mezclar el gas caliente con el aire diluido.

6

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

El gas que sale de la mezcla deberá tener una temperatura y velocidad adecuadas. La temperatura a la entrada de la cámara de combustión depende de la relación de presiones en el compresor, carga y tipo de motor; y si la turbina es regenerativa o no. Normalmente el desempeño de la cámara de combustión depende de tres factores: eficiencia, pérdida de presión y una temperatura de salida baja. La perdida de presión es el problema más importante porque afecta el consumo del combustible. La perdida de presión usualmente tiene un rango del 2% al 8% de presión estática. Está perdida es igual a un decrecimiento en la eficiencia del compresor. El resultado de un incremento en el consumo de combustible y baja salida de potencia afectada por el tamaño y peso del motor. Otro problema importante durante la combustión es la formación de óxido nítrico. La reacción química que produce óxido nítrico es: 2 N + 5O + H 2O ¾ ¾® 2 NO + 3O + H 2 O ¾ ¾® 2 HNO

(1.2).

La formación de acido nítrico no ocurre durante el proceso de combustión, pero después el oxido nítrico oxida y enfría al NO2 rápidamente; por lo tanto es necesario controlar la formación de oxido nítrico para que no se convierta en acido nítrico. Si reducimos la temperatura de combustión, retardaremos la formación de acido nítrico. Otros productos indeseables son el oxido de azufre y acido sulfúrico, sin embargo su control es más caro. Una alternativa es separar la mayor cantidad posible de azufre del combustible. Las turbinas de gas contienen suficiente aire, lo cual no produce CO (monóxido de carbono). La cámara de combustión podría ser un tubo que conecte al compresor con la turbina. Realmente este arreglo sería impráctico porque la combustión a altas velocidades produciría grandes pérdidas de presión. La perdida de presión es directamente proporcional a la velocidad del aire; por esta razón el aire pasa primero por un difusor que reduce la velocidad de entrada a la cámara de combustión y simultáneamente reduce a la mitad la perdida de la presión. Existe un límite mínimo de velocidad para sostener a la flama durante la combustión, por lo tanto debe de existir un equilibrio de la velocidad y este se logra con ayuda de bujías. Generalmente, la bujía enciende y el gas (propano/butano) incendia, tanto la bujía como el gas son necesarios al principio, hasta que el queroseno alcanza la temperatura adecuada (aproximadamente 100º C); entonces cortamos el gas auxiliar. A continuación se inyecta carburante precalentado en los vaporizadores por pequeños tubitos de un diámetro interior entre 0.4 y 0.6 mm, (inyectores), dentro de la cámara de combustión. En esta zona se mezcla con aire comprimido y se incendia. La temperatura 7

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

de combustión es proporcional al rendimiento; esto quiere decir que entre más alta mejor. Sin embargo, una temperatura muy alta calentará a la turbina en exceso; las temperaturas de entrada en la turbina no pueden superar las limitaciones térmicas de los materiales. Para reducir la temperatura de entrada a la turbina sólo se quema parte del aire comprimido. Esto se logra dividiendo el aire al entrar en la cámara de combustión: parte del aire se mezcla con el combustible y se inflama, y el resto se emplea para enfriar la turbina. Las cámaras de combustión se clasifican como: § Tubular (zona de combustión). Está formada por un número de unidades de diámetro pequeño con revestimientos y cubiertas individuales. Tienen las ventajas de que los pequeños tubos son fáciles de sustituir; la desventaja es que desperdician la sección transversal que atraviesa al aire (figura 1.7). § Anular. La cámara de combustión anular tiene una o dos envolturas continuas. El combustible se introduce por conducto de toberas a la entrada de la envoltura y el aire secundario lo hace por perforaciones. Sus ventajas son que utiliza con efectividad el espacio disponible y suministra una mezcla casi uniforme; su desventaja principal es que es difícil desarmar para dar el mantenimiento. (figura 1.8) § Tubo-Anular. Es un diseño mixto desarrollado para reunir las ventajas de los dos tipos anteriores. (figura 1.9).

Figura 1.7: Cámara de combustión tipo tubular.

8

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Figura 1.8: Cámara de combustión tipo anular.

Figura 1.9: Cámara de combustión tubo-anular. 9

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

El tercer dispositivo es la turbina, su función es extraer energía cinética de la expansión de los gases que se producen en la cámara de combustión, la acumulación de energía cinética se convierte en potencia del orden de caballos de fuerza para mover un eje, el compresor y algunos accesorios. La turbina de gas está hecha de alabes estacionarios y rotatorios unidos a una flecha y un disco. Las turbinas se dividen en tres tipos: impulso, reacción y una combinación de ambas conocida como impulso-reacción. La energía de cada etapa está en función del área de la tobera y de la configuración. Es importante considerar el área de la tobera en el diseño porque si es corta chocará rápidamente con el flujo y si es larga no operará con su eficiencia máxima. La turbina de impulso no produce cambios de presión entre el alabe rotatorio de entrada y el de salida. Sin embargo, la velocidad relativa de entrada será la misma que la velocidad relativa de salida. Los alabes guía de entrada forman un camino para el flujo que tiene la característica de reducir la presión y aumentar la velocidad. En la turbina de reacción los alabes guía solo alteran el paso del flujo. El incremento de velocidad y disminución de presión en el gas es acompañado de una forma convergente entre los alabes rotatorios. En la turbina de impulso W1=W2. En la turbina de reacción W1=C1 y W2=C2. La diferencia entre los dos tipos de turbinas se muestra en la figura 1.10.

Figura 1.10: Comparación entre la turbina de impulso y la de reacción.

Algunas turbinas basadas en sus objetivos incorporan dos compresores y dos turbinas con ejes diferentes. En este caso la primera turbina (de mayor presión) maneja al último compresor y la última turbina maneja al primer compresor. Las turbinas de gas tienen elementos importantes para su funcionamiento conocidos como accesorios. Estos elementos no son parte de la operación en la conversión de energía y sin embargo son necesarios por ejemplo para el suministro de combustible. Ejemplos de estos accesorios son: 10

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

§ Sistemas de ignición. La bujía produce mediante un arco eléctrico la flama que atraviesa la cámara de combustión, después el aire se encarga de mantenerla. § Sistemas de lubricación. Proporciona el aceite necesario para vencer la fricción en dispositivos como cojinetes. § Tanques. Acumulan una reserva extra de aceite para periodos de paro en el motor. § Bombas. El aceite y el fluido deben mantener una presión constante, la cual se logra con ayuda de una bomba. § Filtros. Son los encargados de detener el paso a partículas contaminantes que pueden causar daño al funcionamiento general del fluido. § Enfriadores. Se encargan de reducir el nivel de temperatura de entrada a la turbina de gas para que la soporten los materiales. Si clasificamos a las turbinas de gas, podemos empezar a dividirlas en base al lugar de aplicación; principalmente son de aire y de superficie (mar y tierra). Dentro de las aeroderivativas o basadas en aplicaciones para aviación están el turboventilador, turbojet y turbohélice. Las turbinas de gas basadas en superficie se utilizan para impulso mecánico. Vamos a revisar con detalle los diferentes tipos de motores: · Motores de Reacción. Utilizan una tobera al final para lograr un mayor empuje y aprovechar mejor la energía calorífica de los gases que entran a la turbina; también utilizan un difusor para aumentar la presión al inicio del compresor. El turbojet se caracteriza por tener un gran empuje a la salida de la turbina con ayuda de la tobera; este empuje es capaz de producir un gran chorro de aire para elevar el motor. En el turboventilador y el turbohélice se extrae energía de la tobera para impulsar el compresor y el ventilador o la hélice, los cuales lograran que vuele el avión. La figura 1.11 contiene los componentes principales de los motores de aviación. [3]

11

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Figura 1.11: Motor Turbojet.

· Motores de impulso mecánico. Pueden ser dispositivos de impulso mecánico para uso pesado, uso mediano y aeroderivativas (basadas en motores de aviación) y se aplican como generadores eléctricos, bombeo mecánico y propulsión marina. Estos motores pueden tener un árbol de salida independiente, un árbol con conexión longitudinal y un árbol doble longitudinal. Cuando el árbol está conectado a la turbina se le conoce como conexión en caliente y cuando está conectado al compresor se le conoce como conexión final en frío. Las figuras 1.12 y 1.13 muestran ambos esquemas respectivamente.

Figura 1.12: Esquema de turbina con árbol conectado en lado caliente.

12

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Figura 1.13: Esquema de turbina con árbol conectado en lado frío.

1.2. Aplicaciones de las turbinas de gas. Dos áreas principales de aplicación de las turbinas de gas son la propulsión en aviación y generación de potencia eléctrica. Su uso en aviación genera potencias para manejar el compresor y equipos auxiliares. Los gases que salen a alta velocidad son los responsables de la propulsión necesaria para elevar el avión. Las turbinas de gas son usadas en plantas de potencia estacionarias en conjunción con plantas de potencia de vapor a alta temperatura. En estas plantas, la salida de los gases de las turbinas de gas sirve como fuente de calor. El ciclo de turbinas de gas se ejecuta también en ciclos cerrados para plantas de potencia nuclear. Actualmente el fluido de trabajo no tiene que ser aire, puede usarse un gas con características mejores, por ejemplo helio. [4] La mayoría de las flotas navales del este ya usan turbinas de gas para propulsión y generación de potencia eléctrica. Las turbinas de gas LM2500 de General Electric para la potencia de embarcaciones tienen una eficiencia térmica de un ciclo simple de 37 por ciento. Las turbinas de gas WR-21 de General Electric equipadas con regeneración y refrigeración intermedia tienen una eficiencia térmica de 43 por ciento y producen 21.6 MW. La regeneración causa una reducción en la temperatura de escape de 600º C a 350º C. El aire es comprimido a 3 atmosferas antes de entrar por el refrigerador intermedio. Comparada con las turbinas de vapor y los sistemas de propulsión diesel, la turbina de gas ofrece más potencia con menor tamaño y peso, alta rentabilidad, mayor tiempo de vida y una mayor operatividad. La propulsión de vapor arranca en 4 min. ; Y la turbina de gas en tan solo 2 min. Muchos sistemas de propulsión marina modernos usan turbinas de gas junto con motores diesel porque los motores de turbinas de gas solas consumen más combustible. En sistemas diesel-turbinas de gas combinados, el diesel es necesario 13

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

para suministrar una menor potencia y la turbina de gas para aportar una mayor velocidad. En las plantas de potencia de turbinas de gas, la relación de presiones del compresor (llamada razón de trabajo) es muy alta. Más de la mitad del trabajo de salida de la turbina es usado para manejar el compresor. La situación empeora cuando la eficiencia isoentrópica en la turbina y el compresor disminuyen. En contraste las turbinas de vapor disminuyen un porcentaje muy pequeño la razón de trabajo. Sin embargo, no es sorprendente que un líquido sea comprimido en plantas de vapor en lugar de gas, y el trabajo de flujo estacionario sea proporcional al volumen específico del fluido de trabajo. Una planta con una alta razón de trabajo requiere turbinas más largas para suministrar potencia al compresor. Las turbinas de gas son más largas que las turbinas de vapor para la misma potencia neta de salida.

1.3. Aplicaciones en México. Uno de los principales usos de las turbinas de gas en México es la generación de energía. La principal empresa que se dedica a la generación y distribución es Comisión Federal de Electricidad por medio de contratos a la iniciativa privada. Su principal proveedor es el grupo UNION FENOSA cuenta en México con 1.550 MW de potencia bruta instalada en ciclos combinados de gas. En México también son utilizadas por la industria aeronáutica unas de las empresa que utilizan son Mexicana de Aviación y Aeroméxico. Otra aplicación es para la industria petrolera. A continuación se en listan las principales empresas dedicadas a la comercialización de turbinas de gas así como el diseño: IGSA: Empresa que brinda un servicio en plantas de emergencia, instala plantas de potencia mediante su división de motores y turbinas a gas. Industrializa 150 turbinas aeroderivativas con marcas como: Orenda, Kawasaki, General Electric y Rolls Royce. [5] ALSTOM: Empresa dedicada a la construcción y servicios de plantas de potencias. Principalmente de turbinas de gas y vapor. En México se localiza en Morelia. 14

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Turbinas de Zihuatanejo: empresa que provee los siguientes servicios: análisis, diseño, drafting, publicaciones técnicas e ilustraciones y desarrollo de métodos. Estos servicios son desarrollados a través de los grupos: 1. Diseño y análisis. 2. Modelado de sólidos y drafting. 3. Publicaciones técnicas. 4. Desarrollo de métodos. Siemens de México: Empresa dedica a dar los siguientes servicios: reparaciones, modernizaciones, asistencia técnica en sitio o servicios completos de operación y mantenimiento. Uno los servicios que ofrece esta empresa es la modernización y mejoras de turbinas de gas. Esto es realizado con el uso de materiales más resistentes, revestimiento con tecnología avanzada, arreglos de sellos mejorados, flujos de enfriamiento optimizados donde se puede mejorar el grado de eficiencia de la turbina y prolongar la vida útil. ITR forma parte de una red mundial de líderes en la Industria Aeronáutica, empresa que se dedica al desarrollo e investigación que es una de las más reconocidas en los sectores de transporte aéreo, Ingeniería, Fabricación y Mantenimiento de Turbinas de gas. En México ofrece los siguientes servicios. [6] • Mantenimiento y reparación de motores • Ingeniería de Diseño y Desarrollo • Fabricación de componentes Grupo Sentry empresa afiliada a Sentry Intercontinental LTD de Inglaterra se dedica principalmente a la comercialización de turbinas de gas industriales Rolls- Royce para los sectores de petróleo y gas, así como la generación de energía eléctrica incluyendo plantas de cogeneración. También se dedica a comercialización de refacciones para turbinas industriales y aeronáuticas.

1.4. Mantenimiento de las turbinas de gas. El mantenimiento involucra la restauración de las tolerancias a estados iniciales comparables con los que fueron manufacturados los componentes de la turbina de gas. Debido a la complejidad de las turbinas de gas mismas y de todos sus componentes el mantenimiento no es sencillo y se debe realizar puntualmente, ejecutándolo con procedimientos muy exactos. [1] Para resolver los problemas de mantenimiento, las soluciones se dividen en cuatro categorías: 15

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

· Entrenamiento de personal. La gente debe ser entrenada adecuadamente para adquirir experiencia, y ser técnicos altamente capacitados. El buen entrenamiento es costoso pero también es muy retribuyente. Las máquinas cambian su estructura a pasos agigantados y requieren de un conocimiento de diversas disciplinas. Los métodos clásicos deben dar resultados antes de complicar el tipo de mantenimiento que necesitan. · Herramientas y refacciones. Las herramientas de análisis son boroscopio, analizadores de vibración y programas de mantenimiento en línea. El equipo de refacción puede ahorrar gastos si se sustituye en un lapso de tiempo mínimo. · Reemplazo de piezas. Es importante considerar los problemas que involucra tener que comprar refacciones. El reemplazo de piezas cuesta mucho porque alarga el tiempo de paro, incluso cuando las piezas no son fáciles de sustituir y tardamos bastante tiempo en adquirirlas. La solución de muchos usuarios para reducir costos e inversión es tener un banco de piezas de reemplazo al inicio que adquieren una planta. · Mejoras para la rehabilitación de la maquinaria. El mantenimiento es costoso y baja la rentabilidad de la operación de la máquina por el tiempo de paro del sistema; sin embargo el mantenimiento es necesario. Se ha detectado que una tercera parte de los paros en la maquinaria es debido a fallos. Esto se puede reducir bastante si implementamos un sistema de control y revisamos constantemente mientras trabaja la máquina su estado y si ocurre alguna falla importante. En resumen podemos hablar de 2 tipos de mantenimiento: preventivo y correctivo. El primero tiene la función de aumentar el tiempo de vida de la máquina y asegurar un buen funcionamiento sin fallas; el segundo consiste en reparar fallas después de tener problemas en la maquinaria de la turbina de gas, y es el que tenemos que evitar. Entre los tipos de mantenimiento correctivo se tiene: · Lavado de turbomaquinaria. Son tres razones de limpieza. La primera es para restaurar la capacidad del sistema. Si la unidad es un generador su potencia máxima bajara sí está sucio. Si la maquinaría es un compresor dinámico, la mugre obstruirá su cabeza, y por lo tanto, reducirá su nivel de caudal. La segunda razón es para incrementar la eficiencia de la maquinaria. En muchos casos los componentes sucios requieren una mayor cantidad de combustible porque los depósitos de mugre obstruyen su transferencia de calor. 16

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

La tercera razón es para predecir fallas porque las partículas contaminantes se acumulan en pistones y válvulas causando un exceso de velocidad que no se pueda detener y como consecuencia sobrepase esfuerzos en maquinas centrifugas y algunas vibraciones. Las técnicas más comunes de limpieza utilizan abrasivos y solventes. · Mantenimiento en la sección caliente. Las cámaras de combustión se pueden remover íntegramente para su inspección. Las grietas no son comunes y en caso de encontrarlas necesitaran una atención inmediata. Es muy importante identificar el tipo de grieta y si el metal analizado se puede reparar. El área quemada es muy susceptible de estar sucia. Los alabes de la turbina se inspeccionan continuamente por ser un área que corre peligro constantemente por las altas temperaturas. · Mantenimiento del compresor. Debe de inspeccionarse antes que el área de la sección caliente. En los compresores axiales se dan fallas principalmente en los discos y alabes rotatorios. Durante el mantenimiento cada alabe tiene que lavarse y revisar si no tiene grietas, en caso de tenerlas se sustituirá o reparará por medio de soldaduras. · Mantenimiento a cojinetes. Muchas fallas de las turbinas de gas son causadas por vibración y esfuerzos rotatorios. Los cojinetes pueden amortiguar o atenuar estos esfuerzos. Principalmente se revisan cuatro secciones de los cojinetes: superficie de zapata metálica, superficie pivote de retención, anillos de estancamiento, sellos tipo o-ring y superficies de bola. Como cualquier equipo de potencia, las turbinas de gas requieren de un programa de inspecciones para reparar o reemplazar componentes dañados. Un diseño apropiado de inspección conducida y programas de mantenimiento preventivo incrementa la disponibilidad de las turbinas de gas y reduce el mantenimiento fuera de línea. La inspección y el mantenimiento preventivo son caros, pero no tan costosos como los paros. Todas las manufactureras hacen énfasis a la descripción de procedimientos de mantenimiento preventivo para asegurar la rentabilidad de su maquinaria; y cualquier programa de mantenimiento debe basarse en las recomendaciones de los manufactureros. La inspección y el mantenimiento preventivo se pueden adaptar a las recomendaciones y manuales del fabricante. Las inspecciones diarias se pueden llevar a cabo mientras funciona la maquinaria. Para una inspección más profunda es necesario desarmar la turbina de gas. Los chequeos diarios deben incluir (pero no están limitados) las siguientes características: · Nivel de lubricación de aceite. · Filtros de aceite hacia el motor. · Aflojamiento de sujetadores, tubos y conexiones eléctricas. 17

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

· Entradas de filtros. · Sistemas de escape. · Sistemas de control y monitoreo con indicadores de luces. La inspección diaria requiere al menos una hora para realizarse de manera adecuada. Los intervalos entre inspecciones dependen de las condiciones de la turbina de gas. Generalmente los fabricantes proporcionan guías para determinar los intervalos de presión que se basan en la temperatura de gas, tipo y calidad del combustible utilizado y número de interrupciones. La primera inspección menor con la turbina trabajando es el punto de referencia más importante que se almacenara. Todos los datos deben ser comparados cuidadosamente con la información de la instalación de la turbina para acertar si alguna configuración cambió, desalineamiento o un desgaste excesivo ha ocurrido durante la operación. Las inspecciones siguientes son igual de importantes desde la verificación de las recomendaciones del fabricante hasta ayudar a establecer las condiciones de operación. Cuando establezcamos el tiempo para realizar mantenimientos mayores, el departamento de operación y los ingenieros de manufactura deben planear la inspección en base a los datos de medición. Antes de poner fuera de servicio a la turbina, se tomara un tiempo para realizar una prueba en presencia del ingeniero de manufactura. Estas pruebas usan como referencia la medición de presión y temperatura, cuyas variables servirán como grado de comparación con pruebas idénticas que se van a realizar con la planta fuera de servicio. Las pruebas operacionales finalizaran con un exceso de velocidad que indicará a que mecanismo se prestará más atención durante el paro de la máquina.

1.5. Diagnóstico de las turbinas de gas. La información que obtenemos con el monitoreo es si el motor trabaja correctamente o tiene al menos una falla. Sin embargo, no podemos predecir donde está exactamente la falla y para buscarla tenemos que de tener el motor. [7] El diagnóstico es la disciplina que se encarga del estudio de las técnicas de la detección de fallas. El poder predecir el componente donde se encuentra la falla del motor y la causa nos permitirá ahorrar tiempo y dinero en el paro del motor. Algunas de las fallas más comunes en las turbinas de gas se describen en la tabla 1.1.

18

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Tabla 1.1: Fallas principales en los motores de turbinas de gas.

COMPRESOR Componente Alabes rotatorios estacionarios Disco Pernos

y

Falla

Causa

Fatiga (resonancia), erosión, objetos externos, choques corrosivos, ruido, desgaste. Fatiga lineal, desgaste, fricción. Fatiga mecánica, fricción.

Vibración, surge, stall, distorsión de flujo.

Cargas de temperatura centrifuga Arranques y paros cíclicos, fricción.

CAMARA DE COMBUSTION Componente

Falla

Causa

Boquilla

Fatiga térmica, pandeo, fatiga térmica, desprendimiento corrosión y distorsión térmica. Fatiga. Desgaste, corrosión, fatiga térmica. Fatiga térmica, desgaste y fricción.

Puntos calientes, gradientes de temperatura, vibración, pulsaciones de presión dinámica excesivas. Ciclos a presión. Pulsación y vibración. Pulsaciones dinámicas y vibración.

Componente

Falla

Causa

Alabes rotatorios

Fatiga de alta eficiencia, desalineamiento, corrosión, solidificación, erosión.

Alabes Estacionarios

Ruptura lineal, corrosión, solidificación, arqueo, fatiga térmica. Ruptura lineal, fatiga de bajo rendimiento

Esfuerzos térmicos y centrífugos, desarrollo vibratorio, crecimiento de temperatura del combustible, problemas de enfriamiento. Problemas de enfriamiento, perfil térmico impropio. Enfriamiento impropio entre ruedas, esfuerzos térmicos.

Carcasa Tubos de flama Piezas de transición

TURBINA

Discos

1.5.1. Diagnóstico por medios físicos. La dirección de la diagnosis física incluye: inspección visual, inspección de las partes interiores del motor con equipo óptico, el análisis de la estructura del aceite usado, el grupo de métodos de la búsqueda de grietas y otros. Estos métodos se aplican durante el mantenimiento y reparación del motor. Los requisitos son parar el motor y desmontarlo. · Monitoreo de partículas en el lubricante. Las superficies de rodamiento generan partículas y están sujetas a fallas incipientes. Las partículas pueden generarse de diferente tamaño y distribución. El incremento en la falla depende del tamaño. En cojinetes y chumaceras bajo condiciones elasto-hidrodinámicas, donde el grosor de la película es grande comparado con superficies ásperas, una superficie que esta fatigada se siente rugosa y produce partículas de 100 a 1000 m. En el régimen de cuerpos lubricados y de sustancias mezcladas las partículas son más pequeñas (k. La solución (3.11) asegura errores aleatorios reducidos de las estimaciones, si comparamos con la solución: A = (V ) -1 Y

(3.12).

que se tiene para el caso n=k, cuando el número de ecuaciones se iguala al número de las variables desconocidas. Al poner la estimación Aˆ . en la ecuación (3.5), tenemos la función de referencia La siguiente herramienta para crear la función de referencia y la principal en la presente investigación es la llamada redes neuronales artificiales.

51

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

3.3.2. Método de aproximación por redes neuronales La teoría de redes neuronales se basa en el modelo de las neuronas del cerebro. La neurona es una célula activada por estímulos químicos y biológicos y tiene una capacidad muy pequeña del tratamiento de información. Sin embargo, cuando están conectadas millones de ellas trabajan como una red muy poderosa de procesadores paralelos. Eso ocasiona que en muchas aplicaciones prácticas los supercomputadores modernos todavía no son capaces de semejarse con el funcionamiento del cerebro humano. Aunque en el pasado las redes neuronales artificiales tenían el objetivo general de un procesamiento de nivel más bajo, por ejemplo, reconocimiento de patrones e inteligencia artificial; existen teoremas que demuestran que redes como el perceptron multicapa y la red de base radial, puedan aproximar varias funciones matemáticas. La primer investigación de las virtudes del perceptrón multicapa como dispositivos para la representación de funciones continuas arbitrarias, la realizaron Hecht Nielsen (1987), quienes se basaron en el teorema de superposición de Kolomogorov que formulo Sprecher en 1965. Entonces, Gallant y White mostraron que una red con una capa oculta, con cosenos monótonos ajustados en la capa oculta, e insertados en la salida como un caso especial de “red de Fourier” se aproxima a un conjunto de series de Fourier dada por su salida. Sin embargo, en el contexto del tradicional perceptrón multicapa, fue Cibenko quien demostró rigurosamente que una sola capa oculta es suficiente para aproximar uniformemente una función continua contenida en un hipercubo. [17] Para resumir los teoremas mencionados anteriormente centraremos la atención en los resultados realizados por Funahashi y Cybenko en 1989: Definamos a j (.) como un campo de funciones continuas, monótonas y crecientes. Ip denota el hipercubo unitario de dimensión-p [0,1]p. El espacio de funciones continuas en Ip se llamara C(Ip). Entonces, dada una función f Î C ( I p ). y e > 0. , existe un entero M y un grupo de constantes αi, θi y wji, donde i=1,……….M y j=1,……..p tal que: M

p

i =1

j =1

F ( x1 , K , x p ) = å a ij (å w ji x j -q j )

(3.13).

Como condición de aproximación de la función f(.); se debe cumplir que: F ( x1 ,K, x p ) - f ( x1 ,K, x p ) < e

52

(3.14).

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

para todo {x1 ,K , x p } Î I p . El teorema es directamente aplicable al perceptrón multicapa. Primero, notemos que la función logarítmica 1 [1 + exp(-v)] no lineal en un modelo neuronal para la construcción de un perceptrón multicapa, es necesariamente una función monoticamente creciente que satisface las condiciones de la función j (.) . El teorema de aproximación universal está respaldado por una justificación matemática de aproximación de funciones continuas. Para el presente estudio seleccionamos el perceptrón multicapa que se entrena con el algoritmo de retropropagación. La estructura de la red utilizada se muestra en la figura 3.2. Como podemos ver, es una red neuronal con 3 capas: La primera es la capa de r entrada donde cada señal es un elemento del vector U de las condiciones de operación de turbinas de gas. A su vez, las salidas de estas se propagan con los pesos de la matriz w1 hacia la capa oculta que se activa con una función sigmoide de transferencia. De manera semejante las salidas de la capa oculta se propagan con los pesos de la matriz w2 a los nodos de salida. En ellos se suman y a través de la función de transferencia forman las r señales de salida, elementos del vector Y0 de las variables monitoreadas. El algoritmo que entrena a la red neuronal se basa en la biología de humanos donde la memoria a corto y largo plazo está asociada con las fuerzas entre las células presinapticas y postsinapticas. De esta manera tenemos que ir modificando los valores de los pesos hasta que mediante el procesamiento no lineal (o lineal) de cada capa se alcanza el valor r deseado de la salida Y0 . El desarrollo del algoritmo de retropropagación para el entrenamiento del perceptrón ha impulsado una amplia difusión de esta red. El objetivo del entrenamiento de retropropagación es encontrar tales valores de todos pesos que minimizan la diferencia (error promedio e) entre las salidas deseadas de la red y las actuales para todos los datos de la muestra de entrenamiento. Esta muestra consta de los mismos datos que las matrices V e Y usadas para calcular los coeficientes de polinomios. Podemos tratar el entrenamiento como el problema de la minimización de la función e(w1,w2) en el espacio multidimensional de todos los pesos desconocidos.

53

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Figura 3.2.-Estructura del perceptrón la función de referencia.

A pesar de la capacidad de aplicación que comprende una red neuronal, es una estructura compleja. Por eso, se examinaran cada uno de sus elementos en este capítulo, también se menciona el procedimiento matemático que implica el algoritmo de entrenamiento, mejor conocido como regla delta generalizada. La retropropagación estándar es un algoritmo de descenso del gradiente, como la regla de aprendizaje de Widrow Hoff, que establece el movimiento de los pesos hacia el gradiente negativo de la función definida por la red. Hay un gran número de variantes para el método de retropropagación, basados en técnicas estándar de retropropagación, por ejemplo: el método de Newton y el gradiente conjugado. El toolbox de matlab utiliza más de una optimización, por lo que es importante describir primero detalladamente el método de retropropagación estándar. En la aplicación de retropropagación, distinguimos dos fases de cálculo. La primera fase, que se refiere a la propagación hacia adelante y la segunda fase es la propagación hacia atrás. En el cálculo hacia delante los pesos sinápticos permanecen inalterados y las funciones de las señales de la red son calculadas neurona por neurona. [9] Para entender cómo se propagan los valores de entrada hacia delante consideremos la figura 3.3 que muestra un perceptrón multicapa con C capas, C-2 capas ocultas y nc neuronas en la capa c, para c=1,2,……..,C. El peso de la conexión de la neurona i de la capa c a la neurona j de la capa c+1 es wijC . Los componentes del vector de umbrales de la

54

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

capa c son uiC . Denominaremos las entradas como xi = ai1 , salidas aic de la capa oculta c y aiC = yi salidas globales de la última capa.

Figura 3.3.-Red PERCEPTRON de C capas.

Los valores con los que se activan las neuronas de la capa de entrada con las señales del exterior y se expresan como el vector X=(x1, x2, ………. , xn). Las neuronas ocultas se encargan de procesar la información recibida aplicando una función de activación, que se explico en el capitulo dos; y puede ser sigmoidal, tangente hiperbólica o lineal: f ( x) =

Función sigmoidal

Función Tangente hiperbólica Función lineal

1 1 + e-x

f ( x) =

(3.15).

1 - e- x 1 + e-x

f ( x) = x

(3.16). (3.17).

El argumento de las funciones es la sumatoria de los productos de las activaciones de la capa anterior por los pesos más el umbral. Es decir: nc -1

aic = f (å w cji-1 a cj-1 + u cj )

para i = 1,2,........, nc y c = 2,3,......... ., C - 1

j =1

donde a cj -1 son activaciones de la capa c-1, o sea la capa anterior.

55

(3.18).

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Las activaciones en la capa de salida son similares a las neuronas en la capa oculta; con la diferencia que son salidas globales de toda la red. La función puede ser también sigmoidal o lineal y el argumento es la sumatoria de los productos de las activaciones en la ultima capa oculta por los pesos más el umbral. La activación se calcula en (3.19): nc -1

yi = aiC = f (å w Cji -1a Cj -1 + u Cj )

para i = 1,2,........, nc

(3.19).

j =1

donde Y=(y1,y2,……..,yn) es el vector de salida de toda la red. Esta fue la fase de activación de la red. La segunda fase, conocida como propagación hacia atrás, comienza por la capa de salida, que transmite la señal de error hacia su izquierda, capa por capa, al mismo tiempo calcula recursivamente el gradiente local para cada neurona. Este proceso recursivo permite que los pesos sinápticos de la red actualicen sus valores de acuerdo con la regla delta. Por cada neurona localizada en la capa de salida, d es igual a la señal de error de la neurona multiplicada por la derivada de la función de activación no lineal. Para las neuronas en la capa oculta hay que considerar las conexiones vecinas y calcular el error recursivamente. El detalle de esta última fase del algoritmo reside en que se aplican criterios diferentes en la capa oculta y la capa de salida. Para la segunda fase del algoritmo, comenzaremos por definir el error e(n) cometido por la red para el patrón n, dado por: e( n ) =

1 nc ( si (n) - yi ( n)) 2 å 2 i=1

(3.20).

La señal de error de la salida de la neurona j durante la iteración n (presentación del enésimo patrón de entrenamiento) se define como: e j (n) = s j ( n) - y j (n)

(3.21).

Sea N el número de patrones o ejemplos de entrenamiento. El error cuadrático promedio se obtiene sumando E(n) desde 1 hasta N y normalizando con respecto a N: Eav =

1 N

N

å E ( n) n=1

56

(3.22).

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

La suma instantánea de los errores cuadráticos E(n) y el promedio de los errores cuadráticos Eav son función de todos los parámetros libres (por ejemplo, pesos sinápticos y umbrales) de la red. Eav representa la función de costo como medida del rendimiento del aprendizaje. El objetivo del proceso de aprendizaje es ajustar los parámetros libres para minimizar Eav. Los ajustes a los pesos se realizan en concordancia con los errores calculados por cada patrón presentado a la red. La aritmética promedio de estos cambios individuales de los pesos sobre todo el grupo de entrenamiento es una estimación del cambio verdadero que resultaría de modificar los pesos iniciales para minimizar la función de costo Eav para el grupo de entrenamiento completo. La minimización del error se lleva a cabo por el método del descenso del gradiente, con fundamento en la teoría del cálculo. El gradiente con respecto a los pesos de la capa de salida es independiente del gradiente respecto a los pesos de las capas ocultas, el cómputo para el incremento DW se ilustra en las siguientes ecuaciones: Pesos en la capa de salida w Cji -1 (n) = wCji -1 ( n - 1) - a

¶e( n) ¶wCji -1

Pesos en la ultima capa oculta wkjC -2 (n ) = wkjC -2 ( n - 1) + a

¶e(n) ¶wkjC -2

(3.23).

(3.24).

El gradiente ¶e ¶w representa un factor de inestabilidad, determinado por la dirección en busca del espacio de pesos para los pesos sinápticos w. Por tanto, para actualizar los pesos es necesario evaluar la derivada del error e(n) en dicho punto como en la ecuación (3.25). ¶e(n) ¶e(n) ¶yi (n) = ¶w Cji -1 ¶yi ( n) ¶w Cji -1

(3.25).

Diferenciando ambos lados de la ecuación (3.20) con respecto a yi(n) y considerando la salida deseada constante, obtenemos: ¶e(n) = -( si ( n) - yi (n)) ¶yi ( n)

57

(3.26).

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Diferenciando ambos lados de la ecuación (3.19) con respecto a wji(n), obtenemos: nc -1 ¶y i ( n ) ¢ = f ( w Cji -1a Cj -1 + uiC )a Cj -1 å C -1 ¶w ji (n) j =1

(3.27).

El gradiente local matemáticamente se define como: nC -1

nC -1

j =1

j =1

d iC ( n) = -e j ( n) f ¢( å wCji -1a Cj -1 + uiC ) = -( si ( n) - yi ( n)) f ¢( å wCji -1a Cj -1 + u iC )

(3.28).

El gradiente local puntual requiere cambios en los pesos sinápticos. De acuerdo con (3.28) el gradiente local d j (n) para la salida de la neurona j es igual al producto de la señal de error ej(n) y la derivada de la función de activación asociada. Sustituyendo en (3.25), encontramos la expresión para actualizar los pesos de la capa de salida. ¶e(n) = d iC (n) a Cj -1 ( n) ¶wCji -1

(3.29).

De las ecuaciones anteriores podemos notar que un factor clave involucrado en el cálculo del ajuste de pesos Dw ji (n) es la señal de error ej(n) a la salida de la neurona j. En este contexto, debemos identificar dos casos distintos, dependiendo en que parte de la red está localizada la neurona j. En el primer caso estará localizada en la capa de salida. Este caso es el más simple porque cada nodo de la salida de la red está alimentado con la respuesta deseada, haciéndose abiertamente importante para el cálculo asociado con la señal de error. En el segundo caso, la neurona j está localizada en la capa oculta. Cada una de las neuronas ocultas no son accesibles, pero comparten la responsabilidad de los errores en la capa de salida de la red. La pregunta, sin embargo, consiste en como castigar o premiar a las neuronas de la capa oculta la parte de su responsabilidad. A este problema lo conocemos como problema de crédito-asignación y es una forma elegante de propagar hacia atrás la señal de error de la red (Viñuela y Galván: 54). CASO 1: La neurona j se localiza en la capa de salida. Cuando la neurona j se encuentra en la capa de salida de la red, es alimentada directamente con la respuesta deseada. Por lo tanto usamos la ecuación (3.21) para calcular la señal de error asociada con está neurona. Después de determinar ej(n), es fácil usar (3.28) para obtener el gradiente d i (n) . 58

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

CASO 2: La neurona j se localiza en la capa de oculta. Cuando la neurona j está localizada en alguna capa oculta de la red, no hay una respuesta deseada específica para esa neurona. Por consiguiente, la señal de error para una neurona oculta puede determinarse recursivamente en términos de las señales de error de todas las neuronas conectadas con ella directamente; la complejidad del algoritmo de retropropagación reside en este procedimiento. En este caso elegimos un peso de la capa C-2 a la capa C-1. El peso de la conexión de la neurona k de la capa C-2 a la neurona j de la capa C-1 es wkjC -2 , cuyo peso influye en todas las salidas de la red, por lo que la derivada del error respecto al peso toma en cuenta la sumatoria de todas las salidas en la red y es mostrado en (3.30). nC ¶y (n) ¶e(n) = ( si (n) - yi (n)) i C -2 å C -2 ¶wkj ¶wkj i =1

(3.30).

Para calcular la derivada de la salida yi(n) respecto al peso wkjC -2 , hay que considerar que el peso solo influye en la neurona j de la capa C-1. nC -1 ¶a Cj -1 ¶yi ( n) C -1 C -1 C C -1 ¢ = f (å w ji a j + u i ) w ji ¶wkjC -2 ¶wkjC -2 j =1

(3.31).

Sustituyendo 3.31 en 3.30 y aplicando la definición de gradiente local de (3.28). ¶a Cj -1 ¶e( n) nC C C -1 = å d i ( n) w ji ¶wkjC -2 i=1 ¶wkjC -2

(3.32).

La derivada de la neurona j de la capa oculta C-1 con respecto al peso que la conecta con C-2 la calculamos en (3.33). ¶a Cj -1 ¶wkjC -2

nC - 2

= f ¢( å wkjC -2 akC -2 + u Cj -1 )a kc-2 (n ) k =1

59

(3.33).

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Nuevamente podemos definir un gradiente local para las neuronas de la capa C-1 en la expresión (3.34). nC - 2

nC

k =1

i =1

d j C -1 ( n) = f ¢( å wkjC -2 a kC -2 + u Cj -1 ) å d iC ( n) wCji -1

(3.34).

A partir de 3.34 podemos generalizar el gradiente local para las neuronas de la capa oculta como sigue: nc

nc +1

k =1

i =1

d j c+1 ( n) = f ¢(å wkjc akc + u cj )å d ic +2 (n) wcji

(3.35).

El factor f ¢(v j (n)) involucrado en el cálculo del gradiente local d j (n) en la ecuación (3.34) depende solamente de la función de activación asociada con una neurona oculta k. El factor restante involucrado en el cálculo, la sumatoria sobre nc+1, depende de dos grupos de términos. El primer grupo de términos, d i (n) , requiere conocimiento de las señales de error ej(n), para todas estas neuronas caen en la capa a la derecha inmediata a la neurona j oculta. El segundo grupo de estos términos, wji, consiste en los pesos sinápticos asociados con estas conexiones. En aplicaciones prácticas del algoritmo de retropropagación, para entrenar a la red se utilizan muchos grupos de ejemplos. Cada ejemplo es un conjunto de entradas y salidas conocidas a priori para el caso de una red supervisada. Después de presentar todo el conjunto de ejemplos terminamos un proceso que se conoce como época. El proceso de aprendizaje se repite época por época hasta que los pesos sinápticos y los umbrales de la red se estabilizan y el error cuadrático promedio converge a un valor mínimo. Es buena práctica presentar aleatoriamente los ejemplos a la red de una época a otra. Esta aleatoriedad tiende a buscar el espacio de pesos estocásticamente sobre los ciclos de aprendizaje, esto evita la posibilidad de calcular valores cíclicos en los vectores de los pesos sinápticos. Existen dos maneras para que el algoritmo de retropropagación presente los ejemplos a la red durante una época. Los dos modos de entrenamiento son: § Modo Serie. En el algoritmo de retropropagación modo serie, los pesos se actualizan después de la presentación de cada ejemplo. Para ser específica, consideramos una época que consiste de N ejemplos de entrenamiento (patrones) arreglados en orden [ X (1), d (1)], K , [X ( N ), d ( N )]. El primer ejemplo [ X (1), d (1)] en la 60

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

época es presentado a la red, inmediatamente después la red desempeña la secuencia de cálculos hacia adelante y hacia atrás, como resultado los pesos sinápticos y niveles de umbral ajustan sus valores. La red recibe el segundo ejemplo [ X (2), d ( 2)] para posteriormente efectuar los cálculos hacía adelante y atrás, seguido de un ajuste más rápido en los valores de pesos y umbrales. Este proceso continuará hasta el último ejemplo [ X ( N ), d ( N )]. Designemos Dw ji (n) al cambio en el peso sináptico después de presentar el patrón n. Entonces, el cambio de peso en la red Dwˆ ji , promedio durante el entrenamiento de N patrones, esta dado por: Dwˆ ji =

1 N

N

å Dw ji (n) = n=1

a

¶E (n) a =å N n=1 ¶w ji ( n) N N

¶e j (n)

N

å e (n) ¶w j

n =1

ji

( n)

(3.36).

§ Modo Lotes. En el modo por lotes, le red actualiza los pesos después de la presentación de todos los ejemplos de entrenamiento, es decir, después de una época los pesos y umbrales cambian sus valores. Para una época, definimos la función costo como el error cuadrático medio, ecuación (3.22). Para una tasa de aprendizaje constante h , la regla delta define el ajuste de los pesos sinápticos: Dw ji = -a

¶Eav a =¶w ji N

N

å e (n) j

n =1

¶e j ( n) ¶w ji

(3.37).

Comparando la ecuación (3.36) con la (3.37), observamos con facilidad las diferencias. Desde un punto de vista operacional, en tiempo real, es preferible el modo serial, porque requiere menor capacidad de almacenamiento para cada conexión sináptica. Sin embargo, los patrones son presentados a la red de manera aleatoria, el uso de actualización de pesos patrón por patrón hace que la búsqueda en el espacio de pesos sea de naturaleza estocástica, lo cual ocasiona que el algoritmo quede atrapado en un mínimo local. En cambio, el entrenamiento por lotes posee mayor exactitud en la estimación del gradiente. En la presente investigación, entrenamos a la red neuronal por lotes debido a que el tiempo de ejecución es más rápido y aprovechar procedimientos de aprendizaje más eficientes definidos en matlab. Cuando entrenamos a la red neuronal propuesta consideramos dos funciones de activación o transferencia no lineales, ambas funciones tienen un rango de salida limitado; [0,1] para el caso del sigmoide logarítmico y [-1,1] para la tangente hiperbólica. Sin embargo, las salidas deseadas asociadas a las entradas tienen un rango de [- ¥, ¥] , rango que ocasiona conflicto al entrenar la red. 61

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Por lo tanto, al entrenar a la red neuronal se normalizo el rango, es decir, acotar el rango del conjunto de vectores Y al rango [0,1] con respecto al valor menor y mayor de todos los ejemplos de salidas deseadas. Una vez ajustados los pesos de la red se procede a probar su funcionamiento con ejemplos ajenos a la etapa de educación; pero se obtendrán salidas con valores de 0 a 1, a dichas salidas se aplica un proceso de normalización inverso para ampliar el intervalo respecto a los valores originales de la etapa de entrenamiento. La etapa de normalización que acabamos de describir se le conoce como preprocesamiento y posprocesamiento. Después de establecer la arquitectura y detallar el método de aprendizaje de la red es importante destacar los elementos que se pueden cambiar, los cuales son: cantidad de neuronas en la capa oculta, numero de épocas, definición inicial de pesos y umbrales, funciones de activación, algoritmo de entrenamiento y finalmente, rango de normalización durante el preprocesamiento y el posprocesamiento. En la sección siguiente se describen las instrucciones para programar el polinomio y la red neuronal en matlab, también cada una de las variantes del algoritmo de retropropagación que matlab ofrece como funciones para entrenar la red.

3.4. Matlab como herramienta de aplicación Los dos algoritmos para calcular la función de referencia se programaron en matlab versión 2007. Para calcular los coeficientes y entrenar la red se utilizo un archivo el cuál contiene 330 vectores de entrada y salida, el vector de salida se calculo por medio de un modelo termodinámico y tuvo como argumentos los parámetros de entrada. Para validar el polinomio y la red neuronal se utilizó otro archivo con 4096 vectores de entrada y salida, basados en mediciones hechas a un motor en buen estado. Un fragmento del archivo de entrenamiento se muestra en la figura 3.4 y el archivo de prueba, en la figura 3.5.

62

330 vectores.

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

r Y

Figura 3.4.-Archivo de entrenamiento “base”.

4096 vectores.

r U

r U

r Y

Figura 3.5.-Archivo de prueba “export”.

63

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Para abrir un archivo de texto en matlab se utiliza la función fopen. Para describir dicha función analicemos el siguiente código: fid=fopen('base.txt','rt');

El indicador fid es un valor de retorno que sirve como identificador del fichero. Los argumentos de la función son el nombre del archivo junto con la extensión, encerrado con comillas simples. El archivo debe guardarse en el mismo directorio que el programa, en caso contrario debemos escribir la ruta. Al lado derecho del nombre del archivo, separado con comas, se escriben entre comillas simples las letras que indican las acciones permitidas para el archivo, por ejemplo: 'r' 'w' 'a' 'r+' 'w+' 'a+' 'W' 'A'

Leer. Sobrescribir (crea el archivo si no existe). Adjuntar (escribir a continuación). Leer y escribir (no crea el archivo). Truncar o crear para leer y escribir. Leer y adjuntar (crea el archive si no existe). Escribir. Adjuntar sin sobrescribir.

Después de abrir el archivo aplicamos el código siguiente: krb=-2; while ne(1,feof(fid)) tmpline=fgets(fid); krb=krb+1; end;

En el código anterior vamos a incrementar la variable krb después de ejecutar la función fgets que se encarga de leer línea por línea del archivo hasta terminar. Cuando termina de leer al archivo fid regresara un uno, la cual es la condición para terminar el ciclo. Es decir, con el ciclo anterior vamos a contar el número de líneas que es igual a la cantidad de vectores para calcular los coeficientes y entrenar a la red. La variables krb tiene un valor inicial igual a menos dos porque la información en las dos primeras líneas del archivo son solo comentarios. De acuerdo con la explicación anterior de la función fgets, el siguiente código realizara un salto a las dos primeras líneas del archivo. 64

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

tmpline=fgets(fid); % skip line tmpline=fgets(fid); % skip line

Para poder manipular los valores numéricos del archivo base en matlab, es necesario pasarlos a una matriz como se muestra en el siguiente código: UYT=fscanf(fid,'%g',[kuy,krb]); % reading the U and Y information

La función de la instrucción fscanf es leer los datos para retornarlos a un arreglo o matriz y en general tiene la siguiente sintaxis: [var1,var2,…]=fscanf(fid, ‘cadena de control’ ,size) Donde fid es el identificador del fichero, size es un vector opcional para indicar el tamaño del vector o matriz a leer. La cadena de control va encerrada entre apóstrofos simples, y contiene el formato para las variables, por ejemplo: %s %d %f %lf

para cadenas de caracteres. para variables enteras. para variables de punto flotante. para variables de doble precisión.

En este caso escogimos el formato g que se refiere a elementos reales de la matriz con valores enteros y de punto flotante. Para separar los datos de entrada y salida de la matriz UYT y formar la matriz que contiene las variables del polinomio se utilizaron diversas rutinas con ciclos for. La matriz de variables de polinomios la nombramos A y a la matriz que almaceno los cálculos de los coeficientes la nombramos X. El código siguiente aplica las ecuaciones (3.11) y (3.12) al cálculo de los coeficientes: ky=7; for k=1:ky X(:,k)=A\Y(:,k); YE(:,k)=A*X(:,k); DY(:,k)=(Y(:,k)-YE(:,k))./YE(:,k); end;

Para crear la red neuronal mostrada en la figura 3.2 en matlab se programa la siguiente instrucción: 65

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

nx=minmax(U'); net=newff(nx,[13,7],{'tansig','logsig'},'trainc'); net.trainParam.goal=0.0002; net.trainParam.epochs=1500; net.trainParam.show=35;

La función newff se refiere una arquitectura perceptrón multicapa que utiliza el algoritmo de retropropagación para su entrenamiento y tiene como argumentos: nx, el cual es el valor de retorno de la función minmax (función que toma el valor máximo y mínimo de cada neurona de entrada para tener una mejor distribución de los ejemplos); a continuación entre paréntesis cuadrados se especifica el numero de neuronas de las capas ocultas y la capa de salida (separada cada capa por comas); entre corchetes se especifica la función de transferencia de cada capa y finalmente entre comillas simple el algoritmo de entrenamiento utilizado por toda la red neuronal, por ejemplo trainlm. En la instrucción anterior la capa oculta y la capa de salida utilizan como función de transferencia a la tangente hiperbólica y la sigmoide lógica respectivamente. El entrenamiento de la RNA se realiza por medio de la instrucción: [net,tr]=train(net,U',Ynorm);

La instrucción train llama a la función net.trainFcn, usando las características definidas por net.trainParam., rutina por medio de la cual podemos definir las características de la red, por ejemplo, el número épocas y de nodos en la capa oculta. Ynorm dentro del paréntesis se refiere al vector de supervisión que construye le función de error junto con el vector de supervisión y se obtiene del archivo base, sin embargo estos datos deben ser normalizados a un rango entre [0,1] y [-1,1] por ser los rangos de salida de las funciones no lineales de propagación en el perceptrón. La instrucción train actualiza todos parámetros libres después de una época, cuando todos los ejemplos son presentados a la red. Es decir, educa con el método de retropropagación por lotes. [17] Aunque el método original sea el algoritmo de retropropagación existen modificaciones para que la red converja más rápido, por ejemplo, el método de Levenberg-Marquardt. A continuación se definen los algoritmos para entrenar la red:

Traingd (Gradiente Descendente por Lotes). Cuando entrenamos a la red neuronal con esta instrucción de matlab, aplicamos el algoritmo de retro-propagación que se explico en la sección anterior. Los parámetros 66

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

libres como pesos y umbrales de la red se actualizan después de que transcurre una época, o sea por lotes. Durante la ejecución de esta función los pesos y umbrales son actualizados en la dirección negativa del gradiente. Los siete parámetros asociados a esta función son: epochs, show, goal, time, min_grad, max_fail, lr. El parámetro lr se refiere a la tasa de aprendizaje y es importante tomarlo en cuenta porque si es muy pequeño será muy lenta la convergencia de la función de error hacia un mínimo, sin embargo, si el parámetro lr es grande puede causar inestabilidad en el algoritmo.

Traingdm (Gradiente Descendente con momento). A partir de traingd podemos encontrar tres variaciones más. El gradiente descendiente con momento no solo responde al gradiente local, también se dirige en la superficie de error. Actúa como un filtro pasa bajas, que permite que la red ignore ciertas características de la superficie de error. Sin el momento, el entrenamiento podría detenerse en un mínimo local. Esta función tiene dos parámetros que son: lr, definido anteriormente y mc que se refiere al momento. El momento considera dos nuevos términos h y Dw(n - 1) que se agregaran a la ecuación (3.23), obteniendo la siguiente ley: w(n ) = w(n - 1) - a

¶e(n) + hDw( n - 1) ¶w

donde Dw( n - 1) = w(n - 1) - w( n - 2)

(3.38). (3.39).

Aunque conserva las propiedades del algoritmo anterior, el termino h Dw(n - 1) proporciona cierta inercia, es decir, la modificación actual depende de la modificación anterior. Aplicando sucesivamente (3.39) en (3.38), se obtiene: Dw(n - 1) = w( n - 1) - w(n - 2) = -a

n-1 ¶e( n - 1) ¶e(t ) + hDw(n - 2) = -a å h n -1-t ¶w ¶w t =0

Por lo tanto, podemos generalizar (3.38) en (3.41) como se muestra a continuación: 67

(3.40).

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

n

w(n ) = w(n - 1) - a å h n-t t =0

¶e(t ) ¶w

(3.41).

El cambio del peso actual es función de los gradientes de las iteraciones anteriores. Por lo tanto, si la derivada parcial del error respecto a los pesos cambia de signo en iteraciones consecutivas, la suma compensa este cambio con un incremento en el peso más suave, evitando oscilaciones bruscas. Por otra parte, si la derivada parcial del error conserva el mismo signo en iteraciones consecutivas, el momento procura un cambio mayor en el peso, con el fin de acelerar la convergencia del algoritmo.

Traingda, Traingdx (tasa de aprendizaje variable). Se menciono anteriormente que cuando la derivada de la función de error con respecto a los pesos sinápticos tiene el mismo signo durante muchas iteraciones consecutivas, significa que la superficie de error cayó en una superficie plana, como consecuencia podemos quedar atrapados en un mínimo local, para evitarlo debemos incrementar la tasa de aprendizaje. Si la derivada de la función de costo o error con respecto a los pesos sinápticos cambia de signo durante muchas iteraciones consecutivas, significa que estamos pasando por diferentes picos y valles. Por lo tanto, para prevenir la oscilación en los valores de los pesos tenemos que reducir la tasa de aprendizaje. La función de costo o error depende tanto de los pesos como de la tasa de aprendizaje, lo cual nos permite obtener una relación entre el gradiente y la tasa de aprendizaje. Para describir matemáticamente el algoritmo podemos considerar la función de costo para la suma instantánea de los errores cuadráticos: 2

1 nC e(n) = å [si (n ) - yi (n)] 2 i =1

(3.42).

Aunque la función de error definida en (3.42) es igual a la función de error del algoritmo estándar, el espacio de parámetros involucra a otra tasa de aprendizaje. Denotemos a ji (n) el parámetro de tasa de aprendizaje que depende de w ji (n) para la iteración n. Aplicando la regla de cambio a e(n) podemos escribir: ¶e( n) ¶e(n) ¶yi ( n) = ¶a ji ¶yi ( n) ¶a ji ( n)

68

(3.43).

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Por conveniencia redefinimos las ecuación (3.23) como: w ji (n) = w ji (n - 1) - a ji (n )

¶e(n - 1) ¶w ji (n - 1)

(3.44).

¶e( n - 1) c-1 ]a j + u cj ) ¶w ji (n - 1)

(3.45).

Sustituyendo (3.44) en (3.19), obtenemos: nc -1

yi (n ) = f (å [ w ji (n - 1) - a ji (n) j =1

Por lo tanto, diferenciando 3.45, tenemos: nc -1 ¶y i ( n) ¶E (n - 1) C -1 ¢ = f (å w ji ( n)a Cj -1 + u Cj )( )a j ¶a ji ( n) ¶w ji ( n - 1) j =1

(3.46).

Después, evaluamos la derivada parcial ¶e( n) ¶yi ( n) . Para el caso en que la neurona i reside en la capa de salida, la respuesta deseada si (n) es alimentada externamente. Diferenciando (3.42) con respecto a yi(n) resulta: ¶e(n) = -[si - yi ( n)] ¶yi ( n)

(3.47).

donde ei(n) es la señal de error. Entonces, usando la derivada parcial de (3.46) y (3.47) en (3.43) y reagrupando términos, escribimos la ecuación 3.48: nC -1 é ¶e( n - 1) ù C -1 ¶e(n) = -[ si ( n) - yi (n)] f ¢(å w ji (n)a Cj -1 + u Cj ) êúa j ¶a ji ( n) j =1 ëê ¶w ji (n - 1) ûú

(3.48).

La derivada parcial ¶E (n - 1) ¶w ji ( n - 1) en el lado derecho de la ecuación (3.48) se refiere a la función de error en el tiempo n-1. Sustituyendo (3.29) en (3.48), podemos simplificar la ecuación como se muestra abajo: ¶e(n) ¶e( n) ¶E ( n - 1) =¶a ji ( n) ¶w ji ( n) ¶w ji (n - 1)

69

(3.49).

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Ahora estamos listos para formular una regla para la actualización en la tasa de aprendizaje que se ejecuta escalonadamente en la superficie de error. Específicamente, el ajuste aplicado a a ji (n) es: Da ji (n + 1) = -g

¶e(n) ¶e( n) ¶e(n - 1) =g ¶a ji (n) ¶w ji (n ) ¶w ji (n - 1)

(3.50).

donde g es una constante positiva, llamada parámetro de control de paso escalonado para el proceso de adaptación de la tasa de aprendizaje. Haremos dos observaciones importantes: § Cuando la derivada de la superficie de error con respecto a los pesos tiene el mismo signo algebraico en dos iteraciones consecutivas, el ajuste Da ji (n + 1) tiene un valor positivo. El proceso de adaptación, por consiguiente, incrementa la tasa de aprendizaje para el peso wji. Respecto al aprendizaje de retropropagación, la dirección crecerá más rápido. § Cuando la derivada de la superficie de error con respecto a los pesos sinápticos cambia de signo en dos iteraciones consecutivas, el ajuste Da ji (n + 1) será negativo. Respecto a la retropropagación avanzará más lento. Este proceso de aprendizaje es conocido como regla delta-delta. El método anterior tiene un problema significativo. Si el gradiente conserva el mismo signo pero el cambio en magnitud es pequeño entre dos iteraciones consecutivas, el ajuste positivo aplicado a la tasa de aprendizaje implica una variación muy pequeña en los pesos. También, tiene signos opuestos, pero una diferencia significativa en las magnitudes entre iteraciones, se aplicara un ajuste muy grande a los pesos. Bajo estas circunstancias, es difícil establecer un valor adecuado del parámetro calculado g . Esta limitación de la regla delta-delta motivo crear una regla que unificará los algoritmos del momento y la tasa de aprendizaje. Si a ji (n) denota la tasa de aprendizaje. La regla de actualización de la tasa de aprendizaje es la siguiente: ìk ï Da ji (n + 1) = í- ba ji ( n) ï î0

si S ji (n - 1) D ji ( n) > 0 si S ji (n - 1) D ji ( n) < 0 en otro caso 70

(3.51).

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Dji(n) y Sji(n) se definen en las ecuaciones (3.52) y (3.53). D ji (n) =

¶e( n) ¶w ji (n)

S ji (n ) = (1 - x ) D ji (n - 1) + xS ji (n - 1)

(3.52).

(3.53).

donde x es una constante positiva. La cantidad D ji (n) es el valor actual del gradiente. La variable S ji (n) es la suma promediada exponencialmente de valores actuales y pasados del gradiente, con x como base y la iteración n es el exponente. El procedimiento de tasa de aprendizaje adaptativa es llamado regla delta-palanca-delta.

Trainrp (retro propagación resistente). Las redes con más de una capa de neuronas trabajan con funciones de transferencia no lineales, especialmente en las capas ocultas. Estas funciones son conocidas como “funciones aplastadas” porque comprimen el rango de entrada de infinito a finito. Las funciones sigmoidales están caracterizadas por el hecho de que sus inclinaciones se acercan a cero cuando las entradas son muy grandes. Lo anterior causa problemas con el gradiente escalonado porque el gradiente cambia lentamente ocasionando que pesos y umbrales estanquen su actualización y se alejen de sus valores óptimos. El propósito de la retropropagación con resistencia es eliminar los efectos indeseables en la magnitud de las derivadas parciales. La actualización de los parámetros libres considera el signo del gradiente solamente; pero ignora su magnitud. El tamaño en el cambio de los pesos es independiente de su valor de actualización. A los pesos y umbrales se va a sumar un valor delt_inc si el gradiente cambia de signo durante dos iteraciones consecutivas; se les restara un valor delt_dec, si no hay tal cambio. Si el gradiente es cero, entonces el valor en los pesos y umbrales permanecerá igual.

Traincgf (formula Fletcher-Reeves). Una red neuronal inicialmente comienza a trabajar con una gran cantidad de neuronas; pero a medida que el entrenamiento avanza, ya no son necesarias todas las neuronas. Como solución a este problema se proponen técnicas, por ejemplo, podar la red. Una de las técnicas de podado consiste en extraer información de la segunda derivada de la superficie de error para realizar un balance entre la complejidad de la red y la reducción de la función de error. El modelo local de la superficie de error se construye con series de 71

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Taylor. Si llamamos dwi a la perturbación del peso sináptico wi ; el cambio correspondiente en la función de error E representada por series de Taylor será: dE = å gidwi (n) + i

1 å å h jidwidw j + componentes de orden mas grande 2 i j

(3.54).

donde gi es el componente i del vector gradiente de E, h ji es un componente de la matriz hessiana de E. Ambos son representados en las siguientes ecuaciones: gi = hii =

¶E ¶wi

¶2E ¶w j ¶wi

(3.55). (3.56).

El objetivo es identificar un grupo de parámetros cuya supresión del perceptrón multicapa causara un incremento mínimo en la función de error. Una solución práctica del problema sigue dos enfoques: • Aproximación extrema. La red eliminará algunos parámetros solo después que el proceso de entrenamiento converge. Dicha suposición es válida cuando los parámetros libres caen en un mínimo local o global de la superficie de error. En tal caso, gi(n) es cero, y la primera sumatoria del lado derecho de (3.54) es nula. • Aproximación cuadrática. Supongamos que la curva de error cerca de mínimos locales y globales es cuadrática. Entonces en (3.54) los términos de orden superior serán ignorados. Bajo las suposiciones anteriores (3.54) se reduce a (3.57): dE =

1 1 h ji dwidw j = dwT H dw åå 2 i j 2

(3.57).

donde dw es la perturbación aplicada al vector w, y H es la matriz hessiana que contiene todas las derivadas de segundo orden de E con respecto a los elementos del vector w. En el método de gradiente descendente de primer orden, la dirección del vector está dada por el negativo del gradiente del vector. Como consecuencia, la aproximación al mínimo global toma la forma de camino de zigzag. El método del gradiente conjugado evita este 72

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

problema porque incorpora una formula entre la dirección y el gradiente del vector. Fletcher y Reeves aplicaron la primera propuesta. El gradiente conjugado garantiza localizar el mínimo de una función cuadrática de N variables en N pasos. Para una función no cuadrática, como la de error cuadrático medio, en el perceptron multicapa, son mas de N pasos y necesita un criterio de convergencia. Si p(n) es la dirección del vector en la iteración n del algoritmo. Entonces la regla de actualización de pesos es: w(n + 1) = w( n) + a (n) p (n)

(3.58).

donde h (n) es el parámetro de aprendizaje. Para definirlo, consideramos la dirección del vector inicial p(0) que es igual al negativo del gradiente g(n), en el punto inicial n=0: p (0) = - g (0)

(3.59).

Cada dirección de vector sucesiva es calculada en función de la magnitud del gradiente y la dirección anterior. Quede expresado matemáticamente así: p ( n + 1) = - g ( n + 1) + b (n) p (n)

(3.60).

donde b (n) es un parámetro variable con el tiempo, las reglas para determinarlo tienen argumentos como el gradiente actual y el pasado. La formula de Fletcher-Reeves se muestra en la siguiente ecuación: b (n) =

g T ( n + 1) g (n + 1) g T (n) g (n)

(3.61).

Traincgp (Formula de Polak-Ribieré). La formula de Polak-Ribiere para b (n) es: b (n) =

g T ( n + 1)[ g ( n + 1) - g ( n)] g T (n ) g ( n)

73

(3.62).

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Traincgb (Formula de Powell-Beale). En todos los algoritmos que utilizan el gradiente conjugado, la búsqueda de dirección periódicamente reajusta el gradiente negativo. El punto de ajuste ocurre cuando el número de iteraciones es igual al número de parámetros libres de la red; pero existen diferentes métodos para implementar la eficiencia en el entrenamiento. La versión de Powell basada en el trabajo de Beale comienza cuando hay un poco de ortogonalidad a la izquierda del gradiente actual y el gradiente previo. La siguiente inecuación tiene la tarea de verificarlo: g T (n) g ( n + 1) ³ 0.2 g ( n + 1)

2

(3.63).

Si la condición es cierta, la dirección cambia junto con el negativo del gradiente. Los algoritmos que acabamos de describir tienen un parámetro importante en la ecuación (3.58), conocido como tasa de aprendizaje a (n) , este parámetro se actualiza por medio de la siguiente ecuación: a (n) = arg min{x av ( w(n) + ap(n))} a

(3.64).

El cual consiste en un algoritmos de optimización, en matlab se realiza con las siguientes rutinas: · · · · ·

Búsqueda de oro (srchgol). Búsqueda de Bren (srchbre). Búsqueda hibrida de una sección cubica (srchhyb). Búsqueda de Charalambous (srchcha). Búsqueda hacia atrás (srchbac).

Aunque matlab ya tiene la mejor rutina predefinida para cada función, es posible cambiarla con el parámetro srchFcn sí lo deseamos. [18]

Trainscg (Gradiente conjugado adaptativo). Este método es costoso computacionalmente porque requiere, para la respuesta de la red, que todas las entradas sean calculadas muchas veces. Este procedimiento combina Levenberg-Marquardt, que explicare más adelante, con gradiente conjugado. 74

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Trainbfg (Quasi Newton de Broyden, Fletcher, Goldfarb y Shanno). El método de gradiente conjugado usa una matriz hessiana en su deducción, sin embargo el procesamiento de esta no es llevado a cabo. En cambio, en el método de Newton y sus variantes la matriz hessiana juega un papel predominante. Usando la expansión de series de Taylor, aproximamos el incremento de actualización para la función de error Eav(w) como mostramos a continuación: DEav ( w) = Eav ( w + Dw) - Eav ( w) @ g T Dw +

1 DwT HDw 2

(3.65).

donde g es el vector gradiente y H es la matriz hessiana. Diferenciando (3.65) con respecto a Dw , el cambio DEav (w) será minimizado cuando: g + HDw = 0

(3.66).

la cual produce un valor optimo para un incremento en los pesos Dw igual a: Dw = H - 1 g

(3.67).

El método de Newton es más rápido que el gradiente, sin embargo, es difícil calcular computacionalmente la inversa de H. Hay algoritmos basados en el método de Newton que no requieren calcular la segunda derivada. Se llaman métodos de Quasi-Newton o de secante. Aproximan la matriz hessiana en cada iteración y calculan el gradiente conjugado

Trainoss (Algoritmo de la secante en un solo paso). El algoritmo anterior necesitaba una cantidad mayor de memoria y cálculos que el gradiente conjugado, existe una mejor aproximación que requiere menos memoria. Este método OSS es un puente entre el gradiente conjugado y Quasi-Newton. No almacena la matriz hessiana en cada iteración, suponiendo anterior una matriz identidad.

Trainlm (Levenberg-Marquardt). Al igual que el método quasi-Newton, el algoritmo Levenberg-Marquardt fue diseñado para aproximar velozmente el entrenamiento de segundo orden sin tener que calcular la matriz hessiana. Cuando la función de costo toma la forma de suma de cuadrados (típica en la retropropagación), entonces la matriz hessiana se puede aproximar como: H = JTJ 75

(3.68).

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

y el gradiente se aproxima a: g = J Te

(3.69).

donde J es la matriz jacobiana que contiene las primeras derivadas de los errores de la red con respecto a los pesos, y el vector de errores de la red es e. La matriz jacobiana se calcula con técnicas de retropropagación estándar, menos complejas que los cálculos de la matriz hessiana. Para aproximar la matriz hessiana el algoritmo de Levenberg-Marquardt actualiza los pesos con la siguiente formula de Newton: w(n + 1) = w( n) - [ J T J + mI ]-1 J T e

(3.70).

Cuando el escalar m es cero, como en el método de Newton, usamos la aproximación a la matriz hessiana. Cuando m es grande, el gradiente descendente comienza como un pequeño factor de paso. El método de Newton es más rápido y se acerca más al error mínimo, la meta es acercarse al método de Newton tan rápido como sea posible. Entonces m decrece después de cada paso sucesivo (reducción de la función de error) y se incrementa solo cuando se incrementa la función de error. Este procedimiento garantiza siempre la reducción de la función de error por cada iteración. La desventaja principal de Levenberg-Maquardt es que requiere el almacenamiento de algunas matrices que pueden ser grandes para ciertas aplicaciones. El tamaño de la matriz jacobiana es Q x n, donde Q es el numero de ejemplos de entrenamiento y n es el numero de pesos y umbrales de la red. Sin embargo, la matriz no tiene que ser calculada y almacenada como tal. Por ejemplo, si se divide la matriz jacobiana en dos submatrices podemos calcular el hessiano como abajo: éJ ù H = J T J = [ J1T J 2T ]ê 1 ú = J1T J1 + J 2T J 2 ëJ 2 û

(3.71).

Por lo tanto, el jacobiano completo no tiene que existir, todo, al mismo tiempo. Podemos aproximar el hessiano sumando subterminos. Si un término ha sido calculado ya puede ser borrado. Cuando usamos trianlm en matlab el parámetro mem_reduc determina cuantas filas de la matriz jacobiana son calculadas en cada submatriz. Si mem_reduc, entonces el Jacobiano se calculara completo y no habrá reducción de memoria. Si mem_reduc es 2, solo la 76

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

mitad del Jacobiano será utilizado para los cálculos. Entonces ahorraremos espacio a comparación del jacobiano completo.

Trainbr (Regularización automática). La regularización automática involucra una modificación en la función de error para premiar aquellos pesos que tienen un valor grande y castigar a aquellos que tienen valores más pequeños conforme se actualizan, y por lo tanto pierden efecto en la red. Sea la función de costo expresada como en (3.72): F = mse =

1 N

N

å ei2 (n) = n=1

1 N

N

å [s (n) - y (n)]

2

i

i

(3.72).

n =1

Es posible introducir la generalización si modificamos la función de error agregando un término que consiste de la suma de errores cuadráticos medios de pesos y umbrales msereg = gmse + (1 - g )msw

(3.73).

donde g es la razón de desempeño, y msw =

1 N 2 å w j ( n) n n=1

(3.74).

Esta función causa que la red tenga pesos y umbrales más pequeños, y obliga a la red a generar una curva más suave e impedir la sobre educación. La regularización compleja tiene su origen en las técnicas de podado que definimos anteriormente. En el diseño de un perceptron multicapa por cualquier método, construimos un modelo no lineal de un fenómeno físico responsable de una relación de entrada-salida para ejemplos de la red. En la medida que la red es de naturaleza estática, necesitamos una medida apropiada de ajuste entre el modelo y los datos observados. Esto implica que a no ser que tengamos información anterior, el proceso deberá incluir un criterio que implique complejidad en el modelo. Los criterios diferentes que consideran la complejidad del modelo, tienen un objetivo común descrito en la siguiente fórmula: æ Criterio de complejidad ö æ función de ö æ penalización de ö çç ÷÷ = çç ÷÷ + çç ÷÷ è de mod elo ø è probabilidad ø è complejidad de mod elo ø

(3.75).

La diferencia básica entre los diferente criterios reside en la formula de penalización. 77

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

En el aprendizaje por retropropagación. Existe otro procedimiento supervisado importante. Particularmente, se necesita encontrar un vector de pesos que minimice la función de riesgo siguiente: R( w) = E s ( w) + lEc ( w)

(3.76).

El primer término Ec (w) es la función de error estándar, la cual depende de la red y los datos de entrada. La función de optimización de retro propagación estándar es el error cuadrático medio. El segundo término Ec (w) es la penalización, que depende de la red misma, pero su evaluación se extiende a los pesos sinápticos. Para la presente discusión, l es el parámetro de regularización, importante en la penalización respecto a la medida de rendimiento. Cuando l es cero, nos basta entrenar a la red con los ejemplos, a medida que l aumenta, crece la importancia en considerar la función de penalización. En la práctica, el proceso de decaimiento de pesos ayuda a que el parámetro de regularización actué en ambos casos. Después de entrenar a la red con los datos del archivo base, es necesario probar su aprendizaje, en este caso con los datos del archivo export. Para verificar su efectividad en matlab lo hacemos con la siguiente instrucción sim: PB=sim(net,UStr);

La evaluación de la función devolverá valores con rango de 0 a 1, para el procesamiento de estos valores nos basamos en la función que aplicamos a la normalización de los datos de entrenamiento. Después de aplicar la nueva normalización, comparamos a la matriz PB con las mediciones registradas en el archivo export por medio de la formula (3.2).

78

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Conclusiones del capítulo. Se describieron las herramientas, polinomios y redes neuronales, para calcular el modelo de estado normal de una turbina de gas para accionar un compresor centrifugo en tuberías de gas natural. Se explicó también su programación en Matlab. Además se analizaron las variantes del algoritmo de entrenamiento de la red neuronal.

79

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

CAPITULO 4.DISCUSIÓN DE RESULTADOS.

80

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

4.1. Prueba de las herramientas. A fin de confirmar la exactitud de las herramientas (polinomios y redes neuronales), se forma una muestra diferente a la de entrenamiento, la muestra de validación. La disponibilidad de los datos con la influencia de la contaminación del compresor axial de turbinas de gas nos brinda una oportunidad adecuada para estimar y comparar las dos herramientas analizadas. Eso se realiza a través del análisis de las desviaciones correspondientes, calculadas con la formula dada en (3.2). Primero, se forma la muestra de validación. Segundo, para todos los datos de la muestra se calculan dos series de las desviaciones, una con los polinomios y la otra con las redes. Tercero, se grafican en paralelo ambas series contra el tiempo de operación. En estas graficas podemos considerar los errores aleatorios en las desviaciones en el fondo de los cambios sistemáticos causados por la contaminación del compresor. Debido a que los errores dependen primero de la adecuación de la función de referencia, pueden ser buenos indicadores de la calidad de la función. Por último, se comparan estas dos gráficas correspondientes a los polinomios y las redes para concluir sobre la utilidad de las redes. Las tareas siguientes describen las condiciones de los cálculos para formar y probar las funciones de referencia basadas en los polinomios y las redes. 4.2.-Tarea 1: Búsqueda de la estructura de la red. En el capítulo anterior definimos a la red que calcula la función de referencia. La red se muestra en la figura 3.2 y contiene cuatro neuronas en la capa de entrada y 7 neuronas en la capa de salida. Sin embargo, el numero de neuronas de la capa oculta no es una cantidad fija, es decir, realizamos una serie de cálculos y experimentos para asignar la cantidad de neuronas ocultas que nos brinde la mejor aproximación de la función de referencia. En conjunto con el número de neuronas, se busco experimentalmente la cantidad de épocas donde la red alcanzó un entrenamiento satisfactorio. Ambos parámetros se variaron en forma creciente, por ejemplo se comenzó con 10 neuronas en la capa oculta, después se incremento de una por una hasta 15 neuronas. De manera similar se vario el numero de épocas, deteniendo a la red con 100 hasta incrementar a 300. Para verificar la exactitud de ambas herramientas se analizaron las graficas de las desviaciones relativas contra el tiempo, donde el tiempo se mide en horas, y representa cada fila de los archivos base y export de las figuras 3.4 y 3.5. Las curvas de las desviaciones son siete, sin embargo, no es posibles observar todas debido a los limites en las escala de las graficas de matlab. Para tener una mejor 81

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

visualización de las gráficas se seleccionaron tres desviaciones que arrojaron las desviaciones mayores. Las desviaciones se registran en las figuras se refieren a las variables: Tt (Temperatura de presión alta), Tc (Temperatura del compresor) y Pt (Presión de la turbina de presión alta). En la tabla 4.1 se muestran los resultados para el error cuadrático medio calculados con diferente número de neuronas en la capa oculta y diferentes épocas. Los cuadros marcados en azul indican las mejores respuestas y las celdas amarillas, las peores. Tabla 4.1: Número de épocas vs número de neuronas en la capa oculta.

200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229

10 0.25380 0.25854 0.06892 0.18040 0.10522 0.06809 0.12798 0.53751 0.23773 0.16020 0.05719 0.05682 0.34993 0.12122 0.51071 0.12048 0.07554 0.53259 0.09807 0.07666 3.86537 2.73437 0.11730 0.09478 0.12496 0.19406 0.11364 0.06473 0.1378 0.10090

11 0.04329 0.06074 0.04535 0.07035 0.10678 0.22728 0.07285 0.14637 0.28837 0.78037 0.08572 0.05389 0.10105 0.05448 0.07669 0.04567 0.04938 0.05079 0.14584 0.09867 0.04675 0.04827 0.09292 0.87830 0.09185 0.05712 0.06634 0.06344 0.05714 0.13317 82

12 0.04444 0.21877 0.08565 0.04128 0.04468 0.15641 0.09551 0.03992 0.04610 0.04083 0.03915 0.05307 0.12691 0.06601 0.81892 0.03847 0.05609 0.12124 0.12625 0.07614 4.5855 0.06891 0.07595 16.5938 0.16579 0.08861 0.05449 0.11821 0.04592 0.11906

13 0.206882 0.086346 1.40216 0.045776 0.397115 0.400441 0.049793 0.140262 0.120828 0.088285 0.078973 0.046101 0.110234 0.093641 0.046146 0.14712 0.039706 0.182618 0.114534 0.061768 0.059190 0.098242 0.061816 0.81165 0.053365 0.221868 0.061859 0.093992 0.053240 0.135739

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Después de diferentes experimentaciones sobre la semilla de mejores resultados se concluye que se necesitan 211 épocas y 12 neuronas ocultas para que la red alcance un error mínimo y se obtengan desviaciones más pequeñas o cercanas a las que se calcularon con polinomios. En la figura 4.1 se muestra la grafica con las desviaciones entre las medidas de los archivos y los argumentos de salida de la función de referencia basada en la estructura de la red con doce neuronas en la capa oculta.

Fig. 4.1.-Grafica comparativa de resultados con polinomios y red neuronal con 12 neuronas en la capa oculta y entrenamiento en 250 épocas.

4.3.-Tarea 2: Métodos de ajuste de pesos. Después de describir en el capitulo anterior todas las funciones de entrenamiento de redes neuronales predefinidas en matlab podríamos deducir que trainlm y trainbr son las funciones adecuadas para nuestra aplicación, sin embargo, los resultados varían entre diferentes aplicaciones. La tabla 4.2 muestra los resultados de todos los métodos de entrenamiento. La red neuronal se fija a 12 neuronas ocultas y 250 épocas. 83

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Tabla 4.2: Funciones de entrenamiento utilizadas para el calculo de la función de referencia. Función Error Ajuste de Épocas Nodos ocultos Tiempo (s) Estabilidad TTrraaiinnbbffgg 1 0.00790 1250 35 2.03 ü T r a i n c g b 2 T raincgb 0.00302 1500 30 2.25 ü TTrraaiinnccggff 3 0.00231 1500 30 2.3 ü T r a i n c g p 4 T raincgp 0.00882 1213 12 2 ü TTrraaiinnggdd 5 0.13456 5513 20 5 ü T r a i n g d m 6 Train gdm 0.20874 1500 20 4.39 ü TTrraaiinnggddaa 7 0.06025 450 15 4.1 û T r a i n g d x 8 Train gdx 0.12971 1000 25 4.2 ü TTrraaiinnoossss 9 0.07436 320 12 0.98 ü T r a i n s c g 10 T rainscg 0.03208 550 14 0.89 ü TTrraaiinnllm 11 m 0.00020 250 15 14.02 ü 0.19223 TTrraaiinnbbrr 12 250 7 13.54 ü (sse)

Analizando los resultados de la tabla, los algoritmos trainlm y trainbr resultaron los más adecuados como se esperaba, aunque sean más lentos que los demás. Los algoritmos de gradientes conjugados terminaron el entrenamiento después de un número corto de épocas y estuvieron muy lejos de alcanzar el error. Finalmente, los algoritmos que se basan en modificar la tasa de aprendizaje como traingd alcanzaron resultados regulares después de un número muy grande de épocas y con demasiados nodos en la capa oculta. La función trainbr tuvo la ventaja de alcanzar una desviación menor que otras funciones con un menor número de nodos en la capa oculta, en esta caso siete. En las figuras 4.2 y 4.3 se muestran las gráficas comparativas del modelo de estado normal que se obtuvo entrenando a la red neuronal con los algortimos de LevenbergMarquardt y regulación bayesiana respectivamente.

84

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Fig. 4.2.-Grafica comparativa entre polinomios y red neuronal entrenada con función trainlm.

Fig. 4.3.-Grafica comparativa entre polinomios y red neuronal entrenada con función trainbr. 85

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

4.4.-Tarea 3: Modificación de las funciones de transferencia. Para modificar las funciones de transferencia de activación de neuronas entre capas, fijamos la red con cuatro neuronas, que son los argumentos de entrada a la función de referencia, siete neuronas en las capas ocultas y de salida. Se entreno con 250 épocas y con la función trainbr. Es importante destacar que los datos de supervisión o target se normalizaron a el rango de 0 a 1 para el caso de la función de transferencia unipolar (sigmoide logarítmico); después de probar la red con datos reales los valores de salida globales que arrojó la función unipolar caen en el rango de 0 a 1, se normalizaron inversamente a el rango máximo y mínimo del archivo export. En el caso de que la función de transferencia sea una función bipolar como la tangente hiperbólica, los datos deseados con los que se compara la salida de la red para comparar la salida global, se normalizaron a un rango de -1 a 1, la misma fórmula de normalización se aplica con la salida global de la red para ampliar el intervalo en base al archivo export cuando se pruebe a la red con datos reales. La última función de transferencia que se aplicó entre la capa oculta y la capa de salida fue una función lineal llamada purelin, se conservo la función no lineal unipolar o bipolar de la capa de entrada a la capa oculta. La función lineal tiene como argumento su salida, es decir, el resultado de evaluar está función es que la salida es igual a la entrada, con la característica de que es una función derivable igual que las funciones tansig y logsig a las cuales se les puede aplicar la regla de retropropagación. A diferencia de las dos funciones de transferencia anteriores se tienen como salida argumentos que van del rango de -¥ a +¥, lo cual nos permitió realizar dos variantes del programa. La primer variante consistió en no aplicar una normalización a los vectores de prueba o targets y en la segunda variante se aplicó está normalización como se venía haciendo con la funciones de transferencia logsig y tansig. Se hicieron cálculos con: · La función bipolar (tansig) en la capa oculta y la función unipolar (logsig) en la capa de salida; · La función unipolar (logsig) en la capa oculta y la función bipolar (tansig) en la capa de salida; · En la capa oculta y en la capa de salida, ambas funciones unipolares (logsig); · En la capa oculta y en la capa de salida, ambas funciones bipolares (tansig); · Función de transferencia hacia la capa oculta no lineal y función lineal (purelin) en la capa de salida normalizando los datos de salida; · Función de transferencia hacia la capa oculta no lineal y función lineal (purelin) en la capa de salida sin normalización. 86

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Los resultados que se obtuvieron aplicando la función bipolar a la salida fueron ligeramente mejores respecto a la función unipolar y se muestran en la figura 4.4. Los resultados con la función de transferencia lineal hacia la capa de salida fueron peores con respecto a las variantes anteriores, incluso sin normalización, finalmente se muestran en las figuras 4.5 y 4.6.

Fig. 4.4.-Grafica comparativa entre polinomios y red neuronal entrenada con función de transferencia bipolar.

87

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Fig. 4.5. Resultados entrenado una red neuronal con el algoritmo de retropropagación (regulación bayesiana) y funciones (pureline).

Fig. 4.6. Resultados entrenado una red neuronal con el algoritmo de retropropagación (regulación bayesiana) y funciones (pureline sin normalizar). 88

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

4.5.-Tarea 4: Modificación de los parámetros de salida. Para esta tarea se realizo una modificación en los límites de salida de la función logsig. Para explicarlo primero consideremos que esta función tiene la característica de que sus límites de salida están en el rango de 0 a 1 con el rango de entrada de -¥ a +¥. Para el caso de los valores que se usan para entrenar la red no tenemos un intervalo de entrada tan grande y como consecuencia el intervalo de salida no será entre 0 y 1, para solucionar este problema se normalizaron los valores en un intervalo aproximado de 0.1 a 0.9 para el caso de la función unipolar. Para el caso de la función bipolar se normalizo con un rango entre -0.9 y 0.9. Los resultados para ambas funciones se muestran en las figuras 4.7 y 4.8.

Figura 4.7. Resultados entrenando una red neuronal con el algoritmo de retropropagacion (regulación bayesiana) y funciones (tansig y logsig) modificando los argumentos de logsig

89

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Figura 4.8. Resultados entrenando una red neuronal con el algoritmo de retropropagacion (regulación bayesiana) y funciones (logsig y tansig) modificando los argumentos de tansig.

4.6.-Tarea 5: Influencia del método de inicialización de pesos y umbrales. En esta variante se consideran diferentes maneras de inicializar los parámetros libres como pesos y umbrales. Anteriormente se obtuvo un mejor cálculo con una red de siete neuronas en la capa oculta, 250 épocas de entrenamiento, función de transferencia bipolar en la capa oculta y unipolar en la capa de salida. Tomando en consideración está red, se cambio el método para obtener los valores iniciales de los parámetros libres, en este caso, pesos y umbrales. La tabla 4.3 muestra el error sse, para el caso de la función trainbr en comparación con la función que inicializa los pesos y umbrales. Por ejemplo, initzero los inicializa todos a cero e initnw regresa valores de pesos y umbrales uniformemente distribuidos. El código que se agrego al programa de matlab fue el siguiente: net.layers{1}.initFcn='initwb' net.layers{2}.initFcn='initwb'

En el código llamamos a las capas 1 y 2 de la red para que la función de inicio sobre los parámetros sea igual a la que escribimos entre comillas simples ‘’. 90

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Las gráficas comparativas de desviaciones quedaron con resultados muy similares para las cuatro funciones que proporcionan valores iniciales en pesos y umbrales. Para establecer un criterio de cuáles eran los mejores valores de pesos y umbrales se calculo el error sse. Tabla 4.3:Inicialización de parámetros libres vs error sse. METODO SSE initzero 0.19898 initwb 0.23796 initnw 0.241568 rands 0.223248 midpoint 0.207156

En la figura 4.9 se ilustra la gráfica para las desviaciones con la función del sse más pequeño, es decir initzero, donde los pesos y umbrales se actualizan con valores iniciales igual a cero.

Fig. 4.9. Resultados entrenando una red neuronal con pesos y umbrales inicializados todos a cero

91

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

4.7.-Tarea 6: Opción de paro automático. En muchas ocasiones se considera que el número de épocas, con el que trabajamos inicialmente no es suficiente para alcanzar el error o es demasiado grande y puede generar una sobre educación, para solucionar este problema utilizamos el algoritmo conocido como parada temprana o early stopping, este método tiene la ventaja de que no tenemos que definir el número de épocas porque compara dos muestras de igual tamaño, la primera es la muestra de entrenamiento y la segunda de prueba. El método consiste en calcular el error cuadrático medio (MSE) para ambas muestras y cuando el MSE de la muestra de prueba comienza a divergir la red se detiene y emite la salida. En esta tarea entrenamos con dos muestras de 150 elementos cada una, que se obtuvieron de la mitad de datos del archivo base. Estos datos consistieron en tomar las primeras 150 horas para una muestra y las subsecuentes para una segunda muestra. Los resultados que se obtuvieron no mejoraron con respecto a métodos anteriores, como se muestra en la figura 4.10.

Fig. 4.10. Resultados con red neuronal educada con el algoritmo de parada temprana para 2 muestras de entrenamiento

92

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

4.8.-Tarea 7: Entrenamiento con datos reales. En esta variante se entreno a la red neuronal con datos reales propios del archivo export. Para entrenar a la red se tomaron muestras del archivo export de 1 a 150 horas y de 1000 a 1100 horas, se escogieron estos datos porque son los que siguen al lavado del motor, lo anterior se observa en graficas anteriores. Para probar la red se eligieron los datos de 151 a 999 horas y 1101 a 4091 horas, donde se encuentra el mayor ruido y las desviaciones más grandes. Después de elegir ambas muestras, se entreno a la red neuronal y se calcularon los coeficientes con 251 datos. Para verificar ambos métodos se utilizó el resto de los datos reales, o sea 3840 datos. Los resultados se muestran en la figura 4.11, en esta variante se modificaron el número de neuronas en la capa oculta y el número de épocas, sin embargo, en una red supervisada no es conveniente entrenar con datos estables y probar con datos con ruido es por esto que en la gráfica de desviaciones contra el tiempo se puede apreciar una sobreeducación.

Fig. 4.11. Resultados de red neuronal con entrenamiento de datos reales.

93

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Conclusiones del capítulo. Describimos los resultados de comparación entre la función de referencia con polinomios y con una red neuronal (perceptrón multicapa). La comparación consistió en graficar y comparar visualmente las desviaciones computadas contra el tiempo de operación por las dos versiones de la función. Se describió cada una de las modificaciones que se realizaron para mejorar los resultados de la red neuronal artificial. Se observó un comportamiento un poco diferente en estas modificaciones, sin embargo, el algoritmo de regulación bayesiana fue el mejor algoritmo de entrenamiento. Los resultados empeoraron en la modificación donde se entreno a la red con datos reales, lo que demuestra que un perceptrón multicapa entrenado en datos con ruido puede bajar su capacidad de describir datos nuevos. Casi en todos los casos se observó una mejor calidad de las desviaciones computadas por los polinomios. Por lo tanto, podemos concluir que los polinomios tienen en general una mejor exactitud, a excepción del caso de la modificación de la red con el algoritmo de regulación bayesiana y función de transferencia bipolar, en el cual, ambas herramientas tienen una exactitud igual.

94

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

CONCLUSIONES GENERALES. Pues, dentro del desarrollo de la tesis los siguientes trabajos científicos han sido ejecutados. En el primer capítulo se describió el funcionamiento termodinámico de la turbina de gas, así como cada uno de los componentes que la integran. Se concluye que todos los componentes de la turbina de gas requieren un monitoreo permanente de su comportamiento por razones de seguridad, económicas y debido a los procesos complejos a que son sometidos. Se introduce el área de diagnostico paramétrico de los motores de turbina de gas el cual permite analizar el comportamiento de un motor sin detener su funcionamiento. Este tipo de diagnóstico involucra la función de referencia en la simulación de las fallas del motor. Se llama función referencia o modelo de estado normal porque describe una turbina de gas en buenas condiciones. Este modelo es una función vectorial que relaciona las variables medidas en el conducto de flujo con las de control y aire ambiental. Las fallas y el deterioro del motor afectan al estado del motor y a sus mediciones en el conducto de flujo pero no afectan a tal modelo. Por lo tanto, las diferencias entre las variables medidas y las computadas por esta función (podemos llamar estas diferencias como desviaciones) son buenas indicadores de fallas y se usan ampliamente en el diagnóstico de turbinas de gas. Hemos escogido dos métodos diferentes del cálculo del modelo para investigar y escoger el mejor método. El primer método usa las redes neuronales descritas en el capitulo dos. Las redes neuronales artificiales son modelos matemáticos de las redes neuronales biológicas. Su objetivo es imitar las capacidades que tienen el hombre y los animales de reconocer objetos e interpretar estímulos. Para poder implementar estos modelos es necesario considerar que la neurona es un pequeño procesador con capacidades limitadas a comparación de las computadoras actuales. Sin embargo al trabajar muchas ellas en un conjunto son capaces de resolver problemas muy serios. Se escogió una red llamada el perceptron multicapa. Este tipo de redes es utilizado frecuentemente para aproximar funciones complejas por eso se espera que el perceptron describa bien el comportamiento de turbinas de gas. El capítulo tres describe el segundo método de la formación de la función de referencia. Este método involucra polinomios para describir la función deseada y el método de mínimos cuadrados para calcular los coeficientes desconocidos de los polinomios usando datos registrados en un motor para girar un compresor centrifugo en tuberías de gas 95

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

natural. El capítulo también describe algoritmos que realizan los dos métodos para formar la función de referencia así como los programas correspondientes elaborados en el ambiente de Matlab. Además se analizaron las variantes del algoritmo de entrenamiento de la red neuronal. En el capítulo cuatro se presentan los resultados de comparación entre la función de referencia con polinomios y la con el preceptrón multicapa. La comparación consistió en graficar y comparar visualmente las desviaciones computadas contra el tiempo de operación por las dos versiones de la función. Se describió cada una de las modificaciones que se realizaron para mejorar los resultados de la red neuronal artificial. Se observó un comportamiento un poco diferente en estas modificaciones, sin embargo, el algoritmo de regulación bayesiana fue el mejor algoritmo de entrenamiento. Casi en todos los casos se observó una mejor calidad de las desviaciones computadas por los polinomios. Por lo tanto, podemos concluir que los polinomios tienen en general una mejor exactitud, a excepción del caso de la modificación de la red con el algoritmo de regulación bayesiana y función de transferencia bipolar, en el cual, ambas herramientas tienen una exactitud igual. Así llegamos finalmente a la siguiente conclusión: la red neuronal seleccionada, perceptron multicapa, no puede sobrepasar los polinomios en la exactitud de la descripción del comportamiento del motor analizado. Además, es necesario tener en cuenta que el perceptron es una herramienta de mayor complejidad y costo computacional. Por lo tanto, para formar la función de referencia en sistemas reales de monitoreo de turbinas de gas, se recomienda aplicar los polinomios a pesar de lo que las redes neuronales son más usadas actualmente.

96

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

REFERENCIAS. [1]

Boyce, Meherwan P. “Gas Turbines Engineering Handbook”. Gulf Publishing Company, July 1995.

[2]

White, Frank M. “Mecánica de Fluidos”. Mc Graw Hill.

[3]

Tony Giampaolo. “The Gas Turbine Handbook: Principles and Practices”. Prentice Hall. 1997.

[4]

Bathie William W. “Fundamentos de Turbinas de Gas”. Editorial Limusa.

[5]

http://www.igsa.com.mx/

[6]

http://www.siemens.com.mx/

[7]

Rao, B.K.N., 1996. “Handbook of Condition Monitoring”. Elsevier Advanced Technology, Oxford, 604p.

[8]

Loboda, Igor. Notes: “Construction of Gas Turbine Plants and Engines”. National Aerospace University of Ukraine, 2002.

[9]

Isasi Viñuela, Galván León. “Redes de Neuronas Artificiales, Un Enfoque Práctico". Prentice Hall, 2004.

[10] Bonifacio Martín del Brío, Alfredo Sanz Molina, Redes neuronales y Sistemas Difusos. Alfaomega Grupo Editor, México, 2001. [11] James A. Anderson. “Redes Neuronales”. Alfaomega, 2007. [12] Loboda I., Yepifanov S., Feldshteyn Y. “Deviation problem in gas turbine health monitoring”. Proceedings of IASTED International Conference on Power and Energy Systems (PES‐2004)”, Clearwater Beach, Florida, USA, pp. 335‐340.

97

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

[13] Loboda I., Yepifanov S., Feldshteyn Y. “Diagnostic analysis of maintenance data o fault gas turbine for driving an electric generator”. ASME Turbo Expo 2009: International Technical Congress “Power for Land Sea & Air”, Orlando, Florida, USA, June 8‐12, 2009, 12p., ASME Paper No. GT200‐6 0176. [14] Villarreal González C.F., Loboda I., Trahyn Amescua I.K. “Aplicación de las redes neuronales en modelo de estado normal para el diagnóstico de turbinas de gas”. Memorias del 5to Congreso Internacional de Ingeniería Electromecánica y Sistemas, ESIME, IPN, México, D.F., 10-14 noviembre de 2008, 6p, ISBN 978-607-414-049-1. [15] Villarreal González C.F., Loboda I., Trahyn Amescua I.K. “Análisis de una red neuronal en la aplicación a la función de referencia de una turbina de gas”. Congreso de Instrumentación SOMI XXIV, Mérida, Yucatán., 14-16 octubre de 2009, 11 p, 274-CVG. [16] Nakos George, Joyner David. “Algebra lineal con aplicaciones”. International Thomson Editores. [17] Haykin Simon. “Neural Networks A comprehensive foundation”. IEEE PRESS, 1994. [18] http://www.mathworks.com/products/neuralnet/ [19] Ehsan Mesbahi Mohsen Assadi et al. “A unique technique for vaporative gas turbine (EvGT) parameters. IGTI/ASME Turbo Orlaens, USA, 7p., ASME Paper 2001-GT-0008. [20] Mohsen Assadi Ehsan, Mesbahi, et al. “A novel correction technique for simple gas turbine parameters”. IGTI/ASME Turbo Expo 2001, June 4-7, 2001, New Orlaens, USA, 7p., ASME Paper 2001-GT-0008. [21] Magnus Fast, Mohsen Assadi, Andrew Pike, Peter Breuhaus. “Different condition monitoring models for gas turbines by means of artificial neural networks”. IGTI/ASME Turbo Expo 2009, June 8-12, 2009, Orlando, Florida, USA, 11p., ASME Paper GT2009-59364. 98

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

[22] Kacprzynski Gregory J., Michael Gumina, Michael J. Roemer, Daniel E. Caguiat, Thomas R. Galie, Jack J. McGroarty (2001). “A prognostic modelling approach for predicting recurring maintenance for shipboard propulsion system”. Proceedings of ASME Turbo Expo 2001, New Orleans, LA USA, 7p., 2001-GT-0218. . [23] Roemer Michael J., Kacprzynski Gregory J. (2000). “Advanced diagnostics and prognostics for gas turbine engine risk assessment”. IGTI/ASME Turbo Expo, May 8-11, Munich, Germany, 10p., 2000-GT-30. [24] Bryce Lord – TransCanada Pipelines Ltd, Joshua Bennett –Idax Incorporated. “Equipment health monitoring failure mode characteristics case study”. 17th National Petroleum Show, Calgary, Canada – June 12th to 15th, 2000, 25p. [25] Orlando J. Illi, Frank L. Greitzer, Lars J. Kangas, Tracy J. Reeve. “An artificial neural network system for diagnosing gas turbine engine fuel faults”. 48th Meeting of the Mechanical Failures Prevention Group, Wakefield, MA, April 19-22, 1994, 9p. [26] S.O.T. Ogaji, Y. G. Li, Suresh Sampath, Riti Singh. “Gas path fault diagnosis of a turbofan engine from transient data using artificial neural networks”. IGTI/ASME Turbo Expo 2003, June 16-19, 2003, Atlanta, Georgia, USA, 10p., ASME Paper GT2003-38423. [27] Praveen Shankar, Rama K. Yedavalli. “A neural network based adaptive observer for turbine engine parameter estimation”. IGTI/ASME Turbo Expo 2006, May 811, 2006, Barcelona, Spain, 9p., ASME Paper GT2006-90603. [28] Suresh Sampath, Riti Singh. “An integrated fault diagnostics model using genetic algorithm and neural networks”. Journal of Engineering for Gas Turbines and Power -- January 2006 -- Volume 128, Issue 1, pp. 49-56. [29] C. Romessis, K. Mathioudakis. “Bayesian network approach for gas path fault diagnosis”. Journal of Engineering for Gas Turbines and Power -- January 2006 -Volume 128, Issue 1, pp. 64-72.

99

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

[30] C. Romessis, A. Kyriazis, K. Mathioudakis. “Fusion of gas turbine diagnostic inference – the Dempster-Schafer approach”. IGTI/ASME Turbo Expo 2007, May 14-17, 2007, Montreal, Canada, 9p., ASME Paper GT2007-27043. [31] C. Remessis, K. Mathioudakis. “Detection of gas turbines malfunctions from emission concentration distributions”. IGTI/ASME Turbo Expo 2007, May 14-17, 2007, Montreal, Canada, 8p., ASME Paper GT2007-27107. [32] Hai Kiu, Neil Eklund, Weizhong Yan, Piero Bonissone, Feng Xue, Kai Goebel. “Estimating deterioration level of aircraft engines”. IGTI/ASME Turbo Expo 2007, May 14-17, 2007, Montreal, Canada, 7p., ASME Paper GT2007-27519.

100

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

ANEXO A. PROGRAMAS

101

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Esta sección contiene los programas base que se utilizaron en el cálculo de la función de la función de referencia. Se aplicaron modificaciones al algoritmo de retropropagación, las funciones de transferencia de las capas oculta y de salida, numero de neuronas en la capa oculta y procedimientos de normalización.

PROGRAMA 1 Clear; kuy=11; ku=4; ky=7; kcoef=15; tk=273.15; ntk=[2 7 8 10]; ktk=4; npol1=[5 1 2 3 4 1 1 1 2 2 3 1 2 3 4]; npol2=[5 5 5 5 5 2 3 4 3 4 4 1 2 3 4]; d1=330; d2=4091; % Modelo con métodos numéricos fid=fopen('base.txt','rt'); krb=-2; while ne(1,feof(fid)) tmpline=fgets(fid); krb=krb+1; end; fclose(fid); % Measured parameter input fid=fopen('base.txt','rt'); tmpline=fgets(fid); % skip line tmpline=fgets(fid); % skip line UYT=fscanf(fid,'%g',[kuy,krb]); % reading the U and Y information fclose(fid); UY=UYT'; % Matrix formation for k=1:ktk UY(:,ntk(k))=UY(:,ntk(k))+tk; end; %UY(:,8)=UY(:,8)*sqrtt0./sqrt(UY(:,2)); % Temperature correction for k=1:ku U(:,k)=UY(:,k); U2(:,k)=UY(:,k); %MODIFICACION DE PROGRAMA ORIGINAL end; u1=ones(krb,1); U2(:,ku+1)=u1; for k=1:kcoef A(:,k)=U2(:,npol1(k)).*U2(:,npol2(k)); end; % RRRRREDES NNNNEURONALES for k=1:ky Y(:,k)=UY(:,k+ku); end; nx=minmax(U');

102

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

net=newff(nx,[13,7],{'tansig','logsig'},'trainbr'); net.trainParam.goal=0.00018; net.trainParam.epochs=260; net.trainParam.show=35; Yt=Y'; for i=1:ky Ypmn(i)=min(Yt(i,:)); Ypmx(i)=max(Yt(i,:)); dif(i)=Ypmx(i)-Ypmn(i); for j=1:d1 Ynorm(i,j)=(Yt(i,j)-Ypmn(i))/dif(i); end end [net,tr]=train(net,U',Ynorm); y5y2=Y(:,5)./Y(:,2); % Model coefficients, model parameters and errors for k=1:ky X(:,k)=A\Y(:,k); YE(:,k)=A*X(:,k); DY(:,k)=(Y(:,k)-YE(:,k))./YE(:,k); end; [dymx,nymx]=max(DY); [dymn,nymn]=min(DY); sdy=std(DY,1,1); % File size fid=fopen('export.txt','rt'); krs=-2; while ne(1,feof(fid)) tmpline=fgets(fid); krs=krs+1; end; fclose(fid); % Measured parameter input fid=fopen('export.txt','rt'); tmpline=fgets(fid); % skip line tmpline=fgets(fid); % skip line UYST=fscanf(fid,'%g',[kuy,krs]); % reading the U and Y information fclose(fid); % Matrix formation UYS=UYST'; for k=1:ktk UYS(:,ntk(k))=UYS(:,ntk(k))+tk; end; %UYS(:,8)=UYS(:,8)*sqrtt0./sqrt(UYS(:,2)); % Temperature correction for k=1:ku US(:,k)=UYS(:,k); US2(:,k)=UYS(:,k); %MMMMMMODIFICACION DE LAS REDES NEURONALES end Utr=U'; PB2=sim(net,Utr); for j=1:ky

103

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

for k=1:d1 PBorigen2(j,k)=(PB2(j,k)*dif(j))+Ypmn(j); end end PBorigentr2=PBorigen2'; for k=1:ky YS(:,k)=UYS(:,k+ku); end; %%%%%%%%%%%%L A P R U E B A%%%%%%%% YSt=YS'; for i=1:ky YpmnEX(i)=min(YSt(i,:)); YpmxEX(i)=max(YSt(i,:)); difEX(i)=YpmxEX(i)-YpmnEX(i); for j=1:d2 YnormEX(i,j)=(YSt(i,j)-YpmnEX(i))/difEX(i); end end UStr=US'; PB=sim(net,UStr); for nn=1:ky Ypmndb(nn)=min(Ypmn(nn),YpmnEX(nn)); Ypmxdb(nn)=max(Ypmx(nn),YpmxEX(nn)); difdb(nn)=Ypmxdb(nn)-Ypmndb(nn); end for j=1:ky for k=1:d2 PBorigen(j,k)=(PB(j,k)*difdb(j))+Ypmndb(j); end end PBorigentr=PBorigen'; %%%%%%%**************la prueba********%%%%%%%%%%%%%%% u1s=ones(krs,1); US2(:,ku+1)=u1s; for k=1:kcoef AS(:,k)=US2(:,npol1(k)).*US2(:,npol2(k)); end; for k=1:ky YS(:,k)=UYS(:,k+ku); end; YStr=YS'; for k=1:7 DYrn2(:,k)=(YS(:,k)-PBorigentr(:,k))./PBorigentr(:,k); end; [dymx,nymx]=max(DYrn2); [dymn,nymn]=min(DYrn2); sdy=std(DYrn2,1,1); for k=1:ky DYrn2(:,k)=(YS(:,k)-PBorigentr(:,k))./PBorigentr(:,k); end; [dymx,nymx]=max(DYrn2);

104

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

[dymn,nymn]=min(DYrn2); sdy=std(DYrn2,1,1); for k=1:ky DYrn1(:,k)=(Y(:,k)-PBorigentr2(:,k))./PBorigentr2(:,k); end; [dymx,nymx]=max(DYrn1); [dymn,nymn]=min(DYrn1); sdy=std(DYrn1,1,1); % Model parameters and errors for k=1:ky YES(:,k)=AS*X(:,k); DYS(:,k)=(YS(:,k)-YES(:,k))./YES(:,k); TMP(:,k)=YS(:,k)-YES(:,k); end; DSUMM=(DYS(:,2)-DYS(:,3)+DYS(:,4)+DYS(:,5)-DYS(:,6))/5; %Integral cryterion [dymxs,nymxs]=max(DYS); [dymns,nymns]=min(DYS); sdys=std(DYS,1,1); % Plot variable t=1:krs; % SECONDARY MODEL FORMATION AND APPLICATION tc0=1700; dtc=700; kcc=2; if tc0+dtcn) tiene la solución analítica bien conocida:

termodinámico nos permitió obtener los valores Y 0 de la

Ù

A = ( U*U) -1 U *Y ,

®

instalación analizada en una región amplia del espacio U lo que es muy difícil realizar en el mantenimiento real. El ®

®

conjunto de los vectores U y Y 0 obtenidos en 330 puntos de operación constituye la muestra de entrenamiento para calcular los coeficientes desconocidos de polinomios y redes neuronales usados en el artículo presente como las funciones ®

de referencia. En esta muestra valores de un vector U y un ®

vector Y forman una porción elemental de datos y la muestra consta de 330 tales porciones.

+ c5 PaTa + c6 Pa ntp + c7 Pa Ga + + c8Ta ntp + c9Ta Gc + c10 ntp Gc +

C. Redes neuronales

® ®

n

Pn ( x) = a0 + a1 x + ....an xn =

å (a x k

k =0

k

)

5)

(10)

+ c11 P 2 a + c12T 2 a + c13 n 2 tp + c14 G 2 c

De la explicación anterior podemos entender que nuestro trabajo consiste en aproximar los datos de la muestra de entrenamiento por una función donde los argumentos son

Y0. Los polinomios de grado máximo n

(9)

la cual se usa en nuestra investigación para determinar los coeficientes de la función de referencia con la muestra de entrenamiento generada por el modelo termodinámico. Para entrenar las redes neuronales se usa la misma muestra. Hemos demostrado en [12] que los polinomios completos del segundo orden describen bien el comportamiento de turbinas de gas. Por eso en la investigación actual aplicamos la función siguiente para cada variable monitoreada: Y = co + c1 Pa + c2Ta + c3 ntp + c4Gc +

B. Polinomios

los elementos del vector U y el resultado sería el vector

(6)

La neurona artificial, célula o autómata, es un elemento que posee un estado interno, llamado nivel de activación, y recibe señales que le permiten, en su caso, cambiar de estado; emulando así el comportamiento de una neurona biológica. A la manera en que estas células (neuronas, nodos) se conectan entre sí se le denomina arquitectura de la red.

118

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

En las investigaciones de este artículo usamos la arquitectura llamada perceptrón multicapa y el algoritmo de retropropagación para su entrenamiento. En particular, se utilizaron las variaciones de este algoritmo disponibles en Matlab, las cuales realizan el aprendizaje supervisado (aprtendizaje con las salidas deseadas de la red son conocidas) en el modo de lote (batch mode). En el perceptrón multicapa usado se distinguen tres tipos de capas: la de entrada, la escondida y la de salida. Las neuronas de la capa de entrada son las condiciones de ®

operación U de la instalación analizada y las neuronas de la ®

capa de salida son las variables monitoreadas Y 0 correspondientes a buenas condiciones de la instalación. El número de neuronas en la capa escondida se varía en cálculos y el número óptimo fue 12. El perceptron tiene las funciones sigmoidales de activación por lo tanto las salidas de la red se varían en el intervalo (0-1) y las variables ®

monitoreadas (elementos del vector Y 0 ) deben ser normalizadas antes de usarlas en el entrenamiento. La figura 1 visualiza las descripciones previas y demuestra la estructura del perceptron usado para la función de referencia. La conexión entre la capa de entrada y la escondida así como entre la capa escondida y la de salida se realiza por los coeficientes (pesos) unidos en dos matrices, W1 y W2 correspondientemente. El objetivo del entrenamiento del perceptrón es encontrar tales valores de todos pesos que minimizan la diferencia (error promedio e) entre las salidas deseadas de la red y las actuales para todos los datos de la muestra de entrenamiento (la misma que se aplica para calcular los coeficientes de polinomios). De este punto de vista podemos tratar el problema de entrenamiento como el problema de la minimización de la función e(W1,W2) en el espacio multidimensional de todos los pesos desconocidos. Los algoritmos usados de entrenamiento tienen un carácter iterativo y el error se reduce sucesivamente, iteración por iteración, hasta alcanzar el valor mínimo.

Fig.1. Estructura del perceptrón para la función de referencia D. Validación Ambas herramientas, tanto polinomios como redes neuronales, calculadas con el uso de la muestra de entrenamiento necesitan una muestra más para su validación. La muestra de validación se compuse con la base de datos reales de la instalación analizada. Esta muestra tiene la misma estructura que la muestra de entrenamiento y incluye 4096 porciones de datos (secciones de medición) registradas con el intervalo de una hora durante de un año de operación. El registro cubre dos periodos de contaminación y el lavado del compresor lo que presenta información importante para el diagnóstico ya que la contaminación es reconocida como uno de los mecanismos más frecuentes de envejecimiento. Con respecto al criterio de validación de la función de referencia, el error promedio e puede ser calculado en la muestra de validación y considerado como el criterio. Sin embargo a diferencia de la muestra de entrenamiento, estos datos incluyen la influencia de la contaminación la cual alterará el criterio e. Por ello el error e se aplicará en el análisis de la siguiente sección sólo como un criterio preliminar mientras que el criterio final será una estimación visual de calidad de las gráficas de las desviaciones calculadas con la función analizada como se propone en [12].

119

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

III. RESULTADOS

ambas herramientas contaminación.

El software del cálculo de las desviaciones por medio de dos herramientas, polinomios y redes neuronales, ha sido desarrollado en Matlab el que simplificó el desarrollo así como la visualización y comparación de los resultados. La Figura 1 demuestra las desviaciones obtenidas por polinomios y redes neuronales en las muestras de entrenamiento y validación. Para estos cuatro casos el formato de graficas es el mismo: desviaciones de tres variables monitoreadas especificadas en la Tabla 1 contra el tiempo de operación t. Se puede considerar las desviaciones de la parte izquierda de la figura como errores de aproximación de los datos de entrenamiento por las herramientas correspondientes. Podemos ver que las redes tienen los errores cinco veces más grandes. En la parte derecha comportamiento de las desviaciones computadas con polinomios también parece mucho mejor. Podemos ver tendencias claras del cambio de las desviaciones a causa de la contaminación del compresor y el lavado en el punto t = 920 horas mientras que las fluctuaciones en las desviaciones computadas con las redes son significativas y capaces de esconder completamente los efectos de la contaminación. La calidad baja de las desviaciones y de la función de referencia en base de redes neuronales se explica por falta de ajuste en las redes. El perceptrón usado tiene tres posibilidades para su ajuste: escoger la variación propia del algoritmo de entrenamiento, encontrar número necesario de las iteraciones NI y determinar la cantidad óptima de nodos de la capa escondida NN. Después de escoger el mejor algoritmo de entrenamiento, formamos un plan de experimento numérico para determinar los números de iteraciones y nodos. Tabla 3 demuestra este plan rectangular con la variación independiente de estos dos parámetros. Cada celda de la tabla presenta el valor del error promedio e para el cálculo correspondiente con la red neuronal. Los mejores y los peores resultados se marcan por color. Se selección propia de los números NI y NN así como el algoritmo de entrenamiento nos ha permitido mejorar significativamente el funcionamiento de la red neuronal en la aplicación a la función de referencia y comportamiento de las desviaciones correspondientes. Los resultados finales de comparación de dos herramientas son graficados en la Fig.3. Observando las graficas podemos concluir que en la muestra de entrenamiento los errores de la red neuronal han bajado aproximadamente en tres veces. En la muestra de validación la calidad de la red observada a través de sus desviaciones se mejoró drásticamente también: ahora las desviaciones de

describen

igualmente

bien

la

Tabla 3. Plan del experimento numérico con la red neuronal NI 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229

710 0.25380 1 0.25854 2 0.06892 43 0.18040 2 0.10522 4 0.06809 14 0.12798 4 0.53751 7 0.23773 9 0.16020 9 0.05719 47 0.05682 94 0.34993 3 0.12122 1 0.51071 7 0.12048 2 0.07554 53 0.53259 6 0.09807 58 0.07666 8 3.86537 2.73437 0.11730 3 0.09478 15 0.12496 2 0.19406 4 0.11364 0.06473 76 0.1378 0.10090 8

Número de nodos NN 11 12 0.043294 0.04444 6 0.218773 0.060740 6 0.045355 0.085653 6 9 0.070359 0.041288 9 6 0.106783 0.044684 4 0.227283 0.156417 0.072853 5 0.146378 0.288374 0.78037 0.085725 2 0.053898 0.101054 0.054488 7 0.076694 5 0.045679 5 0.049382 7 0.050797

0.095511 4 0.039929 9 0.046107 5 0.040839 7 0.039153 1 0.053076 8 0.126915 0.066013 2 0.818928 0.038479 3 0.056096 9 0.121247

0.145849 0.098670 0.046750 0.048273 7 0.092927 1 0.878309

0.126256 0.076147 5 4.5855

0.091858 3 0.057125 3 0.066343 9 0.063449

0.165796 0.088610 2 0.054494 1 0.118214

0.057145 4 0.133177

0.045922 9 0.119061

0.068911 4 0.075958 6 16.5938

Nota:

120

Mejores respuestas de la red

13 0.206882 0.0863464 1.40216 0.0457762 0.397115 0.400441 0.0497931 0.1402626 0.120828 0.0882855 0.0789731 0.0461012 0.110234 0.0936413 0.0461464 0.14712 0.0397065 0.182618 0.114534 0.0617683 0.0591907 0.09824201 0.061816 0.81165 0.0533651 0.221868 0.0618592 0.0939929 0.0532404 0.135739

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

La exactitud alcanzada ya con polinomios y reds neuronales es suficientemente alta y no es inferior a un nivel conocido de la literatura. Por esta razón, futuros progresos no vendrán fácilmente.

Peores respuestas de la red

IV. DISCUCIONES Después de una serie de ensayos de la red neuronal perceptrón multicapa variando el número de iteraciones entrenamiento y de neuronas escondidas, nos hemos llegado a los resultados prácticamente iguales a los de polinomios computados por el método de mínimos cuadrados. Eso quiere decir que la función de referencia (una generalización de las características de estrangulación y las climáticas) de la instalación analizada es relativamente simple, los polinomios son suficientes para describirla y la herramienta más compleja, perceptron multicapa no puede realizar su ventaja potencial de flexibilidad elevada. Aunque el perceptrón multicapa) es un aproximador universal de funciones tiene todavía la desventaja del conocimiento a priori del numero de nodos ocultos y de la complejidad de su algoritmo de entrenamiento comparando con el método matricial de encontrar los coeficientes de los polinomios. Así, los polinomios parecen ser una herramienta adecuada para describir la función de referencia y calcular las desviaciones en sistemas de monitoreo de turbinas e gas. Sin embargo, esta conclusión es preliminar. La investigación conducida ha demostrado existen algunas posibilidades del mejoramiento de la función de referencia con redes neuronales. También hay que extender la comparación ejecutada para una instalación con turbina libre en otros tipos de turbinas de gas.

V. CONCLUSIONES Así, la formación de desviaciones, la cual presenta un problema importante del diagnóstico de turbinas de gas, ha sido considerada en este artículo. La red neuronal perceptron multicapa fue propuesta, realizada en Matlab y comparada con polinomios para el cálculo de las desviaciones. La motivación para realizar este trabajo fue que se esperaba que la red neuronal pudiera aproximar mejor la función de referencia porque la red tiene más grados de libertad. Después de realizar numerosas variantes de cálculos y gráficas comparativas llegamos a la siguiente conclusión: ambas herramientas comparadas tienen prácticamente la misma exactitud sin embargo la red neuronal es una herramienta más compleja que un polinomio, por lo tanto será más factible aproximar la función de referencia y calcular las desviaciones con polinomios. Esta conclusión necesita una comprobación más amplia y hay que continuar las investigaciones en esa área. AGRADECIMIENTOS Las investigaciones de este artículo han sido soportadas por el Instituto Politécnico Nacional de México (proyecto de investigación 20080974).

121

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

Fig.2. Resultados preliminares de la comparación de polinomios y redes neuronales

Fig.3. Resultados finales de la comparación.

122

ELABORACIÓN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A POLINOMIOS Y REDES NEURONALES.

REFERENCIAS 1. Kacprzynski Gregory J., Michael Gumina, Michael J. Roemer, Daniel E. Caguiat, Thomas R. Galie, Jack J. McGroarty (2001). A prognostic modelling approach for predicting recurring maintenance for shipboard propulsion system. Proceedings of ASME Turbo Expo 2001, New Orleans, LA USA, 7p. 2. Roemer Michael J., Kacprzynski Gregory J. (2000). Advanced diagnostics and prognostics for gas turbine engine risk assessment. IGTI/ASME Turbo Expo, May 8-11, Munich, Germany, 10p. 3. Bryce Lord – TransCanada Pipelines Ltd, Joshua Bennett –Idax Incorporated. Equipment health monitoring failure mode characteristics case study. 17th National Petroleum Show, Calgary, Canada – June 12th to 15th, 2000, 25p. 4. Frank L. Greitzer, Lars J. Kangas, Kristine M. Terrones, Melody A. Maynard, Bary W. Wilson, Ronald A. Pawlowski, Daniel R. Sisk, and Newton B. Brown. Gas turbine engine health monitoring and prognostics. International Society of Logistics (SOLE) 1999 Symposium, Las Vegas, Nevada, August 30 – September 2, 1999, 7p. 5. H. I. H. Saravanamuttoo, B. D. MacIsaac, Thermodynamic models for pipeline gas turbine diagnostics. ASME Journal of Engineering for Power, 1983, Vol. 105, pp.875-884 ASME Paper No.83-GT-235 6. Hans DePold, Jason Siegel, Allan Volponi, Jonthan Hull. Validation of diagnostic data with statistical analysis and embedded knowledge. IGTI/ASME Turbo Expo 2003, June

16-19, 2003, Atlanta, Georgia, USA, 7p., ASME Paper GT2003-38764 7. A.J. Volponi, H. DePold, R. Ganguli. The use of Kalman filter and neural network methodologies in gas turbine performance diagnostics: a comparative study. Journal of Engineering for Gas Turbines and Power -October 2003 -- Volume 125, Issue 4, pp. 917-924 8. Suresh Sampath, Riti Singh. An integrated fault diagnostics model using genetic algorithm and neural networks. Journal of Engineering for Gas Turbines and Power -- January 2006 -- Volume 128, Issue 1, pp. 49-56. 9. C. Romessis, A. Kyriazis, K. Mathioudakis. Fusion of gas turbine diagnostic inference – the Dempster-Schafer approach. IGTI/ASME Turbo Expo 2007, May 14-17, 2007, Montreal, Canada, 9p., ASME Paper GT2007-27043. 10. Hai Kiu, Neil Eklund, Weizhong Yan, Piero Bonissone, Feng Xue, Kai Goebel. Estimating deterioration level of aircraft engines. IGTI/ASME Turbo Expo 2007, May 14-17, 2007, Montreal, Canada, 7p., ASME Paper GT2007-27519. 11. Al Volponi, Tom Brotherton, Rob Luppold. Empirical tuning of on-board gas turbine engine model for real-time module performance estimation. IGTI/ASME Turbo Expo 2007, May 14-17, 2007, Montreal, Canada, 10p., ASME Paper GT2007-27535 12. I. Loboda, S. Yepifanov, Y. Feldshteyn. Deviation problem in gas turbine health monitoring / IASTED International Conference on Power and Energy Systems (PES-2004), Clearwater Beach, Florida, USA, November 28 – December 1, 2004, pp. 335-340.

123

124

ANALISIS DE UNA RED NEURONAL EN LA APLICACIÓN A LA FUNCION DE REFERENCIA DE UNA TURBINA DE GAS

Claudia Fernanda Villarreal González, Igor Loboda, Iván Trahyn Amezcua

Instituto Politécnico Nacional, ESIME Culhuacán, Av. Santa Ana 1000, col. San Francisco Culhuacán, México, D.F. 044300

[email protected];

[email protected];

[email protected]

RESUMEN

Para monitorear las variables medidas en el conducto de flujo de un motor de turbina de gas es necesario describir el comportamiento del motor en buenas condiciones, es decir, determinar la función de referencia. Las desviaciones computadas como diferencias entre valores medidos y valores de referencia pueden servir como buenos indicadores de la calidad de esta función. En el artículo presente se estudian las redes neuronales en la aplicación a la función de referencia y se comparan con polinomios en la misma aplicación. Un modelo termodinámico del motor y una base de datos reales son fuentes de los datos para determinar y verificar la función. A través de esta función se calcularon las desviaciones para ambas herramientas, tanto redes como polinomios, y se compararon las gráficas de desviaciones para varias variaciones en las redes aplicadas. El análisis de todas las gráficas ha demostrado que las redes, a pesar de de sus características altas de aproximación de datos, no pueden sobrepasar los polinomios en la descripción del motor de turbina de gas analizado.

1 INTRODUCCION Las turbinas de gas son dispositivos mecánicos muy importantes para la economía del país. Tienen una infinidad de aplicaciones, por ejemplo: aviación, generación de energía eléctrica, bombeo de petróleo y compresión de gas natural. Por la naturaleza y complejidad de los motores de turbina de gas resulta tardado y costoso detectar y corregir alguna falla. Sin embargo, existen diferentes sistemas automatizados de monitoreo, los cuales permiten detectar e identificar las fallas de turbina de gas en un tiempo reducido. De tal manera se puede bajar drásticamente el nivel de fallos serios. El trabajo de los sistemas mencionados se basa en un tratamiento diagnóstico de los parámetros medidos en los motores de turbina de gas.

124

125 El presente trabajo analiza los parámetros medidos en el conducto de flujo de una turbina de gas, tales como: temperaturas y presiones en el conducto de flujo, velocidades de rotación y caudal de combustible. Para analizar los parámetros medidos y concluir el estado del sistema por medio de este análisis es necesario compararlos con los valores de referencia de un motor en buenas condiciones después de la fabricación o un mantenimiento. Estos valores dependen de las condiciones de operación del motor. Por ende para describir todas variables de referencia del motor en buenas condiciones se necesita una función vectorial - función de referencia - que tiene el vector de las condiciones de operación como argumentos. Las diferencias entre los valores medidos y la función de referencia son conocidas como desviaciones. Estas desviaciones por un lado cambian gradualmente a causa de diferentes mecanismos de degradación de turbinas de gas (por ejemplo, contaminación de compresores), por otro lado son afectadas por errores de la función misma. Por lo tanto las graficas de las desviaciones no sólo demuestran los efectos de degradación sino también reflejan la calidad de la función de referencia. En nuestros estudios previos [1-3] usamos la herramienta de polinomios para aproximar la función de referencia necesaria. Dado que las redes neuronales artificiales son conocidas como aproximadores perfectas, en este artículo se investigan las redes en la aplicación a la función de referencia para el diagnóstico de un motor de turbina de gas. Durante la investigación se analizan diferentes modificaciones de la red y se comparan con los polinomios.

2 ENFOQUE UTILIZADO Desviaciones El objetivo del diagnostico paramétrico de turbinas de gas es realizar un monitoreo constante de los parámetros medidos y en caso de una falla detectarla e identificarla más pronto posible. La eficiencia de un sistema automatizado de diagnóstico depende en la mayor parte de la calidad de las desviaciones. Para una variable medida y monitoreada Y * , la desviación relativa puede ser calculada de acuerdo a la expresión ®

dY * =

Y * - Y0 (U ) ®

,

(1)

Y0 (U ) ®

donde el valor de referencia Y0 es una función del vector U de condiciones de operación de una turbina de ®

gas. Las funciones individuales Y0 (U ) computadas para cada variable monitoreada se unen en la función vectorial de referencia como se muestra en la siguiente ecuación ®

®

® ®

Y0 = F (U ) = Y0 (U ) .

(2)

En los previos estudios usamos ampliamente la herramienta de los polinomios para formar la función (2) en base de datos registrados de turbinas de gas durante su operación. Se ha demostrado en [1] que los polinomios completos del segundo orden describen satisfactoriamente el comportamiento de motores en diferentes regímenes de operación (puntos de operación). Por lo tanto, los polinomios se emplean como la base de comparación en el análisis de las redes neuronales presentado en este artículo.

125

126

Herramienta de los Polinomios

Para una variable monitoreada la función de referencia, por ejemplo, de cuatro argumentos, se describe a través del polinomio completo del segundo orden como ®

Y0 (U ) = a0 + a1u1 + a2u 2 + a3u3 + a4u4 + a5u1u2 + a6u1u3 + a7 u1u 4 +

(3)

+ a8u2u3 + a9u2u 4 + a10u3u 4 + a11u12 + a12u 22 + a13u32 + a14 u42

Con motivo de presentar toda la función vectorial, podemos generalizar la expresión (3) en la forma siguiente: ®

®

Y0* = V * A ,

(4) ®

®

donde Y0* es el vector renglón de variables monitoreadas de dimensión m, V * es el vector renglón kdimensional que une todos los componentes 1, u1 , u2 ,...u32 , u42 y la matriz A (k×m) incorpora los coeficientes

ai para todas m variables monitoreadas. Obviamente, el numero de ecuaciones m en el sistema lineal (4) no es suficiente para estimar (m×k) coeficientes desconocidos. A fin de obtener más datos, involucramos en los ®

®

cálculos las mediciones Y0

y U

de n diferentes puntos de operación y formamos las matrices

correspondientes Y (n×m) y V (n×k). Con las matrices nuevas, la ecuación (4) se transforma en Y = VA .

(5)

Para estimar los coeficientes desconocidos de la matriz A se aplica el método de mínimos cuadrados (MMC). El MMC consiste en encontrar tales estimaciones que minimizan la suma de errores cuadrados n

å i =1

2

® ®ù é å êê yij - Vi* A j úú . j =1 ë û m

(6)

Con la condición de minimización, el sistema de ecuaciones lineales (5) tiene la solución siguiente bien conocida: Ù

A = (V *V ) -1 V *Y .

(7)

Esta solución del MMC requiere un exceso de los datos de entrada. Por consiguiente, tenemos que cumplir la condición (n×m)>(m×k) o n>k. La solución (7) asegura errores aleatorios reducidos de las estimaciones si comparar con la solución A = (V ) -1 Y

(8)

que se tiene para el caso n=k, cuando el número de ecuaciones se iguala al número de las variables desconocidas.

126

127 Ù

Al poner la estimación A en la ecuación (4), tenemos la función de referencia ®

® Ù

Y0* = V * A .

(9)

Ahora con la expresión (9) se tiene un modelo de turbina de gas listo para aplicarse a cualquier punto de ®

®

®

operación nuevo dado por el vector U (recuerde que V * se determina simplemente a través de U ) y ®

computar el vector Y0* de las características de la turbina. A su vez, los valores conocidos Y0 permiten el cálculo de las desviaciones (1). La siguiente herramienta para crear la función de referencia y la principal en la presente investigación es la llamada redes neuronales artificiales.

Herramienta de las Redes Neuronales Artificiales La teoría de redes neuronales se basa en el modelo de las neuronas del cerebro. La neurona es una célula activada por estímulos químicos y biológicos y tiene una capacidad muy pequeña del tratamiento de información. Sin embargo, cuando están conectadas millones de ellas trabajan como una red muy poderosa de procesadores paralelos. Eso ocasiona que en muchas aplicaciones prácticas los supercomputadores modernos todavía no son capaces de semejarse con el funcionamiento del cerebro humano.

La función de referencia (4), además de encontrarse por medio de polinomios también se puede aproximar a través de una red. Aunque en el pasado las redes neuronales artificiales tenían el objetivo general de un procesamiento de nivel más bajo, por ejemplo, reconocimiento de patrones e inteligencia artificial; existen teoremas [4] que demuestran que redes como el perceptron multicapa y la red de base radial, puedan aproximar varias funciones matemáticas.

Para el presente estudio hemos recogido el perceptrón multicapa que se entrena con el algoritmo de retropropagación. La estructura de la red utilizada se muestra en la figura 1. Como podemos ver, es una red ®

neuronal con 3 capas: La primera es la capa de entrada donde cada señal es un elemento del vector U de las condiciones de operación de turbinas de gas. A su vez, las salidas de estas se propagan con los pesos de la matriz W1 hacia la capa oculta que se activa con una función sigmoide de transferencia. De manera semejante las salidas de la capa oculta se propagan con los pesos de la matriz W2 a los nodos de salida. En ellos se suman y a través de la función de transferencia forman las señales de salida, elementos del ®

vector Y0 de las variables monitoreadas.

127

128

Fig.1. Estructura del perceptrón para la función de referencia.

El algoritmo que entrena a la red neuronal se basa en la biología de humanos donde la memoria a corto y largo plazo está asociada con las fuerzas entre las células presinapticas y postsinapticas. De esta manera tenemos que ir modificando los valores de los pesos hasta que mediante el procesamiento no lineal (o lineal) ®

de cada capa obtengamos el valor deseado de la salida Y0 . El desarrollo del algoritmo de retropropagación para el entrenamiento del perceptron ha impulsado una difusión amplia de esta red. El objetivo del entrenamiento de retropropagación es encontrar tales valores de todos pesos que minimizan la diferencia (error promedio e) entre las salidas deseadas de la red y las actuales para todos los datos de la muestra de entrenamiento. Esta muestra consta de los mismos datos que las matrices V y Y usadas para calcular los coeficientes de polinomios. De este punto de vista podemos tratar el entrenamiento como el problema de la minimización de la función e( W1 , W2 ) en el espacio multidimensional de todos los pesos desconocidos. Ambas herramientas descritas arriba, tanto la red entrenada como el polinomio con los coeficientes determinados, tienen que someterse a pruebas en datos diferentes de los de entrenamiento.

Pruebas de las Herramientas A fin de confirmar la exactitud de las herramientas, se forma una muestra diferente a la de entrenamiento, muestra de validación. La disponibilidad de los datos reales con la influencia de la contaminación del compresor axial de turbinas de gas nos presta una oportunidad buena para estimar y comparar la adecuación de las dos herramientas analizadas. Eso se realiza a través del análisis de las desviaciones correspondientes.

Primero, se forma la muestra de validación en la base de estos datos. Segundo, para todos los datos de la muestra se calculan dos series de las desviaciones, una con los polinomios y la otra con las redes. Tercero, se grafican en paralelo ambas series contra el tiempo de operación. En estas gráficas podemos considerar los errores aleatorios en las desviaciones en el fondo de los cambios sistemáticos causados por la contaminación del compresor. Debido a que los errores dependen primeramente de la adecuación de la función de referencia, pueden ser buenos indicadores de la calidad de la función. Por último, se comparan estas dos gráficas correspondientes a los polinomios y las redes para concluir sobre la utilidad de las redes.

128

129 La sección siguiente describe las condiciones de los cálculos para formar y probar las funciones de referencia basadas en los polinomios y las redes. 3 CONDICIONES DE CALCULOS La investigación del presente artículo se aplicó a un motor de turbina de gas de dos ejes y de turbina libre de potencia. El motor se aplica para accionar un compresor centrífugo de gas natural. Las tablas 1 y 2 describen las variables medidas en este motor.

®

Tabla 1. Variables monitoreadas (vector Y ) No

Nomenclatura

Nombre

1

npa

Velocidad del rotor de compresor

2

Pc

Presión detrás del compresor

3

Tt

Temperatura detrás de la turbina de presión alta

4

Tc

Temperatura detrás del compresor

5

Pt

Presión detrás de la turbina de presión alta

6

Pt

Presión detrás de la turbina de potencia

7

ntpa

Velocidad de rotación de la turbina de potencia

®

Tabla 2. Condiciones de operación (vector U ) No

Nomenclatura

Nombre

1

Gc

Caudal de combustible

2

ntp

Velocidad de rotación de la turbina de potencia

3

Ta

Temperatura ambiental

4

Pa

Presión ambiental

El motor fue presentado en el artículo por su modelo termodinámico y una base de datos medidos en campo. ®

®

El conjunto de los vectores U e Y 0 obtenidos con el modelo en 330 puntos de operación del motor constituye una variación de la muestra de entrenamiento. Otra variación incluye datos reales de la base. La muestra de validación se compuse sólo con los datos reales. La muestra incluye 4096 puntos de operación (porciones de datos) registradas cada hora durante un año de operación. El registro cubre dos periodos de contaminación del compresor con un lavado entre ellos.

129

130 4 MODIFICACIONES ANALIZADAS Y SUS RESULTADOS En el artículo [3] empezamos a aplicar el perceptron multicapa para describir el comportamiento de turbinas de gas. Hemos encontrado que el percepron tiene prácticamente la misma exactitud, sin embargo pero nunca sobrepasa los polinomios en la descripción de las turbinas de gas. Hemos llegado también a la conclusión que el algoritmo de entrenamiento con mejores resultados fue el de retropropagación bayesiana y en el presente artículo continuamos trabajando con el mismo algoritmo. Para encontrar las óptimas condiciones para la red seleccionada, hemos elaborado en Matlab ocho modificaciones nuevas del algoritmo básico de cálculo de la función de referencia y las desviaciones. En estas modificaciones se cambian las técnicas de preprocesamiento de los datos de entrenamiento y las funciones de transferencia usadas, así como se aplica la opción de entrenamiento “parada temprana” (early stopping) y los datos reales para la muestra de entrenamiento. A continuación se detallan las modificaciones:

Modificación 1. En el algoritmo básico usado en [3] los datos de la salida de la red se normalizan dentro del rango (0,1) ya que la función de transferencia logsig se cambia dentro del mismo rango. La modificación actual consiste en la normalización dentro del rango reducido (0.1, 0.9) para mejorar la aproximación de los datos de entrada. Modificación 2. En lugar de la función logsig se aplica la función purelin la cual cambia linealmente y no tiene límites. La normalización de los datos dentro del rango (0,1) se conserva como en el algoritmo básico. Modificación 3. Se aplica la función purelin pero los datos de la salida de la red no se normalizan. Modificación 4. Se aplica la función bipolar tansig que se varía dentro de los límites (-1,1). Los datos se normalizan dentro los mismos límites. Modificación 5. Se aplica la función tansig pero los datos se normalizan dentro del rango reducido (0.9,0.9). Modificación 6. Se introducen nodos adicionales llamados umbrales en adición a las matrices de pesos W1 y W2 . El aumento del número total de pesos significa una flexibilidad mayor de la red y un mejoramiento potencial de la aproximación de los datos. Modificación 7. El algoritmo básico emplea una sola muestra de entrenamiento. La modificación actual aplica la opción del entrenamiento conocida como parada temprana (Early Stopping). Esta variación consiste en entrenar la red con dos muestras; una para entrenar la red y otra para verificarla dentro del mismo proceso de entrenamiento. Para poder aplicar este algoritmo la muestra de entrenamiento original de 330 porciones de datos fue dividida en dos fragmentos iguales de 165 porciones. Las matrices de pesos W1 y W2 se obtienen en los datos del primer fragmento y el entrenamiento termina cuando empieza a crecer el

error e( W1 , W2 ) para la red aplicada al segundo fragmento. Modificación 8. En el algoritmo básico así como en todas las modificaciones previas la red neuronal se entrena con los datos obtenidos por el modelo termodinámico durante la simulación del motor en buenas condiciones. Para esta modificación la muestra de entrenamiento se compone de datos reales correspondientes a un buen estado del motor después del lavado de su compresor.

130

131 Hay que mencionar que en las modificaciones 1-6 sólo cambiamos el cálculo de las redes dejando el cómputo de los polinomios y las desviaciones correspondientes sin correcciones. Sin embargo, las modificaciones 7 y 8 relacionadas con variaciones en los datos de entrenamiento influyen al cálculo de ambas herramientas. La figura 2 muestra los resultados obtenidos para la Modificación 1 del algoritmo de cálculo de la función de referencia y las desviaciones. Se dan las desviaciones obtenidas con tanto los polinomios como las redes neuronales y aplicadas a los datos de la muestra de entrenamiento y la de validación. Para estos cuatro casos el formato de gráficas es el mismo: desviaciones de tres variables monitoreadas especificadas en la Tabla 1 contra el tiempo de operación t. Se puede considerar las desviaciones de la parte izquierda de la figura como errores de aproximación de los datos de entrenamiento por las herramientas correspondientes. Podemos ver que las redes tienen los errores algunas veces más grandes. La parte derecha presenta el de las desviaciones computadas con los datos de validación. Para la opción de polinomios, podemos ver tendencias claras del cambio gradual de las desviaciones a causa de la contaminación del compresor y un cambio brusco en el punto del lavado t = 920 horas. Con respecto a las redes, sus desviaciones tienen fluctuaciones elevadas y capaces de esconder a veces los efectos de la contaminación. En la figura 3 se dan las gráficas de desviaciones para todas ocho modificaciones analizadas. Para cada modificación, sólo resultados de la aplicación de las redes neuronales a los datos de entrenamiento son presentados. Comparando las graficas de diferentes modificaciones podemos constatar lo siguiente: 1) la calidad de las desviaciones (relación "señal sistemático - ruido") para la Modificación 5 es aproximadamente la misma que la de la Modificación 1; 2) en las Modificaciones 1, 4 y 6 baja la calidad; 3) las Modificaciones 3, 7 y 8 tienen la peor calidad de las desviaciones (las fluctuaciones aleatorias prácticamente esconden los efectos sistemáticos de la contaminación). Al comparar las figuras 2 y 3, se puede agregar que en ninguna modificación del algoritmo las redes sobrepasan los polinomios. De otras gráficas no presentadas en este artículo también podemos concluir que en la muestra de entrenamiento los polinomios siempre tenían mejor exactitud.

CONCLUSIONES Así, en este artículo ha sido considerado el análisis de las redes neuronales en comparación con los polinomios en la misma aplicación a la descripción de turbinas de gas. La motivación para realizar este trabajo fue que se esperaba que la red neuronal pudiera describir mejor el comportamiento de los motores porque las redes potencialmente tienen mejor flexibilidad.

La red neuronal perceptron multicapa fue propuesta y analizada. A través de ambas herramientas, las redes y los polinomios, fue realizado en Matlab el cálculo de la función de referencia y las desviaciones para las variables monitoreadas de un motor de turbina de gas. Las redes fueron estimadas por el medio de las gráficas de las desviaciones construidas para ambas herramientas. Después de realizar numerosas modificaciones del cálculo mencionado y analizar para todas las modificaciones las gráficas comparativas, llegamos a la siguiente conclusión: la red seleccionada no puede sobrepasar los polinomios en la exactitud de la descripción del comportamiento del motor analizado. Además, la red neuronal es una herramienta más compleja en su uso que un polinomio. Estas conclusiones comprueban los resultados de comparaciones previas de las herramientas para describir parámetros de

131

132 turbinas de gas. Sin embargo, tenemos que continuar estos estudios ya que se tiene la información que las redes neuronales artificiales describen perfectamente el comportamiento de las plantas de potencia más complejas, tales como las del ciclo combinado.

AGRADECIMIENTOS Las investigaciones de este artículo han sido soportadas por el Instituto Politécnico Nacional de México (proyecto de investigación 20091273).

REFERENCIAS 1. Loboda I., Yepifanov S., Feldshteyn Y. Deviation problem in gas turbine health monitoring”, Proceedings of IASTED International Conference on Power and Energy Systems (PES-2004), Clearwater Beach, Florida, USA, pp. 335-340. 2. Loboda I., Yepifanov S., Feldshteyn Y. Diagnostic analysis of maintenance data of a gas turbine for driving an electric generator, ASME Turbo Expo 2009: International Technical Congress “Power for Land Sea & Air”, Orlando, Florida, USA, June 8-12, 2009, 12p., ASME Paper No. GT2009-60176. 3. Villarreal González C. F., Loboda I., Trahyn Amescua I. K. Aplicación de las redes neuronales en modelo de estado normal para el diagnóstico de turbinas de gas, Memorias del 5to Congreso Internacional de Ingeniería Electromecánica y de Sistemas, ESIME, IPN, México, D.F., 10-14 noviembre de 2008, 6p, ISBN 978-607-414-049-1. 4. Bonifacio Martín del Brío, Alfredo Sanz Molina. Redes neuronales y sistemas difusos. Alfaomega Grupo Editor, México, 2001, 399p.

132

133

Fig.2. Desviaciones de la Modificación 1. Polinomios y redes neuronales aplicados a los datos de entrenamiento y validación.

133

134

Fig.3. Desviaciones de todas las Modificaciones 1-8. Redes neuronales aplicadas a los datos de entrenamiento.

134

135

UDK 621.43.004.62 IGOR LOBODA*, YAKOV FELDSHTEYN**, CLAUDIA FERNANDA VILLARREAL GONZÁLEZ* *National Polytechnic Institute, School of Mechanical and Electrical Engineering, Mexico **Compressor Controls Corporation, USA DIAGNOSTIC ANALYSIS OF GAS TURBINE HOT SECTION TEMPERATURE MEASUREMENTS

Temperatures measured in a hot section of gas turbines are very important for a gas path analysis. A suite of parallel thermocouples are usually installed in the same gas path station in order to compute a filtered and averaged temperature quantity for its further use in control and diagnostic systems. However, in spite of the preliminary treatment, the resulting quantity is not completely free from errors. To eliminate or reduce the errors, the present paper analyzes anomalies in the behaviour of each thermocouple of an industrial gas turbine engine. To that end, time graphs of both measured magnitudes themselves and their deviations from reference magnitudes are plotted. In order to draw sound conclusions, the analysis is conducted on a large volume of the data collected for three particular engines.

Key words: gas turbine, gas path analysis, thermocouples, field data, temperature recording errors.

135

136

Nomenclature

Subscripts and superscripts 0

Baseline function value

Abbreviations

*

Measured value

EGT

Exhaust gas temperature

i

Index of a thermocouple probe

GPA

Gas path analysis

max

Maximum value

HPT

High pressure turbine

med

Mean value

PT

Power turbine

T

Temperature

PTT

Power turbine temperature

S

Total value

T_PT

Mean power turbine temperature

1. Introduction Scalar parameters and vectors dTpt

Deviation of a particular PTT probe

dTt

Deviation of a particular EGT probe

t

Engine operation time variable

®

Gas path analysis (GPA) techniques provide invaluable insight into gas turbine condition. These techniques are based on measured and recorded gas path variables (pressures, temperatures, rotation speeds, fuel consumption, etc.) and hot section temperatures (exhaust gas temperature as well as temperatures behind low and intermediate pressure turbines, if any) among them. Advancements in electronics and computer processing enable less expensive field data collection to support the GPA.

U

Vector of baseline function’s arguments

Y

Gas path variable

d

Maximal deviation

d0

Signal-to-noise ratio

dY

Deviation of a gas path variable

D

Spread (of temperature); interval (of

time) e

e1 , e 2 , e 3

Error of a gas path variable; noise range (of temperature) Error components

s (e S ) Standard deviation of the errors

As engine integrity depends on gas temperature values, temperature measurement and recording are of great importance for gas turbine control and diagnostic systems. The control system can employ these variables, especially the EGT, in engine control programs in order to avoid engine overheating. As to the diagnostic system, some temperature measurement applications worthy to mention are given below. In engine component diagnostic techniques, which involve all available gas path variables into the analysis, the gas temperatures are confirmed

136

137 to be very informative diagnostic parameters [1,2,8]. Life usage algorithms of the hot section, which is the most critical part of the engine, also employ these temperatures [10]. In such applications, the gas temperature in each hot section measurement station is commonly computed by averaging the data of particular thermocouple probes. However, temperature profiles contain additional valuable information on the performances of a burner and turbines. For this reason, gas temperature profile monitoring [3] became an integral part of modern diagnostic systems. As noted in many papers, for example, in [5], thermocouple probes as well as other gas path sensors can deteriorate with time or present abrupt malfunctions. Such errors can be significant and impact on control and diagnosis techniques. That is why it is desired that the techniques take into account possible errors in input information. Sensor fault accommodation procedures, which mitigate a negative effect of sensor errors on a control system and allow the control to be tolerant to them, are proposed [for example, 7]. With respect to the diagnostic techniques, some options are considered to take into consideration possible sensor errors and faults. A sensor-fault-tolerant diagnosis tool is proposed [6]. Another option is the multipoint method described for instance in [5]. It compensates a sensor error impact by increasing input information through data collection in many different operating points. Additionally, many GPA techniques of today detect and identify sensor faults [see, for instance, 4,5,6], thus extending traditional engine component diagnosis over a gas path measurement system.

with the fact that the characteristics of sensor normal errors are also known with an uncertainty. Usually, a total uncertainty range only can be involved into diagnosis [for example, 11,12] while the proportion between random and systematic error components and their drifts remain unknown. Thus, the issue of the input information tracking and validation remains relevant. Direct off-line analysis of raw measurements [see, for example, 3] can contribute in solving this challenging problem. The analysis yields the knowledge of sensor error performance. This allows excluding sensor faults, reducing sensor errors and better accommodating them in diagnostic algorithms. In the previous investigations [see 1, 2], we also conducted a metrological analysis of gas turbine field data. The objective was to ensure high quality of input data for gas turbine diagnostic algorithms by identifying measurement errors and extracting them from the data. The hot section temperatures were analysed among the other variables of a standard gas turbine measurement system. The temperatures were presented by their mean values computed by averaging particular probes' data. Proceeding with the previous off-line analysis on field data, the present paper looks at the behaviour of individual thermocouple probes. The objective is to obtain new information about probe error performance by analysing great bulk of the data. In the paper, the term "probe error" implies a total measurement error without dividing it into a sensor proper error and a recording error.

Although various diagnostic algorithms take In the present analysis, data of each into consideration an uncertainty in input particular probe are studied against the information, they only partially mitigate the background of other probes data. Deviations of impact of errors and faults but can not completely measured probe values from their baseline eliminate it. One of the difficulties is connected (reference) values are employed as well. Tracking 137

138 the deviations has been found to be a good procedure to detect and localize sensor problems.

enough. That is why, such polynomials are employed in the present paper.

The next section describes the principles of the thermocouple probe data analysis.

As noted in [1,2], the deviations dY * not only can be good engine deterioration indicators but also are very sensitive to sensor malfunctions. Being great, such malfunctions can mask the effects of engine gradual deterioration and sudden fault. Hence, it is of great importance to exclude or reduce the sensor malfunctions in order to make the deviations to meet better the diagnostic needs.

2. Principles of gas temperature analysis

The present investigation is partly based on the principles formed in our previous works. In these papers, as mentioned before, we explored carefully acquired data of averaged hot section temperatures as well as other gas path variables. The exploration of gas turbine field data was executed with the aid of advanced graphical tools. They included tracking the deviations of measured variables. A deviation dY * of a monitored gas path variable Y * is computed according to the expression ®

dY = *

Y * - Y0 (U ) ®

,

(1)

Figure 1 exemplifies the EGT deviations of a gas turbine for natural gas pumping stations. The deviations are plotted here against an operation time t (in this figure and all figures below a variable t is given in hours). As can be seen, the presented data cover approximately 4.5 thousand hours. The deviations dY * computed on real measurements with noise are marked by a grey colour while a black line denotes ideal deviations dY without noise. A washing of a gas turbine axial compressor at the time point t = 7970 (here and below an operation time is given in hours) as well as fouling periods before and after the washing are well-distinguishable in the figure.

Y0 (U ) ®

where a baseline function Y0 (U ) presents a ®

healthy engine performance. A vector U of function’s arguments unites the variables setting an engine operating point (atmospheric conditions and engine control variables). In order to determine the baseline function, a special data set called a reference set is created. To verify the function as well as deviation quality, other set, which is called a validation set, is formed. We usually include all available recorded data in it. It is a main problem in computing the deviations to get an adequate baseline function. We demonstrated in previous works [1,9] that the second order full polynomials are adequate 138

Fig. 1. Deviations' characteristics (The deviations are calculated for the EGT)

139 A difference e S = dY * - dY can be considered as an error. If we designate the maximum deviation dY as d 0 , the signal-to-noise ratio d 0 = d 0 s (e S ) ,

(2)

where s (e S ) is a standard deviation of the errors, will be an index of diagnostic quality of the deviations dY * . To enhance the quality we should reduce the errors e S . To do it better, it is important to know error structure and sources. According to Fig.1, the total error e S consists of three elemental errors and can be given by the formula: e S = e1 + e 2 + e 3 ,

(3)

where e1 is a normal noise which is observed at every time point and has the amplitude smaller than 0.3%, e2

presents slower fluctuations of the amplitude limited by 1.5%, and

e 3 means single outliers with the amplitude

greater than 1.5%. The errors e1 , e 2 , and e 3 can be induces both sensor malfunctions of the monitored variable Y * and inadequacy of the reference function. It is important for the current investigation to distinguish error sources and recognize the sensor malfunctions against the background of the function inadequacy. It was shown in [1] and follows from analyzing a structure of formula (1) that the same total error e S can also be divided into four components according possible error sources. Three of them are related with the reference function and were studied in [1,2]. The fourth component is induced by errors of a monitored variable. The present paper will consider errors of particular thermocouples.

The availability of parallel measurements of a suite of thermocouple probes installed in the same engine station gives us new possibilities of thermocouple malfunction detection by means of deviation analysis. If we choose the same reference function arguments and form particular reference sets from the same portion of recorded data, the errors related with the function will be approximately equal in deviations of all particular probes. That is why, the differences between deviations of one probe and deviations of the other probes can denote probable errors and faults of this probe. In the synchronous deviation curves, which are constructed in the present paper versus an engine operation time, such differences are well visible. In addition to the probe malfunction detection, such curves allow estimating general diagnostic quality of each probe through signal-to-noise ratio (2). In the paper, direct analysis of thermocouple probe measurements is conducted as well. To this effect, synchronous plots for all particular probes are constructed vs. the operation time. Engine operating conditions change from one time point to another and this explains common temporal changes of the curves. Anomalies in behaviour of a particular probe can confirm a probe's malfunction. Synchronized perturbations in curves of some probes may be the result of a real temperature profile distortion because of a hot section problem. The principles of the gas temperature analysis described above are applied to an industrial free turbine type power plant for generating electricity. This plant is chosen as a test case because a large volume of field data, which include thermocouple measurements, is available. In the next section, common results of the study of power plant gas temperatures are discussed. The section begins with analysis conditions given in subsection 3.1.

139

140

3. Common Results of Gas Temperature Measurement Analysis

3.1. Analysis Conditions

For the chosen power plant, field data of three particular engines, which are called in the paper as engine 1, engine 2, and engine 3, are available. The data of each engine cover about one year of maintenance and include numerous cycles of fouling and washings. For instance, a total period of engine 1 data acquisition embraces 4914 hours of operation and consists of five fouling intervals divided by the washings. The data of each engine were filtered, averaged, and recorded hourly in an individual database. All databases include necessary measurements of engine operating conditions and monitored gas temperatures: the EGT and a power turbine exhaust gas temperature (PTT). The suite of 11 thermocouple probes is used to measure the EGT while the PTT measurement is presented by six probes. The data of all particular thermocouple probes as well as EGT and PTT mean values are incorporated in the databases. With respect to the reference functions for computing particular probes' deviations, all the functions have the same three arguments, which have been determined in [2] as the best: free turbine shaft power, atmospheric temperature, and inlet pressure. A free turbine rotation speed, one of common variables of an engine operating condition, is not the argument now because the speed is maintained constant for the analyzed power plant.

composed from the first 200 time points after the first washing. The coefficients were calculated by the least square method because of a considerable excess of input information (200>>10) and absence of gross errors in the sets.

3.2. Analysis of the Deviations For the engines under analysis, the reference functions and the deviations have been computed for all EGT and PTT particular probes as well as for EGT and PTT mean temperatures. The deviations of engines 1 and 3 showed trends due to fouling and washings. Since such trends allow estimating the signal-to-noise ratio, they will be useful to assess accuracy of each probe. However, engine 2 deviations demonstrated no notable systematic changes. Probable explanation is that, instead of off-line washings of engines 1 and 3, more frequent on-line washings were applied to unit 2, which resulted in an approximately constant fouling severity. It can also be noted after the comparing engines 1 and 3 that the engine 1 deviations demonstrate more cases of abnormal behaviour, which are interesting for the current analysis. For these reasons, the engine 1 has been chosen to illustrate gas temperature deviation behaviour.

Figure 2 shows all EGT deviations (11 deviations dTti corresponding to particular probes and mean temperature deviation dTtmed) as function of an operation time t. It is known that the washings took place at the time points t = 803, 1916, 3098, and 4317. As can be seen, deviation plots reflect in a variable manner the influence of the fouling and washings. The deviation dTtmed does it better than deviations of particular probes dTti, i=1-11. Among deviations dTti, quantities Each function is a second order full dTt5 and dTt6 , for example, have almost the same polynomial with three arguments and has 10 diagnostic quality as dTtmed, while quantities dTt1 unknown coefficients. The reference sets for and dTt2 are of little quality. Such differences can determining the functions' coefficients have been be partly explained by variations in probe accuracy and reliability. For example, elevated 140

141 random errors of the deviations dTt1 and dTt2 over the whole analyzed period can be induced by greater noise of the first and second EGT probes. The dTt1 fluctuations in the time interval 1900 2600 are probably results of frequent incipient faults of the first probe. Large dTt7 spikes near the time point t = 4900 can certainly be considered as consequences of great single faults of the seventh probe. However, deviation shifts around the point t = 3351 present the most interest for the current analysis. The shifts look like a washing result but they have opposite directions. This case will be considered in section 4.3. Let us now consider the PTT deviations plotted in Fig.3. Comparing this figure with Fig.2, one can see that the behaviours of new and previous deviations are different. The PTT deviations of particular probes seem to be very similar. All of them properly reflect the fouling and washings as well as have shifts at the time point t = 3351. Only small anomalies of each particular deviation can be detected. That is why the deviations of mean temperature dTptmed look like deviations of each particular probe. The conclusion can be drawn from this analysis that the thermocouple probes installed behind the power turbine (PT) have more stable performances than the probes behind the high pressure turbine (HPT). This may be explained by a higher HPT temperature level.

141

142

Fig. 2. EGT deviations (Engine 1; 11 thermocouple probe deviations dTti and a deviation dTtmed of mean EGT variable)

142

143

Fig. 3. PTT deviations (Engine 1; 6 thermocouple probe deviations dTpti and a deviation dTptmed of mean PTT variable)

143

144 3.3. Direct Temperature Analysis It is also useful to compare the deviations of mean EGT and PTT quantities. As can be seen in Fig.2 and Fig.3, behaviours of the deviations dTtmed and dTptmed are different. Although these figures are not sufficient to conclude what deviation is better in a diagnostic sense (for example, on the basis of the signal-to-noise ratio (2)), this issue has been investigated in [2]. In spite of more reliable PTT probes, the conclusion was drawn that general quality of the EGT deviations is slightly higher. Detailed deviation analysis performed for all three engines has also demonstrated that, in addition to the mentioned case at the point 3351, there can be other irregularities in deviations of particular probes that can not be explained by probe faults. The shifts induced by the washings give an example of such irregularities. They should be equal but can indeed differ by 30%. We may see this effect by comparing the dTt5 and dTt9 shifts induced by the second washing on engine 1 (Fig.2, t = 1916) or the dTpt1 and dTpt6 displacements due to the first washing (Fig.3, t = 803). Other irregularity case can be seen in Fig.2 at the point 1380. Some deviations (for example, dTt11) are positively displaced at this point while some others have negative shifts or no changes (see the deviation dTt4).

If we plot temperature curves for all probes of a suite in the same coordinates (for example, all temperatures vs. the operation time), an anomaly of a particular curve will indicate a problem with the corresponding probe. Consequently, observing this curve against the background of the other curves, we are capable to identify a probe fault when the perturbation exceeds normal errors. Such analysis of parallel curves has been performed for all available data. Figures 4 and 5, which present the first part of the engine 1 gas temperature recordings, exemplify the data analyzed and the graphs used. Here and below, temperatures are given in Celsius degrees. The performed study allowed revealing various cases of anomalies in probe data: gross and hidden probe faults as well other irregularities. Some cases of the most interest will be considered later in section 4.

Displays of the noted irregularities are very similar to the impact of a reference function inadequacy. As shown in [1], such inadequacy provokes deviation perturbations. With the examples given above, we can state that the function inadequacy also results in differences between the deviations of parallel probes that measure the same temperature. That is why the deviation analysis can only help with problem detection in particular thermocouple probes. To identify the problems, we analyze below direct temperature measurements. 144

145

Fig. 4. Exaust gas temperature plots (Engine 1; temperatures Tti of 11 thermocouple probes and a mean temperature Ttmed; data collected during the first 270 hours of operation)

145

146

Fig. 5. Power turbine temperature plots (Engine 1; temperatures Tpti of 6 thermocouple probes and a mean temperature Tptmed; data collected during the first 270 hours of operation) In addition to the revealed anomaly cases, common characteristics of thermocouple normal behaviour have been determined. Knowledge of such characteristics will help us to better recognize sensor data irregularities against the background of normal sensor noise and regular temperature change. The graphs given in Fig. 4 and Fig. 5 help to introduce the thermocouple characteristics. Comparing the figures, it can be seen that EGT and PTT measurements change very similarly. The explanation of such common changes is obvious – the influence of variable engine operating conditions. As for particular probes of the same suite (EGT suite or PTT suite), their individual curves are practically synchronous. Consequently, it can be stated that a normal thermocouple noise level e T is not too high and there are no sensor faults in the presented measurements. We can also see that a spread D T between particular probe temperatures

recorded at the same time point is considerable (up to 85°C in Fig. 4). Maximal values e T max and DT max of the described above noise and spread characteristics have been estimated for temperatures EGT and PTT of all three engines. Additionally, temperature levels T were computed for three engines by the averaging their mean temperatures Ttmed and Tptmed in total analyzed time intervals Dt . Table 1 includes the obtained characteristics. As can be seen, there are no engine to engine differences in e T max with the exception of the engine 1 EGT, which has a two times greater noise compared with the other engines. Such difference can not be explained by a slightly higher power level of engine 1 and we can state that an EGT probe suite of this engine is less accurate.

146

147 Table 1: Averaged characteristics of thermocouple probes Engine

Dt

T

e T max

D T max

EGT

800

± 4.0

100

PTT

490

± 1.5

20

1024526

EGT

720

± 2.0

100

PTT

475

± 1.5

17

1-4621

EGT

700

± 2.0

70

PTT

465

± 1.5

18

Gas

higher. It arrives at ±5% for the EGT and ±2% for the PTT. These values were calculated on the data from Table 1 with a preliminary temperature conversion to Kelvin degrees.

temperature 1

2

3

74-4914

Note: all characteristics are in Celsius degrees.

As to DT max , we shall pay close attention to this parameter and, in general, to an issue of temperature distribution behind the turbines. In the table, the parameter DT max changes inside the intervals of 70-100°C for the EGT and 1720°C for the PTT. So, this parameter of maximal temperature spread is more or less stable. It has also been revealed that a current spread DT varies inside the range (70%-100%) DT max . Additionally, parameters DT of the EGT and PTT are in an approximate proportion to temperatures Ttmed and Tptmed correspondingly. Moreover, in all analyzed graphs like in Fig. 4 and Fig. 5, an order of particular probes inside the spread DT was found to be almost constant during the operation time. Thus, the above description of a temperature measurement spread for different probes allows to state that the spread itself is relatively stable during the time, as well as a measurement distribution inside the spread. What explanation for this significant and stable data dispersion can be done? It could be a result of probe’s different systematic errors. However, many sources [for example, 11,12] report a total thermocouple error being less than ±1% while the spread DT is considerably

On the other hand, it is known [3] that a uniform temperature distribution behind a turbine is usually disturbed by burner faults such as clogged or eroded fuel nozzles. Taking into account the above information, a main rational explanation for the observed thermocouple probe measurement spread is a nonuniform circular profile of real temperatures behind turbines, especially behind the HPT. To these explanations, it is important to add the conclusion that this irregular temperature profile is generally conserved during the operation time according to the described above analysis. The profile stability allows developing effective algorithms of EGT and PTT profile monitoring. Proceeding with the analysis of particular thermocouple probes’ data, in the next section we consider in detail some specific cases of irregularity in these data.

4. Cases of Thermocouple Data Abnormal Behaviour

The term "abnormal behaviour" means here an anomaly in measurements of a particular probe when they deviate from common data behaviour of the other probes. Three anomaly types will be analysed below in subsections 4.1, 4.2, and 4.3. The first type is related with single measurement outliers that exceed a normal noise. Different cases of such outliers are analyzed in the next section.

147

148 4.1. Single Outliers Although the database data were filtered and averaged before recording, some cases of single thermocouple probe faults have been found. Graphs (a) and (b) in Fig. 6 illustrate them. Observing two 25% spikes in graph (a) and a 50% spike in graph (b), we can conclude with no doubt that they are results of faults of the corresponding EGT probes: the seventh probe of engine 1 and the first probe of engine 3. We can also see that such large outliers are easily detectable and the used filtering algorithm should be modified to exclude them. Opposite spike directions in the graphs probably indicate different thermocouple fault origins. A greater number of small outliers have been revealed as well. Graph (c) in Fig. 6, where EGT measurements for engine 1 are shown, helps to demonstrate these hidden errors. As can be seen here, two abnormal shifts in probe 10 data are distinguishable against common regular behaviour of the other probes. These small outliers of 10 degrees (1.5%) hardly exceed a normal noise level. Consequently, it will be more difficult to automatically detect and exclude them.

Graph (d) of Fig. 6 present a new case of small outliers that was found out in EGT measurements of engine 3. It is visible in the graph that probes 7 and 8 are synchronously displaced by about 10 degrees during two time intervals t = 962.5-966.5 and t = 971.5-972.5. Additionally, the same measurement increase is observable in the probe 1 curve at time t = 971.5-972.5. So, unlike the previous case of a single faulty probe, the considered case presents correlated shifts in data of some probes and therefore is more complicated. Two explanations can be proposed for this case. The first of them is related with any measurement system common problem that affects some probes and alters their data. So, the outliers can be classified as measurement errors. The second supposes that the measurements are correct but a real EGT profile has been changed in the noted time points. It can be possible because there is no information that EGT and PTT probe profiles should be absolutely stable during operation time. The available data are not sufficient to give a unique explanation; more recorded data should be attracted.

148

149

a)

b)

d)

c)

Fig. 6. EGT probes' errors ( a) single gross errors, engine 1 ; b) single gross errors, engine 3; c) single small errors, engine 1; d) correlated small anomalies, engine 3) 149

150 The next case to analyze is related with the influence of a power plant operating point on EGT and PTT profiles. 4.2. Anomalies induced by operating condition changes Any considerable change of engine operating conditions (power set parameter above all) causes the corresponding shift of hot section temperatures. Such significant temperature changes, in their turn, can potentially give new information on the behaviour of particular probes in different parts of a total measurement range. The available EGT and PTT data have been observed to find out interesting cases of operating condition influence. Two revealed cases are presented by graphs (a) and (b) in Fig.8. In the left part of graph (a), a mean EGT is maintained at the approximately constant level of 730°C, then the temperature level is rapidly reduced up to 585°C, and finally it is recovered to 755°C in the right part. A mean PTT in graph (b) behaves in a similar manner.

150

151

a)

b) Fig. 7. Influence of engine operating point ( a) EGT, engine 1; b) PTT, engine 2)

151

152 These common and large temperature variations are accompanied by small but visible changes of the measurement distribution inside of a total spread DT . For example, it can be seen in graph (a) illustrating EGT probe behaviour that in the left and right parts of the graph the curve of probe 1 is situated higher than the curve of probe 5. However, in the central part, where temperatures are reduced, the curves' positions are apposite. As a result, relative curve positions have been changed by 30°C or 4.5%. Other example can be seen in graph (b), where PTT probe curves are presented. Before the point t = 339.5, where the temperature level drops, the third probe occupies the highest position among all probes. It goes to the lowest position then and finally almost comes back to its highest position after the point t = 340.5, when a temperature level is partly recovered. In this example, the curve position of probe 3 has been changed by 15°C (3.3%) relatively a mean temperature T_PT. The described distortions in the distribution of thermocouple probe data can not be classified as random thermocouple errors because the anomalies are obviously related with operating condition changes. Other possible interpretation implies a systematic probe error that varies due to temperature magnitude variations. However, this error as well as a total error should be within the limit ±1% for thermocouples in good condition. So, a variable systematic error may only be responsible for a part of the 4% measurement distortion that is why another explanation should be added. As a result of the performed analysis, the next explanation is accepted as principle: the profile of real temperatures slightly varies with the change of operating conditions. Now we revert to the mentioned above case of engine 1 deviation shifts at the time point t = 3351. To make clear this case, direct temperature measurements will be studied in the next section on the basis of the same temperature graphs as analysed in subsections 4.1 and 4.2.

4.3. The Case of Engine 1 Measurement Shifts at the Point t = 3351 Figure 8 helps to illustrate EGT measurement behaviour for engine 1 operation around the point t = 3351. To distinguish better temperature curves of different probes, only four more representative probes are presented. We can see that a temperature level drastically changes in the central part of the figure and relative positions of probe curves are altered, especially after the noted point. For example, probe 4 occupies the highest position in the left part of the figure but the lowest position in the right part. At first sight, this looks like the temperature profile distortions induced by operating condition changes that is described in the previous subsection. However, the analysis of the data recorded after the point t = 3351 has shown that the temperature profile altered once at this point is not recovered later. Consequently, the studied case is not similar to the previous ones. To better understand the case, let us put together all known information about it. This information given earlier in the present paper and obtained in previous studies can be presented by three following statements. a) At the time point t = 3351, significant shifts take place in the deviations dTtmed and dTptmed of mean temperatures (see figures 2 and 3) as well as in the deviations of monitored pressure variables [2].

152

153

Fig. 8. Measurement shifts after the point t = 3351 (4 EGT probes of engine 1)

b) At this point, shifts of opposite directions are also observable in most of particular deviations dTti of EGT probes (see Fig.2). PTT deviations dTti are synchronously shifted at the same point (Fig.3). c) A measurement distribution between EGT probes is perturbed at the same point and a new temperature profile is then conserved constant. Taking into account all this information, we think that there is no unique explanation for the studied case and the following interpretation, which includes some probable causes, is proposed. It seems to us that the engine has undergone an unplanned service work including some actions. A part of them, for example, unplanned compressor washing, could return gas path temperatures and pressures to their healthy engine values. The others, for instance, clogged fuel nozzles washing or thermocouples recalibration, could change the EGT measurement profile. This explanation of the analyzed case is supported by the fact that the engine was out of operation 42 calendar days before the mentioned operating time point. The results obtained by thermocouple probe data analysis and the perspectives of their applications are discussed in the following section. 153

154

5. Discussions A primary visual analysis of gas temperature measurements has been conducted in two previous sections. It needs some clarification and generalization and three issues are additionally discussed below: a) quality of the measurements, b) perspectives of gas temperature profile monitoring, and c) effectiveness of the present visual temperature analysis. Gas temperature measurement quality depends on thermocouple accuracy and reliability and can correspondingly be assessed by a noise level e T max and a number of error cases revealed. Coming back to Table 1, we can see that EGT and PTT probes have approximately equal accuracy levels for all engines excepting engine 1, which has a two times worse EGT accuracy. It is also worth to repeat the statement made in subsection 3.3 that the measurements of all considered engines are equally exact with the same exception. As to the probe reliability, the probe fault cases have been revealed in EGT data only and the most of them correspond to engine 1. Summing up the discussion on common measurement quality, we can state that the EGT measurements are a little worse than PTT ones and engine 1 temperature measurements are the worst among three engines under analysis. The deviation curves of Fig.2 help to indicate particular probes that are responsible for low quality of engine 1 EGT measurements. Elevated fluctuations in the deviations dTt1 and dTt2 point at elevated errors of probes 1 and 2. Moreover, it can be seen that the deviations of probes 1, 2, 9, and 11 differ from the other deviations in the reflection of compressor fouling and washings. Specific behaviour of the deviations of the enlisted probes can also be explained by elevated measurement errors of these probes: erroneous data included in reference sets could result in inadequacy of the corresponding reference functions and abnormal behaviour of the deviations. Perspectives of monitoring of EGT and PTT profiles are the next issue to be discussed. It can be seen in Fig.4 and Fig.5 and it is typical for all analysed data that, in general, measurements of particular thermocouple probes change synchronously. This means that the configuration of temperature profiles behind the HPT and PT is altered a little by variations of engine operating conditions. It is a good promise for performing effective temperature profile monitoring. The hypothesis that the EGT profile has been changed at the point t = 3351 due to the service work carried out is an additional confirmation of profile monitoring utility: since the profile varies because of the supposed fuel nozzle washing, it is also sensible to nozzle clogging. One more proof of EGT profile sensibility to hot section faults is that the EGT profile nonuniformity is, in average, five times higher than the PTT nonuniformity (see to the parameter DT in Table 1). For these reasons, the monitoring of the EGT profile seems to be more effective than the PTT profile monitoring. In any case, it will be a challenge to create effective profile monitoring algorithms. Such algorithms should be sophisticated enough in order to reliably distinguish four situations: normal probe noise, probe faults, normal temperature profile variations (random or systematic), and profile changes due to hot section faults (gradual or abrupt). If the faults have been detected, their correct identification is desirable as well. 154

155 However, an effective fault detection and identification will not come easily. The temperature profile monitoring may become complicated because, as determined in subsection 4.2, variable operating conditions can change a little the profile. Moreover, as shown in subsection 4.1, slight random profile variations are also possible. As a result, we could not always give a unique explanation for the measurement anomalies analyzed in the present paper and we sometimes supposed both hot section faults and sensor errors. Having mentioned the uncertainty in our explanations, it is the moment to discuss the last issue effectiveness of the present gas temperature analysis on the basis of deviation and temperature plots. The used graphical tools were useful for determining common characteristics of thermocouple probe behaviour such as a level of normal measurement noise. It is worth to mention that the used graphs have allowed a direct noise estimating for each engine on its real data. The graphical tools also helped to detect many interesting cases of measurement anomalies and to get convincing explanations for a part of them. These tools were useful in the interpretation of the other cases although some uncertainty remained. To better explain these cases, additional tools are required, including statistical treatment of temperature measurements. Such tools should be able to determine individual signatures for each of the enlisted above four situations to be recognized. If that is the case and such signatures are available, the development of effective algorithms for temperature profile monitoring will be only the matter of time. Proceeding with the present analysis, we plan to apply new tools to analyze thermocouple probe measurements in order to determine the basis of effective temperature profile monitoring.

Conclusions In the present paper, the analysis has been performed of gas temperature measurements by thermocouple probe suites installed behind the HPT and PT. Field data of a power plant for generating electricity were attracted. In order to find out and analyse cases of abnormal measurement behaviour, both temperature deviations and temperature themselves were plotted and tracked for all probes mounted in a power plant hot section. In order to thoroughly study thermocouple measurements and draw sound conclusions on measurement behaviour, the temperature analysis was performed on the data recorded on three particular engines during one year of their operation. This off-line analysis of historic data yielded important diagnostic information about possible thermocouple faults and hot part malfunctions. The analysis allowed estimating some characteristics of normal thermocouple probe behaviour and revealed a number of cases of probe data abnormalities. The cases that are the most interesting from a diagnostic point of view were explored in detail and explanations were given for them. For example, some sensor malfunctions were discovered. It was also revealed that gas temperature profiles have, in general, a stable form although it can be slightly altered by variations in engine operating conditions. A greater importance of EGT profile monitoring was shown as well. In general, we think that the paper can contribute in the development of effective algorithms for temperature profile monitoring. In addition to the analysis performed and conclusions drawn, the detailed graphs of the paper may give new useful information for experienced gas turbine analysts and performance engineers. The visual thermocouple data analysis conducted in the paper has demonstrated its general effectiveness; we have rapidly tracked a lot of information and studied many interesting cases. However, 155

156 we could not find a unique correct explanation for some of them. The point is that the displays of hot section faults and hidden sensor malfunctions can be vary similar. The present paper can only be considered as the first attempt to analyze thermocouple data. The visual qualitative analysis performed should be accompanied by quantitative estimations. If there is no simple way to achieve higher measurement accuracy, we need to better distinguish between hot section and sensor problems. That is why we are thinking about other advanced graphical tools and statistical methods to be applied to the gas turbine thermocouple data.

Acknowledgments The work has been carried out with the support of the National Polytechnic Institute of Mexico (research project 20091273).

156

157

References 1. Loboda I. Deviation problem in gas turbine health monitoring / I. Loboda, S. Yepifanov, Y. Feldshteyn . – Proc. IASTED International Conference on Power and Energy Systems, USA, 2004. – 6p. 2. Loboda I. Diagnostic analysis of maintenance data of a gas turbine for driving an electric generator / I. Loboda, S. Yepifanov, Y. Feldshteyn . – Proc. ASME Turbo Expo 2009: International Technical Congress “Power for Land Sea & Air”, Orlando, Florida, USA, 2009, – 12p. 3. Tsalavoutas A. Combined advanced data analysis method for the constitution of an integrated gas turbine condition monitoring and diagnostic system / A. Tsalavoutas, K. Mathioudakis, N. Aretakis, A. Stamatis. – Proc. ASME Turbo Expo 2000, Munich, Germany, 2000. – 8p. 4. Romesis C. Setting up of a probabilistic neural network for sensor fault detection including operation with component fault / C. Romesis, K. Mathioudakis // Journal of Engineering for Gas Turbines and Power. – 2003. – Vol. 125, Issue 3. – pp. 634-641. 5. Kamboukos Ph. Multipoint non-linear method for enhanced component and sensor malfunction diagnosis / Ph. Kamboukos, K. Mathioudakis. – Proc. ASME Turbo Expo 2006, Barcelona, Spain, 2006. – 9p. 6. Borguet S. A sensor-fault-tolerant diagnosis tool based on a quadratic programming approach / S. Borguet, O. Leonard. – Proc. ASME Turbo Expo 2007, Montreal, Canada, 2007. – 10p. 7. Randal T. R. Integrated in-flight fault detection and accommodation: a model-based study / T. R. Randal, K. F. Goebel, N. H. Eklund, B. J. Brunell. – Proc. ASME Turbo Expo 2005, Reno-Tahoe, Nevada, USA, 2007. – 9p. 8. Mathioudakis K. Assessment of the effectiveness of gas path diagnostic schemes / K. Mathioudakis, Ph. Kamboukos // Journal of Engineering for Gas Turbines and Power. – 2006. – Vol. 128, Issue 1. – pp. 57-63. 9. J. C. Hernandez Gonzalez. Development of normal state model for gas turbine performance monitoring / J. C. Hernandez Gonzalez, I. Loboda, C. De La Cruz Alejo. – Memorias del 3er Congreso Internacional de Ingenieria Electromecanica y de Sistemas, Mexico, 2002. – pp. 243 – 246. 10. Benvenuti E. Innovative gas turbine performance diagnostics and hot parts life assessment techniques / E. Benvenuti. – Proceedings of the Thirtieth Turbomachinery Symposium, Texas A&M University, Houston, Texas, USA, 2001. – pp.23-31. 11. Fairbairn G.W. Performance testing and monitoring of compressor units / G.W. Fairbairn, J.R. Nisbet, I.C. Robertson. – Proc. 52nd Autumn Meeting of the Institution of Gas Engineers, London, England, 1986. – 32p. 12. Bryce L. Equipment health monitoring failure mode characteristics case study / L. Bryce, Bennett J. – 17th National Petroleum Show, Calgary, Canada, 2000. – 25p.

157