Analisis de Causa Raiz

ANÁLISIS CAUSA RAIZ DE LA FALLA Análisis causa raíz de la falla 1. 2. 3. 3.1. 3.2 3.3. 3.4. 3.5. 3.6. 3.7. 4. 5.

Views 82 Downloads 4 File size 510KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ANÁLISIS CAUSA RAIZ DE LA FALLA

Análisis causa raíz de la falla

1. 2.

3. 3.1.

3.2

3.3.

3.4.

3.5. 3.6. 3.7. 4. 5. 5.

Introducción ......................................................................................................... 2 Objetivos ............................................................................................................. 2 2.1. Objetivos generales.................................................................................. 2 2.2. Objetivos específicos ............................................................................... 2 Contenido ............................................................................................................ 3 Introducción al análisis causa raíz de la falla ....................................................... 3 3.1.1. Propósito del análisis causa raíz de la falla .............................................. 3 3.1.2. Uso efectivo del análisis ........................................................................... 3 3.1.3. Requerimientos de personal ..................................................................... 4 3.1.4. Cuándo usar el método ............................................................................ 4 Técnicas generales de análisis ............................................................................ 5 3.2.1. Análisis de efectos y modo de falla (FMEA) ............................................. 5 3.2.2. Análisis del árbol de fallas ........................................................................ 6 3.2.3. Análisis de la causa y efecto .................................................................... 8 3.2.4. Análisis de la secuencia de eventos ......................................................... 9 Metodología del análisis causa raíz de la falla ................................................... 13 3.3.1. Reporte de un incidente o problema ....................................................... 13 3.3.2. Clasificación de incidente ....................................................................... 16 3.3.3. Acopio de la data.................................................................................... 20 3.3.4. Observaciones y mediciones .................................................................. 37 Determinación de la causa de la raíz ................................................................. 41 3.4.1. Mala aplicación ...................................................................................... 43 3.4.2. Prácticas y procedimientos de operación pobres.................................... 44 3.4.3. Supervisión ............................................................................................ 47 3.4.4. Comunicaciones ..................................................................................... 49 3.4.5. Ingeniería humana ................................................................................. 50 3.4.6. Sistema de administración ..................................................................... 51 3.4.7. Control de calidad .................................................................................. 52 Evaluación de acciones de correctivas potenciales ........................................... 52 Reportes y recomendaciones ............................................................................ 53 Verificación de acciones correctivas .................................................................. 58 Mapa conceptual ............................................................................................... 59 Referencia bibliográfica ..................................................................................... 60 Glosario de términos.......................................................................................... 61

1

Análisis causa raíz de la falla

ANÁLISIS CAUSA RAÍZ DE LA FALLA

1.

INTRODUCCIÓN La ingeniería de confiabilidad y el mantenimiento predictivo tienen dos objetivos principales: prevenir las fallas catastróficas en los sistemas críticos de una planta de producción y evitar las desviaciones del rendimiento de su nivel aceptable que resulten en prejuicios a las personas, impacto medioambiental, pérdida de la capacidad o baja calidad de los productos. Desafortunadamente, estos eventos ocurrirán sin importar cuan efectivo sea el programa de confiabilidad. De allí que, un programa viable también debe incluir un proceso de total entendimiento y corrección de las causas raíces de los eventos que generan un impacto en el rendimiento de la planta. Este capítulo introduce el concepto del Análisis Causa Raíz de la Falla para evaluar su aplicación en la gestión del mantenimiento de una planta industrial.

2.

OBJETIVOS 2.1. OBJETIVO GENERAL Evaluar la metodología del Análisis Causa Raíz de la Falla (RCFA) para implementarlo en la gestión del mantenimiento. 2.2. OBJETIVOS ESPECÍFICOS • •

2

Identificar las ventajas de implementar el RCFA en una empresa. Justificar la implementación del Análisis Causa Raíz para la solución de fallas crónicas.

Análisis causa raíz de la falla

3. CONTENIDO

3.1.

Introducción al análisis causa raíz dela falla

Por Análisis Causa-Raíz de la Falla (RCFA) se entiende cualquier método o técnica analítica utilizada para identificar las causas básicas y las condiciones (factores) que contribuyen a la ocurrencia de un evento indeseado (accidentes, incidentes, problemas de "performance", etc.) o tendencias adversas, y las contramedidas asociadas. Se evalúa el funcionamiento de sistemas y procesos y no meramente el desempeño individual. Es una tarea interdisciplinaria que involucra, además de profesionales entrenados en las herramientas analíticas, al personal más cercano al proceso o sistema bajo estudio. 3.1.1. Propósito del análisis causa raíz de la falla El propósito del RCFA es resolver los problemas que afectan el rendimiento de la planta. No debe entenderse como un intento para culpar por los incidentes. Esto debe ser claramente comprendido por el equipo de investigadores y por quienes estén involucrados en el proceso. Comprender que la investigación no es un intento para buscar culpables es importante por dos razones: • Primero, el equipo de investigaciones debe comprender que el real beneficio de este método analítico es mejorar la planta. • Segundo, los involucrados en el proceso generalmente adoptan una actitud de auto-conservación y asumen que la investigación es un intento para encontrar y castigar a la persona o personas responsables de los incidentes. De allí que es importante para los investigadores aliviar ese temor y reemplazarlo por un esfuerzo positivo de equipo requerido para resolver problemas.

3.1.2. Uso efectivo del análisis El uso efectivo del RCFA requiere disciplina y consistencia. Cada investigación debe ser minuciosa y debe seguirse cada paso definido en este manual. Tal vez la parte más difícil del análisis es separar la realidad de la ficción. La naturaleza humana dictamina que cada persona involucrada en un evento o incidente que requiere un RCFA está condicionada por su experiencia. La tendencia natural de los involucrados es filtrar la base de datos de entrada en esta condición. Esto incluye al investigador. Sin embargo a menudo tales ideas y percepciones preconcebidas destruyen la efectividad del RCFA. Es importante para el investigador y el equipo de investigaciones hacer a un lado sus percepciones, basar el análisis en puros hechos y no asumir nada.

3

Análisis causa raíz de la falla

Cualquier suposición que entre al proceso de análisis a través de entrevistas u otro proceso de acopio de datos debe ser claramente respaldada. Suposiciones que no pueden ser confirmadas o probadas deben ser desechadas.

3.1.3. Requerimientos de personal El personal requerido para evaluar apropiadamente un evento usando RCFA puede ser completamente materialista. Por ello, este análisis debería estar limitado a los casos que verdaderamente justifican el gasto. Muchos de los costos de ejecutar una investigación y actuar según sus recomendaciones están ocultos pero no obstante son reales. Aún un simple análisis requiere asignar un investigador al proyecto hasta que sea resuelto. Adicionalmente, el análisis requiere involucrar a todo el personal de la planta directa o indirectamente relacionado con el incidente. El investigador debe conducir numerosas entrevistas. En adición, muchos documentos deben ser acopiados y revisados para extraer información relevante. En investigaciones más complejas se requiere de un equipo de investigadores. Así como el alcance y la complejidad se incrementan también lo hace el costo. Como resultado a un elevado requerimiento de personal, el uso general de esta técnica debería evitarse. Y debería limitarse a aquellos incidentes o eventos que tienen un considerable impacto negativo en el rendimiento de la planta, seguridad de las personas, o acatamiento de las normas. 3.1.4. Cuando usar el método El uso del RCFA debería ser cuidadosamente analizado antes de lanzarse a una completa investigación a causa de los altos costos asociados con la ejecución así como en el análisis profundo. El método considera una investigación inicial para clasificar y definir el problema. Una vez que esto terminó, debería considerarse un análisis completo solo si el evento puede ser completamente clasificado y definido, y parece que puede encontrarse una solución al costo – efectivo. Generalmente el análisis no es efectuado en problemas que son clasificados como aleatorios, o eventos no repetitivos. Los problemas que a menudo justifican el uso del método incluyen equipamiento, maquinaria, o fallas de sistemas; desviaciones del rendimiento operacional; cuestiones de rendimiento económico; seguridad; y asuntos de acatamiento de normas.

4

Análisis causa raíz de la falla

3.2.

Técnicas generales de análisis

Un buen número de técnicas generales es utilizado para resolver problemas. Hay muchas metodologías que son utilizadas comúnmente y tienen coincidencias con estas técnicas pero también existen diferencias. A continuación veremos un breve repaso a los métodos más comunes utilizados para realizar un RCFA. 3.2.1. Análisis de efectos y modo de falla (fmea) Un análisis de efecto y modo de falla (FMEA) es un diseño – procedimiento de evaluación usado para identificar modos de falla potencial y determinar su efecto sobre el rendimiento de un sistema. Este procedimiento formalmente documenta prácticas estándares, genera un registro histórico, y sirve como base para futuras mejoras. El procedimiento RCFA es una secuencia lógica de pasos, comenzando con el análisis de subsistemas de muy bajo nivel o componentes. La figura 1 ilustra un típico árbol lógico que resulta con un FMEA.

Disciplinas de confiabilidad primariamente cualitativas

Disciplinas de confiabilidad primariamente cuantitativas Eliminar efectos de falla

Identificar modos de falla

Predecir efectos de la falla Compensaciones y acciones decisivas

Aislar causas de la falla

Reducir efectos de falla

Determinar acciones correctivas Aceptar efectos de falla Otras técnicas/ disciplinas gerenciales

Fig. 1: Diagrama de flujo de un FMEA

El análisis adopta un punto de vista de la falla e identifica grandes modos potenciales de falla con sus mecanismos de falla. El efecto de cada modo de falla luego es rastreado al siguiente nivel del sistema. A cada modo de falla y su efecto resultante es asignado un rango crítico, basado en la probabilidad de ocurrencia, su severidad y su delectability. Para reducir las fallas con

5

Análisis causa raíz de la falla

alto impacto en el rango crítico, se recomienda realizar cambios en el diseño. Por consiguiente este procedimiento provee un diseño más confiable. Además del correcto uso del proceso FMEA resultan dos mejoras principales: a) Mejora de la confiabilidad anticipándose a los problemas e instituyendo correcciones previas a producir productos y b) Mejora de la validez del método analítico, que resulta de una estricta documentación de cada paso en el proceso de toma de decisiones. Dos limitaciones importantes restringen el uso del FMEA: a) Los árboles lógicos usados para este tipo de análisis son basados en la probabilidad de falla en los niveles del componente. b) Su aplicación es muy cara. Los árboles lógicos se fundamentan en la probabilidad de falla, esto es problema debido a que los datos disponibles sobre probabilidad componentes corresponden a condiciones estándar y las técnicas extrapolación no pueden ser usadas para modificar los datos aplicaciones particulares.

un de de en

3.2.2. Análisis del árbol de fallas El análisis del árbol de fallas es un método para analizar la confiabilidad y la seguridad de un sistema. Esto provee una base objetiva para analizar el diseño de sistemas, justificar cambios en los sistemas, realizar estudios trade_off, analizar modos de fallas comunes y demostrar conformidad con los requerimientos medio ambientales y de seguridad. Esto es diferente a un FMEA que está restringido a identificar elementos y eventos de un sistema que generan un evento indeseable en particular. La figura 2 muestra las etapas involucradas al realizar un análisis del árbol de fallas.

6

Análisis causa raíz de la falla

Definición de eventos cumbres

Establecemiento de bondades

Comprensión del sistema

Construcción del árbol de fallas

Analizar el árbol

Toma de acciones correctivas

Fig. 2: Proceso típico del árbol de fallas

Muchas técnicas de confiabilidad son inductivas y su objetivo primario es asegurar que los equipos lleven a cabo su función prevista. El análisis del árbol de fallas es un detallado análisis deductivo que usualmente requiere considerable información acerca del sistema. Esto asegura que todos los aspectos críticos de un sistema sean identificados y controlados. Este método representa gráficamente la lógica Booleana asociado con un particular sistema de fallas, llamado el evento cumbre, y las fallas básicas o causas, llamadas eventos primarios. Los eventos cumbres pueden ser amplios, abarcando todos los sistemas de fallas o la falla de componentes específicos. El análisis provee una visión interior del comportamiento del sistema Un modelo del árbol de fallas presenta lógica y gráficamente las diferentes combinaciones de los posibles eventos que ocurran en un sistema que generaran un evento cumbre. El término evento denota un cambio dinámico de estado que ocurre en un elemento del sistema, el cual incluye equipo, software, personas, y factores medioambientales. Un evento falla es un estado anormal del sistema. Un evento normal se espera que ocurra.

7

Análisis causa raíz de la falla

La estructura del árbol de fallas se muestra en la figura 3. El evento indeseable aparece como el evento cumbre y está conectado a más eventos de falla básicos por eventos declaratorios y compuertas lógicas.

OR

Motor sobrecalentado

Excesiva corriente del motor

OR

Falla primaria del motor

Falla del relé térmico por no abrirse

OR

Excesiva corriente en el circuito

Falla primaria del cableado ( muy delgado)

Falla primaria del suministro de potencia (oscilante)

Falla primaria del relé (cerrado o sobredimensionado)

Fig. 3: Ejemplo de un árbol lógico del árbol de fallas

3.2.3. Análisis de la causa y el efecto El análisis de Causa y Efecto es una técnica gráfica para analizar fallas. Este también es conocido como el Diagrama de Espina de Pescado (o fishbone), derivado de la forma del espinazo del pescado, utilizado para graficar la relación entre varios factores que contribuyen a un evento específico. Típicamente, el análisis de espina de pescado gráfica las cinco mejores clasificaciones de causas potenciales (es decir: humana, máquina, material, metodología y medio ambiente) pero puede incluir una combinación de categorías. La figura 4 ilustra un simple análisis. Es uno de los métodos de análisis de fallas que más gusta, esta técnica hace uso de una evaluación lógica de acciones o cambios que generan un evento específico, tal como la falla de una máquina. La única diferencia entre esta y otros métodos es el uso de la espina de pescado para describir las relaciones de causa y efecto entre acciones específicas, o cambios, y el evento o resultado final.

8

Análisis causa raíz de la falla

Esta técnica tiene una seria limitación. El esquema de espina de pescado no proporciona una secuencia clara de los eventos que derivan en una falla. En cambio, muestra todas las posibles causas que pueden contribuir a que suceda un determinado evento. Mientras es utilizado, no aísla los factores específicos que causan un evento. Otras técnicas proveen los fundamentos para aislar los cambios específicos, omisiones o acciones que causan la falla, una soltura, un accidente u otro evento que está siendo investigado.

Máquina

Humano No hay entrenamiento

Mala aplicación Edad

Error humano

Mantenimiento pobre

No hay supervisión

EFECTO

No hay procedimientos Temperatura muy baja

Supervisión pobre

Malos materiales Mala aplicación

Muy accidentado

Ninguna exigencia

Error del vendedor

Métodos

Medio Ambiente

Materiales

Fig. 4: Diagrama típico de espina de pescado mostrando sus cinco categorías de causas

3.2.4. Análisis de la secuencia de eventos Algunos programas informáticos (como Visio de Microsoft) pueden utilizarse para generar los diagramas de secuencias de eventos. Como parte del programa RCFA, se debe: seleccionar un apropiado software, desarrollar un formato estándar (vea figura 5), y asegurar que se incluya en el diagrama cada evento que es investigado. Utilizando tal diagrama desde el inicio de la investigación ayudará al investigador a organizar la información acopiada, a identificar la pérdida o el conflicto de la mencionada información, mejora su entendimiento al mostrar las relaciones entre eventos e incidentes y hace brillar las causas potenciales de los incidentes.

9

Análisis causa raíz de la falla

EVENTOS: Los eventos son mostrados como cajas rectangulares, que están conectadas por flechas que direccionan el flujo que provee una adecuada secuencia de eventos. Cada caja debería contener solo un evento, así como la fecha y tiempo en que ocurrió. Use palabras precisas, que exprese la realidad sin CALIFICADORES: Cada evento debe ser clarificado usando bloques ovales de datos que provee la data pertinente para calificar ese evento. Cada bloque oval debería contener solo un calificador que provea clarificación, una única restricción, u otra condición que pueda influenciar al evento. Cada calificador oval debe estar conectado a la caja de eventos apropiada usando la flecha direccional FUNCIONES DE FUERZA: Los factores que podrían haber contribuido con el evento deberían ser mostrados en una caja de datos hexagonal. Cada hexágono debe contener una concisa función de fuerza definida. Las funciones de fuerza deben estar conectadas a un evento específico usando una flecha direccional INCIDENTES: La caja de incidente contiene una breve declaración de la razón de la investigación. La caja de incidente debe estar insertada en el punto apropiado en la secuencia de eventos y conectada a la caja de eventos usando flechas direccionales. SUPOSICIONES: Factores de contribución o condiciones sin confirmar pueden estar incluidas en el diagrama de flujo pero usando anotaciones. Este métoINCIDENTES: La caja de incidente contiene una breve declaración de la razón de la investigación.

Evento

Evento

08/97 13:52

08/97 13:56

Calificador Calificador

Evento 08/97 13:52

Funciones de Fuerza

Evento 08/97 13:52

Evento 08/97 13:52

Incidente Evento 08/97 13:52

Supocisiones, preguntas sin responder u otros datos que esten relacionados con el evento. Evento 08/97 13:52

Fig. 5: Símbolos usados en el diagrama de secuencia de eventos

10

Análisis causa raíz de la falla

El diagrama de secuencia de eventos debería ser un documento dinámico generado inmediatamente después que el problema es reportado y continuamente modificado hasta que el evento sea totalmente resuelto. La fig. 6 es un ejemplo de tal programa.

Operador A de CA notifica Operador A en Preparación 08/03/97 06:55 a.m.

Operador A de CA notifica Operador A en Preparación 08/03/97 06:55 a.m.

Operador A en el área de Preparación confirma inicio de la transferencia

Operador A en el área de Preparación confirma inicio de la transferencia

Operador A en Preparación selecciona el silo # 3 08/03/97 07:25

Operador A en Preparación abre válvula hacia el silo # 3 08/03/97 07:29

Inicio de la transferencia de escamas 08/03/97 07:30

Continúa la transferencia de escamas 08/03/97 07:30 08:00

El manómetro de nivel tiene un historial con problemas. El control de nivel es cuestionable.

Operador A en Preparación inspecciona el indicador de nivel del silo # 3 08/03/97 08:01

Silo # 3 se asumió vacío Problemas en el Fluidificador A 08/03/97 08:10

Operador A de CA resetea el interruptor 08/03/97 08:20

Operador A de CA restaura la transferencia 08/03/97 08:21

La carga presenta alto amperaje

Problemas en el fluidificador A 08/03/97 08:23

Operador A de CA detiene la transferencia 08/03/97 08:30

El equipo A inspecciona el transportador neumático 08/03/97 10:00

Instrumentista A inspecciona el manómetro de nivel en el silo # 3 08/03/97 12:00

Sección A - 935 completamente bloqueada con escamas

Lentes del transmisor cubiertas con escamas

Inundación del silo # 3 con escamas

Sección A - 935 completamente bloqueadas con escamas

Silo # 3 completamente lleno y con escamas compactadas

Fig. 6: Diagrama típico de secuencia de evento

El apropiado uso de esta herramienta gráfica mejorará grandemente la efectividad del equipo que solución de problemas y la precisión de la evaluación. Alcanzando el máximo beneficio de esta técnica, siendo consistente y minucioso cuando se desarrolla el diagrama. La siguiente guía debería considerarse cuando se genera un diagrama de secuencia de eventos: Use un orden lógico, describa los eventos en términos activos más que en pasivos, sea preciso, y defina o califique cada evento o función de fuerza. En el ejemplo de la figura 6, se ilustran los repetidos tropiezos del fluidificador usado para transferir escamas desde el departamento de Acetato Celulosa al área de preparación lo cual desató una investigación. El diagrama muestra cada evento que describe el intento inicial y secundario del fluidificador. El evento final, el silo de inspección, indicó que la causa raíz del problema fue la falla del sistema de monitoreo de nivel. A consecuencia

11

Análisis causa raíz de la falla

de esta falla, el Operador A sobrellenó el silo. Cuando esto sucedió, las escamas compactadas en el silo y almacenadas en el sistema de transporte neumático, taponearon la sección de entrada de la tubería del transportador, lo cual resultó en una extensa merma en la producción mientras se removía el tapón. Orden Lógico Se debe mostrar los eventos en un orden lógico desde el comienzo hasta el final de la secuencia. Inicialmente el diagrama de secuencia de eventos debería incluir todos los eventos pertinentes, incluyendo esos que no pueden ser confirmados. Conforme la investigación progresa, esto debe refinarse y mostrar solo los eventos confirmados y relevantes para el incidente. Descripciones Activas Las cajas de eventos en un diagrama de secuencia de eventos deberían contener las etapas de acciones antes que descripciones pasivas del problema. Por ejemplo, el evento debería leerse: “El Operador A presiona el botón de encendido de la bomba” y no “Se encendió la bomba equivocada”. Como regla general, solo un sujeto y un verbo se deben usar en cada caja de eventos. En vez de decir: “El Operador A presionó el botón de parada de la bomba y verificó la válvula alineada”, se pueden usar dos cajas de eventos. La primera caja debería decir: “El Operador A presionó el botón de parada” y la segunda debería decir: “El Operador A verificó la válvula alineada”. No utilice nombre de personas en el diagrama. En cambio utilice funciones de trabajo o asigne un código de identificación para cada persona involucrada en el evento o incidente. Por ejemplo, tres operadores deberían designarse como Operador A, Operador B y Operador C. Precisión Describa precisa y concisamente cada evento, función de fuerza y calificador. Si no es posible una descripción concisa y se deben realizar suposiciones para clarificar, estas deben ser incluidas como anotaciones. Esto es descrito en la figura 5 e ilustrado en la figura 6. Conforme progresen las investigaciones, cada suposición y contribución no confirmadas del evento deben ser confirmadas o descontadas. Como resultado se tendrá que cada evento, función o calificador serán reducidos a más descripciones concisas. Definición de Eventos y Funciones de Fuerza Los calificadores que proporcionan toda la experiencia confirmada o la data de soporte necesaria para definir con precisión los eventos o funciones de fuerza deberían incluirse en un diagrama de secuencia de eventos. Por ejemplo, cada evento debería incluir calificadores de fecha y tiempo que fijan la estructura de tiempos del evento.

12

Análisis causa raíz de la falla

Cuando los calificadores confirmados no están disponibles, se supone que pueden ser usados para definir factores no confirmados o percibidos que puedan haber contribuido a los eventos o la función. Sin embargo, el mayor esfuerzo debe hacerse durante la investigación para eliminar las suposiciones asociadas con la secuencia del diagrama de eventos y reemplazarlos con factores conocidos.

3.3.

Metodología del análisis de la causa raíz de la falla

El RCFA es una secuencia lógica de pasos que conducen al investigador a través de un proceso de aislamiento de los factores alrededor de un evento o falla. Una vez que el problema ha sido completamente definido, el análisis sistemático determina el mejor curso de acción que resolverán los eventos y aseguraran que estos no se repitan. Debido al costo asociado con el rendimiento de tal análisis, debería tenerse cuidado antes que la investigación sea emprendida. El primer paso en este proceso es obtener una clara definición del potencial del problema o evento. El árbol lógico ilustrado en la figura 7 se debería seguir para la fase inicial de la evaluación. 3.3.1. Reporte de un incidente o problema El investigador raramente está presente cuando ocurre un incidente o problema. De allí que el primer paso es la notificación inicial que un incidente o problema ha tenido lugar. Típicamente, este reporte será verbal, una breve nota escrita o anotación en el libro maestro de producción. En muchos casos, la comunicación no contendrá una completa descripción del problema. Más bien, será una breve descripción de los síntomas percibidos observados por las personas que reportan el problema. 3.3.1.1. Síntomas y características La manera más efectiva de definir un problema o evento es determinar sus reales síntomas y establecer los límites que caracterizan el evento. En esta etapa de la investigación, las tareas pueden ser acompañadas por entrevistas al personal que observó primero el problema.

13

Análisis causa raíz de la falla

Notificación

Notificar al originador del reporte

Llenar el reporte para futuras referencias

Implementar acciones correctivas

Clarificar el problema

No

¿Se requiere un análisis de la causa raíz?

Yes Yes

¿Se aprobaron las recomendaciones?

Recoger la data que clarifique el problema o evento

Recomendaciones sometidas a aprobación

¿Es este un equipo o sistema problemático?

Yes Yes

No

Efectuar la revisión del diseño

¿Es posible una solución al costo efectivo?

Archivar para futuras referencias

Preparar un análisis del costo beneficio

Desarrollar una lista de acciones correctivas potenciales

Yes

¿Se puede solucionar el problema basándose en la revisión del diseño? No

Yes

Evalúe la aplicación Continue la secuencia RCFA

Dinámica de procesos de prueba

No

¿Pueden resolverse los problemas basándose en la evaluación de la aplicación?

No

¿Son los parámetros actuales consistentes con el diseño?

Yes

Fig. 7: Árbol lógico inicial del análisis de la causa raíz

14

No

Siga las sugerencias alternativas de RCFA

Análisis causa raíz de la falla

3.3.1.2. Percepción de las causas de un problema En este punto, cada persona entrevistada tendrá una opinión definida acerca del incidente, y tendrá su descripción del evento y una lógica total por lo acontecido. En muchos casos, estas percepciones son totalmente equivocadas, pero no deben ser descartadas. Aun cuando muchas opiniones expresadas por la gente involucrada con el evento o que lo reportan pueden ser no válidas, no se deben descartar sin investigar. Cada opinión debe ser registrada y usada como parte de la investigación. En muchos casos, una o más de las opiniones tendrán la llave de resolución del evento. Los siguientes son ejemplos en donde la percepción inicial fue correcta. • Un ejemplo de este fenómeno es el del problema reportado en la cámara de bolsas del colector de polvo. El reporte inicial declaró que aire cargado de polvo estuvo siendo emitido de la cámara de bolsas de forma aleatoria pero repetida, básicamente. Las personas que reportaron el problema estaban convencidas que la causa fue sin duda la falla crónica de la válvula pilotada actuada por un solenoide que controla el purgador de la cámara de bolsas. Sin embargo, con una rápida revisión del diseño se determinó que la válvula controlada por solenoide esta normalmente cerrada. Este tipo de válvula solenoide no puede fallar en posición abierta, de allí que no puede ser el origen del evento reportado. Al conversar con el ingeniero de procesos se identificó el diafragma utilizado para sellar el tubo de purga como una fuente potencial de problemas. Esta observación junto a la de una inadecuada planta de aire, cambio a ser la causa raíz del problema. • Otro ejemplo que ilustra opiniones preconcebidas es la falla catastrófica de una cadena transportadora Hefler. En este ejemplo, todas las barras del lado izquierdo de la cadena fueron severamente curvadas antes que el sistema pudiera ser paralizado. Aun cuando ningún objeto extraño tal como un perno fue encontrado, se asumió que esto fue la causa de la falla. De la evidencia, quedó claro que alguna obstrucción causó el daño al transportador, pero la más importante interrogante fue, ¿por qué sucedió esto? Los transportadores Hefler son diseñados con un punto intencional de falla que debería haber previsto daños mayores ocasionados por este evento. El diseño del piñón de accionamiento principal incluye un pin de cizallamiento (de sacrificio) que generalmente previene este tipo de daños catastróficos. ¿Por qué falló el transportador? El motivo ha sido la remoción de los pines de cizallamiento y su reemplazo por pernos grado 5.

15

Análisis causa raíz de la falla

3.3.1.3. Formato de reporte de eventos Uno de los factores que limita seriamente la efectividad del RCFA es la ausencia de un formato formal de reporte de eventos. El uso de un formato que describa completamente el potencial del problema o evento, reduce grandemente el nivel de esfuerzo requerido para completar un análisis. Un formato similar al mostrado en la figura 8 provee un nivel mínimo de datos necesarios para determinar el esfuerzo requerido para solucionar problemas.

3.3.2. Clasificación del incidente Una vez que el incidente ha sido reportado, el próximo paso es identificar y clasificar el tipo de problema. Clasificaciones comunes de problemas son equipos dañados o con fallas, rendimiento de la operación, rendimiento económico, seguridad y conformidad con las normas. Clasificar los eventos como un tipo particular de problema permite al analista determinar el mejor método para resolver problemas. Cada clasificación mayor requiere de una técnica RCFA ligeramente diferente, como se muestra en la figura 9. Note, sin embargo, que la clasificación inicial del evento o problema es típicamente la parte más difícil de un RCFA. Además muchas plantas carecen de una vía formal y un sistema de reportes que detecte con precisión y defina las desviaciones respecto de las condiciones de operación óptima. 3.3.2.1.

Falla o equipo dañado

Una mejor clasificación de los problemas que a menudo justifican un RCFA son los eventos asociados con la falla del equipo crítico de producción, la maquinaria o los sistemas.

16

Análisis causa raíz de la falla

FORMATO DE REPORTE DEL INCIDENTE

Fecha: Reportado por: Descripción del incidente:

Localización específica y Equipo/ Sistema afectado: ¿Cuándo ocurrió el incidente? : ¿Quién estuvo involucrado? : ¿Cuál es la probable causa? :

¿Qué acción correctiva tomó? :

¿Hubo personas lesionadas? :



No

¿Fue reportada alguna emanación? :



No

Clasificación del incidente:

Falla del equipo

Desacato de normas

Accidente/ lesión

Desviación del rendimiento

Firma Fig. 8: Formato típico de reporte de incidente

EJERCICIO: Llene el formato de reporte de incidente reportando un caso que Ud. tenga conocimiento.

17

Análisis causa raíz de la falla

Típicamente, cualquier incidente que resulte en una falla parcial o total de la máquina o sistema de procesos, justifica un RCFA. Este tipo de incidente puede tener un severo, impacto negativo en el rendimiento de la planta. De allí, esto a menudo justifica el esfuerzo necesario para evaluar completamente el evento y determinar la causa raíz. Los eventos que resultan en daños físicos al equipo de la planta o los sistemas son los más fáciles de clasificar. Una inspección visual del componente fallado del sistema o máquina usualmente provee una clara evidencia de su modo de falla. Mientras la inspección no resolverá la razón de la falla, los síntomas o resultados visibles serán evidentes. Los eventos que también afecten otros aspectos (por ejemplo; seguridad, normatividad, o impacto financiero) deberían ser investigados automáticamente para determinar el impacto potencial o real del rendimiento de la planta, incluyendo la confiabilidad del equipo.

¿Están la falla o el evento significativo basados en la tasa de fallas y las consecuencias de la falla? Yes

¿Es causa de eventos evidentes?

Aclarar problemas adicionales

No

Yes

¿Afecta esto la seguridad?

¿Afecta esto el equilibrio medioambiental?

¿Afecta esto la capacidad de producción o la calidad del producto?

¿Afecta esto la capacidad o los costos?

¿Resultó esto en fallas del equipo?

Yes

Yes

Yes

Yes

Yes

Siga el árbol de decisión de seguridad

Siga el árbol de decisión sobre medioambiente

Siga el árbol de decisión de operaciones

Siga el árbol de decisión sobre economía

Siga el árbol de decisión de fallas de equipos

Fig. 9: Clasificación inicial de eventos

18

Análisis causa raíz de la falla

En la mayoría de los casos, la máquina fallada debe ser reemplazada inmediatamente para minimizar su impacto en la producción. Si este es el caso, puede ser beneficioso evaluar el sistema circundante al incidente. 3.3.2.2. Rendimiento operacional Las desviaciones del rendimiento operacional pueden ocurrir sin la falla física del sistema o equipo crítico de producción. Las desviaciones crónicas pueden justificar el uso del RCFA como un medio para resolver problemas recurrentes. Generalmente, problemas crónicos relativos a la calidad o capacidad de los productos requieren un completo RCFA. Sin embargo, se debe tener mucho cuidado para asegurar que estos problemas son recurrentes y tienen un impacto significativo en el rendimiento de la planta antes de utilizar esta técnica de solución de problemas. Calidad de la Producción Las desviaciones que por primera vez atraviesan la calidad de los productos son candidatos principales para un RCFA, el cual puede ser usado para resolver muchos problemas relativos a la calidad. Sin embargo, el análisis no debe ser utilizado para todos los problemas de calidad. Las desviaciones no recurrentes o aquellas que no tienen un impacto significativo en la capacidad o los costos no son aplicaciones efectivas del costo. 3.3.2.3. Rendimiento económico Las desviaciones del rendimiento económico, tal como una alta producción o elevados costos de mantenimiento, con frecuencia justifican el uso del RCFA. El árbol de decisión y las etapas específicas requeridas para resolver estos problemas varían dependiendo del tipo de problema y su causa o función de fuerza. 3.3.2.4. Seguridad Cualquier evento que tenga potencial para causar perjuicios a las personas debería investigarse inmediatamente. Mientras los eventos en esta clasificación justifican un completo RCFA, ellos deben resolverse tan pronto como sea posible. Aislar la causa raíz de los eventos o accidentes que causan lesiones generalmente es más difícil que para las fallas de los equipos y requiere una técnica diferente de solución de problemas. La primera razón para este incremento en la dificultad es que la causa es a menudo subjetiva.

19

Análisis causa raíz de la falla

3.3.2.5. Acuerdo regulatorio Cualquier evento de acuerdo regulatorio puede tener un potencial impacto en la seguridad de los trabajadores, el medio ambiente, así como en la continuidad de la operación de la planta. De allí, que cualquier evento que resulta en una violación de las concesiones medioambientales u otras guías de acuerdos medioambientales (por ejemplo, Seguridad Ocupacional y Administración de la Salud OSHA, Agencia de Protección Medioambiental, y regulaciones estatales) debería ser investigado y resuelto tan pronto como sea posible.

3.3.3. Acopio de la data La etapa de acopio de la data debe clarificar el problema o evento reportado. Esta fase de evaluación incluye entrevista con el personal apropiado, reunir evidencia física, y conducir otras investigaciones, así como ejecutar una secuencia de análisis de los eventos, lo cual es necesario para proveer un claro entendimiento del problema. Note que esta sección enfoca primeramente los incidentes de falla o los daños en los equipos. 3.3.3.1. Entrevistas El proceso de entrevistas es el método primario utilizado para establecer las condiciones extremas reales de un incidente y es parte de la clave de una investigación. Es crucial para el investigador ser un buen oyente con buenas habilidades de entrevistador y diplomacia. Para incidentes significativos, todo el personal clave debe ser entrevistado y así conseguir un panorama completo del evento. En adición a los directamente involucrados en el evento o incidente, se deben entrevistar a aquellos individuos que tengan conocimiento directo o indirecto de algo que pueda clarificarlo. La siguiente es una lista parcial de entrevistas: • Todo el personal directamente involucrado en el incidente (asegure la revisión de cualquier declaración escrita de un testigo). • Supervisores y gerentes involucrados en el incidente (incluir al gerente de contratos). • Personal que no está directamente involucrado en el incidente pero que tiene un conocimiento o experiencia similar. • Expertos en aplicaciones técnicas, personal entrenado, y vendedores de equipo, suministradores, o fabricantes.

20

Análisis causa raíz de la falla

Note que esto es extremadamente importante para el investigador transmitir el mensaje del propósito de una entrevista es “buscar hechos no buscar faltas”. El trabajo de un investigador es simplemente determinar lo que realmente está sucediendo y por qué está sucediendo. Es importante para el entrevistador exponer al entrevistado claramente la razón de la evaluación, durante el inicio de la entrevista. El personal de planta debe entender y creer que la razón de la evaluación es encontrar el problema. Si ellos creen que el proceso intenta buscar culpables, se tendrán pocos beneficios. También es necesario verificar la información derivada del proceso de entrevistas. Un medio de verificación es la observación visual de las prácticas reales utilizadas por los equipos de producción y mantenimiento asignados al área que está siendo investigada. Preguntas Efectuadas Para escuchar más efectivamente el entrevistador debe prepararse para la entrevista, y preparar las ayudas evitando pérdidas de tiempo. La preparación de las interrogantes o una lista de tópicos por discutir ayuda a mantener la entrevista encaminada y previene que el entrevistador olvide realizar preguntas de temas claves. La figura 10 es una hoja de flujo resumida del proceso de entrevista. Cada entrevista debería ser conducida para respuestas claras de las siguientes interrogantes: • • • • • • • • •

obtener

¿Qué sucedió? ¿Dónde sucedió? ¿Cuándo sucedió? ¿Qué cambió? ¿Quién estuvo involucrado? ¿Por qué pasó? ¿Cuál es el impacto? ¿Pasará de nuevo? ¿Cómo puede prevenirse la repetición?

¿Qué sucedió? Clarificar lo que realmente pasó es un requisito esencial de RCFA. Como se discutió antes, la tendencia natural es dar las percepciones en lugar de definir cuidadosamente el evento real.

21

Análisis causa raíz de la falla

Es importante incluir con mucho detalle tanto los hechos y Los datos disponibles.

Entreviste a todo el personal directa e indirectamente involucrado en el evento. Recoja la evidencia física que confirmará el modo de falla.

Preserve toda la evidencia física y complete los documentos de la escena de los eventos. Figuras, dibujos y videos son herramientas útiles.

Clarificar el evento

¿Qué sucedió?

Defina claramente los eventos específicos, fallas o incidentes.

Identifique la máquina, sistema o área específica donde ocurrió el evento. ¿También ocurrió esto en unidades similares o es específico de esta localización?.

¿Dónde sucedió esto? La habilidad para fijar una referencia absoluta del momento de ocurrencia de los eventos mejorará grandemente el análisis.

Coleccione todos los datos que definan el medio ambiente antes, durante y después del evento. La data debería incluir todas las operaciones, mantenimientos, y variables medioambientales.

Defina claramente la estructura de tiempos y la secuencia de los eventos ¿Cuándo sucedió?

¿Qué cambió?

¿Quién estuvo involucrado?

Enliste todos los cambios en el producto, las prácticas, los procedimientos, el entorno, etc. Que puedan contribuir con el evento.

Difina a todo el personal directa o indirectamente involucrado en el evento. Incluída la gerencia y la supervisión del área afectada.

¿Cuál es el impacto? Cuantifique en términos de lesiones, confiabilidad o finanzas, el impacto del evento. ¿Sucederá otra vez?

¿Puede prevenirse la recurrencia?

Determine la probabilidad de recurrencia del evento o eventos similares. Determine como evitar la recurrencia del evento o eventos similares.

Fig. 10. El proceso de entrevista.

22

Análisis causa raíz de la falla

¿Dónde Sucedió? Una descripción clara de la localización exacta de los eventos ayudará a aislar y resolver los problemas. Además de la localización, se debe determinar si el evento también ocurrió en un lugar o sistema similar. Si se eliminan las aplicaciones o máquinas similares, el evento puede a veces aislar una (o una serie) función(o funciones) de fuerza totalmente única(s) de localizar. Por ejemplo, si la bomba A falló y las bombeas B, C, y D del mismo sistema no lo hicieron, esto indica que la causa de la falla está probable y únicamente en la Bomba A. Si las bombas B, C, y D exhiben síntomas similares, entonces, es muy probable que la causa sea sistémica y común a todas las bombas. ¿Cuándo Sucedió? Aislar el momento específico en que un evento ocurrió mejora grandemente la posibilidad del investigador de determinar su fuente. Cuando se conoce la estructura real de tiempo de un evento, es muy más fácil de cuantificar los procesos, las operaciones, y otras variables que pueden guarden relación con el evento. Sin embargo, en algunos casos (por ejemplo, desviaciones de producto-calidad), es difícil de precisar el inicio y la duración del evento. Muchos de las acciones destinadas a monitorear y rastrear los registros no proporcionan el nivel de detalle exigido para determinar el tiempo de este tipo de incidentes. En estos casos, el investigador debe evaluar la historia de operación del área del proceso afectado para determinar si es posible encontrar un patrón que fije apropiadamente la estructura de tiempos del evento. Este tipo de investigación, en la mayoría de los casos, aislará el cronometrado de los eventos como sigue: • La producción de un producto específico. • El programa de trabajo de un equipo de operación específico. • Los cambios en el medio ambiente. ¿Qué Cambió? Las fallas de los equipos y las grandes desviaciones respecto de los niveles de rendimiento aceptables no necesariamente suceden. En cada caso, las variables específicas, simples o en combinación, causaron que el evento ocurra. Por consiguiente, es esencial que todos los cambios que ocurrieron en conjunción al evento sean definidos.

23

Análisis causa raíz de la falla

No importa cuál evento fue (es decir, falla de equipo, derrame al medio ambiente, un accidente, etc.), la evaluación debe cuantificar todas las variables asociadas con el evento. Estos datos deben incluir parámetros de la operación; las variables de la producción, como la viscosidad, la densidad, la razón de flujo, y así sucesivamente; y el medio ambiente. Si es posible, los datos también deben incluir información del mantenimiento predictivo asociado con el evento. ¿Quién Estuvo Involucrado? La investigación debe identificar a todo el personal involucrado, directamente o indirectamente, en el evento. Las fallas y los eventos a menudo son el resultado del error humano o de habilidades inadecuadas. Sin embargo, recuerde que el propósito de la investigación es resolver el problema, no buscar culpables. Todos los comentarios o declaraciones derivadas de esta parte de la investigación debe ser impersonal y totalmente objetiva. A todas las referencias sobre el personal directamente involucrado en el incidente se les debe asignar un código u otro identificador, como por ejemplo Operador A o Técnico de mantenimiento B. Esta técnica le ayudará a reducir el miedo al castigo de todos aquéllos directamente involucrados en el incidente. Además, reduce el prejuicio u opinión preconcebida sobre los individuos dentro de la organización. ¿Por qué Sucedió? Si las preguntas precedentes fueron debidamente contestadas, entonces puede ser posible resolver el incidente sin una investigación adicional. Sin embargo, asegúrese que el real problema se ha identificado. Es demasiado fácil mal interpretar los síntomas o percepciones sin un completo análisis. A estas alturas, genere una lista de lo que puede haber contribuido al problema reportado. La lista debe incluir todos los factores, reales y supuestos. Esta etapa es crítica en el proceso. En muchos casos, varios factores, muchos de ellos triviales, se combinan para causar un serio problema. Todas las suposiciones incluidas en esta lista de posibles causas deben ser claramente anotadas, como deben serlo todas las causas comprobadas. Un análisis de la sucesión de eventos proporciona un medio para separar los hechos de la ficción durante el proceso del análisis.

24

Análisis causa raíz de la falla

¿Cuál es el Impacto? La evaluación debe cuantificar el impacto del evento antes de embarcarse en un completo proceso RCFA. Dicho de otra forma, no todos los eventos, incluso los que son repetitivos, justifican un análisis completo. Esta parte del proceso de investigación debe ser tan verdadera como sea posible. Aunque a estas alturas no todos los detalles están disponibles, se intenta evaluar el impacto real o potencial del evento. ¿Pasará De nuevo? Si las entrevistas preliminares determinan que el evento es no recurrente, el proceso puede discontinuarse en este punto. Sin embargo, antes de tomar esta decisión debe efectuarse una revisión minuciosa de los archivos históricos asociados con la máquina o el sistema involucrado en el incidente. Asegúrese que el evento es no recurrente antes de discontinuar la evaluación. Todos los eventos reportados deberían ser registrados y los respectivos archivos guardados para futuras referencias. Para los incidentes calificados como no recurrentes debe establecerse un archivo que retenga todos los datos e informaciones desarrollados en las etapas precedentes. De ocurrir nuevamente el evento o uno similar, estos archivos son una herramienta inestimable de investigación. Debe conducirse una completa investigación en todos los eventos que tienen una historia de repetición periódica, o una probabilidad alta de repetición, y un impacto significativo en los términos de lesión, confiabilidad, o economía. En particular, deben investigarse todos los incidentes que tienen un alto potencial en cuanto a lesión del personal o violación de las normas. ¿Cómo puede Prevenirse la Repetición? Aunque ésta es la próxima interrogante lógica por hacer, generalmente no puede contestarse hasta que se haya completado enteramente el RCFA. Note, sin embargo, que si este análisis determina que no es económicamente factible corregir el problema, el personal de la planta tiene simplemente que aprender a minimizar su impacto.

25

Análisis causa raíz de la falla

3.3.3.2.

Los tipos de entrevistas

Una de las preguntas por contestar al prepararse para una entrevista es: ¿Qué tipo de entrevista se necesita para esta investigación? Las entrevistas pueden agruparse en tres tipos básicos: Uno-a-uno, dos-en-uno, y reunión de grupo. Uno-a-uno: La entrevista es muy simple por dirigir, y es dónde el investigador entrevista a cada persona en lo necesario para clarificar el evento. Este tipo de entrevista debe sostenerse en un lugar privado sin ninguna distracción. En los casos dónde se requiere una reconstrucción detallada de los hechos, la entrevista puede sostenerse en el lugar de trabajo. Dos-en-uno: Cuando se están investigando incidentes polémicos o complejos, puede ser aconsejable tener dos entrevistadores presentes al reunirse con uno de los individuos. Con dos investigadores; uno puede hacer las preguntas mientras el otro registra la información. Los entrevistadores deben coordinar su interrogatorio y deben evitar agobiar o intimidar al entrevistado. Al final de la entrevista, los entrevistadores deben comparar sus impresiones de la entrevista y deben alcanzar un acuerdo general de sus puntos de vista. La ventaja de la entrevista dos-en-uno es que debe eliminarse las percepciones personales de un solo entrevistador del proceso de la investigación. La Reunión de Grupo: Una entrevista de grupo es ventajosa en algunos casos. Este tipo de reunión, o ejercicio grupal de resolución de problemas, es útil para obtener un intercambio de ideas de varias disciplinas (es decir, mantenimiento, producción, ingeniería, etc.). Tal intercambio puede ayudar en la resolución de un evento o problema. Esta técnica también puede usarse cuando el investigador ha completado su evaluación y quiere revisar los resultados con aquéllos involucrados en el incidente. El investigador podría considerar las entrevistas como un punto clave que da testimonio y que permite verificar la sucesión de eventos y las conclusiones antes de presentarlos en la reunión de grupo. El investigador debe actuar como el facilitador en este proceso resolución de problemas y debe usar la secuencia del diagrama de eventos como la herramienta de trabajo para la reunión.

26

Análisis causa raíz de la falla

No pueden realizarse las entrevistas de grupo en un ambiente hostil. Si el problema o el evento son polémicos o políticos, este tipo de proceso de entrevistas no es beneficioso. Generalmente las agendas personales de los participantes evitan resultados positivos. 3.3.3.3. Colección de evidencia física La primera prioridad cuando se investiga un evento que involucra la falla o el daño de un equipo es conservar la evidencia física. La figura 11 es un diagrama de flujo que ilustra los pasos involucrados en la investigación del equipo que falló. Este esfuerzo debe incluir todas las tareas y actividades requeridas para evaluar completamente los modos de fallas y determinar las limitaciones específicas que condicionaron la ocurrencia de la falla. Si fuera posible, se debe aislar del servicio la máquina y su sistema instalado hasta que pueda dirigirse una completa investigación. Al levantarla del servicio, la máquina y todos sus componentes deben guardarse en un área segura hasta que puedan inspeccionarse totalmente y se formulen pruebas apropiadas. Si esta sugerencia no se puede realizar, entonces se debe documentar por completo el escenario de la falla antes que la máquina sea removida de su actual ubicación. Deben documentarse fotografías, bocetos, e instrumentación y control para asegurar que todos los datos sean conservados para el equipo que investiga. Los reportes automáticos, así como aquéllos generados por el sistema de control computarizado, deben obtenerse y conservarse. Los acápites exigidos para coleccionar información y la evidencia física para la investigación pueden ser bastante extensos. La siguiente es una lista parcial de la información que debe recogerse: • Procedimientos de mantenimiento (SMP) y estándares de operación (SOP) normalmente acordados para la máquina o el área donde ocurrió el evento. • Políticas de la compañía que orientan las actividades realizadas durante el evento. • Datos de operación y los procesos (por ejemplo, cartas de despiece, salida de la computadora, y datos – información del registrador). • Registros apropiados de mantenimiento de la maquinaria o área involucrada en el evento. • Copias del libro maestro, paquetes de trabajo, órdenes de trabajo, permisos de trabajo, y archivos de mantenimiento; los

27

Análisis causa raíz de la falla

resultados de pruebas al equipo, los informes de control de calidad; resultados de análisis de lubricación y aceites; temas de vibración; y otros archivos. • Diagramas, esquemas, dibujos, manuales del vendedor, y especificaciones técnicas, incluyendo información correspondiente al diseño del sistema o área involucrada en el incidente. • Registros de entrenamientos, copias de los cursos de entrenamiento, y otra información que muestre los niveles de desarrollo del personal incluido en el evento. • Fotografías, vídeos, o diagramas de la escena del incidente. • Componentes malogrados (por ejemplo, las empaquetaduras rotas, soldadura quemada, fusibles soplados, los rodamientos fallados). • Condiciones medioambientales cuando el evento ocurrió. Estos datos deben estar tan completos y exactos como sea posible. • Copias de los informes de anteriores incidentes en eventos similares e historia o información de la tendencia del área involucrada en el actual incidente.

3.3.3.4. Secuencia de análisis de los eventos Realizar un análisis de la secuencia de eventos y trazar gráficamente las acciones que conllevan y siguen a un evento, accidente, o falla ayudará a visualizar lo que pasó. Es importante usar tal esquema de acciones desde el comienzo de la investigación. Esto no sólo ayudará con la organización de la información sino también a identificar los datos faltantes o contradictorios, a mostrar las relaciones entre los eventos, y a resaltar las causas potenciales del incidente.

28

Análisis causa raíz de la falla

EQUIPO O COMPONENTE QUE FALLADO Notificación de la falla

Aclarar el evento

Preservar la evidencia física

Definir acciones correctivas potenciales

Recolectar la documentación de apoyo

Evaluar los componentes fallados

Preparar análisis costo beneficio

Entrevistar a todo el personal involucrado

Dinámicas de pruebas del sistema

Diagrama de desarrollo de la secuencia de eventos

¿Es evidente la causa raíz?

¿Hay una solución efectiva al costo? Yes

Verificar la causa por testeo

No

Archivar documentos para uso futuro

No

Archivar documentos para uso futuro

Yes

Preparar reportes y recomendaciones No

Revisión del diseño

No

¿Confirmó la causa raíz?

Someter recomendaciones para aprobación

Evaluar la instalación

Evaluar las prácticas de operación

¿Fue aprobado lo recomendado?

Evaluar las prácticas de mantenimiento Yes

Desarrollo potencial de la causa raíz

Implementar acciones correctivas

Verificar la causa por testeo Pruebas para verificar la corrección Demande asistencia del grupo de ingeniería en confiabilidad

No

¿Confirmó la causa raíz?

Yes

Fig. 11: Diagrama de flujo de la investigación de la falla del equipo

3.3.3.5. La revisión del diseño Es esencial entender claramente los parámetros de diseño y las especificaciones de los sistemas asociadas con un evento o falla del equipo. A menos que el investigador comprenda con precisión lo que la máquina o sistema de producción fue diseñado para hacer y sus limitaciones inherentes, es imposible aislar la causa raíz del problema o evento. La información obtenida al revisar el diseño proporciona una

29

Análisis causa raíz de la falla

línea base o referencia que se necesita para investigar y resolver los problemas de la planta. El objetivo de la revisión del diseño es establecer las características de operación específicas de la máquina o sistema de la producción involucrados en el incidente. La evaluación debe definir claramente la función o funciones específicas para las que cada máquina y sistema fueron diseñados. Además, la revisión debe establecer el límite o rango de operación aceptable que la máquina o sistema puede tolerar sin una desviación considerable del rendimiento de diseño. La lógica usada para una revisión comprensiva es similar a la del análisis de efectos y modos de fallas y al análisis del árbol de fallas con los que se piensa identificar las variables de contribución. A diferencia de otras técnicas diferentes que usan complejas tablas de probabilidad y desglosan cada máquina al nivel de componentes, el RCFA toma un acercamiento más práctico. La técnica está basada en los datos prontamente disponibles, y aplicaciones específicas para determinar las variables que pueden causar o contribuir a un incidente. Mientras que el nivel de detalle requerido para una revisión del diseño varíe dependiendo del tipo de evento, esta etapa no se puede omitir de ninguna investigación. En algunos casos, el proceso puede limitarse a una revisión superficial del manual de ventas de operación y mantenimiento (O&M) y a características del rendimiento. En otros casos, una evaluación completa incluirá todo lo obtenido, datos operación y diseño que puedan conseguirse. 3.3.3.6. Datos mínimos de diseño En muchos casos, la información requerida puede obtenerse de cuatro fuentes: de las placas de los equipos, de las especificaciones durante la obtención, especificaciones del vendedor, y de los manuales de O&M proporcionados por los vendedores. Si el investigador tiene una comprensión razonable de la dinámica de la máquina, puede lograrse una revisión minuciosa del diseño para sistemas de producción relativamente simples (por ejemplo, sistema de bombeo) con los datos proporcionados por solo estos cuatro documentos. Debe prestarse especial atención a la guía de solución de problemas del vendedor. Estas sugerencias proporcionarán el entendimiento de las causas más comunes de comportamiento anormal y modos de fallas.

30

Análisis causa raíz de la falla

3.3.3.7. Datos de placa del equipo La mayoría de la maquinaria, los equipos, y los sistemas usados en las plantas de procesos tienen una placa de datos permanentemente pegada que define sus parámetros nominales de operación. Por ejemplo, la placa de datos de una bomba centrífuga incluye su razón de flujo, presión total de descarga, gravedad específica, diámetro del impulsor, y otros datos que definen su diseño. Estos datos pueden usarse para determinar si el equipo es apropiado para la aplicación y si está operando dentro su rango de diseño. 3.3.3.8. Especificaciones de obtención Normalmente las especificaciones de obtención del equipo son preparadas para todo equipo importante como parte del proceso adquisitivo. Estos documentos definen las características específicas y los rangos de operación solicitados por el equipo de ingeniería de la planta. Las especificaciones proporcionan información útil para evaluar el equipo o sistema durante la investigación. Cuando las especificaciones de obtención no están disponibles, los registros de compra deberían describir el equipo y proporcionar las características del sistema. Aunque si bien la data puede estar limitada a un tipo o modelo específico de máquina, en general es útil esta información. 3.3.3.9. Especificaciones de venta En la mayoría de equipos que forman parte de un proyecto importante, se debe disponer de un juego detallado de especificaciones de venta. Generalmente, estas características técnicas se incluyen en la propuesta del vendedor y son entregadas como parte de lo necesario para el proyecto. Normalmente, estos registros están en un archivo en dos departamentos diferentes: compras e ingeniería. Como parte de la revisión del diseño, las especificaciones de obtención y de venta se deben comparar cuidadosamente. Muchos de los problemas crónicos que plagan las plantas son el resultado directo de desviaciones de las especificaciones de venta respecto de las de obtención. Mediante una comparación cuidadosa de estos dos documentos se pueden descubrir las causas raíces de problemas crónicos. 3.3.3.10. Manuales de operación y mantenimiento Los manuales de O&M son unas de las mejores fuentes de información. En la mayoría de los casos, estos documentos proporcionan recomendaciones específicas sobre el apropiado funcionamiento y mantenimiento de la máquina,

31

Análisis causa raíz de la falla

equipo, o sistema. Además, muchos de estos manuales proporcionan guías para la solución de problemas específicos que puedan ocurrir. Una revisión completa de estos documentos es esencial antes de empezar el RCFA. La información proporcionada en estos manuales es esencial para solucionar eficazmente los problemas de la planta. 3.3.3.11. Revisión del diseño El objetivo de la revisión del diseño es determinar las limitaciones del diseño, el entorno de operación aceptable, los modos probables de falla, y los índices específicos que cuantifican la condición de operación real de la máquina, equipo, o sistema del proceso que se investiga. Como mínimo, la evaluación debe determinar la función de diseño y específicamente para que se diseñó la máquina o sistema. La revisión debe definir claramente las funciones específicas del sistema y sus componentes. Para definir completamente las funciones de la maquinaria, el equipo, o sistema, se debería incluir una descripción de las especificaciones de entrada y salida del producto, del trabajo que llevará a cabo y del entorno operacional aceptable. Por ejemplo, una bomba centrífuga puede diseñarse para entregar 1 000 galones por minuto de agua que tiene una temperatura de 100°F y una presión en la descarga d e 100 libras por pulgada al cuadrado. Especificaciones del producto de entrada. Las funciones de la máquina y del sistema dependen del producto entrante a ser manejado. Por consiguiente, la revisión del diseño debe establecer las limitaciones del producto entrante usado en el proceso de diseño. En muchos de los casos, estos límites incluyen rango de temperatura, densidad o gravedad específica, volumen, presión y otros parámetros medibles. Estos límites determinan la cantidad de trabajo que la máquina o el sistema debe proveer. En algunos casos, las condiciones de límite son absolutas. En otros, hay un rango aceptable para cada una de las variables. La revisión debe definir claramente los límites aceptables utilizados en el diseño del sistema. Especificaciones del Producto de salida. Asumiendo que las condiciones de límite del producto entrante son reales, la investigación debe determinar qué rendimiento el sistema fue diseñado a entregar. Como con el producto entrante, el rendimiento de la máquina o sistema puede estar limitado por parámetros específicos, mensurables. El flujo, la presión, la densidad, y la temperatura son sin embargo las mediciones comunes del producto de

32

Análisis causa raíz de la falla

salida. Sin embargo, dependiendo del proceso, puede haber muchos otros. Trabajo a ser Realizado. Esta parte de la revisión del diseño debe determinar el trabajo mensurable a ser realizado por la máquina o sistema. La eficiencia, la potencia utilizada, la pérdida de producto, y otros parámetros similares son utilizados para definir esta parte de la revisión. Los parámetros reales variarán, dependiendo de la máquina o sistema. En la mayoría de los casos, las especificaciones originales del diseño proveerán los parámetros apropiados del sistema bajo investigación. Condiciones de Operación Aceptable. La parte final de la revisión del diseño es definir las características de operación aceptable de la máquina o sistema. Cada máquina o sistema se diseña para operar dentro de un rango específico, o condiciones de operación. Estas condiciones incluyen la variación máxima del producto entrante, velocidades de encendido acelerado y parada brusca, medio ambiente y una variedad de otros parámetros. 3.3.3.12. Revisión de la aplicación y el mantenimiento El próximo paso en el RCFA es revisar la aplicación y asegurar que la máquina o sistema está usándose en la aplicación apropiada. Los datos recogidos durante la revisión del diseño deberían usarse para verificar la aplicación. El registro de mantenimiento también debería ser revisado. En plantas donde múltiples productos son producidos por la máquina o sistema del proceso que se investiga, es esencial que el rango de aplicación total se evalúe. La evaluación debe incluir todas las variaciones de las características de operación sobre el rango total de productos que se producen. La razón de que esto sea tan importante es que muchos de los problemas que serán investigados se relacionan directamente a uno o más procesos que son únicos de ese producto. A menos que el rango total de operación sea evaluado, hay un potencial de que la causa raíz del problema permanezca oculta. Los factores a evaluar en una revisión de la aplicación y del mantenimiento incluyen la instalación, las condiciones de operación, las prácticas y los procedimientos que operación (es decir, procedimientos estándares contra las prácticas reales), historiales, así como procedimientos y prácticas de mantenimiento.

33

Análisis causa raíz de la falla

La Instalación. Cada máquina y sistema tiene criterios específicos de instalación que deben ser seguidos antes de alcanzar y sostener niveles aceptables de confiabilidad. Estos criterios varían con el tipo de máquina o sistema y deberían ser verificados como parte del RCFA. Usando la información desarrollada como parte de la revisión del diseño, el investigador u otros individuos calificados deben evaluar la instalación real de la máquina o sistema que se investigan. Como mínimo, una inspección visual minuciosa de la máquina y su sistema deberían conducir a la determinación de sí la instalación impropia está contribuyendo al problema. Los requisitos de la instalación variarán, dependiendo del tipo de máquina o sistema. Deben prepararse fotografías, bocetos, o dibujos de la instalación real como parte de la evaluación. Ellos deben apuntar cualquier desviación de las prácticas de instalación aceptables o recomendadas definidas en los documentos de referencia y las buenas prácticas de ingeniería. Estos datos pueden usarse después en el RCFA cuando se consideran las acciones correctivas potenciales. Condiciones de Operación. Evaluar la condición real de operación del sistema de producción asociado con el evento investigado es muy difícil. La mejor técnica es determinar todas las variables y límites usados en una producción normal. Por ejemplo, defina el rango completo de velocidades en que opera, la razón de flujo, las variaciones del producto de entrada, y lo que al parecer este asociado con el sistema. En aplicaciones con velocidad variable, determine las oscilaciones mínimas y máximas usadas por los operadores. Prácticas y Procedimientos de operación. Esta parte la revisión de la aplicación/mantenimiento consiste en evaluar los procedimientos de operación estándares así como también las prácticas de operación reales. La mayoría de las áreas de producción mantienen algunos datos históricos que describen su rendimiento y sus prácticas. Estos registros pueden consistir en el libro maestro, informes, o datos en la computadora. Estos datos deben revisarse para determinar las prácticas reales de producción que son utilizadas para operar la máquina o el sistema que se investiga. Los sistemas que usan un sistema de control y monitoreo por ordenador tendrán la mejor base de datos para esta parte de evaluación. Muchos de estos sistemas automáticamente

34

Análisis causa raíz de la falla

almacenan y, en algunos casos, imprimen reportes a cierta frecuencia que definen la evolución del proceso real para cada tipo de producto producidos por el sistema. Esta fuente inestimable de información debe evaluarse cuidadosamente. Procedimientos Estándares de Operación Standard Operating Procedures: SOP )

(

Evalúe los procedimientos estándares de operación del área o sistema afectados para determinar si ellos son consistentes y adecuados para la aplicación. Dos fuentes de referencia, el reporte de revisión del diseño y los manuales de O&M del vendedor, son necesarias para completar esta tarea. Además, evalúe los SOPs para determinar si ellos son utilizables por operadores. Revise la organización, el contenido y la sintaxis para determinar si el procedimiento es correcto y entendible. Procedimientos de Puesta a punto. Debe prestarse una especial atención a los procedimientos de puesta a punto para cada producto producido por una máquina o sistema del proceso. La puesta a punto impropia o incoherente de un sistema es causa principal de una baja calidad del producto, de restricciones en la capacidad, y de equipo no confiable. Los procedimientos deben proporcionar un claro, y fácil entendimiento de las instrucciones que aseguran una exacto, y repetible puesta a punto para cada tipo de producto. Si no es así, las desviaciones deben anotarse para una evaluación adicional. Procedimientos Transitorios. Los procedimientos transitorios, como el encendido, el cambio de velocidad, y la paralización total, también deben evaluarse cuidadosamente. Éstos son, los predominantemente transitorios, los que causan las desviaciones en la calidad y capacidad y tienen un impacto directo en la confiabilidad de equipo. Los procedimientos deben evaluarse para asegurar que ellos no violen las condiciones de operación o las recomendaciones del vendedor. Deben definirse todas las desviaciones con claridad para una evaluación adicional. Prácticas de Operación. Esta parte de la evaluación debe determinar si los SOPs fueron entendidos y seguidos antes y durante el incidente o evento. La tendencia normal de los operadores es evadir los procedimientos, lo cual es una razón para muchos problemas.

35

Análisis causa raíz de la falla

Además, los procedimientos inciertos entendimiento y un empleo perjudicial.

llevan

a

mal

Por consiguiente, la investigación debe evaluar completamente las prácticas reales que el equipo de producción utiliza para operar la máquina o el sistema. La mejor manera para determinar la conformidad con los SOPs es tener la lista de pasos del operador utilizada para accionar la máquina investigada. Esta tarea debe realizarse sin referirse al manual del SOP. El investigador debe conducir las prácticas del operador (es) a través del proceso y utilizar sus datos de entrada para desarrollar un diagrama de secuencias. Después que el diagrama esté completo, compárelo con el SOP. Si las prácticas reales del operador no son las mismas que las descritas en el SOP, los procedimientos pueden necesitar ser actualizados o los operadores pueden necesitar ser re adiestrados. Historial de Mantenimiento. Una revisión minuciosa del historial de mantenimiento asociado con la máquina o el sistema es esencial en el proceso del RCFA. Una pregunta que debería ser contestada es: "¿Sucederá esto otra vez?". Una revisión del historial de mantenimiento puede ayudar a responder esta pregunta. El nivel de exactitud de la data de mantenimiento disponible variará grandemente de una planta a otra. Esto puede dificultar la evaluación, pero es necesario como sea posible desarrollar un claro panorama de la historia de mantenimiento del sistema. Una historia completa del mantenimiento real y programado, incluyendo inspecciones y lubricación, debe desarrollarse para la máquina, sistema o área afectados. Los detalles primarios que se necesitan incluyen la frecuencia y los tipos de reparación, frecuencia y tipos de mantenimiento preventivo, historia de fallas, y cualquier otro hecho que ayude en la investigación. Las Prácticas y Procedimientos de mantenimiento. Debe conducirse una evaluación completa de los procedimientos estándares de mantenimiento y de sus prácticas reales. Los procedimientos deben compararse con el mantenimiento necesario definido por la revisión del diseño y por los manuales de O&M del vendedor. Las prácticas de mantenimiento reales pueden ser determinadas de la misma forma como se describió anteriormente o por observación visual de reparaciones similares. Esta tarea debe determinar si los SMPs son seguidos de forma consistente por todo el personal de mantenimiento asignado a o involucrado con el

36

Análisis causa raíz de la falla

área que se investiga. Debe prestarse una especial atención a las tareas rutinarias, como la lubricación, los ajustes, y otras tareas preventivas. Determine si los procedimientos están siendo ejecutados de una manera oportuna y si están usándose las técnicas apropiadas. 3.3.4. Observaciones y mediciones Si la revisión de las aplicaciones y del mantenimiento no es concluyente, pueden ser necesarias una evaluación y pruebas adicionales. Las técnicas discutidas en esta sección proporcionan maneras de cuantificar las desviaciones de las prácticas de operación y de mantenimiento aceptables. Usando estas técnicas, el equipo de investigaciones puede establecer con exactitud las desviaciones que contribuyen con el problema. Después de establecer las desviaciones potenciales de las condiciones de operación u otras variantes que contribuyen con el evento, el próximo paso es verificar estos factores fueron contribuyentes reales. El mejor método de confirmación es medir físicamente la dinámica operación de la máquina o sistema de producción asociada con el evento. Evaluar cualquier evento o incidente que resulte en una falla parcial o completa de una máquina, de la pieza de un equipo, o de un sistema, debe incluir un análisis completo de las partes componentes fallados. Los métodos reales usados variarán dependiendo del modo de falla y tipo de falla de la máquina o componente fallido. En la mayoría de los casos, deben reemplazarse inmediatamente los componentes fallados para minimizar el impacto en la producción. Si este es el caso, puede ser beneficiosa una evaluación del sistema que rodeó al incidente. Si esta comprobación se puede conducir poco después que la máquina a fallado, puede haber evidencia residual que ayudará en la investigación. Esto es especialmente cierto en los casos dónde las variaciones en los parámetros de operación, como las variaciones del producto y las prácticas de operación, contribuyeron a la falla. Muchos tipos de mediciones pueden tomarse y así como efectuar observaciones, pero las más efectivas incluyen el análisis de vibracional, la cuantificación de parámetros del proceso, y la inspección visual. El análisis de vibración, complementado con el registrador directo de variables del proceso, provee el más efectivo medio para determinar sus efectos. Un análisis completo multicanal de la máquina de reemplazo y su sistema instalado proporciona los datos necesarios para evaluar la contribución potencial de sistema a la falla.

37

Análisis causa raíz de la falla

3.3.4.1. El análisis vibracional El análisis de vibración es quizás el mejor método para medir el real comportamiento operacional de los sistemas mecánicos. Esta técnica proporciona los medios para cuantificar una variedad de factores que pueden contribuir con el evento - incluso cuando la falla del equipo no ha ocurrido. Si se cree que las variaciones en el producto entrante, las prácticas de operación y mantenimiento, el medio ambiente u otras variables son un factor de contribución con la falla, las pruebas de vibración pueden medir el efecto real de cada variable. Es necesario desarrollar una sucesión de pruebas que aíslen y comparen directamente cada variable sospechosa. Por ejemplo, una serie de pruebas de vibración pueden conducir a medir el cambio real de la respuesta de una máquina o sistema de procesos, para cambios discretos en los parámetros del producto entrante, tal como la viscosidad o la temperatura. Otra sucesión de pruebas puede dirigirse para medir los efectos de las variaciones en las prácticas de operación o el medio ambiente. Todas las pruebas de vibración deben ser basadas en un plan de pruebas bien pensado que defina su propósito y los métodos que serán usados. La documentación detallada es esencial. Cada prueba de la sucesión debe ser completamente detallada para definir con claridad los parámetros exactos a usar durante la adquisición de los datos. Esta documentación es esencial para el análisis apropiado y la comparación de la data. En la mayoría de los casos, los datos del proceso o del medio ambiente deben adquirirse conjuntamente con los datos de vibración. Desde que estas pruebas se diseñaron para cuantificar los efectos de los cambios en las variables, es necesario verificar el cambio real causado por cada uno. Pueden usarse los datos en tiempo real para cuantificar con exactitud la relación de causa y efecto entre las variables sospechosas y el comportamiento operacional de la máquina o sistema. Las técnicas de adquisición multicanal de datos proporcionan los medios mejores medios para adquirir este tipo de datos. La técnica multicanal registra todas las variables al mismo tiempo, eliminando la posibilidad que algo en tránsito pueda ser perdido como con un método de adquisición de datos de canal simple.

38

Análisis causa raíz de la falla

3.3.4.2. Parámetros del proceso Las variaciones en la evaluación de parámetros del proceso, como la presión, la razón de flujo, y la temperatura, es un medio efectivo de confirmación de sus impactos en el sistema de producción. En algunos casos, el sistema de supervisión por computadora del Nivel I usada para operar el sistema de procesos proporciona muchos de los datos necesarios. Los sistemas de supervisión normalmente adquieren, informan, y almacenan variables claves del proceso a lo largo del proceso de producción normal. Esta información es útil para el análisis inicial y las pruebas de confirmación. Las pruebas deben desarrollarse para medir el impacto de los cambios de los parámetros del proceso en el sistema para determinar si las desviaciones específicas contribuyeron al evento que está investigándose. En la mayoría de los casos, deben usarse las pruebas en conjunto con el análisis de vibraciones para medir las relaciones de causa y efecto entre los procesos específicos instalados y el comportamiento operacional del sistema. 3.3.4.3. Inspección visual La inspección visual es una herramienta que siempre debe usarse. Tales inspecciones deben realizarse en dispositivos de medición, como en manómetros y los componentes con falla de la máquina.

3.3.4.4. Los dispositivos de medición La mayoría de las máquinas y sistemas incluyen dispositivos de medida que proporcionan una indicación clara de la condición de operación. Una inspección visual de estos dispositivos confirma muchos de los modos de falla que causan desviaciones del proceso y las fallas catastróficas. Por ejemplo, los manómetros de presión son una herramienta primaria para evaluar el comportamiento operacional. Una lectura estable de la presión es una buena indicación que el equipo (por ej., bomba, ventilador, compresor) está operando normalmente y dentro de sus condiciones de operación de diseño. Un manómetro fluctuando es una indicación de que algo anda mal. Un flujo turbulento, cíclico o una variación en la carga o la demanda, y una variedad de otras desviaciones del proceso produce una fluctuación radical de la lectura del manómetro de presión.

39

Análisis causa raíz de la falla

3.3.4.5. Los componentes fallados de la máquina La inspección visual de los componentes fallados de la máquina puede ser una efectiva herramienta de diagnóstico. Por ejemplo, la inspección visual de un rodamiento fallado puede determinar la zona recargada, el patrón de desgaste, y en muchos casos la causa probable de la falla. Lo mismo sucede en engranes, fajas en V, y una variedad de otros componentes de comunes de máquinas. En muchos casos, la inspección visual proporciona pistas positivas que orientan al investigador hacia el probable modo de falla o causa de la raíz. Por ejemplo, el patrón de desgaste de un rodamiento de rodillos o de un conjunto de engranes proporciona indicaciones visuales de un comportamiento o carga anormal. Varios libros de referencia discuten e ilustran los modos de falla comunes de los componentes de una máquina que pueden descubrirse usando la observación visual así como las herramientas de diagnóstico primario. La mayoría de estos libros utilizan fotografías para mostrar claramente la imagen visual de varios modos de falla. 3.3.4.6. Partículas de desgaste El análisis de las partículas de desgaste es una técnica de diagnóstico que usa el análisis visual ayudado por un microscopio electrónico para evaluar el patrón de desgaste de los sólidos metálicos contenidos en el sistema de lubricación de una máquina. Usando esta técnica, un analista especializado puede determinar el tipo de desgaste y su causa más probable. En la mayoría de los casos, este análisis requiere el uso de un laboratorio externo, con costos que van desde aproximadamente $25 a $50 por muestra. Sin embargo, el conocimiento ganado con esta prueba es sumamente valioso para el proceso del RCFA. Otras técnicas de comprobación de la condición (por ej., megado, ultrasonido, emisiones acústicas) puede usarse para medir la relación de causa y efecto entre las variables. Cada técnica es apropiada para aplicaciones específicas y proporciona un medio de cuantificar o mostrar cuales funciones de fuerza específicas contribuyeron al evento o incidente que se investiga. Hay también que a una variedad de pruebas que pueden efectuarse para evaluar las propiedades metalúrgicas del componente que falló.

40

Análisis causa raíz de la falla

Éstos incluyen el esfuerzo de tensión, la tensión residual, y otras propiedades del componente así como el mecanismo de falla real (es decir, ruptura por tensión, fractura de compresión, etc.). A menos que la planta tenga un laboratorio metalúrgico totalmente funcional, las pruebas pueden requerir el uso de un laboratorio externo. El costo de las evaluaciones variará, dependiendo del tipo de componente y la magnitud del análisis. Usado selectivamente, el análisis metalúrgico es una herramienta eficaz y puede ser parte útil de un RCFA.

3.4.

Determinación de la causa de la raíz

A estas alturas de la investigación, los pasos precedentes, los diagramas secuencia de eventos, y los árboles lógicos deben de haber identificado las funciones de fuerza que pueden haber contribuido al problema. Estos datos deben haber proporcionado suficiente visión de la falla para que el investigador desarrolle una lista de razones potenciales o probables para la falla. Las guías para tipos específicos de máquinas así como las guías para la solución de problemas que se dan más adelante deberían ser utilizadas como parte de esta actividad. Un buen número de modos de falla comunes de maquinaria se definen más adelante, estos proporciona síntomas obvios asociados con un problema o falla de la máquina y sus causas comunes. Acoplados con los datos encontrados durante la investigación, estas tablas deberían ayudar a reducir el número de causas potenciales a no más de dos o tres. Un método que puede usarse para evaluar factores potenciales que pueden haber causado o contribuido con el evento es el análisis de causa y efecto. La representación gráfica de las variables o los factores identificados por la investigación usa un diagrama de la espina de pescado que proporciona un medio para evaluar las causas raíces potenciales. La ventaja del diagrama de espina de pescado es que esto obliga al investigador a agrupar lógicamente a cada uno de los factores identificados durante la investigación. Este proceso puede eliminar algunos factores automáticamente y puede descubrir otros problemas que deben ser manejados. Una vez que todos los factores identificados han sido gráficamente mostrados, el investigador o el equipo de investigaciones pueden evaluar cada uno sistemáticamente. Es esencial analizar una lista corta de causas raíces potenciales para verificar cada una de las causas sospechosas. En casi todos los casos, una serie de pruebas relativamente simples y baratas pueden efectuarse para confirmar o eliminar la causa que se sospecha causó la falla del equipo. Como un ejemplo, el azul de prusia puede usarse para verificar el alineamiento y el juego del conjunto de engranes. Este simple y barato test requiere muy poco esfuerzo y confirmará el patrón de desgaste y el embonado del conjunto de engranes. Si el alineamiento o el excesivo contragolpe están presente, esta prueba lo confirmará.

41

Análisis causa raíz de la falla

Cuando se sospecha si existe cavitación en una bomba centrífuga, verifique al menos un factor, tales como goteras en la succión o una baja altura neta de succión positiva (NPSH), presentes en el sistema. Si no se verifican, la cavitación no puede ser la causa de la falla. La mayoría de las causas que contribuyen con los problemas que adversamente afectan el rendimiento de la planta pueden agruparse en una de varias categorías. La mayoría de los problemas del equipo pueden remontarse a la mala aplicación de las prácticas y los procedimientos de operación y mantenimiento o simplemente a la edad. Algunas de las otras causas que se discuten incluyen entrenamiento, supervisión, comunicaciones, ingeniería humana, sistemas de gerencia, y control de calidad. Estas causas son las razones más comunes para un pobre rendimiento de la planta, accidentes, y el no acatamiento de las normas reguladoras. Sin embargo, el error humano puede contribuir a, o ser la sola razón del problema. La figura 12 ilustra las causas más comunes de eventos que afectan la seguridad de la planta, complacencia medioambiental, rendimiento del proceso, y confiabilidad del equipo.

FALLA DEL EQUIPO

Mala aplicación

Prácticas de Operación

Prácticas de Mantenimiento

Edad

Condiciones de operación de diseño fuera de lugar

Procedimientos inadecuados

Procedimiento inadecuado

Desgaste normal

Prácticas pobres de diseño

Ninguna adherencia al procedimiento

Procedimientos no concuerdan

Vida útil terminada

Prácticas pobres de adquisición

Entrenamiento inadecuado

Frecuencia inadecuada

Desgaste acelerado

Incumplimiento

Carencia de habilidades

Fig. 12: Causas comunes de fallas del equipo

42

Análisis causa raíz de la falla

3.4.1. Mala aplicación La mala aplicación del equipo crítico del proceso es una de las causas más comunes de problemas relacionados con el equipo. En algunos casos, la razón para la mala aplicación es un diseño pobre, pero más a menudo es el resultado de modificaciones incontroladas o cambios en los requisitos de operación de máquina. Prácticas Pobres de Diseño. Algunos problemas del equipo son el resultado de aplicar en planta inadecuadas prácticas de ingeniería. Una tendencia creciente en la industria americana, a menudo disminuye o elimina el diseño interno y las capacidades de ingeniería de la planta. Sin embargo, esto puede resultar en pobres prácticas de diseño, lo cual tienen un impacto serio en la confiabilidad del equipo. Incluso en esos medios dónde la capacidad de diseño interno no se elimina, la calidad de los procedimientos y las prácticas pueden verse mermadas tal que afectan el diseño del proceso y contribuyen con los problemas. Durante la fase de revisión del diseño de una investigación, el equipo investigador debe de haber evaluado el diseño del proceso para determinar si es adecuado para la aplicación en particular. Si no, la acción correctiva obvia es modificar los procedimientos y las prácticas que se usan para la función de diseño. Prácticas de Obtención. Los métodos por obtener equipo nuevo y de reemplazo contribuyen a menudo con los problemas relativos al equipo. Los factores principales que contribuyen con las deficiencias son las especificaciones técnicas inadecuadas, substitución de vendedores o máquinas, omisión de las evaluaciones del costo del ciclo de vida, y no obtener las evaluaciones del vendedor. Especificaciones Inadecuadas. Un gran contribuyente en esta categoría es la ausencia de adecuadas especificaciones de obtención. Generalmente, las especificaciones técnicas no incluyen suficiente detalle para asegurar que se está comprando la parte o máquina correcta. Muy a menudo, las especificaciones se limitan a número de modelo o de parte. Sin embargo, este tipo de especificación no define la aplicación específica o rango de operación que la máquina debe proporcionar. Substituciones. El papel definido para el proceso de compra es limitar el costo de las partes y máquinas nuevas y de reemplazo. Como resultado, el personal de adquisiciones a menudo substituye partes o máquinas que reciben por ser externamente iguales. Desgraciadamente, las substituciones no siempre son exactamente las mismas. Los mismos vendedores también contribuyen con

43

Análisis causa raíz de la falla

este tipo de problema. Ellos ofrecerán los equivalentes a las especificaciones requeridas sin pensar en la aplicación que se intenta darle. En algunos casos, les basta con dar una mirada. En otros, hay un esfuerzo intencional en obtener la orden, sin tener en cuenta el impacto en el rendimiento de la planta. Baja Oferta versus el Costo del Ciclo de Vida. Obtener equipo nuevo o de reemplazo basados estrictamente en la baja oferta en lugar de observar el costo del ciclo de vida es otra importante contribución a los problemas de confiabilidad del equipo. En un esfuerzo por reducir los costos, muchas plantas han abandonado el proceso de selección del vendedor basado en el costo del ciclo de vida total del equipo. Este error continúa bajando la confiabilidad del equipo y puede ser la causa raíz de muchos problemas. Evaluaciones del Vendedor. La calidad del equipo nuevo y reconstruido tiende a declinar sustancialmente sobre los diez años. Al mismo tiempo, muchas compañías han abandonado la práctica de inspecciones regulares y certificación del vendedor. El declive resultante en la calidad es otra contribución al mal funcionamiento o falla del equipo. 3.4.2. Prácticas y procedimientos de operación pobres Las prácticas y procedimientos de operación pobres juegan un papel importante en los problemas de confiabilidad del equipo. La figura 13 ilustra las fuentes más comunes de problemas causadas por los procedimientos. Los problemas generalmente resultan porque no se usan los procedimientos, son inadecuados, o se siguen incorrectamente. Cualquiera de estas categorías puede ser la causa raíz, pero normalmente ocurre junto con una o más de otras causas discutidas en esta sección. Por ejemplo, no hacer cumplir es un problema de supervisión y la verdadera causa de la raíz debe incluir una evaluación. La llave a evaluar el potencial de la causa raíz es determinar si el problema es un procedimiento inadecuado o la falla ocurre al seguir procedimientos válidos. Muchos de los SOPs utilizados para operar sistemas críticos en plantas de producción están fuera de fecha o son inadecuados. A menudo esto hace una importante contribución a los problemas relacionados con los equipos y su confiabilidad. Si lo anterior es evaluado como un potencial contribuyente al problema específico que se investiga, refiérase a la figura 13 para la sub clasificación que ayudará a identificar las causas raíces y las acciones correctivas apropiadas. Los problemas de procedimiento tienen un impacto más universal en la confiabilidad y el rendimiento en donde hay una probabilidad sumamente alta que la falla o problema se repita.

44

Análisis causa raíz de la falla

PROCEDIMIENTOS

No usados

Inadecuados

Incorrectamente seguidos

No hay procedimiento

Hechos o métodos equivocados

Formato confuso

Dificultad para su uso

Organización pobre

Excesivas referencias

No hay disponible

Se hizo inadecuada revisión

Demasiado técnico

No se ejecuta

Situación no considerada

Fig. 13: Causas raíces comunes de los problemas relacionados con el procedimiento

La carencia de vigor para hacer cumplir, es una de las razones que los procedimientos no se siguen de forma consistente. La real causa de esto puede ser muchos factores. Falta de entrenamiento o un inadecuado empleo de habilidades normalmente contribuyen a problemas que afectan el rendimiento de la planta y la confiabilidad del equipo. Los mayores contribuyentes a los problemas relativos al entrenamiento incluyen no entrenar, inadecuado entrenamiento y falla al aprender. Las razones implícitas a inadecuadas habilidades varían dependiendo de la cultura de la planta, la mano de obra y una variedad de otros problemas. La figura 14 provee las razones más comunes para un pobre nivel de habilidades que son causadas por problemas de entrenamiento. Además de las subcategorías incluidas en la figura, revise las secciones en Prácticas y Procedimientos de Operación Pobres y Supervisión para problemas donde un inadecuado nivel de habilidades es un potencial contribuyente.

45

Análisis causa raíz de la falla

ENTRENAMIENTO

Ningún Entrenamiento

Inadecuado

No Aprendido

Tarea no analizada

Aprender no es un objetivo

Carencia de retención

No se decidió ningún entrenamiento

Ningún plan

Demasiado técnico

Aprender no es un objetivo

Instrucción pobre

No asistió al curso

El entrenamiento no se ejecuta

La aplicación no es práctica

Conocimiento no verificado

Fig. 14: Causas Comunes de problemas relativos al entrenamiento.

Ningún Entrenamiento. Muchas plantas carecen de un programa de entrenamiento formal que proporcione las habilidades mínimas que requieren los empleados para ejecutar las tareas de obtención, operación, y mantenimiento exigidas para mantener un nivel aceptable de rendimiento de la planta. En otros casos, los programas de entrenamiento de la planta son los limitados a cursos como (por ej., OSHA, EPA, u otros cursos reguladores) eso tiene poco que hacer con las habilidades prácticas exigidas para cubrir los requisitos del trabajo. El Entrenamiento Inadecuado. Hay una variedad de razones por las que los programas de entrenamiento fallan al no lograr un mínimo nivel de habilidades en los empleados. La mayoría se relaciona a los procedimientos y los métodos utilizados para desarrollar y presentar los cursos de entrenamiento. Algunos tipos comprueban la mejora del nivel de habilidades después que el entrenamiento ha sido completado, siendo esta la mejor manera de determinar la efectividad del programa de entrenamiento. Fracaso al Aprender. Los empleados no retienen la instrucción proporcionada en los programas por dos razones: la instrucción es pobre y algunos fracasos del empleado. La instrucción pobre es una falla por la que el empleador proporciona la información requerida para que el empleado realice un particular trabajo en un formato fácilmente entendible y a un paso que le permita absorber el material. El fracaso por el empleado para aprender puede ser el resultado de su nivel de educación, fatiga, falta de deseo, o falta de incentivo. No todos los empleados tienen la educación y las habilidades de comprensión necesarias para entender, dominar, y retener el entrenamiento

46

Análisis causa raíz de la falla

para mejorar sus habilidades de operación y de mantenimiento. En algunos casos, el empleado no puede tener la habilidad para leer y escribir a un nivel que permite un mínimo entendimiento de incluso el más simple programa de entrenamiento. Los empleados que cayeron dentro de esta clasificación presentan un serio problema que es muy difícil corregir. La única solución real es proporcionar cursos de entrenamiento que remedien esto enfocando la lectura y escritura básicas, y las habilidades de comprensión. La fatiga es otro factor que directamente afecta el entrenamiento. Muchos cursos se enseñan fuera de horas de trabajo normales y se espera que los empleados asistan al entrenamiento después de en un día lleno de labores. Desgraciadamente, esto afecta a los estudiantes, y su habilidad para comprender y retener las instrucciones. La falta de motivación puede ser un problema de actitud del empleado, pero en muchos casos la real causa raíz es una falla en la supervisión y las políticas de la planta. Si se sospecha una falta de motivación, evalúe las causas potenciales incluidas en las secciones siguientes en Supervisión, Comunicaciones, y Sistemas de Dirección antes de tomar una decisión final en cuanto a la causa raíz del problema. 3.4.3 SUPERVISIÓN La supervisión incluye todas las causas potenciales que puedan estar asociadas con las prácticas y los procedimientos de dirección. Mientras la mayoría de las causas apuntan a supervisores de primera línea, también pueden apuntar a todos los niveles de dirección. La figura 15 proporciona los factores comunes de problemas relativos a la supervisión. Preparación. La falta de preparación es un factor común a que contribuye a, o es la sola razón para, los problemas de rendimiento de la planta. En algunos casos, es un problema del empleado con uno o más supervisores o gerentes, pero más a menudo es un fracaso en la filosofía de dirección global de la planta. Muchas plantas confían en sus supervisores de primera línea que también tienen otras responsabilidades directas o indirectas.

47

Análisis causa raíz de la falla

SUPERVISIÓN

Preparación

Selección de trabajadores

Supervisión durante el trabajo

Ninguna preparación

No calificados

Pobre trabajo en equipo

Ningún paquete de trabajo

Fatigados

Demasiadas responsabilidades anexas

Carencia de entrenamiento previo al trabajo

Problemas de trastorno / personal

Inadecuada programación

Abuso de sustancias

Mala selección del equipo

Fig. 5: Factores comunes de causas relacionadas con la supervisión

Como resultado, el supervisor tiene poco tiempo para preparar el paquete de trabajos, proporcionar entrenamiento práctico, o realizar muchas de las otras tareas esenciales para el rendimiento consistente de la planta (y el trabajador). Si éste es el caso, citar una supervisión pobre como la causa raíz de un problema es impropio e incorrecto. Otra razón común para el fracaso en esta categoría es la falta de entrenamiento del supervisor. Pocos supervisores de primera línea han seguido un entrenamiento básico de habilidades que ellos necesitan para su posición. Los materiales presentados previamente como Prácticas y Procedimientos de Operación Pobres deberían ser incluidos en cualquier evaluación donde una pobre supervisión es una fuente potencial de problemas. Selección de los Trabajadores. La selección de trabajadores asignados a tareas o trabajos específicos es una contribución común a los problemas. Generalmente, los trabajadores son asignados a tareas según la percepción que el supervisor tenga de sus habilidades. En parte, esta es la razón por la que los niveles de habilidades no son universales en la mayoría de plantas y los supervisores intentan colocar sus mejores hombres en trabajos sensibles o críticos. El problema con este enfoque es que algunos miembros de la fuerza de trabajo llegan a estar sobrecargados, lo cual causa un desvanecimiento de las habilidades personales lo cual los inhabilita a acceder a trabajos calificados. Cuando se evalúan causas raíces potenciales que pueden caer dentro de esta categoría, refiérase a las secciones previas en problemas de entrenamiento.

48

Análisis causa raíz de la falla

Trabajo Durante la Supervisión. Muchos de los problemas debidos a esta causa resultan en una función dual que los supervisores deben realizar. Debido a otras responsabilidades, ellos no están disponibles para supervisar directamente los trabajos que se están ejecutando. Una segunda causa potencial de este problema es la carencia de habilidades o entrenamiento del supervisor. Al chequear cualquier problema potencial que pueda ser atribuido a esta categoría asegure una adecuada identificación de la causa raíz. La falta de preparación o entrenamiento del supervisor. El cruce de información de cualquiera de los problemas potenciales que pueden ser atribuidos a esta categoría para asegurar la identificación apropiada de la causa raíz.

3.4.4. Comunicaciones La falla en la comunicación es otra gran categoría que contribuye a los problemas en la planta. La figura 16 muestra las causas típicas de los problemas relacionados con la comunicación

COMUNICACIONES

Ninguna comunicación

Reorganización

Malos entendidos

Ningún método disponible

Ningún proceso está estandararizado

No hay términos estándar

Comunicaciones tardías

No es usual ningún proceso de reorganización

No es usual volver a repetir

Carencia de formato de reportes

Inadecuado proceso de reorganización

Mensajes muy largos

Medioambiente ruidoso

Fig. 16: Causas comunes de problemas en las comunicaciones

Cualquier problema que pueda ser atribuido a una o más de estas categorías debería ser información que se debe cruzar con las secciones: Procedimientos y Prácticas de Operación Pobres y Sistemas de Administración, para asegurar si la causa correcta está identificada.

49

Análisis causa raíz de la falla

3.4.5. Ingeniería humana Las deficiencias en esta categoría no son tan visibles como las de otras, pero contribuyen a muchos problemas en la planta. Estas causas, que se muestran en la figura 17, son en primer lugar el resultado del mal diseño del área de trabajo y errores en el flujo de trabajo. INGENIERÍA HUMANA

Interfase trabajador -máquina

Entorno del trabajo

Sistemas complejos

Arreglo / empleo

Limpieza general

Decisiones requeridas basadas en el conocimiento

Excesivos estiramientos e inclinaciones

Medio ambiente

Demasiados parámetros para monitoreaer

Herramientas / instrumentos

Espacios angostos

Retroalimentación inadecuada

Controles / displays

Fig. 17: Causas comunes de problemas en ingeniería humana

Interface del Trabajador - Máquina Los planos de diseño de los paneles de instrumentos, controles, estaciones de trabajo y otros equipos tienen un impacto directo en el funcionamiento de la planta. Por ejemplo cuando el diseño del área de trabajo demanda del operador giros constantes, inclinarse o doblarse; el riesgo de daño, error debido a fatiga o la perdida de la calidad final del producto aumenta sustancialmente. Un adecuado diseño del área de trabajo puede ayudar a eliminar problemas potenciales. Ambiente de Trabajo El ambiente de trabajo tiene impacto directo en la fuerza de trabajo y la confiabilidad del equipo. Una iluminación inadecuada, falta de control de temperatura y una limpieza deficiente son las formas más dominantes dentro de esta clasificación. En algunos casos un ambiente inadecuado es un síntoma más que una causa raíz. Por ejemplo, los procedimientos de supervisión o los problemas en los sistemas de administración pueden ser las causas reales. Asegúrese que la evaluación sea lo suficientemente detallada para aislar la causa raíz verdadera.

50

Análisis causa raíz de la falla

Sistemas Complejos Los sistemas de producción se están volviendo más y más complejos. Como consecuencia los niveles de preparación de los operadores y el personal de mantenimiento también deberían mejorar para lograr y mantener niveles de confiabilidad aceptables. Mientras las categorías incluidas en esta sección pueden ser percibidas como una causa raíz viable de una investigación específica, la mayoría son una combinación de la complejidad de los sistemas y otros ítems tales como entrenamiento, motivación del empleado y otros.

3.4.6. Sistema de administración La figura 18 ilustra las causas raíces más comunes de los problemas en los sistemas de administración: las políticas y procedimientos, estándares no usados y relaciones entre empleados. La mayoría de estas potenciales causas raíces concuerdan con la cultura de la planta y la filosofía de manejo. Mientras más difíciles sean aislarlas, las categorías que caigan dentro de este grupo de causas contribuyen a muchos de los problemas que serán investigados.

SISTEMAS DE GERENCIA

Políticas y procedimientos

No se usan estándares

Relaciones empleadas

Ningún estándar

No hay comunicación

Ni auditorías / ni evaluaciones

No son lo bastante estrictos

Recientemente cambiados

Carencia de una auditaría profunda

Confusos o incompletos

Ninguna exigencia

Ninguna comunicación empleada

Errores técnicos

Ningún camino para implementar

Ninguna retroalimentación empleada

Ningún esquema o impresión

Ninguna contabilidad

Fig. 18: Causas comunes de problemas en los sistemas de administración

51

Análisis causa raíz de la falla

3.4.7. Control de calidad El Control de calidad es una causa raíz primaria potencial en problemas de desviación del proceso. Mientras que estos problemas pueden contribuir a la falla de los equipos u otro tipo de problemas, sus roles predominantes están en las investigaciones relativas a la calidad y la capacidad. La figura 19 nombra las causas de control de calidad más comunes creadas por ninguna o una inspección inadecuada.

CONTROL DE CALIDAD

Ninguna inspección

Inadecuado control de calidad

No se requieren inspecciones

Instrucciones pobres

No sostienen puntos

Técnicas pobres

Sostienen puntos ignorados

Inadecuadas técnicas / habilidades

Fig. 19: Causas relativas al control de calidad

3.5.

Evaluación de acciones de correctivas potenciales

El proceso RCFA define una o más acciones correctivas que deberían resolver el incidente o evento bajo investigación. El siguiente paso en este análisis es determinar cual, si hubiera, de estas acciones correctivas debería ser implementada. La figura 20 ilustra un árbol de decisión simplificado que define múltiples acciones correctivas potenciales. Estas acciones incluyen un amplio rango de posibilidades desde no hacer nada hasta reemplazar la máquina o sistema. ¿Qué acciones correctivas deberían ser tomadas? No todas las acciones son financieramente justificables. En algunos casos, el impacto del incidente o evento es menor que el costo de la acción correctiva. En estos casos, el RCFA debería documentar el incidente para una referencia futura, pero recomendando cual acción correctiva no se llevará a cabo.

52

Análisis causa raíz de la falla

El conocimiento básico de la máquina y la guía de detección de fallas dan los lineamientos básicos necesarios para seleccionar las acciones correctivas potenciales requeridas para resolver la falla y prevenir que vuelva a ocurrir. El objetivo de esta tarea es definir una lista corta de acciones correctivas que resolverán la causa raíz de la falla. En este punto, el costo no es factor y la lista debería incluir las mejores soluciones para la causa identificada. Por ejemplo la falla de una bomba causada por cavitación puede ser corregida eliminando la entrada de aire o gas, incrementando la altura de succión neta positiva real (NPSHA), bajando la temperatura de succión de líquido o aumentando la presión de succión. Dependiendo del tipo de cavitación, una o cualquier combinación de estas acciones correctivas eliminará el problema. Sin embargo una vez que ha sido generada esta pequeña lista, debe ser considerado el costo. Cada acción correctiva potencial debería ser cuidadosamente analizada para determinar si realmente corregirá el problema. Esto es importante porque la tendencia normal en menos evaluaciones formales es para arreglar los síntomas de problemas antes la verdadera causa raíz. Además en esta fase de la evaluación debería evaluar cada acción correctiva potencial para asegurar que elimine el problema real. Sin embargo, en algunas ocasiones, corregir los síntomas o implementar una solución temporal es la única forma financieramente justificable. En aquellos casos las recomendaciones deberían definir claramente la técnica que debería ser tomada. Esta debería manifestar lo racional de la decisión y describir las limitaciones o restricciones que la corrección parcial tendrá en el funcionamiento de la planta, la confiabilidad del equipo y otros factores de la operación y el mantenimiento de la planta. A pesar de que el número de reparaciones temporales debería ser limitado tanto como sea posible, frecuentemente son inevitables. Cada esfuerzo debe hacerse para implementar acciones correctivas permanentes, y la meta es eliminar todos los factores negativos asociados con el evento o incidente. Mientras haya generalmente una acción correctiva que logre las metas, el reto es encontrar la acción más aceptable que también sea efectiva en costos.

3.6.

Reportes y recomendaciones

La siguiente prueba requerida en el RCFA es un reporte que incluya una descripción completa del incidente o evento, la identificación de las causas específicas y recomendaciones para su corrección. El reporte debería incluir la siguiente información: • • • • • • • •

Resumen del incidente. Condición inicial de la planta. Evento de inicialización. Descripción del incidente. Acciones correctivas inmediatas. Reportes externos archivados. Lecciones aprendidas. Referencias y anexos.

53

Análisis causa raíz de la falla

• • •

54

Descripción del investigador o equipo de investigación. Descripción del equipo de revisión y aprobación. Lista de distribución.

Fig.20: Árbol simplificado de decisión definiendo múltiples acciones potenciales correctivas

Análisis causa raíz de la falla

55

Análisis causa raíz de la falla

a.

Resumen de incidentes

El resumen del incidente debe ser una corta y concisa descripción del incidente o evento. No se deben resumir los hechos que tienen una contribución directa con el incidente. B.

Condición inicial de la planta

Esta sección debe incluir una breve descripción que defina el estatus de la planta al inicio del incidente. Debe incluir cualquier condición anormal que contribuya al incidente. Esta sección no debe intentar proveer un análisis cuantitativo del mismo pero debería estar limitado a una clara descripción de las condiciones límites que existieron en el momento del incidente. C.

Inicio de la investigación del evento

De una breve descripción de la falla inicial o la acción que ocasionó el incidente o que dirigió a su descubrimiento y la investigación resultante. No use en esta sección del reporte títulos o nombres de empleados específicos. En su lugar use códigos y descriptores que identifiquen funciones dentro del área afectada. D.

Descripción del incidente

Esta sección debería incluir una detallada cronología del incidente. La cronología debería ser referida al diagrama de secuencia de eventos desarrollada como parte del análisis. Este diagrama debería estar incluido como apéndice en el reporte. Esta sección debería incluir una descripción de cómo el incidente fue descubierto, los hechos que rodearon el incidente, la identificación por número de componente y el nombre de cada equipo fallado, el desempeño del sistema de seguridad, las acciones del sistema de control, las acciones e intervenciones significativas del operador, y los datos transitorios de los parámetros importantes de la planta. También debería incluirse consideraciones especiales observadas en el incidente, tales como comportamientos inexplicados e inesperados del equipo o las personas, inadecuados o degradados desempeños del equipo, significativos malos entendidos del personal de operaciones o de mantenimiento, modos de falla comunes, progresión de los eventos respecto de las condiciones de operación de diseño, violación de las especificaciones técnicas o límites de diseño, o fallas de acciones correctivas previamente recomendadas. E.

ACCIONES CORRECTIVAS INMEDIATAS

Muchas de las fallas o eventos tienen un impacto directo en la producción y requieren inmediatas acciones correctivas que minimicen el tiempo muerto. Como resultado, a menudo son requeridas acciones temporales que permitan una reanudación de la producción. Esta sección debe describir que acciones intermedias y rápidas fueron tomadas que permitieron reanudar la producción.

56

Análisis causa raíz de la falla

Causas y Acciones Correctivas de Largo Plazo Esta sección del reporte debería describir claramente la causa o causas raíces que ocasionaron el incidente. Esto debería detallar recomendaciones específicas para acciones correctivas de largo plazo. Causa raíz La descripción de la causa o causas raíces debería estar completa además de proveer suficiente detalle y data de soporte que el lector pueda entender completamente y aceptar el uso racional para aislar la causa o causas raíces. Esta sección debería incluir todos los factores de contribución, tales como el entrenamiento y la supervisión que contribuyeron con el incidente. Acciones Correctivas de Largo Plazo Recomendadas Esta sección debería proveer una clara y completa descripción de las acciones correctivas requeridas para prevenir la recurrencia del incidente o evento. Esto debería incorporar conclusiones derivadas del análisis costo beneficio desarrollado previamente. El análisis completo debería estar incluido como parte del paquete de condiciones expedidas al gerente para su aprobación. F.

Llamadas telefónicas externas efectuadas y reportes archivados

Esta sección debería documentar cualquier llamada telefónica externa efectuada así como los reportes escritos y archivados. Si el incidente involucra cuestiones de disconformidad con las normas, las llamadas telefónicas pueden haber sido efectuadas y los reportes archivados por políticas locales y por el equipo que responde la emergencia, el Centro de Respuesta Nacional de Guardacostas, La Comisión de Respuestas de Emergencias del Estado, el Comité de Planeamiento de Emergencias Locales, la oficina regional de la Agencia de Protección Medioambiental de los EE.UU., el Departamento norteamericano de Transporte, o la Agencia de Control de la Polución del Agua del estado. G.

Lección aprendida

Esta lección debería describir las lecciones aprendidas por las que debe haber pasado el personal apropiado. Esta información debería ser diseminada a través de un entrenamiento formal o algún otro medio, tal como la retroalimentación individual o lectura requerida. Esta sección debería designar a la persona (por nombre) responsable de asegurar que las lecciones aprendidas sean comunicadas, la fecha de conclusión para la comunicación, y la lista específica del personal de planta que deberían recibir las comunicaciones. H.

Referencias y anexos

Es la lista de todas las referencias y los anexos usados como parte de la investigación. Se deben incluir como apéndices: las copias o extractos de procedimientos apropiados, originales, impresiones de computadora, planos y declaraciones del personal involucrado.

57

Análisis causa raíz de la falla

I.

Descripción del equipo investigador o investigado

Esta sección debe incluir una lista y las descripciones del personal involucrado en la investigación. J.

Descripción del equipo que revisa y aprueba

Los reportes de RCFA deberían siempre ser revisados y aprobados antes de ser distribuidos al personal de planta. La cadena de aprobación variará de una planta a otra pero debería ser establecida antes de implementar un RCFA. El proceso de revisión es importante por reducir el potencial de errores o mal interpretación que es parte inherente de un proceso de investigación. K.

Distribución

Incluir una lista del personal de planta, incluyendo contratistas apropiados, que deberían recibir una lista del reporte final.

3.7.

Verificación de la acción correctiva

Una vez que la acción correctiva ha sido aprobada e implementada, la tarea final requerida para un minucioso RCFA es verificar que la acción correctiva detuvo el problema. Después que las acciones correctivas han sido implementadas, una serie de pruebas de confirmación deben conducir a asegurar una operación confiable de la máquina o aplicación corregida. Para la mayoría de maquinaria común de planta, un bien planificado análisis de vibración en tiempo real multicanal debería confirmar la acción correctiva. Una serie de mediciones de la vibración pueden ser desarrolladas e implementadas para medir las dinámicas de operación de la instalación nueva o modificada. La serie debería incluir las condiciones totales de operación del sistema, incluyendo cualquier cambio en las prácticas de operación que fueron parte de la recomendación. Los resultados de estas series de pruebas confirmaran la validez de las correcciones y proveerán la garantía que el sistema modificado opera confiablemente. EJERCICIO: Elabore el análisis causa raíz para una falla crónica que se puede presentar en las siguientes máquinas: • Bomba centrífuga accionada por un motor trifásico asíncrono de rotor en cortocircuito. • Molino de bolas accionado por un motor trifásico asíncrono de rotor en cortocircuito. • Cable subterráneo de media tensión.

58

Análisis causa raíz de la falla

4.

Mapa conceptual

ANÁLISIS CAUSA RAÍZ DE LA FALLA (RCFA)

PROPÓSITO DEL ANÁLISIS CAUSA RAÍZ DE LA FALLA

USO EFECTIVO DEL ANÁLISIS INTRODUCCIÓN AL ANÁLISIS CAUSA RAÍZ DE LA FALLA REQUERIMIENTOS DE PERSONAL

CUÁNDO USAR EL MÉTODO

ANÁLISIS DE EFECTO Y MODO DE FALLA

ANÁLISIS DEL ÁRBOL DE FALLAS TÉCNICAS GENERALES DE ANÁLISIS ANÁLISIS DE LA CAUSA Y EFECTO

ANÁLISIS DE LA SECUECIA DE EVENTOS

REPORTE DE UN INCIDENTE O PROBLEMA

CLASIFICACIÓN DE INCIDENTE METODOLOGÍA DEL ANÁLISIS CAUSA RAÍZ DE LA FALLA ACOPIO DE LA DATA

OBSERVACIONES Y MEDICIONES

MALA APLICACIÓN

PRÁCTICAS Y PROCEDIMIENTOS DE OPERACIÓN POBRE

SUPERVISIÓN

DETERMINACIÓN DE LA CAUSA DE LA RAÍZ

COMUNICACIÓNES

INGENIERÍA HUMANA

SISTEMA DE ADMINISTRACIÓN

CONTROL DE CALIDAD

EVALUACIÓN DE ACCIONES DE CORRECTIVAS POTENCIALES

REPORTES Y RECOMENDACIONES

VERIFICACIÓN DE ACCIONES CORRECTIVAS

59

Análisis causa raíz de la falla

5.

Referencias bibliográficas • Francisco J. Gonzales Fernandez (2009). Teoría y Práctica del Mantenimiento Industrial Avanzado. FC EDITORIAL. (658.202/G71). • Santiago García Garrido (2008). Organización y Gestión Integral del Mantenimiento. DIAZ DE SANTOS. (658.202/G23). • Alberto Mora Gutierrez (2009). Mantenimiento. Planeación, Ejecución y Control. (658.202/M86)

Se puede complementar el estudio de la presente unidad visitando las siguientes páginas Web: • • • • •

60

http://campuscurico.utalca.cl/~fespinos/ANALISIS%20CAUSA%20RAIZ %20%20(RCA).pdf http://www.calidad.uady.mx/resources/nosotros/presentaciones/T%C3% A9cnicas%20para%20identificar%20la%20Causa-Ra%C3%ADz.pdf http://www.mantenimientomundial.com/sites/mm/notas/causaraizaltmann .pdf http://aprendizajevirtual.pemex.com/nuevo/guias_pdf/Guia_SCO_Analisi s_Causa_Raiz.pdf http://www.iie.org.mx/boletin042012/art-inv.pdf

Análisis causa raíz de la falla

6.

Glosario de términos • Acápites: Texto breve, posterior al título, que aclara el contenido del artículo que encabeza. • Acopio: Acción y efecto de juntar, reunir en cantidad algo. • Aleatorios: Dependiente de algún suceso fortuito. • Analíticas: Perteneciente o relativo al análisis. • Analizar: Hacer análisis de algo. • Confiabilidad: Probabilidad de buen funcionamiento de algo • Crónicos: Que viene de tiempo atrás. • Data: Almacenamiento de datos. • Diagnóstico: Arte o acto de conocer la naturaleza de una avería mediante la observación de sus síntomas y signos. • Disciplina: Arte, facultad o ciencia. • Efectividad: Capacidad de lograr el efecto que se desea o se espera. • Estándares: Que sirve como tipo, modelo, norma, patrón o referencia • Eventos: Eventualidad, hecho imprevisto, o que puede acaecer. • Evidencia: Prueba determinante en un proceso. • Fluidificador: Que hace fluido algo. • Hostil: Contrario o enemigo. • Ingeniería: Estudio y aplicación, por especialistas, de las diversas ramas de la tecnología. • Interdisciplinaria: Que se realiza con la cooperación de varias disciplinas. • Interface: Separación entre dos fases. • Investigado: Hacer diligencias para descubrir algo. • Investigación: Que tiene por fin ampliar el conocimiento científico, sin perseguir, en principio, ninguna aplicación práctica. • Lesión: Daño o detrimento corporal causado por una herida, un golpe o una enfermedad. • Lógicos: Dicho de unos sucesos: Cuyos antecedentes justifican lo sucedido. • Método: Modo de decir o hacer con orden. • Mensurable: Que se puede medir. • Metodología: Conjunto de métodos que se siguen en una investigación científica. • Precisión: Determinación, exactitud, puntualidad, concisión. • Sistemático: Que sigue o se ajusta a un sistema.

61