Modelos de Supervivencia y su aplicabilidad en diferentes áreas de negocio

Desde hace varios siglos en áreas de las ciencias de la salud y demográficas se ha estudiado la forma de establecer la cantidad de tiempo que los humanos viven o no hace presencia de determinada enfermedad o eventos como cambios económicos, análisis hechos con base en las condiciones de cada individuo como lo pueden ser Sexo, Edad, Peso, Enfermedades previas, Estado Físico, tratamientos médicos y otros.  Las diversas técnicas utilizadas que permiten establecen la probabilidad ocurrencia o presencia de un fenómeno en un momento determinado del tiempo teniendo en cuenta que haya o no sucedido el evento, han generado varios modelos entre los cuales encontramos los modelos de supervivencia o modelos de duración.

La siguiente imagen muestra un ejemplo de resultado que arrojan estos modelos de sobrevivencia, en este caso % de sobrevivientes frente a una enfermedad en una cantidad de días.

Estas funciones también nos permiten comparar el comportamiento de la probabilidad de sobrevivencia ante una enfermedad para dos grupos poblacionales cada uno con tratamientos distintos.

Así pues, el análisis de la supervivencia es una técnica muy apropiada para analizar respuestas binarias en estudios longitudinales o de seguimiento que se caractericen por:

1. Duración variable del seguimiento: los estudios de seguimiento tienen fechas muy bien definidas de inicio y de cierre, pero los sujetos se incorporan al estudio en momentos diferentes.

2. Observaciones incompletas: en la fecha de cierre del estudio aún no se ha producido el evento terminal en ciertos sujetos (sujetos retirados “vivos”). Además, puede haber pérdidas (sujetos perdidos). Para realizar un estudio de supervivencia, en realidad, sólo se necesitan un par de valores: el tiempo de seguimiento del sujeto y una variable binaria que indica si es un tiempo completo o censurado.

¿Dónde puedo aplicar estos modelos en otros entornos?

Si bien la base donde se formaron estos modelos fue el área de la salud y demográfica, es posible extrapolar este tipo de entendimientos de presencialidad o ausencia de fenómenos en diferentes ámbitos como, por ejemplo:

Jurídico

Como hemos visto el análisis de supervivencia también ofrece la posibilidad de comparar el tiempo de supervivencia de dos o más poblaciones diferentes (Clark et al., 2003a). Esto es especialmente útil cuando quiere contrastarse, por ejemplo, una población que recibió un diagnóstico de riesgo de reincidencia bajo, con otra de riesgo de reincidencia alto.

La siguiente grafica muestra la función de supervivencia para el fenómeno de probabilidad de arresto para una población de individuos, que se encuentran en condiciones de vulnerabilidad a   un evento como el arresto, donde se identifica que en el rango de 15 a 30 años se presenta una probabilidad muy alta de ser arrestado.

https://journals.copmadrid.org/apj/art/apj2018a11

Educativo

Muchos estudiantes de universidad o colegios se encuentran enfrentados a distintas condiciones económicas, académicas, sociales y otras que ocasionan que no pueda continuar con sus estudios, este fenómeno se puede estudiar como la probabilidad que un estudiante no sobreviva hasta  terminar su programa académico y se gradué. Visto el problema desde esta perspectiva se puede utilizar los modelos de supervivencia para entender su comportamiento.

La siguiente grafica muestra en función de supervivencia donde podemos evidenciar que en el nivel medio de periodos de estudio se presenta un nivel alto de abandono de los estudios.

Mantenimiento de equipos

En el mantenimiento de equipos frecuentemente requiere establecer cuando un determinado componente o pieza pueda fallar con base en la cantidad de horas de funcionamiento y otras características como la marca, material, mantenimiento preventivo y otros,  teniendo en cuenta lo anterior se requiere calcular cual es la tasa de confiabilidad es decir la supervivencia de este componente o pieza ,  la siguiente grafica se puede observar un ejemplo de este comportamiento de confiabilidad.

¿Como funcionan estos modelos?

En el análisis de supervivencia existen dos funciones fundamentales, la cual primera está definida como la probabilidad que un evento de interés suceda es decir mide el riesgo de ocurrencia de un evento, esta probabilidad se conoce como tasa de riego o Harzard rate y cambia en función del tiempo usualmente se expresa como f(t) acompañando a  este manejo en función del riesgo existe una que tiene el riesgo acumulado a un momento del tiempo conocida como F(t),  la segunda función  es sobrevivencia S(t) como el completo (1-F(t)) de la primera y establece la probabilidad que el evento no sucede en t  periodos, El análisis de este  colocar imágenes de las funciones

https://www.elsevier.es/es-revista-anales-pediatria-continuada-51-articulo-metodos-estadisticos-estudios-supervivencia-S1696281809704536

también existe algo conocido como los datos censurados que son todos aquellos donde los sujetos de estudio o interés no presentan el fenómeno en el tiempo de estudio ya sea porque lo presentaron antes de iniciar el estudio o después de haberlo terminado, es importante identificar este tipo de datos para hacer un adecuado cálculo de las probabilidades que serán aplicados a nuevas poblaciones de datos.

Tipos de Modelos

Hay dos tipos de modelos de supervivencia, los llamados modelos paramétricos y los llamados semi-parametricos. Los primeros son aquellos que hacen supuestos sobre las características de la población a la que la muestra pertenece. En este caso, los supuestos son sobre el riesgo de base o “baseline hazard”, es decir, sobre el riesgo de que el evento ocurra cuando todas nuestras variables independientes sean iguales a cero. El tipo de modelo de supervivencia más común para esta categoría es el modelo de Weibull. Por otro lado, los modelos semi-parametricos no hacen ningún tipo de supuestos sobre la función de base, ya que ésta es estimada a partir de los datos. El ejemplo más famoso de esta especificación es la del modelo de Cox

La ventaja del modelo de Cox sobre sus contrapartes paramétricas es que existen test para saber si alguna variable de nuestro modelo rompe el presupuesto de proporcionalidad de los riesgos, y de esa forma podremos corregirlo generando interacciones entre estas variables y variables temporales. De esta forma, permitimos que en nuestro modelo haya dos tipos de coeficientes: coeficientes constantes en el tiempo, y coeficientes cambiantes en el tiempo. Por ejemplo, podemos imaginar que, ante un aumento brusco en la calidad de las instituciones democráticas de un país, la tasa de riesgo de implementar democracia directa se dispare y que dicho efecto de desvanezca en el lapso de cuatro o cinco años. Cuando definas tu modelo, es importante que reflexiones sobre qué variables puede asumirse que permanezcan constantes en los riesgos y cuáles no.

La recomendación dada por el Oxford Handbol para una buena implementación de modelos de supervivencia es la siguiente: (a) Primero, dada las ventajas de los modelos semi-paramétricos sobre los paramétricos, se recomienda el uso de Cox por sobre Weibull u otro modelo paramétrico. (b) Una vez que hemos definido nuestra variable dependiente (el evento), el tiempo de “nacimiento” y de “muerte” de cada observación, podemos especificar nuestro modelo. (c) Los coeficientes deben ser interpretados en tasas de riesgo (hazard rates), lo que exige exponenciar los coeficientes brutos que obtenemos en R. (d) Una vez que tenemos el modelo que creemos correcto, en función de nuestras intuiciones teóricas, es necesario testear que ninguno de los coeficientes viole el presupuesto de proporcionalidad de los riesgos. Para ello ejecutamos un test de Grambsch y Therneau, o mediante el análisis de los residuos de Schoenfeld. (e) Una vez identificados los coeficientes problemáticos, permitimos que estos interactúen con el logaritmo natural de la variable que mide la duración del evento. De esta forma, permitimos que haya coeficientes cuyo efecto se desvanece o se potencia con el tiempo. Una vez corregidos los coeficientes problemáticos, podemos si, proceder a interpretar nuestro modelo y la función de supervivencia del modelo.

¿Como puedo implementar estos Modelos?

Existen diversas formas tecnológicas de implementar este tipo de modelos, sin embargo, debe tener en cuenta que tendrá que ejecutar mínimo las siguientes etapas.

1.Identificar el fenómeno que se requiere estudiar

2.Identificar las variables que pueden influir en la presencia del fenómeno.

3.Recopilar las variables en cada uno de los periodos de análisis y para cada uno de los sujetos o entes a evaluar.

3.Establecer el nivel de significancia (el grado de incidencia) de cada una de las variables en la ocurrencia del fenómeno.

4.Realizar el entrenamiento del modelo con los datos recopilados.

5.Validar los resultados del modelo entrenado y hacer los ajustes necesarios para un mejor resultado.

Si está interesado en conocer más acerca de la implementación de estos modelos contamos con un equipo de científicos que lo asesorara…