Sensibilidad, Especificidad y Fiabilidad de la Puntuación RIPASA para el Diagnóstico de Apendicitis Aguda en relación con la Puntuación Alvarado / Cirugía Española)
Introducción
La apendicitis aguda (AA) se asocia con una morbilidad del 10% y tasas de mortalidad del 0,24-4,0% 1 y es el diagnóstico más frecuente a nivel mundial para cirujanos de emergencia, representando hasta el 20% de todas las operaciones quirúrgicas.2 Ocurre con mayor frecuencia entre la segunda y la cuarta década de vida, con un diagnóstico oportuno que es difícil y predominantemente basado en síntomas.3
El porcentaje de apendicectomías negativas (10-15%) no ha cambiado con la introducción de la ecografía y la tomografía computarizada, mientras que el porcentaje de diagnósticos erróneos en pacientes sometidos a apendicectomía laparoscópica es significativamente mayor que en la apendicectomía abierta. Se gastan mil millones de dólares cada año en apendicectomías negativas,4,5 por lo que las altas tasas de apendicectomías negativas ya no son aceptables. Con el fin de evitar retrasos en el diagnóstico, reducir el margen de error e identificar a los pacientes que requieren cirugía de emergencia o a los pacientes sin AA, la aplicación de una escala de puntuación sería muy útil. La puntuación de Alvarado sugiere, con una puntuación más alta, la probabilidad de que el paciente tenga síntomas de AA.6
Un nuevo sistema, el score de Apendicitis RajasterI Pengiran Anak Saleha (RIPASA), parece tener una mayor sensibilidad y especificidad para el diagnóstico de AA y una reducción significativa de las apendicitis negativas.7,8
El objetivo de este estudio fue aplicar ambas escalas en el servicio de urgencias en casos de pacientes con diagnóstico presunto de AA y compararlas con los informes patológicos posteriores a la apendicectomía, comparando así la eficacia, sensibilidad y especificidad de las puntuaciones de Alvarado y RIPASA en el diagnóstico de AA en un hospital terciario que atiende a la población del oriente de México.
Métodos
Se realizó un estudio observacional analítico entre el 1 de junio y el 31 de diciembre de 2016 en pacientes de ambos sexos de 18 años o más que acudieron al servicio de urgencias del Hospital de Alta Especialidad de Veracruz con sospecha diagnóstica de AA y se sometieron a apendicectomía. Se incluyeron para el estudio todos los casos tratados con apendicectomía urgente con resultados patológicos. El estudio fue aprobado por el Comité de Ética del hospital.
Instrumentos. Las 2 clasificaciones diferentes, las puntuaciones de Alvarado y RIPASA, fueron aplicadas a cada uno de los pacientes por un médico residente en cirugía, sin influir en la decisión del cirujano con respecto a la intervención quirúrgica. La puntuación de Alvarado (publicada en 1986) es una tabla de evaluación (Tabla 1), cuya suma da un máximo de 10 puntos con una mayor probabilidad de que el paciente tenga AA.6 Se afirma que la puntuación RIPASA (publicada en 2010) tiene una mayor sensibilidad y especificidad.7
Variables en las Escalas Alvarado y RIPASA y Sus Valores.
Alvarado Score | RIPASA Puntuación | ||
---|---|---|---|
Variable | Valor | Variable | Valor |
Dolor en el RIF | 2 | Macho | 1 |
Blumberg Positivo | 1 | Femenino | 0.5 |
el Dolor de la migración | 1 | Menores de 40 | 1 |
Náuseas o vómitos | 1 | Mayores de 40 | 0.5 |
la Anorexia | 1 | Extranjero | 1 |
Temperatura de más de 38°C | 1 | Dolor en el RIF | 0.5 |
Leucocitosis superior a la 10000 | 2 | Náuseas o vómitos | 1 |
Neutrofilia mayor que 70% | 1 | el Dolor de la migración | 0.5 |
la Anorexia | 1 | ||
los Síntomas de la h | 1 | ||
Síntomas >48h | 0.5 | ||
Hipersensibilidad en el RIF | 1 | ||
Cuidando | 2 | ||
Positivo signo de rebote | 1 | ||
Positivo el signo de Rovsing | 2 | ||
Fiebre >37°C a °C | 1 | ||
Leucocitosis | 1 | ||
Prueba de orina negativa | 1 |
Fosa ilíaca derecha.
El sistema Alvarado incluye 3 síntomas, 3 signos físicos y 2 parámetros de laboratorio; a cada variable se le asigna un valor de 1 o 2 puntos. El resultado consiste en la suma de los valores, con una puntuación máxima de 10. Cuanto mayor sea la puntuación obtenida, mayor será la probabilidad de que el paciente tenga AA. Una vez establecido el puntaje, el diagnóstico de apendicitis se clasifica como dudoso con menos de 5 puntos, sugestivo de 5 a 6 puntos, probable de 7 a 8 puntos y muy probable de 9 a 10 puntos. El sistema RIPASA tiene 18 variables divididas en 4 grupos (datos, signos, síntomas y estudios de laboratorio) que les dan un valor de 0,5 a 2, con una puntuación máxima de 16 y, según la puntuación, la probabilidad de diagnóstico es: menos de 5 puntos (improbable), 5-7 puntos (baja probabilidad), 7,5–11,5 puntos (alta probabilidad) y mayor de 12 puntos (diagnóstico de apendicitis).
Independientemente de las puntuaciones de Alvarado y RIPASA para cada paciente con sospecha de AA, el cirujano responsable solicitó estudios complementarios según el caso. En todos los pacientes se solicitó análisis completo y análisis de orina; en 21 pacientes se solicitó ecografía abdominal, además de radiografías abdominales, y en 66 pacientes solo se solicitaron radiografías abdominales, ya que el diagnóstico probable de AA fue básicamente clínico, así como la decisión de realizar la intervención quirúrgica. Cabe mencionar que la tomografía axial no es un estudio que se solicite de forma rutinaria en nuestro hospital en casos de sospecha de AA.
Se registraron los hallazgos intraoperatorios de cada uno de los pacientes y se confirmó el diagnóstico de AA con el estudio patológico del apéndice extirpado. Después del alta, los pacientes fueron seguidos en el ambulatorio durante al menos 30 días.
Análisis estadístico
Se realizó un análisis estadístico descriptivo de los datos demográficos de la población, así como el análisis de pruebas diagnósticas, utilizando el informe patológico como estándar de oro (sensibilidad, especificidad , valor predictivo positivo, valor predictivo negativo ). Con estos datos, se generaron curvas ROC para comparar ambos puntajes.
Después, se calculó la razón de verosimilitud. El LR es un buen parámetro para decidir cuándo se debe realizar una prueba diagnóstica. El RL se calcula dividiendo la probabilidad de obtener un resultado positivo cuando el sujeto está enfermo por la probabilidad de obtener el mismo resultado cuando está sano, es decir, la sensibilidad dividida por 1 especificidad. Cuanto más lejos de 1, mejor es la prueba para diferenciar entre sujetos enfermos y sanos. Por ejemplo, si una RL es 5 (o 5 a 1), el resultado de la prueba se producirá 5 veces en aquellos en los que la enfermedad está presente, por cada vez que ocurra en aquellos sujetos en los que la enfermedad está ausente (RL+ siempre será mayor que 1 y RL− será menor que 1).
LR + indica en qué punto es más probable que un individuo sea positivo en la realidad (cuando la prueba dice que es positivo). Por el contrario, LR: indica en qué momento es más probable que una persona sea negativa en realidad cuando la prueba es positiva.
En el manejo de los datos se mantuvo la confidencialidad y se respetó el anonimato de los pacientes. Uno de los investigadores fue responsable de codificar los datos de los pacientes, utilizando números en lugar de nombres.
Resultados
Durante el período de reclutamiento, de los 218 pacientes tratados en un año, se incluyó en este estudio a un total de 100 pacientes (46%); 42 eran mujeres y 58 hombres, con una relación hombre:mujer de 1,7:1 (Tabla 2). La edad media de los pacientes fue de 36,5±16,2 años (intervalo 18-81 años). La distribución de los casos de AA fue similar a la de otros informes, afectando predominantemente a los pacientes entre la segunda y la cuarta década de vida.
Distribución de las Variables de los Pacientes Incluidos.
No. | % | La Media De | ||
---|---|---|---|---|
Género | ||||
Las Hembras | 42 | 42% | ||
Los Machos | 58 | 58% | ||
Edad | Gama 18-81 años | 100 | 100% | 36.5±16.2 años |
IMC | Rango de 17 a 36 kg/m2 | 100 | 100% | 25.3±3.8 kg/m2 |
Comorbiditiesa | ||||
El exceso de peso y la obesidad | 65 | 76.5% | ||
DM Tipo 2 | 7 | 8.7% | ||
HTN | 4 | 50% | ||
Tipo 2 DM + HTA | 6 | 7.5% | ||
Otros | 3 | 3.8% | ||
Totala | 80 | 100% | ||
Antes de la administración de | ||||
la Analgesia | 47 | 67.2% | ||
los Antibióticos | 1 | 1.4% | ||
la Analgesia+antibióticos | 22 | 31.4% | ||
Total | 70 | 100% |
El índice de masa corporal se calcula dividiendo el peso en kilos por el cuadrado de la altura en metros. El sobrepeso / obesidad se definió por una acumulación anormal / excesiva de grasa. Las definiciones de la OMS: IMC igual o superior a 25 es sobrepeso; IMC igual o superior a 30 es obesidad.
DM: diabetes mellitus; HTA: hipertensión; IMC: índice de masa corporal.
Más de un paciente presentó más de una comorbilidad.
El índice de masa corporal medio fue de 25,3±3,8 kg/m2 (intervalo de 17 a 36 kg/m2). Del total, 70 pacientes recibieron tratamiento médico previo, 65 (92,9%) prescritos por un médico y 5 (7,1%) automedicación; 47 (67,2%) de estos pacientes recibieron solo analgesia, 22 (31,4%) pacientes recibieron analgesia más antibióticos y un paciente (1,4%) solo antibióticos.
El dolor y la hipersensibilidad en la fosa ilíaca derecha ocurrieron en el 100% de los pacientes, seguidos de leucocitosis en el 91%, dolor por descompresión brusca en el 90%, neutrofilia en el 90%, protección en el 82%, prueba de orina negativa en el 80%, aumento de la temperatura corporal en el 75%, anorexia en el 73%, náuseas y vómitos en el 62% y migración del dolor en el 44%.
el 80% de todos los pacientes presentaron una o varias comorbilidades, la más frecuente de las cuales fue el exceso de peso en 48 pacientes y la obesidad en 17 pacientes (65 pacientes, 76.5%); 7 (8.7%) los pacientes también tenían diabetes mellitus tipo 2; 4 (5%) pacientes presentaron hipertensión; 6 (7,5%) presentaron ambas; y 3 (3,8%) pacientes presentaron otras comorbilidades.
El tiempo promedio entre el inicio de los síntomas y la primera evaluación médica fue de 45,5±35h (rango 8–144h). El tiempo promedio transcurrido desde la evaluación inicial por el cirujano hasta la resolución quirúrgica fue de 8,5±4,0 h (rango 2–48h). En cuanto a la operación, todas las apendicectomías fueron cirugías abiertas; en 69 se utilizó la incisión tipo McBurney, mientras que en 31 se realizó una laparotomía de línea media. Se observó apendicitis edematosa en 2 casos, apendicitis flemmonosa en 30 pacientes, apendicitis necrótica en 21 y apendicitis perforada en 33 casos.
Se produjeron complicaciones postoperatorias en 8 pacientes (4 seromas, 2 infecciones del sitio quirúrgico y 2 abscesos residuales). Se definió absceso residual como la presencia de acumulaciones purulentas intraabdominales tras el tratamiento quirúrgico de AA.
La tasa de apendicectomías negativas (apéndice histológicamente normal) fue del 14%. No hubo muertes durante el presente estudio. La estancia hospitalaria promedio fue de 3,5±1.8 días (intervalo de 1 a 21 días).
Al aplicar los sistemas de clasificación a los pacientes del estudio, encontramos que la puntuación RIPASA mostró mayor certeza diagnóstica en comparación con la puntuación de Alvarado, con una sensibilidad del 98,8%, especificidad del 71,4%, VPP del 95,5% y VPN del 90,9% frente a sensibilidad del 90,7%, especificidad del 64,3%, VPP del 94,1% y VPN del 60%, respectivamente (Tabla 3). La puntuación RIPASA mostró un área bajo la curva (AUC) de 0,88 en comparación con la puntuación de Alvarado, que es de 0,80 (Fig. 1).
2×2 Tabla De Contingencia Donde Se Obtuvieron los Resultados.
RIPASA Puntuación | |||
---|---|---|---|
Patología Resultado | los Pacientes (+) | Saludables (–) | > Total |
Negativo | 1 | 10 | 11 |
Positivo | 85 | 4 | 89 |
Total | 86 | 14 | 100 |
FN 1 | TN 10 | ||
TP 85 | FP 4 |
Alvarado Score | |||
---|---|---|---|
Pathology Result | Patients (+) | Healthy (–) | Total |
Negative | 6 | 9 | 15 |
Positive | 80 | 5 | 85 |
Total | 86 | 14 | 100 |
FN 6 | TN 9 | ||
TP 80 | FP 5 |
rip «página de Partitura» | |||
---|---|---|---|
Sensibilidad | Especificidad | PPV | VPN |
0.99 | 0.71 | 0.96 | 0.91 |
Alvarado Puntuación | |||
---|---|---|---|
Sensibilidad | Especificidad | PPV | VPN |
0.91 | 0.64 | 0.94 | 0.60 |
FN: falso negativo; FP: falso positivo; TN: verdadero negativo; TP: verdadero positivo; VPN: valor predictivo negativo; VPP: valor predictivo positivo.
Curvas ROC obtenidas calculando los resultados de ambas puntuaciones.
Posteriormente, se calculó el LR para nuestros resultados y para cada uno de los anteriores informes similares (Tabla 4). En el caso de nuestro estudio, el positivo LR fue de 3,5 y el negativo LR 0,02 para la RIPASA puntuación, en comparación con el LR positivo de 2,5 y la LR negativo de 0,2 para el Alvarado puntuación. La RL positiva media de todos los estudios incluidos en la Tabla 4 para la puntuación de Alvarado se calculó en 3,6 (rango 2,0-6,5) y fue ligeramente superior para la puntuación de RIPASA en 3,7 (con un rango mucho más amplio: 1,2–10,1); la especificidad media fue del 77,8% (64.3%-90%) para la escala de Alvarado y 63,3% (36% -90,5%) con un rango más amplio para RIPASA; la sensibilidad promedio fue de 67,1% (52% -90,7%) vs 90,7% (75% -98,8%) para las puntuaciones de Alvarado y RIPASA, respectivamente.
Comparación de la Sensibilidad y Especificidad del Score de Alvarado y el Score de RIPASA en Diferentes Publicaciones.
Alvarado Score | RIPASA Puntuación | |||||||
---|---|---|---|---|---|---|---|---|
Sensibilidad | Especificidad | LR+ | LR− | Especificidad |
LR+ |
LR− |
|
|
Chong et al., 20118 | 68.3% | 87.9% | 5.6 | 0.4 | 98% | 81.3% | 5.2 | 0.03 |
Alnjadat et al., 20139 | 73.7% | 68.6% | 2.3 | 0.4 | 93.2% | 61.8% | 2.4 | 0.1 |
Wessex et al., 201410 | 58.9% | 85.7% | 4.1 | 0.5 | 96.2% | 90.5% | 10.1 | 0.04 |
Repplinger et al., 201411 | 52% | 74% | 2.0 | 0.6 | 75% | 37% | 1.2 | 0.7 |
la mente et al., 201612 | 65.2% | 90% | 6.5 | 0.4 | 95.5% | 65% | 2.7 | 0.07 |
Golden et al., 201613 | 61% | 74% | 2.2 | 0.6 | 78% | 36% | 1.3 | 0.5 |
Este estudio | 90.7% | 64.3% | 2.5 | 0.2 | 98.8% | 71.4% | 3.5 | 0.02 |
los Promedios | 67.1% | 77.8% | 3.6 | 0.4 | 90.7% | 63.3% | 3.7 | 0.2 |
LR(+): razón de verosimilitud positiva; LR(−): cociente de probabilidad negativo.
Comparamos los resultados de sensibilidad de ambas clasificaciones entre pacientes con apendicitis; asimismo, comparamos los resultados en términos de especificidad entre pacientes sin apendicitis (prueba de McNemar para datos emparejados). Las diferencias observadas entre ambos puntajes no fueron estadísticamente significativas. Se compararon los valores de AUC (de ambas curvas ROC) y la diferencia no fue estadísticamente significativa (técnica de DeLong, software Med Cal).
Discusión
El objetivo de nuestro estudio fue comparar la capacidad de dos sistemas de puntuación clínica, las puntuaciones Alvarado y RIPASA, para diagnosticar o descartar apendicitis, ya que la tomografía computarizada, la ecografía y la laparoscopia no han sido capaces de reducir el porcentaje de error diagnóstico.14
Se ha propuesto que la tasa de apendicectomías negativas no debe superar el 15%, y al mismo tiempo se debe reducir la incidencia de perforación.14 Con el fin de aumentar la certeza diagnóstica y, en consecuencia, reducir el porcentaje de apendicectomías negativas, se han desarrollado estos sistemas de puntuación clínica. Nuestra investigación evaluó la utilidad de tales escalas en la población de la región oriental del país, y se encontró una mayor sensibilidad y especificidad con la puntuación RIPASA. Se generaron curvas ROC (Fig. 1), demostrando un mayor AUC para el score de RIPASA en comparación con el score de Alvarado; esto representa una mejor sensibilidad/especificidad para la escala de RIPASA.
En el estudio de Golden et al. en los Estados Unidos, el AUC reportado se invirtió: 0,67 para la puntuación RIPASA y 0,72 para la puntuación Alvarado.13 Esto puede deberse a la población estudiada, ya que se ha reportado que la escala RIPASA fue diseñada inicialmente para la población asiática porque la escala de Alvarado no demostró confiabilidad diagnóstica en esa población.7
En cuanto a sensibilidad y especificidad, Velázquez et al. relataron que utilizaron la puntuación de Alvarado en 113 pacientes, observando una sensibilidad del 99% y una especificidad del 62%, lo que es similar a nuestros datos.15 Cedillo y otros se observó en 99 pacientes una mayor especificidad de la puntuación de Alvarado (57%) en comparación con la tomografía computarizada o la ecografía en las primeras 24 h después del inicio.16
En los estudios que compararon ambos sistemas (Tabla 4), Chong et al. se reportó para la puntuación RIPASA una sensibilidad del 98% y una especificidad de 81.3%, mientras que para el puntaje de Alvarado observaron una sensibilidad de 68,3% y una especificidad de 87,9%.8 Alnjadat y Abdallah mostraron una sensibilidad de 93,2% y especificidad de 61,8% para RIPASA, y una sensibilidad de 73,7% con especificidad de 68,6% para Alvarado.9 Dos estudios adicionales11, 13 reportaron la especificidad más baja encontrada para la escala RIPASA. Del mismo modo, Sinnet et al.12 demostraron una especificidad de 65% para RIPASA, que fue menor que la especificidad de 90% para Alvarado.
En contraste, Nanjundaiah et al. se reportó una sensibilidad y especificidad para RIPASA del 96,2% y 90%.5%, y para Alvarado de 58.9% y 85.7%, respectivamente.10 Finalmente, el estudio no comparativo de Butt et al.17 observaron una especificidad del 93% y una sensibilidad del 96,7% (LR+ 13,8 y LR− 0,04) para la puntuación RIPASA. Estos estudios8 – 13 muestran que, en términos generales, las puntuaciones RIPASA y Alvarado son relativamente sensibles y específicas para el diagnóstico de AA. Algunos autores también han demostrado su ventaja sobre los estudios de imagen,16 aunque esto no ha sido confirmado por otros.13 La especificidad de RIPASA, como en el artículo de Nanjundaiah et al.,10 fue superior a Alvarado en nuestro hospital (Tabla 4). La variabilidad de las cifras observadas entre los estudios también puede ser secundaria a un efecto de la población de la que se extrajo la muestra.
Asimismo, determinamos que el punto de corte para la puntuación de Alvarado puede ser tan bajo como 6,5 (recomendado entre 7 y 7,510) y 9,25 para la puntuación de RIPASA utilizando curvas ROC, ya que este punto de corte obtiene un equilibrio entre especificidad y sensibilidad.
Luego nos acercamos a la tarea de calcular el RL positivo para cada informe comparativo (Tabla 4), y el promedio de estos estudios fue ligeramente superior (3,7 vs 3,6) para la escala RIPASA.
La tasa de apendicectomías negativas reportadas en nuestro estudio fue del 14%, similar a lo reportado en la literatura internacional.14,18,19 Se ha informado que el uso de estas clasificaciones tiene un efecto en el porcentaje de apendicectomías negativas, y en el estudio de Chong et al., estos autores lograron reducir la tasa a solo 6,9%.8 Aunque el 70% de los pacientes llegaron a nuestro hospital con medicación previa (analgesia y antibióticos), esto no redujo la eficacia diagnóstica de los sistemas de puntuación.
A pesar de que el 80% de nuestros pacientes tenían una o varias comorbilidades, solo el 8% de los pacientes presentaron complicaciones quirúrgicas. El tiempo promedio entre el inicio de los síntomas y la primera evaluación médica fue de 45,5 h. Los médicos generales deben estar capacitados en el uso de estas escalas para evitar retrasos en el diagnóstico.
En conclusión, la puntuación RIPASA presenta mayor precisión y confiabilidad como prueba diagnóstica en comparación con la puntuación de Alvarado y es útil para tomar decisiones terapéuticas adecuadas. En hospitales como el nuestro, el diagnóstico de AA depende en gran medida de la evaluación clínica realizada por los cirujanos. Un sistema de puntuación clínica adecuado evitaría errores diagnósticos, manteniendo una tasa baja satisfactoria de apendicectomías negativas mediante una estratificación adecuada del paciente, al tiempo que limitaría la exposición del paciente a la radiación ionizante, ya que hay un mayor riesgo de desarrollar cáncer con tomografía computarizada, particularmente para el grupo de edad pediátrica.13,20
Conflicto de intereses
Los autores no tienen ningún conflicto de intereses que declarar relacionado con esta investigación.