Sensibilité, Spécificité et Fiabilité du Score RIPASA pour le Diagnostic de l’Appendicite Aiguë par rapport au Score Alvarado | Cirugía Española (Édition Anglaise)

Introduction

L’appendicite aiguë (AA) est associée à une morbidité de 10% et à des taux de mortalité de 0,24 % à 4,0%1 et constitue le diagnostic le plus fréquent au monde pour les chirurgiens urgentistes, représentant jusqu’à 20% de toutes les opérations chirurgicales.2 Elle survient le plus souvent entre la deuxième et la quatrième décennie de la vie, avec un diagnostic rapide difficile et principalement basé sur les symptômes.3

Le pourcentage d’appendicectomies négatives (10% -15%) n’a pas changé avec l’introduction de l’échographie et de la tomodensitométrie, tandis que le pourcentage d’erreurs de diagnostic chez les patients subissant une appendicectomie laparoscopique est significativement plus élevé que dans l’appendicectomie ouverte. Un milliard de dollars sont dépensés chaque année en appendicectomies négatives, 4, 5 de sorte que des taux élevés d’appendicectomies négatives ne sont plus acceptables. Afin d’éviter un diagnostic retardé, de réduire la marge d’erreur et d’identifier les patients nécessitant une intervention chirurgicale d’urgence ou les patients sans AA, l’application d’une échelle de notation serait très utile. Le score Alvarado suggère, avec un score plus élevé, la probabilité que le patient présente des symptômes AA.6

Un nouveau système, le score d’appendicite de Raja Isteri Pengiran Anak Saleha (RIPASA), semble avoir une sensibilité et une spécificité plus grandes pour le diagnostic des AA et une réduction significative des appendicectomies négatives.7,8

Le but de cette étude était d’appliquer les deux échelles au service des urgences dans les cas de patients présentant un diagnostic présumé d’AA et de les comparer avec les rapports de pathologie après appendicectomie, comparant ainsi l’efficacité, la sensibilité et la spécificité des scores Alvarado et RIPASA dans le diagnostic d’AA dans un hôpital tertiaire desservant la population de l’est du Mexique.

Méthodes

Une étude analytique et observationnelle a été menée entre le 1er juin et le 31 décembre 2016 chez des patients des deux sexes âgés de 18 ans ou plus qui se sont présentés au service des urgences de l’Hôpital de Alta Especialidad de Veracruz avec un diagnostic suspect d’AA et ont subi une appendicectomie. Tous les cas traités avec une appendicectomie urgente ayant des résultats pathologiques ont été inclus dans l’étude. L’étude a été approuvée par le Comité d’éthique de l’hôpital.

Instruments. Les 2 classifications différentes, les scores Alvarado et RIPASA, ont été appliquées à chacun des patients par un médecin résident en chirurgie, sans influencer la décision du chirurgien concernant l’intervention chirurgicale. Le score Alvarado (publié en 1986) est un tableau d’évaluation (tableau 1), dont la somme donne un maximum de 10 points avec une probabilité plus élevée que le patient ait un AA.6 Le score RIPASA (publié en 2010) est censé avoir une sensibilité et une spécificité plus grandes.7

Tableau 1.

Variables dans les échelles Alvarado et RIPASA et leurs Valeurs.

Score d’Alvarado Score de RIPASA
Variable Valeur Variable Valeur
Douleur dans le RIF 2 Homme 1
Blumberg Positif 1 Femelle 0.5
Migration de la douleur 1 Plus jeune que 40 1
Nausées ou vomissements 1 Plus vieux que 40 0.5
Anorexie 1 Étranger 1
Température supérieure à 38°C 1 Douleur dans le RIF 0.5
Leucocytose supérieure à 10000 2 Nausées ou vomissements 1
Neutrophilie supérieure à 70% 1 Migration de la douleur 0.5
Anorexie 1
Symptômes h 1
Symptômes > 48h 0.5
Hypersensibilité dans le FRR 1
Garde 2
Signe de rebond positif 1
Signe positif de Rovsing 2
Fièvre > 37 ° C à ° C 1
Leucocytose 1
Test d’urine négatif 1

RIF : fosse iliaque droite.

Le système Alvarado comprend 3 symptômes, 3 signes physiques et 2 paramètres de laboratoire; chaque variable se voit attribuer une valeur de 1 ou 2 points. Le résultat se compose de la somme des valeurs, avec un score maximum de 10. Plus le score obtenu est élevé, plus la probabilité que le patient ait un AA est grande. Une fois le score établi, le diagnostic d’appendicite est classé comme douteux avec moins de 5 points, suggestif de 5 à 6 points, probable de 7 à 8 points et très probable de 9 à 10 points. Le système RIPASA comporte 18 variables divisées en 4 groupes (données, signes, symptômes et études de laboratoire) leur donnant une valeur de 0,5 à 2, avec un score maximum de 16 et, selon le score, la probabilité de diagnostic est: inférieure à 5 points (peu probable), 5-7 points (faible probabilité), 7,5–11,5 points (forte probabilité) et supérieure à 12 points (diagnostic d’appendicite).

Quels que soient les scores Alvarado et RIPASA pour chaque patient suspecté d’AA, le chirurgien responsable a demandé des études complémentaires en fonction du cas. Chez tous les patients, une analyse complète et une analyse d’urine ont été demandées; une échographie abdominale a été demandée chez 21 patients, en plus des radiographies abdominales, et chez 66 patients, seules des radiographies abdominales ont été demandées, car le diagnostic probable d’AA était essentiellement clinique, tout comme la décision de procéder à l’intervention chirurgicale. Il convient de mentionner que la tomographie axiale n’est pas une étude qui est régulièrement demandée à notre hôpital en cas de suspicion d’AA.

Les résultats peropératoires pour chacun des patients ont été enregistrés et le diagnostic d’AA a été confirmé par l’étude pathologique de l’appendice excisé. Après la sortie des patients, ils ont été suivis en ambulatoire pendant au moins 30 jours.

Analyse statistique

Une analyse statistique descriptive des données démographiques de la population a été réalisée, ainsi que l’analyse des tests diagnostiques, en utilisant le rapport de pathologie comme étalon-or (sensibilité, spécificité, valeur prédictive positive, valeur prédictive négative). Avec ces données, des courbes ROC ont été générées pour comparer les deux scores.

Ensuite, nous avons calculé le rapport de vraisemblance. Le LR est un bon paramètre pour décider quand un test de diagnostic doit être effectué. Le LR est calculé en divisant la probabilité d’obtenir un résultat positif lorsque le sujet est malade par la probabilité d’obtenir le même résultat lorsqu’il est en bonne santé; en d’autres termes, la sensibilité divisée par 1 − spécificité. Plus on s’éloigne de 1, mieux le test permet de différencier les sujets malades des sujets sains. Par exemple, si un LR est de 5 (ou de 5 à 1), le résultat du test se produira 5 fois chez ceux chez lesquels la maladie est présente, pour chaque fois qu’il survient chez les sujets chez lesquels la maladie est absente (LR + sera toujours supérieur à 1 et LR − sera inférieur à 1).

LR+ indique à quel moment un individu est plus susceptible d’être positif dans la réalité (lorsque le test indique qu’il est positif). En revanche, LR – indique à quel moment une personne est plus susceptible d’être négative en réalité lorsque le test est positif.

Dans le traitement des données, la confidentialité a été maintenue et l’anonymat des patients a été respecté. L’un des chercheurs était responsable du codage des données des patients, en utilisant des chiffres au lieu de noms.

Résultats

Au cours de la période de recrutement, sur les 218 patients traités en un an, un total de 100 patients ont été inclus dans cette étude (46%); 42 étaient des femmes et 58 des hommes, avec un ratio hommes / femmes de 1,7: 1 (tableau 2). L’âge moyen du patient était de 36,5 ±16,2 ans (entre 18 et 81 ans). La distribution des cas d’AA était similaire à celle d’autres rapports, affectant principalement les patients entre la deuxième et la quatrième décennies de vie.

Tableau 2.

Distribution des Variables des Patients Inclus.

Non. % Moyenne
Sexe
Femmes 42 42%
Hommes 58 58%
Âge Tranche d’âge 18-81 ans 100 100% 36.5±16.2 ans
IMC Plage de 17 à 36 kg/ m2 100 100% 25.3±3.8 l/m2
Comorbiditésa
Excès de poids et obésité 65 76.5%
Type 2 DM 7 8.7%
HT 4 50%
Type 2 DM + HTN 6 7.5%
Autres 3 3.8%
Totala 80 100%
Gestion antérieure
Analgésie 47 67.2%
Antibiotiques 1 1.4%
Analgésie + antibiotiques 22 31.4%
Total 70 100%

L’indice de masse corporelle est calculé en divisant le poids en kilos par la taille au carré en mètres. Le surpoids / obésité était défini par une accumulation anormale / excessive de graisse. Les définitions de l’OMS: Un IMC égal ou supérieur à 25 est en surpoids; un IMC égal ou supérieur à 30 est obèse.

DM: diabète sucré; HTN: hypertension; IMC: indice de masse corporelle.

a

Plus d’un patient a présenté plus d’une comorbidité.

L’indice de masse corporelle moyen était de 25,3 ± 3,8 kg / m2 (plage de 17 à 36 kg/m2). Sur le total, 70 patients ont reçu une prise en charge médicale préalable, 65 (92,9%) prescrits par un médecin et 5 (7,1%) d’automédication; 47 (67,2%) de ces patients n’ont reçu qu’une analgésie, 22 (31,4%) patients ont reçu une analgésie plus des antibiotiques et un patient (1,4%) seulement un antibiotique.

Des douleurs et une hypersensibilité dans la fosse iliaque droite sont survenues chez 100% des patients, suivies d’une leucocytose chez 91%, d’une douleur lors d’une décompression brutale chez 90%, d’une neutrophilie chez 90%, d’une garde chez 82%, d’un test urinaire négatif chez 80%, d’une augmentation de la température corporelle chez 75%, d’une anorexie chez 73%, de nausées et de vomissements chez 62% et d’une migration de la douleur chez 44%.

80% de tous les patients présentaient une ou plusieurs comorbidités, dont la plus fréquente était l’excès de poids chez 48 patients et l’obésité chez 17 patients (65 patients, 76.5%); 7 (8.7%) les patients avaient également un diabète sucré de type 2; 4 (5%) patients présentaient une hypertension artérielle; 6 (7,5%) présentaient les deux; et 3 (3,8 %) patients présentaient d’autres comorbidités.

Le délai moyen entre l’apparition des symptômes et la première évaluation médicale était de 45,5 ±35h (plage de 8 à 144h). Le temps moyen qui s’est écoulé entre l’évaluation initiale par le chirurgien et la résolution chirurgicale était de 8,5 ± 4,0 h (plage de 2 à 48 h). En ce qui concerne l’opération, toutes les appendicectomies étaient des chirurgies ouvertes; dans 69 cas, l’incision de type McBurney a été utilisée, tandis que 31 ont été réalisées avec une laparotomie de la ligne médiane. Une appendicite œdémateuse a été observée dans 2 cas, une appendicite phlegmoneuse chez 30 patients, une appendicite nécrotique chez 21 et une appendicite perforée dans 33 cas.

Des complications postopératoires sont survenues chez 8 patients (4 séromes, 2 infections du site chirurgical et 2 abcès résiduels). Nous avons défini l’abcès résiduel comme la présence de collections purulentes intra-abdominales après le traitement chirurgical des AA.

Le taux d’appendicectomies négatives (appendice histologiquement normal) était de 14%. Il n’y a pas eu de décès au cours de la présente étude. Le séjour moyen à l’hôpital était de 3,5 ±1.8 jours (plage de 1 à 21 jours).

En appliquant les systèmes de classement aux patients de l’étude, nous avons constaté que le score RIPASA montrait une plus grande certitude diagnostique par rapport au score Alvarado, avec une sensibilité de 98,8%, une spécificité de 71,4%, un PPV de 95,5% et un NPV de 90,9% vs une sensibilité de 90,7%, une spécificité de 64,3%, un PPV de 94,1% et un NPV de 60%, respectivement (tableau 3). Le score RIPASA a montré une aire sous la courbe (ASC) de 0,88 par rapport au score Alvarado, qui est de 0,80 (Fig. 1).

Tableau 3.

2×2 Tableau De Contingence Où les Résultats Ont Été Obtenus.

Score de RIPASA
Résultat de la pathologie Patients (+) En bonne santé (–) Total
Négatif 1 10 11
Positif 85 4 89
Total 86 14 100
FN 1 TN 10
TP 85 FP 4
Alvarado Score
Pathology Result Patients (+) Healthy (–) Total
Negative 6 9 15
Positive 80 5 85
Total 86 14 100
FN 6 TN 9
TP 80 PF 5
score de la page d’extraction
Sensibilité Spécificité PPV NPV
0.99 0.71 0.96 0.91
Score d’Alvarado
Sensibilité Spécificité PPV NPV
0.91 0.64 0.94 0.60

FN: faux négatif; FP: faux positif; TN: vrai négatif; TP: vrai positif; NPV: valeur prédictive négative; PPV: valeur prédictive positive.

 Courbes ROC obtenues en calculant les résultats des deux scores.
Fig. 1.

Courbes ROC obtenues en calculant les résultats des deux scores.

(0.12 MB).

Plus tard, nous avons calculé le LR pour nos résultats et pour chacun des rapports similaires précédents (tableau 4). Dans le cas de notre étude, le LR positif était de 3,5 et le LR négatif de 0,02 pour le score RIPASA, contre le LR positif de 2,5 et le LR négatif de 0,2 pour le score Alvarado. La LR positive moyenne de toutes les études incluses dans le tableau 4 pour le score Alvarado a été calculée à 3,6 (plage de 2,0 à 6,5) et était légèrement plus élevée pour le score RIPASA à 3,7 (avec une plage beaucoup plus large: 1,2 à 10,1); la spécificité moyenne était de 77,8% (64.3% -90%) pour l’échelle d’Alvarado et 63,3% (36% -90,5%) avec une plage plus large pour RIPASA; la sensibilité moyenne était de 67,1% (52% -90,7%) contre 90,7% (75% -98,8%) pour les scores d’Alvarado et de RIPASA, respectivement.

Tableau 4.

Comparaison de la Sensibilité et de la Spécificité du Score Alvarado et du Score RIPASA dans différentes Publications.

Score d’Alvarado Score de RIPASA
Sensibilité Spécificité LR+ LR- Sensibilité Spécificité LR + LR−
Chong et coll., 20118 68.3% 87.9% 5.6 0.4 98% 81.3% 5.2 0.03
Alnjadat et al., 20139 73.7% 68.6% 2.3 0.4 93.2% 61.8% 2.4 0.1
Wessex et coll., 201410 58.9% 85.7% 4.1 0.5 96.2% 90.5% 10.1 0.04
Repplinger et coll., 201411 52% 74% 2.0 0.6 75% 37% 1.2 0.7
l’esprit et al., 201612 65.2% 90% 6.5 0.4 95.5% 65% 2.7 0.07
Golden et coll., 201613 61% 74% 2.2 0.6 78% 36% 1.3 0.5
Cette étude 90.7% 64.3% 2.5 0.2 98.8% 71.4% 3.5 0.02
Moyennes 67.1% 77.8% 3.6 0.4 90.7% 63.3% 3.7 0.2

LR(+) : rapport de vraisemblance positif; LR(−) : rapport de vraisemblance négatif.

Nous avons comparé les résultats de sensibilité des deux classifications entre patients atteints d’appendicite; de même, chez les patients sans appendicite, nous avons comparé les résultats en termes de spécificité (test de McNemar pour les données appariées). Les différences observées entre les deux scores n’étaient pas statistiquement significatives. Les valeurs de l’ASC (des deux courbes ROC) ont été comparées, et la différence n’était pas statistiquement significative (technique DeLong, logiciel Med Cal).

Discussion

Le but de notre étude était de comparer la capacité de deux systèmes de notation clinique, les scores Alvarado et RIPASA, à diagnostiquer ou à exclure une appendicite car la tomodensitométrie, l’échographie et la laparoscopie n’ont pas permis de réduire le pourcentage d’erreur diagnostique.14

Il a été proposé que le taux d’appendicectomies négatives ne dépasse pas 15%, tout en réduisant l’incidence de la perforation.14 Afin d’augmenter la certitude diagnostique et par conséquent de réduire le pourcentage d’appendicectomies négatives, ces systèmes de notation clinique ont été développés. Notre recherche a évalué l’utilité de telles échelles dans la population de la région orientale du pays, et une plus grande sensibilité et spécificité ont été trouvées avec le score RIPASA. Des courbes ROC ont été générées (Fig. 1), démontrant une ASC plus grande pour le score RIPASA par rapport au score Alvarado; cela représente une meilleure sensibilité / spécificité pour l’échelle RIPASA.

Dans l’étude de Golden et al. aux États-Unis, l’AUC signalée a été inversée: 0,67 pour le score RIPASA et 0,72 pour le score Alvarado.13 Cela peut être dû à la population étudiée, car il a été rapporté que l’échelle de RIPASA avait été initialement conçue pour la population asiatique car l’échelle d’Alvarado ne démontrait pas de fiabilité diagnostique dans cette population.7

En ce qui concerne la sensibilité et la spécificité, Velázquez et al. ils ont indiqué avoir utilisé le score Alvarado chez 113 patients, observant une sensibilité de 99% et une spécificité de 62%, ce qui est similaire à nos données.15 Cedillo et coll. on a observé chez 99 patients une spécificité plus élevée du score Alvarado (57%) par rapport à la tomographie informatisée ou à l’échographie dans les 24 premières heures suivant l’apparition.16

Dans les études comparant les deux systèmes (tableau 4), Chong et al. rapporté pour le score RIPASA une sensibilité de 98% et une spécificité de 81.3%, alors que pour le score Alvarado, ils ont observé une sensibilité de 68,3% et une spécificité de 87,9%.8 Alnjadat et Abdallah ont montré une sensibilité de 93,2% et une spécificité de 61,8% pour RIPASA, et une sensibilité de 73,7% avec une spécificité de 68,6% pour Alvarado.9 Deux études supplémentaires11,13 ont rapporté la spécificité la plus faible trouvée pour l’échelle RIPASA. De même, Sinnet et al.12 a démontré une spécificité de 65% pour RIPASA, ce qui était inférieur à la spécificité de 90% pour Alvarado.

En revanche, Nanjundaiah et al. a rapporté une sensibilité et une spécificité pour RIPASA de 96,2% et 90.5%, et pour Alvarado de 58,9% et 85,7%, respectivement.10 Enfin, l’étude non comparative de Butt et al.17 ont observé une spécificité de 93% et une sensibilité de 96,7% (LR + 13,8 et LR−0,04) pour le score RIPASA. Ces études8–13 montrent que, d’une manière générale, les scores RIPASA ainsi que les scores Alvarado sont relativement sensibles et spécifiques pour le diagnostic des AA. Certains auteurs ont également montré leur avantage par rapport aux études d’image16, bien que cela n’ait pas été confirmé par d’autres.13 La spécificité de RIPASA, comme dans l’article de Nanjundaiah et al., 10 était supérieur à Alvarado à notre hôpital (tableau 4). La variabilité des chiffres observés entre les études peut également être secondaire à un effet de la population à partir de laquelle l’échantillon a été extrait.

De même, nous avons déterminé que le point de coupure pour le score Alvarado peut être aussi bas que 6,5 (recommandé entre 7 et 7,510) et 9,25 pour le score RIPASA en utilisant des courbes ROC, car ce point de coupure obtient un équilibre entre spécificité et sensibilité.

Ensuite, nous avons abordé la tâche de calculer le LR positif pour chaque rapport comparatif (tableau 4), et la moyenne de ces études était légèrement supérieure (3,7 vs 3,6) pour l’échelle RIPASA.

Le taux d’appendicectomies négatives rapportées dans notre étude était de 14%, similaire aux rapports dans la littérature internationale.14,18,19 L’utilisation de ces classifications a été rapportée pour avoir un effet sur le pourcentage d’appendicectomies négatives, et dans l’étude de Chong et al., ces auteurs ont réussi à réduire le taux à seulement 6,9%.8 Bien que 70% des patients soient arrivés à notre hôpital avec des médicaments antérieurs (analgésie et antibiotiques), cela n’a pas réduit l’efficacité diagnostique des systèmes de notation.

Malgré le fait que 80% de nos patients présentaient une ou plusieurs comorbidités, seuls 8% des patients présentaient des complications chirurgicales. Le délai moyen entre l’apparition des symptômes et la première évaluation médicale était de 45,5 h. Les médecins généralistes devraient être formés à l’utilisation de ces échelles pour éviter les retards dans le diagnostic.

En conclusion, le score RIPASA présente une plus grande précision et fiabilité en tant que test diagnostique par rapport au score Alvarado et est utile pour prendre des décisions thérapeutiques appropriées. Dans les hôpitaux comme le nôtre, le diagnostic d’AA repose grandement sur l’évaluation clinique effectuée par les chirurgiens. Un système de notation clinique adéquat permettrait d’éviter les erreurs de diagnostic, en maintenant un faible taux satisfaisant d’appendicectomies négatives par une stratification adéquate des patients, tout en limitant l’exposition des patients aux rayonnements ionisants, car il existe un risque accru de développer un cancer avec la tomodensitométrie, en particulier pour le groupe d’âge pédiatrique.13,20

Conflit d’intérêts

Les auteurs n’ont aucun conflit d’intérêts à déclarer lié à cette recherche.