Sensitivity, Specificity and Reliability of the RIPASA Score for Diagnosis of Acute Appendicitis in Relation to the Alvarado Score | Cirugía Española (Engelse editie))

Inleiding

Acute appendicitis (AA) wordt geassocieerd met 10% morbiditeit en 0,24% -4,0% mortaliteit1 en is wereldwijd de meest voorkomende diagnose voor chirurgen in noodgevallen, die tot 20% van alle chirurgische operaties vertegenwoordigen.2 Het komt het vaakst voor tussen de tweede en vierde levensdecennia, met een tijdige diagnose die moeilijk is en voornamelijk op symptomen is gebaseerd.3

het percentage negatieve blindedarmaandoeningen (10% -15%) is niet veranderd met de introductie van echografie en computertomografie, terwijl het percentage verkeerde diagnoses bij patiënten die laparoscopische blindedarmoperatie ondergaan significant hoger is dan bij open blindedarmoperatie. Een miljard dollar wordt elk jaar besteed aan negatieve appenectomies, 4, 5 dus hoge tarieven van negatieve appenectomies zijn niet langer aanvaardbaar. Om een vertraagde diagnose te voorkomen, de foutenmarge te verminderen en patiënten te identificeren die noodchirurgie of patiënten zonder AA nodig hebben, zou de toepassing van een scoreschaal zeer nuttig zijn. De Alvarado score suggereert, met een hogere score, de kans dat de patiënt AA symptomen heeft.6

een nieuwe systemen, de Raja Isteri Pengiran Anak Saleha Appendicitis (RIPASA) score, lijkt een grotere gevoeligheid en specificiteit te hebben voor de diagnose van AZ en een significante vermindering van negatieve appendicomieën.7,8

het doel van deze studie was beide schalen toe te passen op de afdeling spoedeisende hulp bij patiënten met een vermoedelijke diagnose van AZ en deze te vergelijken met de pathologische rapporten na appenectomie, waarbij de werkzaamheid, gevoeligheid en specificiteit van de Alvarado-en RIPASA-scores voor de diagnose van AZ in een tertiair ziekenhuis ten dienste van de bevolking van Oost-Mexico werden vergeleken.

methoden

tussen 1 juni en 31 December 2016 werd een analytisch, observationeel onderzoek uitgevoerd bij patiënten van beide geslachten die 18 jaar of ouder waren en naar de spoedeisende hulp van het Hospital de Alta Especialidad van Veracruz kwamen met een vermoedelijke diagnose van AA en een blindedarmoperatie ondergingen. Voor de studie waren alle gevallen opgenomen die werden behandeld met dringende appendectomie met pathologische resultaten. De studie werd goedgekeurd door de Ethische Commissie van het ziekenhuis.

instrumenten. De 2 verschillende classificaties, de Alvarado en de RIPASA scores, werden toegepast op elk van de patiënten door een huisarts in chirurgie, zonder invloed op de beslissing van de chirurg met betrekking tot chirurgische interventie. De Alvarado score (gepubliceerd in 1986) is een beoordelingsgrafiek (Tabel 1), waarvan de som maximaal 10 punten geeft met een grotere kans dat de patiënt AA heeft.6 de RIPASA-score (gepubliceerd in 2010) zou een grotere gevoeligheid en specificiteit hebben.7

Tabel 1.

variabelen in de Alvarado en RIPASA schalen en hun waarden.

Alvarado Score RIPASA Score
Variabele Waarde Variabele Waarde
Pijn in de RIF 2 Man 1
Positieve Blumberg 1 Vrouwelijke 0.5
Pijn migratie 1 Jonger dan 40 1
Misselijkheid of braken 1 Ouder dan 40 0.5
Anorexia 1 Buitenlander 1
Temperatuur hoger dan 38°C 1 Pijn in de RIF 0.5
Leukocytosis hoger dan 10000 2 Misselijkheid of braken 1
Neutrophilia groter dan 70% 1 Pijn migratie 0.5
Anorexia 1
Symptomen h 1
Symptomen >48 0.5
Overgevoeligheid in de RIF 1
het Bewaken van 2
Positieve reactie aanmelden 1
Positieve Rovsing aanmelden 2
Koorts >37°C naar °C 1
Leukocytosis 1
negatieve urinetest 1

rif: rechts iliac fossa.

het Alvarado-systeem bevat 3 symptomen, 3 fysieke tekenen en 2 laboratoriumparameters; elke variabele krijgt een waarde van 1 of 2 punten. Het resultaat bestaat uit de som van de waarden, met een maximale score van 10. Hoe hoger de score, hoe groter de kans dat de patiënt AA heeft. Zodra de score is vastgesteld, wordt de diagnose van appendicitis geclassificeerd als twijfelachtig met minder dan 5 punten, suggestief van 5 tot 6 punten, waarschijnlijk van 7 tot 8 punten, en zeer waarschijnlijk van 9 tot 10 punten. Het RIPASA systeem heeft 18 variabelen verdeeld in 4 groepen (gegevens, tekenen, symptomen en laboratoriumstudies) waardoor ze een waarde van 0,5 tot 2, met een maximale score van 16 en, volgens de score, de waarschijnlijkheid van de diagnose is: minder dan 5 punten (onwaarschijnlijk), 5-7 punten (lage waarschijnlijkheid), 7,5–11,5 punten (hoge waarschijnlijkheid), en groter dan 12 punten (diagnose van appendicitis).

ongeacht de Alvarado-en RIPASA-scores voor elke patiënt met een vermoedelijke AZ, vroeg de verantwoordelijke chirurg aanvullende studies op basis van het geval. Bij alle patiënten, volledige analyse en urineonderzoek werden gevraagd; abdominale echografie werd gevraagd bij 21 patiënten, naast abdominale X-stralen, en bij 66 patiënten alleen abdominale X-stralen werden gevraagd, omdat de waarschijnlijke diagnose van AA was in principe klinisch zoals de beslissing om de chirurgische ingreep uit te voeren was. Het moet worden vermeld dat axiale tomografie is niet een studie die routinematig wordt aangevraagd bij ons ziekenhuis in gevallen van vermoedelijke AA.

de intraoperatieve bevindingen voor elk van de patiënten werden geregistreerd en de diagnose van AA werd bevestigd met het pathologisch onderzoek van de geëxciseerde appendix. Nadat de patiënten waren ontslagen, werden ze gedurende ten minste 30 dagen in de poliklinische omgeving opgevolgd.

statistische analyse

een beschrijvende statistische analyse van de demografische gegevens van de populatie werd voltooid, evenals de analyse van diagnostische tests, waarbij het pathologisch rapport als gouden standaard werd gebruikt (gevoeligheid, specificiteit, positieve voorspellende waarde , negatieve voorspellende waarde ). Met deze gegevens werden ROC-curves gegenereerd om beide scores te vergelijken.

daarna hebben we de waarschijnlijkheidsratio berekend. De LR is een goede parameter om te beslissen wanneer een diagnostische test moet worden uitgevoerd. De LR wordt berekend door de kans op het verkrijgen van een positief resultaat bij ziekte te delen door de kans op het verkrijgen van hetzelfde resultaat wanneer hij/zij gezond is; met andere woorden, gevoeligheid gedeeld door 1−specificiteit. Hoe verder weg van 1, hoe beter de test is om onderscheid te maken tussen zieke en gezonde proefpersonen. Bijvoorbeeld, als een LR is 5 (of 5 tot 1) het testresultaat zal 5 keer voorkomen in die waarin de ziekte aanwezig is, voor elke keer dat het optreedt in die proefpersonen bij wie de ziekte afwezig is (LR+ zal altijd groter zijn dan 1 en LR− zal kleiner zijn dan 1).

LR+ geeft aan op welk moment een individu in werkelijkheid meer kans heeft positief te zijn (wanneer de test aangeeft dat het positief is). In tegenstelling, LR-geeft aan op welk punt een persoon meer kans om negatief te zijn in werkelijkheid wanneer de test positief is.

bij de verwerking van de gegevens werd vertrouwelijkheid gehandhaafd en werd de anonimiteit van de patiënt gerespecteerd. Een van de onderzoekers was verantwoordelijk voor het coderen van patiëntgegevens, met behulp van nummers in plaats van namen.

resultaten

tijdens de wervingsperiode werden van de 218 patiënten die in één jaar werden behandeld in totaal 100 patiënten in dit onderzoek opgenomen (46%); 42 waren vrouwen en 58 mannen, met een man:vrouw verhouding van 1,7:1 (Tabel 2). De gemiddelde leeftijd van de patiënt was 36,5±16,2 jaar (spreiding 18-81 jaar). De verdeling van de AZ-gevallen was vergelijkbaar met andere meldingen, die voornamelijk patiënten betroffen tussen de tweede en vierde levensdecennia.

Tabel 2.

verdeling van de variabelen van de patiënten opgenomen.

Nee. % Gemiddelde
Geslacht
Vrouwen 42 42%
Mannetjes 58 58%
Leeftijd Bereik 18-81 j. 100 100% 36.5±16.2 jaar
BMI Bereik 17–36 kg/m2 100 100% 25.3±3.8 kg/m2
Comorbiditiesa
Overgewicht en obesitas 65 76.5%
Type 2 DM 7 8.7%
HTN 4 50%
Type 2 DM + HTN 6 7.5%
Andere 3 3.8%
Totala 80 100%
Voorafgaand management
Pijnstilling 47 67.2%
Antibiotica 1 1.4%
Pijnstilling+antibiotica 22 31.4%
totaal 70 100%

de body mass index wordt berekend door het gewicht in kilo ‘ s te delen door de hoogte in het kwadraat in meters. Overgewicht / obesitas werd gedefinieerd als een abnormale / overmatige ophoping van vet. De WHO-definities: BMI gelijk aan of groter dan 25 is Overgewicht; BMI gelijk aan of groter dan 30 is obesitas.

DM: diabetes mellitus; HTN: hypertensie; BMI: body mass index.

a

meer dan één patiënt vertoonde meer dan één comorbiditeit.

de gemiddelde body mass index was 25,3±3,8 kg/m2 (bereik 17–36kg / m2). Van het totaal kregen 70 patiënten voorafgaande medische behandeling, 65 (92,9%) voorgeschreven door een arts en 5 (7,1%) zelfmedicatie; 47 (67,2%) van deze patiënten kregen alleen analgesie, 22 (31,4%) patiënten kregen analgesie plus antibiotica en één patiënt (1,4%) alleen antibioticum.Pijn en overgevoeligheid in de rechter iliacale fossa kwamen voor bij 100% van de patiënten, gevolgd door leukocytose bij 91%, pijn na abrupte decompressie bij 90%, neutrofilia bij 90%, bewaking bij 82%, negatieve urinetest bij 80%, verhoging van de lichaamstemperatuur bij 75%, anorexia bij 73%, misselijkheid en braken bij 62% en migratie van pijn bij 44%.

80% van alle patiënten had één of meerdere comorbiditeiten, waarvan overgewicht het meest frequent was bij 48 patiënten en obesitas bij 17 patiënten (65 patiënten)., 76.5%); 7 (8.7%) patiënten hadden ook diabetes mellitus type 2; 4 (5%) patiënten vertoonden hypertensie; 6 (7,5%) presenteerden beide; en 3 (3,8%) patiënten vertoonden andere comorbiditeiten.

de gemiddelde tijd tussen het begin van de symptomen en de eerste medische beoordeling was 45,5±35U (spreiding 8–144u). De gemiddelde tijd die verstrijkt tussen de eerste beoordeling door de chirurg en de chirurgische resolutie was 8,5±4,0 uur (bereik 2–48 uur). Met betrekking tot de operatie waren alle blindedarmoperaties open operaties; in 69 werd de McBurney-type incisie gebruikt, terwijl 31 werden uitgevoerd met een middellijn laparotomie. Oedemateuze appendicitis werd waargenomen in 2 gevallen, flegmoneuze appendicitis bij 30 patiënten, necrotische appendicitis bij 21 en geperforeerde appendicitis in 33 gevallen.

postoperatieve complicaties traden op bij 8 patiënten (4 seromen, 2 infecties van de operatieplaats en 2 resterende abcessen). We definieerden residueel abces als de aanwezigheid van intra-abdominale purulente collecties na de chirurgische behandeling van AA.

het percentage negatieve appendix (histologisch normaal appendix) was 14%. Er waren geen doden tijdens het huidige onderzoek. Het gemiddelde verblijf in het ziekenhuis was 3,5±1.8 dagen (bereik 1-21 dagen).

bij het toepassen van de beoordelingssystemen op de patiënten in de studie, vonden we dat de RIPASA-score een grotere diagnostische zekerheid vertoonde in vergelijking met de Alvarado-score, met een gevoeligheid van respectievelijk 98,8%, specificiteit 71,4%, PPV 95,5% en NPV 90,9% vs gevoeligheid 90,7%, specificiteit 64,3%, PPV 94,1% en NPV 60% (Tabel 3). De RIPASA-score toonde een oppervlakte onder de curve (AUC) van 0,88 in vergelijking met de Alvarado-score, die 0,80 is (Fig. 1).

Tabel 3.

2×2 Contingentietabel waar de resultaten zijn verkregen.

RIPASA Score
Pathologie Resultaat Patiënten (+) Gezonde (–) Totaal
Negatief 1 10 11
Positief 85 4 89
Totaal 86 14 100
FN-1 TN 10
TP 85 FP-4
Alvarado Score
Pathology Result Patients (+) Healthy (–) Total
Negative 6 9 15
Positive 80 5 85
Total 86 14 100
FN 6 TN 9
TP 80 FP 5
rip pagina Score
Gevoeligheid Specificiteit IPV NPV
0.99 0.71 0.96 0.91
Alvarado Score
Gevoeligheid Specificiteit IPV NPV
0.91 0.64 0.94 0.60

FN: false negative; FP: false positive; TN: true negative; TP: true positive; NPV: negatieve voorspellende waarde; PPV: positieve voorspellende waarde.

ROC-curven verkregen door de resultaten van beide scores te berekenen.
Fig. 1.

ROC-curven verkregen door de resultaten van beide scores te berekenen.

(0.12 MB).

Later hebben we de LR berekend voor onze resultaten en voor elk van de vorige vergelijkbare rapporten (Tabel 4). In het geval van onze studie was de positieve LR 3,5 en de negatieve LR 0,02 voor de RIPASA score, vergeleken met de positieve lr van 2,5 en de negatieve lr van 0,2 voor de Alvarado score. De gemiddelde positieve LR van alle in Tabel 4 opgenomen onderzoeken voor de Alvarado–score werd berekend op 3,6 (spreiding 2,0–6,5) en was iets hoger voor de RIPASA-score op 3,7 (met een veel breder bereik: 1,2-10,1); de gemiddelde specificiteit was 77,8% (64.3% -90%) voor de Alvarado schaal en 63,3% (36% -90,5%) met een breder bereik voor RIPASA; de gemiddelde gevoeligheid was 67,1% (52% -90,7%) Versus 90,7% (75% -98,8%) voor de Alvarado en RIPASA scores, respectievelijk.

Tabel 4.

vergelijking van de gevoeligheid en specificiteit van de Alvarado-Score en de RIPASA-Score in verschillende publicaties.

Alvarado Score RIPASA Score
Gevoeligheid Specificiteit LR+ LR− Sensitivity Specificiteit LR+ LR−
Chong et al., 20118 68.3% 87.9% 5.6 0.4 98% 81.3% 5.2 0.03
Alnjadat et al., 20139 73.7% 68.6% 2.3 0.4 93.2% 61.8% 2.4 0.1
Wessex et al., 201410 58.9% 85.7% 4.1 0.5 96.2% 90.5% 10.1 0.04
Repplinger et al., 201411 52% 74% 2.0 0.6 75% 37% 1.2 0.7
the mind et al., 201612 65.2% 90% 6.5 0.4 95.5% 65% 2.7 0.07
Golden et al., 201613 61% 74% 2.2 0.6 78% 36% 1.3 0.5
Deze studie 90.7% 64.3% 2.5 0.2 98.8% 71.4% 3.5 0.02
Gemiddelden 67.1% 77.8% 3.6 0.4 90.7% 63.3% 3.7 0.2

LR (+): positieve waarschijnlijkheidsratio; LR (−): negatieve waarschijnlijkheidsratio.

We vergeleken de gevoeligheidsresultaten van beide classificaties tussen patiënten met appendicitis; ook onder patiënten zonder appendicitis vergeleken we de resultaten in termen van specificiteit (McNemar ‘ s test voor gepaarde gegevens). De waargenomen verschillen tussen beide scores waren niet statistisch significant. De AUC-waarden (van beide ROC-curven) werden vergeleken en het verschil was niet statistisch significant (Delong-techniek, Med Cal-software).Het doel van onze studie was om het vermogen van twee klinische scoresystemen, de Alvarado-en de RIPASA-scores, te vergelijken om appendicitis te diagnosticeren of uit te sluiten, aangezien computertomografie, echografie en laparoscopie niet in staat waren het percentage diagnostische fouten te verminderen.14

er is voorgesteld dat het percentage negatieve appenectomieën niet meer dan 15% mag bedragen en dat tegelijkertijd de incidentie van perforatie moet worden verminderd.Om de diagnostische zekerheid te verhogen en bijgevolg het percentage negatieve appendicomen te verminderen, zijn deze klinische scoresystemen ontwikkeld. Ons onderzoek beoordeelde het nut van dergelijke schalen in de bevolking van de oostelijke regio van het land, en grotere gevoeligheid en specificiteit werden gevonden met de RIPASA score. ROC krommen werden gegenereerd (vijg. 1), waarmee een hogere AUC voor de RIPASA-score wordt aangetoond in vergelijking met de Alvarado-score; dit betekent een betere gevoeligheid/specificiteit voor de RIPASA-schaal.

in de studie van Golden et al. in de Verenigde Staten werden de gerapporteerde AUC omgekeerd: 0,67 voor de RIPASA-score en 0,72 voor de Alvarado-score.13 Dit kan te wijten zijn aan de onderzochte populatie, aangezien is gemeld dat de RIPASA-schaal aanvankelijk was ontworpen voor de Aziatische populatie omdat de Alvarado-schaal geen diagnostische betrouwbaarheid bij die populatie aantoonde.7

met betrekking tot gevoeligheid en specificiteit, Velázquez et al. ze meldden dat ze de Alvarado score gebruikten bij 113 patiënten, waarbij ze een gevoeligheid van 99% en een specificiteit van 62% observeerden, wat vergelijkbaar is met onze gegevens.15 Cedillo et al. waargenomen bij 99 patiënten een hogere specificiteit van de Alvarado score (57%) in vergelijking met geautomatiseerde tomografie of echografie in de eerste 24 uur na aanvang.16

in de studies waarin beide systemen werden vergeleken (Tabel 4), werden Chong et al. voor de RIPASA-score werd een gevoeligheid van 98% en een specificiteit van 81 gemeld.3%, terwijl ze voor de Alvarado score een gevoeligheid van 68,3% en een specificiteit van 87,9% waarnamen.Alnjadat en Abdallah vertoonden een gevoeligheid van 93,2% en een specificiteit van 61,8% voor RIPASA, en een gevoeligheid van 73,7% met een specificiteit van 68,6% voor Alvarado.In twee aanvullende studies11, 13 werd melding gemaakt van de laagste specificiteit die werd gevonden voor de RIPASA-schaal. Ook Sinnet et al.Er werd een specificiteit van 65% voor RIPASA aangetoond, wat lager was dan de specificiteit van 90% voor Alvarado.

daarentegen, Nanjundaiah et al. gemeld werd een gevoeligheid en specificiteit voor RIPASA van 96,2% en 90.5%, en voor Alvarado van 58,9% en 85,7%, respectievelijk.10 tot slot, de niet-vergelijkende studie van Butt et al.17 waargenomen een specificiteit van 93% en een gevoeligheid van 96,7% (LR+ 13,8 en LR− 0,04) voor de RIPASA-score. Uit deze studies8-13 blijkt dat zowel de RIPASA-als de Alvarado-scores over het algemeen relatief gevoelig en specifiek zijn voor de diagnose van AA. Sommige auteurs hebben ook hun voordeel ten opzichte van beeldvormingsstudies getoond, 16 hoewel dit door anderen niet is bevestigd.13 de specificiteit van RIPASA, zoals in het artikel van Nanjundaiah et al., 10 was superieur aan Alvarado in ons ziekenhuis (Tabel 4). De variabiliteit van de waargenomen cijfers tussen de studies kan ook secundair zijn aan een effect van de populatie waaruit het monster werd geëxtraheerd.

evenzo hebben we vastgesteld dat het cut-off-punt voor de Alvarado-score zo laag kan zijn als 6,5 (aanbevolen tussen 7 en 7.510) en 9.25 voor de RIPASA-score met behulp van ROC-curven, omdat dit cut-off-punt een evenwicht tussen specificiteit en gevoeligheid verkrijgt.

vervolgens benaderden we de taak om de positieve LR voor elk vergelijkend rapport te berekenen (Tabel 4), en het gemiddelde van deze studies was iets hoger (3,7 Versus 3,6) voor de RIPASA-schaal.

het percentage negatieve blindedarmaandoeningen dat in onze studie werd gemeld was 14%, vergelijkbaar met meldingen in de internationale literatuur.14,18,19 het gebruik van deze classificaties is gemeld om een effect te hebben op het percentage negatieve appendicomies, en in de studie door Chong et al., deze auteurs erin geslaagd om het percentage te verlagen tot slechts 6,9%.8 hoewel 70% van de patiënten in ons ziekenhuis arriveerde met eerdere medicatie (analgesie en antibiotica), verminderde dit de diagnostische effectiviteit van de scoresystemen niet.

ondanks het feit dat 80% van onze patiënten één of meerdere comorbiditeiten had, vertoonde slechts 8% van de patiënten chirurgische complicaties. De gemiddelde tijd tussen het begin van de symptomen en de eerste medische beoordeling was 45,5 uur. huisartsen moeten worden opgeleid in het gebruik van deze schalen om vertraging in de diagnose te voorkomen.

concluderend kan worden gesteld dat de RIPASA-score als diagnostische test een grotere nauwkeurigheid en betrouwbaarheid vertoont dan de Alvarado-score en nuttig is bij het nemen van geschikte therapeutische beslissingen. In ziekenhuizen zoals het onze, is de diagnose van AA sterk afhankelijk van de klinische evaluatie uitgevoerd door chirurgen. Een adequaat klinisch scoresysteem zou diagnostische fouten voorkomen, waarbij een voldoende laag percentage negatieve blindedarmziekten wordt gehandhaafd door adequate stratificatie van de patiënt, terwijl de blootstelling van de patiënt aan ioniserende straling wordt beperkt, aangezien er een verhoogd risico bestaat op het ontwikkelen van kanker met computertomografie, met name voor de pediatrische leeftijdsgroep.13,20

belangenverstrengeling

de auteurs hebben geen belangenverstrengeling te verklaren gerelateerd aan dit onderzoek.