Paradoja de Simpson
Ilustración
Comprender la paradoja de Simpson es más fácil en el contexto de un ejemplo simple. Supongamos que a una universidad le preocupa el sesgo sexual durante el proceso de admisión a la escuela de posgrado. Para estudiar esto, los solicitantes a los programas de posgrado de la universidad se clasifican según el sexo y el resultado de admisión. Estos datos parecen ser consistentes con la existencia de un sesgo por sexo, porque los hombres (el 40 por ciento fueron admitidos) tenían más probabilidades de ser admitidos en la escuela de posgrado que las mujeres (el 25 por ciento fueron admitidos).
Para identificar la fuente de la diferencia en las tasas de admisión de hombres y mujeres, la universidad subdivide a los solicitantes en función de si se presentaron a un departamento de ciencias naturales o a uno de ciencias sociales, y luego vuelve a realizar el análisis. Sorprendentemente, la universidad encuentra que la dirección de la relación entre el sexo y el resultado se ha invertido. En los departamentos de ciencias naturales, las mujeres (el 80% fueron admitidas) tenían más probabilidades de ser admitidas en la escuela de posgrado que los hombres (el 46% fueron admitidas); del mismo modo, en los departamentos de ciencias sociales, las mujeres (el 20% fueron admitidas) tenían más probabilidades de ser admitidas en la escuela de posgrado que los hombres (el 4% fueron admitidos).
Aunque el cambio de asociación que se observa en la paradoja de Simpson puede parecer desconcertante, en realidad es sencillo. En este ejemplo, se produjo porque tanto el sexo como los ingresos estaban relacionados con una tercera variable, a saber, el departamento. En primer lugar, es más probable que las mujeres se postulen a los departamentos de ciencias sociales, mientras que es más probable que los hombres se postulen a los departamentos de ciencias naturales. En segundo lugar, la tasa de aceptación en los departamentos de ciencias sociales fue mucho menor que en los departamentos de ciencias naturales. Debido a que las mujeres tenían más probabilidades que los hombres de postularse a programas con bajas tasas de aceptación, cuando se ignoraba el departamento (es decir, cuando los datos se agregaban en toda la universidad), parecía que las mujeres tenían menos probabilidades que los hombres de ser admitidas a la escuela de posgrado, mientras que en realidad era cierto lo contrario. Aunque ejemplos hipotéticos como este son fáciles de construir, numerosos ejemplos de la vida real se pueden encontrar fácilmente en las literaturas de ciencias sociales y estadísticas.