Control de la selección

Por José Supo

2023 / 04 / 26

Parte del error sistemático corresponde a los sesgos que se producen al momento de la selección de las “unidades de estudio” que formarán parte de la investigación, los sesgos cuando se identifican se pueden controlar, sin embargo muchos sesgos pasan desapercibidos por el investigador, de allí la necesidad de hacer una lista de ellos.

El control de la selección incluye: identificar un marco muestral, obtener una muestra aleatoria, eliminar variables de confusión, utilizar variables control en el análisis estadístico; y asegurar que las unidades de estudio no se pierdan durante el proceso de seguimiento.

Todo comienza con utilizar una técnica de muestreo probabilístico, donde el ideal es el muestreo aleatorio simple, pero también es el menos factible, difícil de alcanzar; sin embargo, el no utilizarlo es asumir un sesgo que debemos anunciar en el protocolo de investigación.

Para realizar un adecuado control de la selección de las unidades de estudio que participarán en el mismo, debemos tener en cuenta a los sesgos de selección, solo así podremos evitarlos, son errores que se cometen al momento de conformar la muestra y que de no poder eliminarlos se deben anunciar como una limitación.

1. El sesgo de admisión

Todos los elementos que forman parte de la población, deben tener la misma probabilidad de conformar la muestra, para asegurar ello se debe contar con un marco muestral, de no contar con este marco muestral, ya no es posible asegurar este concepto y aparece el primer sesgo de selección.

Hay que recordar que el interés de todo investigador es conocer lo que ocurre en la población, se recurre al estudio de una muestra porque no es posible estudiar a toda la población, donde solo el muestreo aleatorio simple asegura que todas las unidades de estudio que conforman la población, tienen la misma probabilidad de incluirse en la muestra.

El solo hecho de definir inadecuadamente al marco muestral, ya sea cuando la población es desconocida, inaccesible o inalcanzable, el sesgo de admisión se hace presente, desde el momento que existen unidades de estudio que no tienen posibilidades de incluirse en la muestra, por haber definido un marco muestral que conceptualmente difiere de la población.

En un estudio descriptivo, el control del sesgo de admisión se realiza definiendo adecuadamente el marco muestral porque de allí, se obtendrá la muestra, mientras el marco muestral sea igual a la población y hayamos utilizado el muestreo aleatorio simple no habrá sesgo de admisión, en todos los demás casos tendremos que comunicar el error sistemático.

En los estudios analíticos, específicamente en el diseño de casos y controles, es muy común que los casos sean pacientes diagnosticados en un hospital, cuando debieran ser pacientes diagnosticados en la población; sin embargo, por factibilidad se obtienen de un hospital, eliminando así la posibilidad de incluirse en la muestra a los casos que no acuden al hospital.

En el diseño de casos y controles, es más grave aún obtener los controles del mismo hospital, cuando debieron haber salido de la población, el problema de utilizar controles hospitalarios, es que estos controles no son sanos, presentan una enfermedad distinta y esta otra enfermedad se convierte en una variable de confusión que afecta a las conclusiones.

El concepto de que todos los elementos de la población deben tener la misma probabilidad de conformar la muestra, no siempre es práctico, a veces se requiere de una búsqueda sistemáticas de casos en la población, como fue el caso de la pandemia del COVID-19, donde por cada persona que resultaba positiva a la prueba diagnóstica, se evaluaban a todos sus contactos.

A su vez, de encontrar entre ellos un nuevo caso positivo, se evaluaban nuevamente a todos sus contactos, esto es el muestreo de la bola de nieve, que conjuntamente con el aislamiento de los casos positivos se conoce como cerco epidemiológico, una estrategia particular, donde no se evalúa a las personas con un muestreo aleatorio simple.

2. El sesgo de la autoselección

El grado de interés o motivación que pueda tener un individuo que participa voluntariamente en una investigación puede diferir sensiblemente en relación con otros sujetos, en ese caso aparece el sesgo de la autoselección, cuando la decisión de participar se correlaciona con la variable de estudio, tendremos una muestra no representativa.

Por ejemplo, en un hospital, los pacientes tienen necesidades particulares así como características socioeconómicas que dependerán de, si el hospital es público o privado; la autoselección no es sinónimo exacto de voluntariado, por ejemplo, los pacientes que acuden al consultorio particular de un médico son una muestra autoseleccionada pero no necesariamente voluntaria.

Una encuesta telefónica, entrega resultados sesgados porque los encuestados son autoseleccionados, desde el momento en que decidieron contar con una línea telefónica, luego cuando deciden atender la llamada; las personas que tienen fuertes opiniones o sustanciales conocimientos pueden estar más dispuestos a contestar una encuesta que aquellos que no lo tienen.

Puede ocurrir también una negativa de las personas a formar parte del estudio, porque no quieren exhibir la característica en estudio, por ejemplo, si queremos conocer cuáles son las enfermedades de transmisión sexual que han padecido los estudiantes de medicina en el último año, los que hayan padecido una de estas enfermedades, se van a negar a participar en el estudio.

El control del sesgo de la autoselección se lleva a cabo mediante una técnica de muestreo probabilístico, este control se logra cuando el grupo de personas que están siendo estudiadas no tengan ningún tipo de control sobre si participar o no; dado que la autoselección puede sobredimensionar o subestimar los resultados que estamos buscando.

La posibilidad de las personas para decidir participar o no en el estudio puede potencialmente influenciar en los resultados ya sea de manera positiva o negativa; pero eliminar toda posibilidad de decisión en las unidades de estudio es una utopía, por lo que el investigador debe informar con exactitud, la forma en que reclutó a sus unidades de estudio.

Existen casos donde la autoselección no estaría relacionada con los resultados medidos, por ejemplo, si realizamos un estudio de los parámetros sanguíneos como el hemograma o la hemoglobina en un grupo voluntario de estudiantes de medicina, no habría razón para pensar en que estos valores difieran de la población, solo porque sean voluntarios.

El sesgo de la autoselección afecta fundamentalmente a los estudios que incluyen sujetos como “unidades de estudio” y en ellos se evalúan variables subjetivas, en cambio variables objetivas como el peso y la talla no estarían siendo modificadas, porque un individuo decida ser voluntario o se niegue a ser parte del estudio.

3. Sesgo de pertenencia

Llamado también sesgo de membresía, o sesgo de afiliación. Se produce cuando en la población existen subgrupos con algún atributo en particular, y este atributo está relacionado de manera positiva o negativa con la variable en estudio, esta característica constituye una variable, que si no se controla ocasiona un sesgo de confusión.

Continuando con la secuencia, no basta con definir adecuadamente al marco muestral e impedir que los participantes del estudio, tengan alguna posibilidad de decidir acerca de su participación, aún podemos cometer un error sistemático, si incluimos en la muestra a sujetos de un segmento de la población que por su condición afectarán los resultados del estudio.

Por ejemplo: si queremos evaluar el nivel de conocimientos sobre: signos de alarma en las gestantes de un centro de salud, y en ese centro de salud, hay mujeres profesionales de la salud que también están gestando, sus conocimientos sobre signos de alarma sesgarán de manera importante los resultados del estudio, mientras mayor sea el número de estas mujeres.

Si obtenemos un promedio de la calificación del centro de salud, este promedio estará anormalmente elevado, si retiramos a las profesionales de la salud, el promedio global del grupo de estudio estará en un nivel real; y eso es lo que nos interesa conocer; por esta razón, debemos excluir del estudio a las gestantes que sean profesionales de la salud.

El control del sesgo de pertenencia, se consigue mediante la aplicación de los criterios de elegibilidad identificando estos subgrupos en la población y retirándolos con los criterios de exclusión, pero si no podemos eliminarlos, entonces, deberemos recolectar ese dato, y lo incluiremos en el análisis de datos para controlarlo estadísticamente.

En los estudios analíticos el sesgo de pertenencia ocurre cuando se trabaja con grupos preexistentes, o no formados de manera aleatoria, por ejemplo, en los estudios cuasi experimentales, la muestra de estudio no se construyó aleatoriamente, sino porque los pacientes necesitaban de alguna intervención terapéutica, y esta condición podría asociarse a la variable de estudio.

En ocasiones pertenecer a un colectivo determinado puede orientar la interpretación de los resultados, en un sentido completamente distinto al real, por ejemplo, en la pandemia de la COVID-19 uno de los grupos más contagiados correspondió al personal de salud, cuando el personal de salud es el que conoce y cumple a cabalidad las medidas de bioseguridad.

La proporción elevada de contagios en el personal de salud se debe a la exposición frente al SARS-CoV-2 que ocasiona la evaluación y tratamiento de pacientes infectados precisamente por la naturaleza de su trabajo y este factor de exposición tiene que considerarse necesariamente en el estudio para una mejor interpretación.

4. Sesgo de aleatorización

La aleatorización se utiliza en los estudios experimentales para neutralizar los diversos factores de confusión (conocidos y desconocidos), dado que siempre que son prospectivos; el procedimiento de la aleatorización hace que una característica que puede influir sobre la variable de estudio, se distribuya de manera homogénea en ambos grupos.

Cuando existe una característica intrínseca en las unidades de estudio, una condición que no se puede modificar y que, de eliminar a las unidades de estudio que la posean, hace que se reduzca la muestra de manera significativa, esas unidades de estudio se deben incluir en la muestra y se recoge la variable o condición que puede modificar los resultados.

La construcción de grupos aleatorios para un experimento, no solo balancea las condiciones que el investigador identificó previamente y que pueden modificar los resultados, la aleatorización balancea también aquellas condiciones no detectadas por el investigador, de manera que los resultados del estudio se deban únicamente a la intervención del investigador.

En un estudio con pacientes, ellos pueden tener padecimientos que el investigador desconoce y al conformar los grupos de manera aleatoria, se elimina la posibilidad de que los resultados se deban a este factor de confusión, dejando la posibilidad únicamente que las diferencias en ambos grupos se deben a la intervención del investigador.

La aleatorización se define como aquel procedimiento en el que todos los individuos tienen la misma probabilidad de entrar al grupo de tratamiento como al grupo control; reduce el sesgo de selección, por eso la aleatorización es un procedimiento estandarizado en un estudio experimental porque reduce la confusión.

El objetivo de la aleatorización es que los grupos construidos de esta manera, solo difieran en la característica que se plantea como causa, esto ayuda en la demostración de la relación causa efecto, descrita por Bradford Hill quién enumeró nueve criterios de causalidad que pueden resumirse en tres: de validez interna, de comprobación y de generalización.

En los estudios observacionales, no se controla la asignación del paciente a un determinado tratamiento o intervención, porque no son estudios manipulados, el tratamiento se efectuó de acuerdo a las necesidades terapéuticas de los pacientes, siendo por lo tanto el investigador un simple observador de lo que ha ocurrido.

Por otro lado, en los pre experimentos, donde la administración del medicamento o la terapia responde a las necesidades del paciente; y no, a la del investigador, no es posible controlar el sesgo de aleatorización; siendo que existe un tratamiento probado, no podemos tener grupo blanco, no podemos dejar un grupo sin tratamiento.

5. El sesgo de Prevalencia

Ocurre cuando el factor de exposición se encuentra asociado al pronóstico, el estudio de casos prevalentes puede producir asociaciones espurias; no así en los casos incidentes; a este problema se le conoce como sesgo de Neymann, donde la condición en estudio, determina la pérdida prematura de las unidades de estudio.

Si estamos estudiando los efectos de una terapia para un grupo de pacientes con cáncer, a medida que estos pacientes vayan falleciendo, iremos perdiendo información acerca de la intervención, esto podría confundirse con los pacientes que desaparecen o no regresan a la consulta médica, al no tener controles sucesivos, también estamos perdiendo información.

Si tenemos un grupo de 30 personas diabéticas con obesidad y se inscriben en un programa de dieta y ejercicios, la promesa es que en 3 meses reducirán 5 kg de peso, todos comienzan el programa, pero poco a poco, los pacientes abandonan el programa, al final solo quedan 10; en los cuales se observa efectivamente una reducción de 5 kg en su peso.

El autor del estudio dirá que su programa es 100% efectivo, porque los 10 pacientes que completaron el programa muestran una reducción de su peso en 5 kg, sin embargo, tenemos 20 que abandonaron el programa, probablemente sin ningún beneficio, por esta razón, el análisis estadístico debe incluir a todos, a esto se le denomina “análisis de supervivencia”.

Para controlar el sesgo de prevalencia, se hacen mediciones repetidas y seriadas sobre todo el grupo, hasta el momento en que abandonan el tratamiento, la información de aquellos que abandonaron el tratamiento también es relevante, luego hacer mediciones repetidas implica hacer un estudio prospectivo, la única forma de controlar el sesgo de prevalencia.

Siempre, es mejor un estudio prospectivo que un retrospectivo, bajo esa óptica la incidencia siempre será mejor que la prevalencia, porque solamente la incidencia controla el sesgo de supervivencia selectiva, el cual aparece tanto en los estudios descriptivos como en los estudios analíticos, en este último grupo es conocido como sesgo de Neymann.

En resumen, para controlar los sesgos de selección, se requiere en primer lugar: definir adecuadamente el marco muestral, en segundo lugar: los participantes no deben tener ninguna oportunidad de decidir entre participar y no participar en el estudio; en tercer lugar: detectar variables intervinientes que pueden afectar la relación causa-efecto y eliminarlas.

En cuarto lugar: los estudios que cuentan con grupo control aleatorizado tienen claras ventajas respecto de aquellos que no lo tienen, los pacientes deben desconocer el grupo al que pertenecen y en quinto lugar: preferir estudio prospectivo que permita trabajar con incidencias, antes que trabajar con prevalencias, todo esto asegura controlar los sesgos de selección.