Es importante recordar que, la forma ideal de obtener una muestra representativa es mediante el muestreo aleatorio simple; donde todos los individuos de la población, tienen igual probabilidad de ser seleccionados para la muestra. Es algo así como poner a cada individuo en una urna e ir extrayendo por azar cada uno de ellos hasta completar el tamaño de muestra.
El muestreo aleatorio simple garantiza la ausencia de sesgos en el proceso de selección de la muestra; pero en la práctica es extremadamente difícil de completar, es tan exacto como utópico, es tan ideal como inalcanzable, por ello existen otras posibilidades.
Usar el muestreo aleatorio simple requiere de algunas condiciones: como disponer de un marco muestral, un listado completo de todos los individuos que conforman la población; también es necesario acceso a dichos individuos y la predisposición de los mismos a participar en el estudio.
Un solo individuo que rechace participar en una encuesta sería suficiente para invalidar un proceso de muestreo aleatorio estricto. Como podemos analizar, estas condiciones son muy exigentes, haciendo que en la práctica el muestreo aleatorio simple sea más complicado, la solución a este problema es el muestreo no probabilístico.
1. Muestreo por cuotas.
Conocido también como cuasi probabilístico o pseudo probabilístico, es el favorito de las empresas que realizan sondeos de opinión; esto es porque dentro de los muestreos no probabilísticos, es aquel que menos sesgo tiene. Si bien se trata de una técnica no probabilística es la mejor opción cuando no podemos utilizar el muestreo probabilístico.
Mediante esta técnica se pretende obtener una muestra representativa a partir de una selección de individuos no necesariamente aleatoria, utilizando la distribución de algunas variables concretas que permitan reproducir la distribución de la variable a analizar en la población. Para usar el muestreo por cuotas es necesario tener en cuenta dos cosas:
Primero, identificar a las variables relevantes que pueden influir en el resultado del estudio. Por ejemplo, si estamos diseñando un estudio de preferencias electorales, las variables como: la edad, la ubicación geográfica o el nivel socioeconómico, son variables relevantes porque pueden influir en la preferencia del voto.
Dicho de otro modo, la edad y la preferencia del voto son variables que pueden estar asociadas. Por el contrario, existen variables que no guardarían ninguna relación con la preferencia electoral, tal como la talla, el número de DNI, el nombre del individuo, son variables irrelevantes en un estudio de preferencias electorales.
Segundo, necesitamos conocer la distribución de las variables relevantes en la población de estudio, caso contrario, no podremos reproducir dicha distribución en la muestra. Por ejemplo, si deseamos fijar una cuota sobre la variable edad, podemos recurrir a estudios censales y otras fuentes de información proporcionados por los organismos oficiales en cada región.
Independientemente de la metodología empleada, agregar cuotas al diseño muestral encarece el trabajo de campo ya que obliga a descartar posibles participantes cuando exceden una determinada cuota; por ello hay que tener en cuenta que algunas variables pueden ser redundantes (están correlacionadas), por lo que, controlar solo una de ellas puede ser suficiente.
Por ejemplo, si fijamos una cuota sobre la variable nivel socioeconómico, posiblemente pueda prescindir de otras variables como ingreso familiar promedio o nivel de instrucción, en razón de que estas dos últimas variables son dimensiones de la variable nivel socioeconómico, por lo que se dice que están correlacionadas.
Cuando construimos cuotas con dos o más variables, podemos hacerlo de forma cruzada o no cruzada. Veamos un ejemplo: Si queremos obtener una muestra de 1000 personas para un estudio de preferencias electorales, y hemos identificado dos variables relevantes: sexo (50% hombres y 50% mujeres) y edad (50% menores de 40 años y 50% mayores de 40 años).
En un muestreo con cuotas no cruzadas, del total de individuos de la muestra (1000), necesitamos 500 hombres y 500 mujeres; además 500 menores de 40 años y 500 mayores de esa edad. Es decir que, una muestra de 500 hombres menores de 40 años y 500 mujeres mayores de 40 años sería válido, esto es más fácil de conseguir.
Por otro lado, si definimos cuotas cruzadas sexo-edad, exigiremos que la muestra se componga de 250 hombres menores de 40 años, 250 hombres mayores de 40 años, 250 mujeres menores de 40 años y 250 mujeres mayores de 40 años. Definir cuotas cruzadas es más costoso, este esquema se utiliza solamente cuando existe dependencia entre las variables relevantes.
2. Muestreo según criterio.
Responde a la necesidad de establecer un tamaño y una forma de elegir a las unidades de estudio, la cual no siendo probabilística, está alineada al origen del conocimiento, primero el conocimiento previo, segundo la experiencia del investigador, y tercero la opinión de expertos.
Desde el punto de vista de la construcción de muestras, existen básicamente dos formas de criterio: el primero es el criterio del investigador, y el segundo es el criterio de un grupo de expertos. Al primero de ellos se le denomina también discrecional; y al segundo, criterio de juicio. A continuación, desarrollaremos un ejemplo con cada uno de ellos:
El criterio del investigador, donde el único que decide acerca del número y de la forma de seleccionar a los elementos que conformarán la muestra, es el propio investigador, para ello tiene en cuenta el conocimiento previo y su propia experiencia, se trata de un criterio particular, llamado también discrecional e intencional.
Veamos el siguiente ejemplo: queremos desarrollar un estudio en los profesionales de la salud de América Latina, que realizan docencia en el posgrado, para ver cuál es el grado de uso que le dan a las tecnologías de la información en el proceso de enseñanza-aprendizaje. Entonces, ¿Cómo seleccionaremos a los profesionales que conformarán la muestra?
Como siempre, pienso en el muestreo que tenga la menor cantidad de sesgo posible. Comienzo a analizar la factibilidad del muestreo por cuotas, las cuotas podrían ser los países, de cualquier forma, tendría que asegurar un determinado número en cada país, ocurre el mismo conflicto que genera el muestreo estratificado.
Así que la solución será utilizar mi propia experiencia, a partir de la cual decidiré, como seleccionar a los profesionales de la salud que hacen docencia en el posgrado; y se me ocurre acudir a los miembros de la Sociedad Hispana de Investigadores Científicos, porque allí contamos con un registro de los profesionales de la salud que hacen docencia en el posgrado.
El criterio de un grupo de expertos, llamado también de juicio, consiste en consultar a un grupo de profesionales sobre el tamaño y la forma de seleccionar a los elementos que conformarán la muestra; siempre que se sea posible contar con este grupo de profesionales, por eso se considera opinático, porque se trata de una opinión externa.
En este caso tendré que ponerme en contacto con ellos para pedirles su opinión, y esta vez aparece el término de opinático. También podemos partir de una propuesta del investigador y son los expertos los que tendrán que realizar una crítica sobre la propuesta elegida; es la razón por la que también a este muestreo se le llama crítico.
Este tipo de muestreo es utilizado también en las pruebas piloto, por ejemplo, cuando estamos realizando un estudio de validación de instrumentos, se requiere una muestra para analizar las propiedades métricas del instrumento en cada nivel investigativo, aquí no estamos estudiando a la población, sino al instrumento, no es necesario una muestra representativa.
El focus group muy utilizado en los estudios de mercado, se realiza en muestras no probabilísticas seleccionadas según criterio del investigador, tanto en tamaño como en la forma de seleccionar a las unidades que conformarán la muestra; por supuesto, se necesita cierta experiencia para tener éxito en este tipo de muestreo.
3. Muestreo en bola de nieve.
Es un muestreo del estudio exploratorio, como cuando queremos construir un instrumento. Para ello vamos a poner el siguiente ejemplo: queremos construir un instrumento que nos permita identificar cuáles son las costumbres que tienen las mujeres a la hora del parto en una región alto andina, en el sur del Perú.
La lógica nos sugiere identificar a una de esas mujeres que atiende el parto empírico; donde muchas gestantes no acuden al hospital porque cuando lo hacen, el personal de salud trata de modificar sus costumbres, transgreden su cultura y sus creencias; por eso prefieren tener un parto empírico, y las mujeres que les apoyan en esta tarea reciben el nombre de parteras.
Encontrar una partera es muy sencillo, pero encontrarlas a todas imposible, porque ni siquiera sabemos cuántas son, cuando encontremos a la primera le pediremos que nos haga un listado de las costumbres que tienen las mujeres gestantes a la hora del parto; al final de la entrevista le pediremos que nos ponga en contacto con otras de sus colegas.
Debemos tener en cuenta que no existe un listado de las parteras; en realidad, tampoco necesitamos de uno, no necesitamos entrevistar a 400 parteras, porque nuestro interés no está en generalizar las conclusiones, únicamente estamos tratando de identificar las costumbres de las mujeres a la hora del parto en esta región.
Entonces ¿Cómo determinamos el número de parteras que necesitamos? Esto va a ser simple de definir cuándo empecemos a encontrar patrones en las respuestas que ellas nos vayan dando. Al entrevistar a una segunda partera encontraremos que si bien tiene cosas nuevas que decirnos, en la mayoría de los casos repetirá lo que nos había dicho la primera.
Terminada la entrevista con esta segunda partera le pediremos que nos ponga en contacto con otra de sus colegas y encontraremos en esta tercera entrevistada, que las costumbres que nos ha relatado son, en la mayoría de los casos, las mismas que nos han relatado las dos primeras. Así llegará el punto en que no habrá más necesidad de seguir buscando parteras.
Este punto de saturación se determina con un número suficiente de entrevistadas para nuestro propósito; no existe un cálculo del tamaño muestral, no hay un algoritmo ni una fórmula; porque esta estrategia es cualitativa y la técnica de muestreo es en bola de nieve, no es una técnica probabilística, el resultado del estudio no será inferencial
Por lo tanto, es el investigador quien tendrá que decidir el número de unidades de estudio a evaluar, por otro lado, el muestreo en bola de nieve habitualmente requiere solamente de unas cuantas unidades de estudio, por corresponder a una de las técnicas cualitativas de la investigación, como por ejemplo el juicio de expertos.
El muestreo en bola de nieve puede ser utilizado para el estudio de grupos, minoritarios o que se encuentran muy dispersos, pero que tienen contacto entre sí. Por ejemplo: inmigrantes ilegales, el requisito es que las unidades de estudio se encuentren conectadas entre sí, de tal forma que la identificación de uno de ellos nos permita acceder al resto de la comunidad.
El muestreo en bola de nieve también puede ser utilizado en un estudio cuantitativo, por ejemplo: calcular el ingreso económico promedio de los venezolanos en la ciudad de Lima, claramente se trata de un estudio cuantitativo, pero que en ningún caso es inferencial, porque la muestra no es representativa de la población.
4. Muestreo por conveniencia.
Recibe también el nombre de muestreo deliberado, porque no cuenta con ningún procedimiento estandarizado, ninguna acción específica que realizar, ni razón más que la comodidad o única oportunidad de muestrear; en suma, no hay ninguna forma de seleccionar la muestra, es simplemente deliberado.
Pongamos un ejemplo: imagina a Neil Armstrong, el primer hombre que pisó la luna, tomando una muestra de la superficie lunar para conocer las propiedades fisicoquímicas de nuestro satélite natural. Ese momento corresponde a la única oportunidad para conocer de qué está hecha la luna, no hay forma de tomar una muestra probabilística de toda la superficie lunar.
En realidad, aunque hubiera manera de hacerlo, tomaría demasiada inversión de tiempo y riesgo, únicamente para hacer un muestreo más amplio; además, tampoco podemos elegir la zona donde vamos a alunizar, “el mar de la tranquilidad”, se eligió en función de la factibilidad tecnológica con la que se contaba en ese momento.
Es un muestreo por tanto errático, sin normas, accidental y hasta por comodidad, por ejemplo, si quieres una muestra rápida de cualquier conjunto de unidades de estudio, puedes pedir voluntarios o incluso podrías ofrecer un premio o una recompensa a las personas que quieran participar en el estudio, esto claramente no es representativo de la población.
En la mayoría de los casos, el sesgo que esto puede generar es inmenso, siendo que el muestreo por conveniencia es el menos representativo de todos los muestreos, incluso dentro de los no probabilísticos. Pero existen otras circunstancias donde el muestreo por conveniencia tiene resultados por demás satisfactorios.
Ahora imagina que estamos probando el efecto de una nueva droga antihipertensiva y necesitamos voluntarios para poner a prueba el efecto de este fármaco, para estudiar la farmacocinética y farmacodinamia en sujetos sanos, en este caso incluso si la muestra que consideramos es de voluntarios, se espera un resultado muy similar de haber estudiado a toda la población.
De hecho, si hacemos el estudio, para comparar el efecto que tuvo en los voluntarios con el efecto de la misma droga ya a nivel comercial sobre la población, sobre los pacientes que tienen la hipertensión, encontraremos que será más o menos el mismo, por no decir igual, más bien muy cercano al resultado que habíamos encontrado en los voluntarios.
Por lo tanto, el muestreo por conveniencia es una técnica que no debemos desestimar al momento de hacer investigación, habrá muchos casos en que podemos encontrar resultados en la muestra muy similares a los que encontraríamos en la población, pero también existirá el otro extremo donde los voluntarios representarán la máxima cantidad de sesgo posible.
El muestreo por conveniencia, suele ser en muchos casos la última alternativa para viabilizar el estudio y en ese contexto, tanto el número de los elementos que conforman la muestra, así como su selección es un accidente, es errático, no se guía por normas, más bien no es posible seguir normas en el contexto de su desarrollo.
En muchas ocasiones es la única forma de hacer el estudio, pero no por ello, el estudio no será válido, sino que es un punto de partida, es el inicio del desarrollo de un conjunto de estudios, cada uno más profundo que el anterior, su grado de representatividad sobre la población es una interpretación del investigador.