La interpretación de resultados es un proceso creativo que utiliza como sustrato o insumo a la presentación de resultados, comienza con una completa descripción, continúa con una lectura enfocada del análisis estadístico de los datos, y culmina con una enmarcada interpretación estadística de los mismos.
La descripción de resultados no es una transcripción de lo que se presentó en las tablas o en las gráficas de la sección de resultados, se trata de una lectura reflexiva a cerca de lo que nos interesa resaltar, casi adelantándonos al análisis estadístico que lo acompaña.
La lectura enfocada del análisis estadístico de los datos, constituye también un puente entre los resultados mismos y las conclusiones a las que deseamos llegar, se trata de una examinación del análisis estadístico que apunta a sustentar las futuras conclusiones.
La interpretación estadística, es la conclusión estadística a la que llegamos a partir de su análisis, no se trata de las conclusiones del estudio, por cuanto aún faltan muchos elementos que considerar para tal fin, se trata de concluir probabilísticamente, para que esto sirva de insumo para la discusión de resultados, de donde se obtendrán las conclusiones definitivas del estudio.
1. Descripción de resultados
Se realiza después de la presentación de resultados, no consiste en repetir las cifras que aparecen en la presentación de resultados, sino en remarcar los hallazgos principales, se trata de un proceso creativo, que va a requerir del buen discernimiento del autor a la hora de elegir qué parte es importante y qué parte no lo es.
Esto no es una tarea para principiantes, y no se trata de conocer el método o dominar la estadística, sino del conocimiento sobre la línea de investigación, un profesional que investiga dentro de su especialidad, garantiza el dominio del tema, pero no es suficiente, solamente el poseer una línea de investigación garantiza una adecuada descripción de los resultados.
Es aquí donde el investigador puede recurrir a otros investigadores que compartan su misma línea de investigación, que puedan aportar de su experiencia en el análisis de los resultados. El trabajo colaborativo siempre es más provechoso que el trabajo individual, la experiencia compartida garantiza un buen análisis de los resultados.
Todo procedimiento analítico y la descripción de resultados no es una excepción a la regla, está enfocado en el propósito del estudio, es un error muy común en los investigadores nóveles enfocarse en la matriz de datos recolectada, también en la posibilidad de crear tablas y gráficas a partir de los datos, más descripción no hace a un estudio de mejor calidad.
En los estudios exploratorios al no existir análisis estadístico, tampoco habrá interpretación del análisis estadístico, en ese caso la interpretación de resultados considera únicamente a la descripción de resultados, esto será suficiente insumo para formular las conclusiones, esto ocurre también en los estudios descriptivos no inferenciales.
En los estudios inferenciales aparece el concepto de población y muestra, aparece la necesidad de estudiar a la población a partir de una muestra, con lo que también aparece el verdadero análisis de datos estadísticos, como el muestreo que se realiza a través de un algoritmo matemático, el mismo que debe ser descrito en cuanto a su desarrollo.
A partir de este punto la descripción de resultados, solo es el punto de partida de lo que denominamos interpretación de resultados, una adecuada descripción de resultados, es una lectura que prepara al lector del reporte de investigación al futuro análisis estadístico, es como una presentación preliminar de los procedimientos estadísticos que siguen a continuación.
Por ejemplo, si estamos desarrollando un estudio de casos y controles para determinar si el hábito de fumar es un “factor de riesgo” para el cáncer de pulmón, el resultado es una tabla de contingencia y el análisis estadístico un chi cuadrado. La descripción de resultados, resalta la diferencia de la frecuencia del hábito de fumar entre los casos y los controles.
Continuando con el ejemplo anterior, es posible que, el hábito de fumar sea más frecuente en el grupo de los casos respecto del grupo de los controles (y se pueden mencionar los porcentajes), esto si bien es solo una descripción, está anunciando que esa puede ser la conclusión, solo faltaría confirmarla o no, de acuerdo al nivel de significancia de la prueba estadística.
Una buena descripción de resultados, no es una lectura puramente descriptiva de las tablas o las gráficas, es una selección de comentarios respecto de la tabla o gráfica, que advierte el procedimiento estadístico que se presenta a continuación, es un argumento que justifica el análisis estadístico posterior.
2. Análisis estadístico
Cuando el análisis estadístico implica la realización de una prueba de hipótesis, su interpretación, no consiste en escribir, en el informe final de la investigación, todo el ritual de la significancia estadística, sino solamente anunciar el procedimiento estadístico realizado y el estadístico calculado, así como el p-valor.
El ritual de la significancia estadística es un proceso analítico que se lleva a cabo de manera mental, es un procedimiento heurístico, propio del razonamiento analítico que comienza con plantear el sistema de hipótesis, establecer el nivel de significancia, elegir el estadístico de prueba, dar lectura al p-valor calculado y tomar una decisión probabilística.
No es necesario escribir todos los pasos de la prueba de hipótesis en el informe de investigación, porque no se trata de un capítulo donde debemos exhibir nuestras habilidades en el análisis de datos aplicado a la investigación científica, sino de obtener una conclusión probabilística, de quedarnos con la hipótesis planteada por el investigador o de negarla.
La conclusión del análisis estadístico se realiza utilizando la terminología adecuada según el objetivo estadístico; los resultados obtenidos de esta manera son el suministro para la interpretación del propósito del estudio; si el objetivo estadístico dice: “comparar” entonces, la conclusión del análisis estadístico dirá que existen diferencias o no existen diferencias.
Si el objetivo estadístico dice: “correlacionar” entonces, la conclusión del análisis de datos dirá que existe correlación o no existe correlación, etc. La conclusión del análisis estadístico, consiste en quedarse con una de las hipótesis, ya sea la nula o la alterna, las cuales fueron planteadas utilizando la terminología del objetivo estadístico.
El análisis de datos estadísticos, está compuesto por procedimientos desarrollados de manera estratégica, no se puede leer un resultado separado del otro, por ejemplo, cuando se desarrolla la prueba estadística denominada correlación de Pearson, y se obtienen los siguientes resultados: un coeficiente r = 0,8 y un p-valor = 0,1.
No se puede decir que la correlación es buena (r = 0,8), cuando no hay significancia estadística (p-valor = 0,1), que demuestre que exista correlación, por lo tanto, en este ejemplo de la correlación de Pearson, se debe leer primero el p-valor para determinar si existe correlación o no -y en caso de que esta exista- recién leer el coeficiente “r”.
En otro escenario, cuando se trabaja con datos numéricos continuos es deseable contar con distribución normal, para poder aplicar procedimientos estadísticos paramétricos. Antes de realizar estos procedimientos es preciso conocer si la variable analizada cuenta con distribución normal, si eso no se conoce se procede a la prueba de normalidad.
En el caso de que la distribución de una variable se conozca de forma preliminar que cuenta con distribución normal, no es necesario aplicar la prueba de normalidad, por ejemplo, si se conoce que la talla, el peso, las horas de sueño, tienen distribución normal en la población adulta, entonces de trabajar con esas variables, no es necesario aplicar la prueba de normalidad.
El análisis estadístico de los datos, se rige por principios, no hay dos estudios que requieran exactamente los mismos procedimientos, conocer una gran cantidad de herramientas estadísticas, asegura el uso idóneo de los métodos estadísticos, de allí la necesidad de conocer los procedimientos más comunes para cada uno de los niveles de la investigación.
En el estudio experimental el análisis estadístico es la piedra angular, es el sustento, es la base de la demostración de la relación causa efecto, al mismo tiempo debemos reconocer que solamente con la estadística no se puede demostrar relaciones de causalidad, se requiere complementar al análisis estadístico con los criterios de causalidad.
El experimento más simple que existe, es aquel que conforma dos grupos aleatoriamente, se interviene a uno de ellos y se le denomina grupo experimental, el otro será considerado grupo control o grupo blanco, luego se hace como mínimo dos mediciones, una antes de la intervención y la otra después de la intervención.
El análisis estadístico plantea identificar las diferencias entre uno y otro grupo, como quiera que ambos grupos están balanceados, y que en la primera medida se demostró ello, las diferencias que se encuentren en la segunda medida serán adjudicadas a la intervención por parte del investigador, esto es un resultado netamente matemático.
Pero desde el punto de vista del experimento, estas diferencias se interpretan como un efecto resultado de la intervención, con lo cual se demuestra la relación causal, para ello el estudio tiene que estar acompañado de todos los controles y requisitos que se requieren para un estudio de nivel explicativo.
El análisis estadístico de los diseños experimentales, parten de la premisa de que todas las condiciones metodológicas están garantizadas, de manera que más adelante se pueda concluir a partir del análisis estadístico, pero que implícitamente se está considerando las condiciones de todo experimento, que corresponden al control.
3. Interpretación estadística
No hay que confundir la interpretación estadística de los resultados con la interpretación del propósito del estudio, son cosas distintas. No es lo mismo elegir una de las hipótesis al final del ritual de la significancia estadística, que interpretar o traducir los resultados estadísticos para satisfacer al propósito del estudio.
Veamos un ejemplo, si se está desarrollando un estudio de factores de riesgo, utilizando el diseño de los casos y controles, el objetivo estadístico es comparar, y si logramos demostrar diferencias entre los dos grupos, el resultado será que existen diferencias, luego hay que observar la tabla de contingencia, para interpretar donde es más frecuente una característica.
La interpretación estadística, integra la lectura tanto del p-valor como de la tabla de contingencia, primero se lee el p-valor y en caso de que este esté por debajo del nivel de significancia, entonces se procede a interpretar los resultados de la tabla de contingencia, si el p-valor no es significativo, no hay nada que interpretar en la tabla.
En un estudio de prevalencia, desde el punto de vista estadístico, calculamos la frecuencia de la enfermedad en una muestra, esto correspondería a la estimación del parámetro de la población, siendo así se deberá acompañar al mismo con sus respectivos intervalos de confianza, lo cual da respuesta al objetivo estadístico.
En un estudio que pretende demostrar la influencia del hábito de fumar en la aparición del cáncer de pulmón, se considera expuestos a los fumadores y a los fumadores pasivos, mientras que se considera no expuestos a los no fumadores, luego de un periodo de seguimiento con evaluaciones seriadas se calculará la frecuencia de la enfermedad en cada grupo.
Luego de recolectar los datos, es posible que el cáncer de pulmón sea más frecuente en el grupo expuesto respecto del grupo no expuesto, estas frecuencias se interpretan como incidencias, para poder obtener un valor de riesgo relativo -hasta aquí- nos conduce el análisis estadístico, el concepto de influencia ya corresponde al propósito del estudio.
Continuando con el ejemplo anterior, para interpretar que el grupo expuesto tiene mayor incidencia de la enfermedad que el grupo no expuesto, requiere de un p-valor significativo derivado de la prueba de chi cuadrado, de manera que primero se procede al cálculo del p-valor y en caso de que este sea significativo, se procede a la lectura del riesgo relativo.
Si en el estudio en curso, el único objetivo fuese el cálculo del riesgo relativo, para poder interpretar el riesgo relativo, primero habría que asegurarse que su intervalo de confianza, no cruza el valor de la unidad, en toda su amplitud con su nivel de confianza del noventa cinco por ciento debe estar por encima de la unidad.
En la validación de pruebas diagnósticas, uno de los objetivos del estudio más comunes es evaluar la utilidad global de la prueba diagnóstica, que desde el punto de vista estadístico, no es más que el coeficiente Kappa de Cohen, por lo tanto, se trata de una medida de concordancia, la interpretación estadística, únicamente nos conduce a decir que existe concordancia.
El Kappa de cohen como medida de concordancia, es también utilizado para medir la capacidad predictiva de un modelo predictivo donde la variable a predecir es categórica dicotómica, el Kappa de Cohen, solo es un estimador, el concepto de capacidad predictiva o rendimiento diagnóstico del test, no le corresponde señalar a la estadística.
En una tabla de contingencia de 2 por 2, la tabla misma corresponde a la presentación de un resultado, la misma que se puede acompañar con un estadístico y valor de probabilidad, esta tabla de 2 por 2 tiene múltiples interpretaciones, dependiendo de la intención del investigador, que se traduce en el propósito del estudio y luego en los objetivos.
Por ejemplo, en una tabla de 2 por 2 se puede analizar la comparación de dos grupos, también se puede analizar la asociación de dos condiciones, si fuera el caso se puede calcular el riesgo relativo (RR), el Odds Ratio (OR), la sensibilidad, la especificidad, el valor predictivo positivo (VPP) y el valor predictivo negativo (VPN), etc.
Esto no significa que todos estos valores deban ser calculados a partir de una tabla de 2 por 2, sino solamente aquellos que correspondan a la intención del investigador, alineados al propósito de su estudio y operacionalizados en sus objetivos, de allí la necesidad de que el investigador tenga siempre en mente el propósito del estudio al momento de analizar los datos.
La interpretación de una tabla de 2 por 2 no es un ritual, es un proceso creativo, es un razonamiento contextual, es un argumento justificado, alineado con lo que el investigador desea demostrar, de nada sirve analizar todo lo que una tabla de contingencia nos puede dar, si al final no se canaliza una conclusión futura.
La interpretación estadística es el sustrato de la interpretación de los resultados para completar el propósito del estudio, son dos momentos distintos, el primero es netamente probabilístico y el segundo es la respuesta al propósito del estudio, si bien se puede hacer este razonamiento de manera conjunta, deberá tenerse en mente que son dos cosas distintas.