La razón de ser de un estudio son sus resultados, puesto que, si no se presentan los resultados, no hay nada que informar; no hay informe final. Alguien podría omitir sin intención cualquier otra sección del informe final o reporte de la investigación, y aun así tendríamos una contribución, esto no puede ocurrir con la sección de resultados.
Existen algunos principios a considerar al momento de presentar los resultados y el primer principio es la capacidad comunicativa de nuestra presentación, esto significa que, los resultados tienen que tener la capacidad de explicarse solos, incluso sin recurrir a otras secciones del reporte.
El segundo principio es la parsimonia, significa que la mejor forma de presentar un resultado es siempre la forma más simple, pero esto no implica sacrificar el primer principio, que es ser comunicativo, y la forma más simple es utilizar el texto, las tablas y las gráficas.
Los resultados pueden ofrecerse mediante texto, tablas y gráficas; el texto es la forma más simple, rápida y eficiente de presentar los datos, sobre todo en los estudios descriptivos, pero mientras vayamos avanzando en los niveles de la investigación se hará necesaria la presencia de tablas y gráficas que nos ayuden a resumir la información.
1. Presentación de resultados en texto
En los estudios exploratorios no existe el análisis estadístico de los datos, por tanto, la única oportunidad de presentar los resultados de un estudio exploratorio es en texto, no hay tablas ni gráficas como resultados, si puede acompañarse de evidencias como fotografías, placas radiográficas, exámenes imagenológicos, etc.
Los estudios fenomenológicos, presentan en texto el recojo de datos como argumento o evidencia de lo que desean comunicar, por ejemplo, en la pandemia del COVID-19, un médico chino comunicó la existencia de cuatros casos de neumonía atípica que no era causada por ninguno de los patógenos conocidos hasta esa fecha, la información comunicada evidenciaba ello.
En un reporte del 11 de febrero de 2020, el Comité Internacional de Taxonomía de los Virus (ICTV), nombró al virus como “coronavirus de tipo 2 causante del síndrome respiratorio agudo severo (SARS-CoV-2)”. Este informe es una comunicación científica donde la presentación de resultados corresponde a las conclusiones del reporte.
Tras diversos análisis se encontró que el SARS-CoV-2, es un virus que guarda similitudes con los otros coronavirus conocidos, su genoma es 96% idéntico al genoma de otros coronavirus que infectan murciélagos, esta fue otra comunicación científica, donde los resultados corresponden a una teoría que se comunica como conclusiones.
En el contexto de la pandemia, existían países latinos con tasas bajas de contagio por coronavirus, sin embargo, la mortalidad era alta en estos mismos países, el razonamiento nos lleva a pensar que no están detectando los casos a tiempo, así como no están haciendo las suficientes pruebas, este análisis de datos presentado corresponde a otra comunicación en texto.
En los estudios descriptivos, las variables categóricas se presentan en frecuencias absolutas y frecuencias relativas, donde el porcentaje es la medida de frecuencia más usada. No es necesario hacer una tabla para decir que el valor de la prevalencia es del 10%, con una línea de texto basta para comunicar este resultado.
Las variables numéricas se presentan en promedios y desviaciones estándar, como medidas básicas de resumen; no es necesario presentar otras medidas de tendencia central ni dispersión, a menos que sea una necesidad particular en algún estudio, con este mismo criterio podrían acompañar las medidas de posición como los percentiles.
El texto también es utilizado para complementar la información que se presenta en las tablas y las gráficas. Pero complementar no quiere decir repetir, exactamente lo que se observa en la tabla, que es la práctica errónea más frecuente, todo lo que se anota debajo de una tabla o gráfica solo deberá complementar lo que ya se puso en el otro formato.
En una tabla de frecuencias para variables nominales, que no guardan orden entre sus categorías, se presentan los resultados en orden descendente de frecuencias, donde las categorías menos frecuentes suelen agruparse bajo la categoría de “otros” el texto que se presenta bajo la tabla, redacta a que otras categorías estaría haciendo referencia.
En los estudios analíticos también es posible presentar resultados en texto, aunque lo más frecuentes es que esto sea para acompañar y complementar las tablas y gráficas que son muy comunes de encontrar en los resultados de estos estudios, una medida de eficiencia – en texto- puede acompañar a una tabla cuyo contenido demuestra esa eficiencia.
2. Presentación de resultados en tablas
Las tablas nos ayudan a presentar los resultados de manera condensada, una buena tabla permite transmitir desde el principio todos los resultados de una sola vista, ayuda a retener los datos en la memoria, para una lectura sustanciosa, permite el análisis de los datos y también permite intuir las conclusiones del estudio.
Una tabla permite enlistar una gran cantidad de valores numéricos en poco espacio y puede ser mejor que, una explicación extensa en texto; de manera que permite reducir la extensión del informe final. El título de la tabla debe ser lo suficientemente descriptivo como para entender el contenido de la misma, sin necesidad de recurrir a los objetivos del estudio.
En las tablas descriptivas,la primera columna llevará las categorías de la variable. Esta primera columna requiere un encabezado solamente si su contenido no queda claro en el título de la tabla. En el encabezado de cada columna habrá que indicar el tipo de datos presente en la columna, con las unidades de medición entre paréntesis.
Las filas aparecen por delante de la primera columna y por debajo de los encabezados de columna, su contenido serán los resultados condensados que queremos presentar. Si hemos de presentar los resultados de un test, no es necesario presentar los resultados de cada ítem, sino de la calificación total; en casos necesarios se puede presentar la calificación por dimensiones.
Para los datos categóricos en el cuerpo de la tabla se anotan las frecuencias absolutas y las frecuencias relativas. Hay que asegurarse de que las frecuencias relativas hagan una suma exacta. Esto porque es un indicador de la rigurosidad del trabajo estadístico realizado, y el Jurado de la tesis podría considerar que no hubo un adecuado análisis estadístico.
Para los datos numéricos en la tabla, debemos anotar la media como medida de tendencia central y la desviación estándar como medida de variabilidad, opcionalmente el intervalo de confianza al 95% para la media, calculado a partir del error estándar que, en este caso, deberá aparecer también. No se repiten las unidades de medida en el cuerpo de la tabla.
Las tablas de contingencia se utilizan para representar la relación entre variables categóricas; lo mejor siempre serán las tablas de 2 por 2, llamadas también tablas tetracóricas o tetra nucleadas, esto porque poseen cuatro núcleos, donde es muy sencillo observar y analizar las relaciones entre variables.
Dada la naturaleza bivariada de las tablas de contingencia, se acompañan de pruebas estadísticas para el contraste de hipótesis. A su vez, las tablas ayudan a la interpretación de resultados, sobre todo cuando comparamos grupos y llegamos a la conclusión de que son diferentes, es muy útil observar las tablas para encontrar la diferencia detectada con la estadística.
Si las categorías de alguna de las variables que participan en las tablas de contingencia son muy numerosas, es preferible que la tabla se extienda verticalmente antes que horizontalmente, es deseable que la tabla no se extienda más allá de una página, las tablas que ocupan más de una página pierden su capacidad comunicativa.
No todos los datos son factibles de presentarse en tablas; por ejemplo, si hacemos un análisis de supervivencia o una serie de tiempo, las tablas no ayudan mucho, las tablas de vida sirven para construir gráficas y a partir de ellas, realizar los análisis, en este caso la tabla sirve para encontrar el dato exacto que descubrimos a partir de la gráfica.
3. Presentación de resultados en gráficas
Las gráficas comunican visualmente mejor los resultados de un estudio longitudinal, por ejemplo, a la hora de mostrar tendencias o patrones, una imagen vale más que mil palabras, pero también es muy fácil quebrar el objetivo visual de la gráfica y presentar resultados con datos innecesarios.
Al igual que las tablas, las gráficas deben estar en la capacidad de explicarse por sí solas. De hecho, es muy probable que la gráfica se utilice para una presentación audiovisual, así que conviene que se defienda sola. Las gráficas deben ser monocromáticas, para dejar a un lado la tentación de hacer una gráfica más compleja solo porque los colores lo permiten.
Las variables categóricas en los estudios descriptivos pueden presentarse en un diagrama de sectores, consiste en crear un círculo que representa al cien por ciento de los casos, el mismo que se divide en sectores proporcionales a la frecuencia de cada categoría, es recomendable su uso cuando las categorías son cuatro o menos.
En los estudios descriptivos los diagramas de sectores se utilizan para describir variables categóricas, hasta un máximo de cuatro categorías, más allá es preferible utilizar un gráfico de barras que presenta a las categorías en orden descendente de frecuencia, comunica mucho mejor que un diagrama de sectores.
El gráfico de barras es más utilizado cuando en la presentación de resultados: la variable categórica tiene cuatro o más categorías, se debe presentar las barras en orden de magnitud descendente, tal cual como ocurre en las tablas, debe consignarse en la parte superior de cada barra su frecuencia absoluta y o relativa.
Las leyendas están proscritas en una gráfica, por cuanto toda la información debe ir cargada sobre la propia gráfica, por ejemplo, si se trata de un diagrama de sectores, los nombres de las categorías, así como las frecuencias absolutas y relativas deben ir al interior del segmento o sector correspondiente.
Cuando de presentar una gráfica para variables numéricas se trata, tenemos el caso de la presentación de una sola variable a través de un histograma, el mismo que debe ir acompañado de la curva normal, su valor medio y sus respectivas medidas de dispersión, ya sea la desviación estándar o la desviación típica según corresponda.
Las barras de error son otra forma de presentar a las variables numéricas, en el centro se encuentra el valor promedio y los límites superior e inferior corresponden al “intervalo de confianza” para los datos si se calculó con la desviación estándar y al intervalo de confianza para la media si se calculó con la desviación típica.
Cuando de estudios analíticos se trata, existe una infinidad de posibilidades para construir gráficas, en el nivel más básico, en el nivel relacional cuando se trabaja con variables numéricas, es muy común utilizar el diagrama de dispersión o nube de puntos, esto por su aspecto de la presentación en el plano cartesiano.
Un diagrama de dispersión, debe incluir las definiciones de las unidades de medición empleadas en el eje de las abscisas y en el eje de las ordenadas, enfocando la gráfica solamente sobre la nube de puntos y no extendiendo innecesariamente el plano cartesiano. Una gráfica que requiere media página de texto explicativo, no es útil.
4. Presentación del análisis estadístico
En la sección de resultados no se presenta el análisis estadístico, sino los resultados del análisis estadístico. Si bien pueden existir procedimientos estadísticos intermedios para lograr el resultado que queremos mostrar, estos no se presentan, sino solamente su resultado final.
Si bien, para el desarrollo de la prueba de hipótesis contamos con el ritual de la significancia estadística, este procedimiento no se presenta, sino únicamente el resultado final, que viene a ser el estadístico calculado. Incluso la mención a los procedimientos estadísticos no va en la sección de resultados, sino al final de la sección de material y métodos.
El nivel de significancia debió plantearse en la sección de métodos, aun así no basta con decir que el p-valor es menor al cinco por ciento, debemos escribir exactamente el valor de p. El p-valor representa la probabilidad del error tipo 1, es decir, la probabilidad de equivocarnos en caso haber elegido aceptar la hipótesis del investigador.
No es necesario presentar todo lo que el software estadístico puede brindarnos. Hay que tener en cuenta que las salidas del software siempre nos brindan más información de la que solicitamos, e incluso de la que necesitamos. Mucha de esta información le sirve al analista para corroborar que el procedimiento ha sido el adecuado.
Por ejemplo, cuando comparamos dos grupos mediante una t de Student, debemos asegurarnos de la homogeneidad de varianzas, así como la distribución normal; pero esto no constituye un resultado, sino un requisito para el contraste estadístico. Por lo tanto, no debe ser presentado, sino solo mencionado y esta mención se hace en la sección de métodos.
Dentro de los niveles de la investigación, el análisis estadístico aparece en el nivel descriptivo de la investigación, específicamente cuando queremos estimar un parámetro de la población a partir de una muestra, el análisis estadístico consiste en calcular la estimación puntual y acompañarla con sus respectivos intervalos de confianza al noventa y cinco por ciento.
En el nivel descriptivo de la investigación también aparece la prueba de hipótesis donde los procedimientos más usados son: la prueba de bondad de ajuste de chi cuadrado y la t de Student para una muestra, en la presentación de resultados se coloca el valor del estadístico, acompañado del p-valor, que representa a la magnitud del error tipo 1.
Las pruebas estadísticas como chi cuadrado o t de Student, son procedimientos que nos permiten decidir sobre la presencia o ausencia de la relación entre variables, a partir de estos resultados se puede concluir sobre la dependencia o independencia entre ellas, pero desde el punto de vista probabilístico.
Las pruebas estadísticas, nunca por sí solas concluyen sobre la relación causal entre variables, el concepto de relación causal, sobrepasa el campo de acción del análisis estadístico, por lo que se requiere de completar otros criterios de causalidad, sin embargo, el análisis estadístico es el punto de partida de la relación causa efecto.
En los niveles predictivo y aplicativo aparecen las técnicas estadísticas, como la regresión logística binaria, o la regresión lineal múltiple, que no son pruebas estadísticas, sino procesos complejos que se desarrollan paso a paso y toman distintos rumbos a medida que se desarrollan, estos pasos intermedios tampoco es menester de la presentación de resultados.