Como ya hemos comentado anteriormente, cuando analizamos un fenómeno aleatorio es imposible acceder a la totalidad de la población por lo que accedemos a una muestra de la misma. Dicha muestra debe ser lo suficientemente representativa como para poder extrapolar las conclusiones obtenidas con este subconjunto a la totalidad de la población. 

¿Cómo podemos saber si una muestra es representativa o no?, ¿qué criterios debemos seguir para obtener una muestra representativa? 

Veamos el Teorema Central del Límite. Este nos dice que cuando analizamos una población de datos mediante varios subgrupos de muestras representativas (ejemplo: queremos saber la población media de los hombres de un país y se cogen varios grupos de individuos correspondientes a las principales ciudades del mismo), cada una de ellas puede obtener una distribución distinta entre ellas (los hombres de las ciudades del norte son más bajos, y los del sur son más variables, etc.). Si aumentamos el número de ciudades que estudiamos (como por ejemplo a 30), la distribución de las medias (µ) de las alturas de todas las ciudades tenderá a una distribución normalizada. Este ejemplo lo podemos visualizar en la siguiente Figura: 

Quimiometría 2013. Metabolismo del nitrógeno



La principal conclusión práctica de este ejemplo es que el número de muestras debe ser siempre mayor o igual a 30 para que el tamaño de la muestra poblacional sea lo suficientemente representativo de la totalidad de la población. 

Nota: Existen fórmulas para calcular exactamente este número dependiendo de varios criterios como el nivel de confianza que queremos. 

Aunque las teorías estadísticas nos indiquen el tamaño muestral necesario para nuestros experimentos, muchas veces esos valores están en contraposición con la viabilidad técnica y económica de quien hace los estudios. Realizar un experimento con una carga analítica de más de 30 muestras por cada tratamiento puede ser inviable en muchos casos. 

La solución a este problema no es fácil, y se tiene que llegar a una relación de compromiso teniendo en cuenta la siguiente premisa: cuanto mayor sea el número de repeticiones, más potencia tendrá nuestro estudio estadístico, y por tanto, las conclusiones que saquemos.

0 comentarios: