Los dos ejemplos anteriores ya los hemos visto en el capítulo anterior. La tercera opción corresponde a una herramienta fundamental en la inferencia estadística, el Contraste de Hipótesis. Se basa en estudiar la probabilidad de formular una afirmación (o hipótesis) sobre un caso concreto y que estemos en lo cierto.
Nota: Este tipo de estimaciones se usan en los casos de distribución normalizada.
Veámoslo con el siguiente ejemplo: queremos estudiar si hay un problema de contaminación y nos preguntamos ¿es mayor de 50 mg L-1 la concentración de nitratos en un rio que pasa cerca de una granja agrícola? Si es mayor, habrá contaminación y si es menor, no (valores referencia según la legislación vigente).
Para estudiar este caso, hemos ido a río y hemos recogido muestras de agua para analizarlas en el laboratorio. Tenemos dos posibles hipótesis antagónicas a contrastar:
- - La hipótesis nula (H0), correspondería a la afirmación que queremos contrastar (ejemplo: la concentración de nitratos es menor o igual de 50 mg L-1).
- - La hipótesis alternativa (H1) o la contraria a H0 (ejemplo: la concentración es mayor de 50 mg L-1).
Al obtener los resultados de los análisis, vemos las siguientes posibilidades:
Como podemos observar, tenemos cuatro posibilidades. Dos de ellas en las que no cometemos error en la formulación de nuestra hipótesis.
- - Decisión correcta de Tipo A: Suponemos que los nitratos son menores de 50 mg L-1 y lo confirmamos con los análisis. Podemos afirmar que NO HAY contaminación.
- - Decisión correcta de Tipo B: Suponemos que los nitratos son mayores de 50 mg L-1 y lo confirmamos con los análisis. Podemos afirmar que SI HAY contaminación.
Las otras dos nos informan del error que hemos cometido en nuestra hipótesis:
- - Error de Tipo I (o de tipo α): Suponemos que la concentración de nitratos era mayor de 50 mg L-1 y no lo era.
- - Error de Tipo II (de tipo β): Suponemos que la concentración de nitratos era menor de 50 mg L-1 y no lo era.
Nota: Para hacer un contraste de hipótesis, debemos definir muy bien cual es la hipótesis nula (H0) y alternativa (H1), ya que todas las conclusiones se harán en base a esto.
A la hora de descartar una u otra hipótesis, no podremos afirmar exactamente cuál es la decisión correcta debido a que solo tenemos acceso a una parte de la población (una muestra de ella). Por lo tanto, es lógico que hablemos en términos probabilísticos, ya que así podremos evaluar el error que cometemos al equivocarnos.
Así, en términos de probabilidad tendríamos lo siguiente:
- Probabilidad de escoger H0 siendo H0 cierta (P = 1-α)
- Probabilidad de escoger H0 siendo H1 cierta (P= β)
- Probabilidad de escoger H1 siendo H0 cierta (P= α)
- Probabilidad de escoger H1 siendo H1 cierta (P= 1-β)
Nota: Es usual utilizar el Error de tipo I, es decir, el error que comentemos al afirmar que la hipótesis nula no es la correcta ya que es más fácil de controlar.
Veámoslo gráficamente:
Ejemplo de gráfica de una cola sacado de http://iescastelar.juntaextremadura.net/web/departamentos/matematicas/matematicasccss2ba/matematicas2ccss/home.htm |
μ se corresponde con el valor de la concentración de nitratos de las muestras de agua y μ0 con 50 mg L-1. Aquí vemos que el nivel de significancia o probabilidad de cometer el error de tipo I es α.
Nota: si hubiésemos definido las hipótesis como H0 fuese la concentración de nitratos en agua 50 mg L-1 y H1, una concentración distinta a esta (independientemente que fuese mayor o menor), tendríamos una gráfica de “dos colas”.
Ejemplo de gráfica de dos colas sacado de http://iescastelar.juntaextremadura.net/web/departamentos/matematicas/matematicasccss2ba/matematicas2ccss/home.htm |
0 comentarios:
Publicar un comentario