MATEMÁTICAS

Intervalos de confianza

A partir de la normalización de estudios estadísticos mediante distribuciones muestrales, es posible determinar parámetros de una población a través de sus valores estadísticos. Normalmente, no se indica un valor único para el parámetro desconocido, sino un rango de valores denominado, intervalo de confianza.

Estimación paramétrica

Cuando se conoce la distribución que sigue una población estadística y se desea determinar el valor de alguno de sus parámetros, puede elegirse una muestra representativa de la población y aplicar las fórmulas de sus valores estadísticos. Este tipo de operación se denomina estimación paramétrica.

Al realizar una estimación paramétrica, pueden obtenerse dos tipos de resultados:

  • Estimación puntual, con un único valor para el parámetro desconocido.
  • Intervalo de confianza, que ofrece para dicho parámetro un rango de valores comprendidos entre dos límites.

Cálculo de intervalos de confianza

En una estimación paramétrica, el intervalo de confianza [a, b] debe contener en su interior a la media de la población m con una probabilidad igual a 1 - a, expresión que se conoce como nivel de confianza. Es decir:

En una distribución muestral de las medias con media poblacional m, desviación típica poblacional s, tamaño de la muestra n, media muestral e intervalo de confianza predeterminado 1 - a (expresado en porcentaje; por ejemplo, 95%), es posible calcular el intervalo de confianza a partir de la expresión:

El intervalo de confianza de la distribución de la figura para un nivel de confianza 1 - es el formado por[-z/2, +z/2].

En una distribución muestral de las proporciones de tipo N (p, ), puede determinarse el intervalo de confianza, para el cual existe una proporción p de elementos que poseen una cierta característica, a partir de una muestra representativa, donde la proporción es p’, por medio de la siguiente expresión:

Contraste de hipótesis

Otra operación común en el manejo de distribuciones muestrales es la que consiste en contrastar una hipótesis de partida a través de los resultados de una muestra obtenida de una población estadística. El procedimiento que se sigue consta de los pasos siguientes:

  • Proponer una hipótesis que se considera como verdadera, llamada hipótesis nula.La inversa de la hipótesis nula se llama hipótesis alternativa.
  • Definir las leyes de probabilidad de la población y de la muestra (en general, se considera una distribución normal).
  • Determinar la zona de aceptación de la hipótesis nula, mediante intervalos de confianza.
  • Fijar posibles zonas de rechazo, donde no se admite la hipótesis nula, que se conocen genéricamente como región crítica.

Cuando la región crítica está situada a los dos lados de la zona de aceptación de la hipótesis nula, el contraste se denomina bilateral o de dos colas; si está sólo a un lado de la región crítica, se llama unilateral o de una cola.

Regiones críticas y de aceptación en contraste de hipótesis bilateral (arriba) y unilateral (abajo), en el caso de la media.

Nivel de significación

En la contrastación de hipótesis puede producirse un riesgo de rechazo de la hipótesis para algún valor concreto del intervalo de confianza aunque la hipótesis sea válida en el resto del intervalo. Esta probabilidad se denomina riesgo de error o nivel de significación, y se denota por a.

  • Si se acepta la hipótesis, se considera que la diferencia entre el valor del parámetro contemplado en la hipótesis nula y el que le corresponde según la muestra es no significativa.
  • Cuando se rechaza la hipótesis nula para un valor de a = 5%, la diferencia se dice que es significativa.
  • Si la hipótesis nula se rechaza con un valor de a = 10%, se dice que la diferencia es muy significativa.

Muestras grandes para la media

En la determinación de intervalos de confianza para la media, si el valor de n es grande (n ³ 30) y se desconoce la desviación típica poblacional, puede sustituirse ésta por la desviación típica de la muestra.

 

Muestras grandes para la proporción

Ilustración gráfica de las zonas de aceptación y de rechazo en el contraste de hipótesis para la media.

Comportamiento de la variable tipificada en el contraste de hipótesis para la media.

En el cálculo de intervalos de confianza para las proporciones, cuando el valor de n es grande (n ³ 30) y no se conoce el parámetro p, puede sustituirse éste por el parámetro p’ = f / n de la muestra.