Inferencia estadística
Aproximación mediante una distribución muestral
Para expresar las propiedades de una población estadística a través de un muestreo se determinan muestras representativas de la población y se procede a analizar sus parámetros estadísticos según dos técnicas posibles: distribución muestral de las medias o distribución muestral de las proporciones (ver t64).
Al tratarse de una aproximación, por exacta que sea, el muestreo introduce una diferencia entre las propiedades de la muestra y el valor real que se obtendría si se analizara el conjunto de toda la población.
Por ejemplo, dada una población de tamaño N con media aritmética m y desviación típica s, y obtenida por distribución muestral de las medias una muestra de la misma de tamaño n, media aritmética
y desviación típica
, el error absoluto introducido en el cálculo de cada media tendría el valor |m -
|. A escala global, la media de las medias de la distribución coincide con la media de la población, así que las diferencias |m -
| serán bajas, aunque en general no nulas.
La distribución de todas las medias obtenidas a partir de una población mediante una distribución muestral de las medias tiene forma de campana de Gauss (distribución normal).
Error muestral
Para determinar en términos estadísticos el error introducido en el muestreo se define el concepto de error muestral como la desviación típica de la distribución muestral de las medias o de las proporciones.
Valor del error muestral en los diferentes tipos de distribuciones muestrales:

Error máximo admisible
Una distribución muestral de las medias o de las proporciones se representa a modo de una curva o campana de Gauss. Por tanto, nunca es posible abarcar estadísticamente todo el área de la curva, ya que tiende asintóticamente a infinito.
Para evaluar la validez del muestreo, se maneja el concepto de nivel de confianza, establecido como el porcentaje del área de la curva que se contempla en el estudio (por ejemplo, el 90%, el 95%, etcétera).
Llamando d al error máximo admisible en el muestreo, la probabilidad de que la media de la distribución muestral y la media de la población difieran en una cantidad menor que d se llama nivel de confianza, y se expresa por (1 - a).
En una distribución muestral de las medias, el nivel de confianza se calcula como:

Como casos particulares, se obtiene que:
- Si d =
, P = 0,6826, es decir, un nivel de confianza del 68,26%. - Si d = 2
, P = 0,9544, lo que significa un nivel de confianza del 95,44%. - Si d = 3
, P = 0,9974, con un nivel del confianza del 99,74%.
Así, el nivel de confianza puede expresarse en función de la desviación típica de la distribución muestral de las medias, a través del valor de un coeficiente denominado k.
En una distribución muestral de las proporciones, el nivel de confianza obedece a la fórmula siguiente:

Entre el error máximo admisible y el error muestral existe una relación a través del valor del coeficiente k:

Tamaño de la muestra
En la realización de estudios estadísticos, el tamaño n de una muestra representativa depende del tamaño de la población N, del error máximo admisible d y del nivel de confianza (1 - a), según las expresiones siguientes para determinar el tamaño de una muestra representativa:

Más información
Relación entre el valor de k y el nivel de confianza (1-a).
Tabla de relación entre la constante k y el nivel de confianza (1 - a).
Error con respecto a la media
El error máximo admisible se expresa comúnmente en forma porcentual como:
d = k · s / Ön
El valor de d puede sustituirse por el producto l · m, siendo l el porcentaje de aproximación indicado en tanto por uno.
Tablas de nivel de confianza
Para determinar el tamaño de una muestra extraída de una población finita se manejan tablas de nivel de confianza, en especial para los valores 95,44% y 99,74%.
