Inferentzia estatistikoa
Laginketako banaketaren bitarteko hurbilketa
Biztanleen estatistika baten ezaugarriak langinen bidez adierazteko, biztanleriaren lagin adierazgarriak zehaztu behar dira eta ondoren, horien parametro estatistikoak aztertu behar dira, aukeran dauden bi tekniken arabera: batezbestekoen laginetako banaketa edo proportzioen laginetako banaketa (64. gaia ikusi).
Hurbilketa bat denez, nahiz eta oso zehatza izan, laginek ezberdintasun bat sortzen dute laginaren ezaugarrien eta biztanleri osoko azterketaren balio errealaren artean.
Esate baterako: N tamainako biztanleria badago m batazbesteko aritmetikoarekin eta s desbiderapen tipikoarekin, eta batezbestekoen laginketako banaketaren bitartez, n tamaina,
batezbesteko aritmetikoa eta
desbiderapen tipikoa duen biztanleriaren lagina lortzen bada, batezbesteko bakoitza kalkulatzean sortutako akats absolutuak |m -
| balioa edukiko du. Eskala globalean, banaketaren batezbestekoen bataz bestea bat dator biztanleriaren batezbestekoarekin. Horrenbestez, |m -
| diferentziak baxuak izango dira, nahiz eta oro har, nuluak ez izan.
Biztanle-talde jakin batetik, batezbestekoen laginketako banaketaren bitartez, lortutako batezbesteko guztien banaketak Gauss kanpaina itxura dauka.
Laginen akatsa
Estatistikari dagokionez, laginetan sortutako akatsa zehazteko, laginen akatsa izeneko kontzeptua definitu behar da, alegia: batezbestekoen edo proportzioen laginetako banaketaren desbiderapen tipikoa.
Laginen akatsaren balioa, laginetako banaketa-mota desberdinetan:

Onartzen den akats maximoa
Batezbestekoen edo proportzioen laginetako banaketa kurba edo Gauss kanpaia moduan irudikatzen da. Beraz, estatistikari dagokionez, ezin izango da inoiz kurba osoa okupatu, asintotikoki infiniturantz jotzen duelako.
Laginen baliotasuna egiaztatzeko, konfiantza-maila erabili behar da, hau da: azterketako kurbaren aldeko portzentaia (adibidez: %90, %95, etab.)
Laginetan onar daitekeen akats maximoari d deituz gero, laginetako banaketaren batezbestekoa eta biztanleriaren batezbestekoaren arteko desberdintasuna d baino txikiagoa izateko probabilitateak konfiantza-maila izena izango du eta (1 - a) moduan adieraziko da.
Batezbestekoen laginetako banaketan, konfiantza-maila gisa horretan kalkulatzen da:

Berezitasun gisa, honelako kasuak aipatu behar dira:
- d =
bada, P = 0,6826 izango da, alegia: %68,26ko konfiantza-maila. - d = 2
bada, P = 0,9544 izango da, alegia: %95,44ko konfiantza-maila. - d = 3
bada, P = 0,9974 izango da, alegia: %99,74ko konfiantza-maila.
Era horretan, konfiantza-maila adieraz daiteke batezbestekoen laginetako banaketaren desbiderapen tipikoen arabera, k izeneko koefiziente baten balioaren bidez.
Proportzioen laginketako banaketa batean, konfiantza-maila honako formularen araberakoa da:

k koefizienteak harreman bat sortzen du onar daitekeen akats maximoa eta laginetako akatsaren artean.

Laginaren tamaina
Estatistikako azterketetan, lagin adierazgarri baten tamaina -n-, biztanleriaren tamainaren -N-, onar daitekeen akats maximoaren -d-, eta konfiantza-mailaren -(1 - a)-, araberakoa da. Beraz, ondorengo adierazpenetan oinarrituz, ondoren aipatzen den guztia egin behar da, lagin adierazgarri baten tamaina zehazteko:
Informazio gehiago
k balioaren eta (1-a) konfiantza-mailaren arteko harremana.
k aldagaiaren eta (1 - a) konfiantza-mailako harremana irudikatzen duen taula.
Batezbestekoari dagokion akatsa
Onar daitekeen akats maximoa, normalean portzentajetan adierazten da.
d = k · s / Ön
l · m, biderkadurak d balioa ordezka dezake, eta ondorioz, l izango da ehuneko batean adierazitako hurbilketa-portzentajea izango da.
Konfiantza-mailako taulak
Biztanleri finitu batetik ateratako lagin baten tamaina zehazteko, konfiantza-mailako taulak erabili behar dira, batez ere, %95,44 eta %99,74 balioei dagokionez.
