Normalfordeling. Graf for normalfordelingens tæthedsfunktion (rød) og fordelingsfunktion (blå). Hvis en størrelse, der er normalfordelt, måles, er der 68,27% sandsynlighed for, at målingen ligger inden for en standardafvigelse (σ) fra gennemsnittet μ, og kun 0,27% sandsynlighed for, at den afviger mere end tre standardafvigelser fra gennemsnittet.

.

Normalfordeling. En egenskab som menneskers højde, der påvirkes af et stort antal uafhængige faktorer, både genetiske og miljømæssige, vil kunne beskrives godt af en normalfordeling. Billedet viser 1914-årgangen fra Connecticut Agricultural College opstillet efter højde. Den karakteristiske klokkeform er tydelig: De fleste har en højde tæt på gennemsnittet, og yderværdierne er kun lidt sandsynlige.

.

Normalfordeling er i sandsynlighedsregning og statistik den vigtigste og oftest forekommende af alle sandsynlighedsfordelinger. Den beskriver fx fordelingen af måleresultater, når disse er behæftet med en vis usikkerhed. Normalfordelingen har form som en klokkekurve, hvor toppunktet af kurven angiver middelværdien af det statistiske materiale, og bredden af kurven er et mål for spredningen eller standardafvigelsen.

Faktaboks

Også kendt som

Gaussfordeling

Fordelingen har formlen (tæthedsfunktionen) \[f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{1}{2\sigma^2}(x-\mu)^2\right) ,\]

hvor \(\mu\) er middelværdien, og \(\sigma\) er standardafvigelsen (\(\sigma^2\) kaldes variansen).

Den tilhørende fordelingsfunktion er \(F(x) = \int^x_{-\infty}f(y)dy\) .

Normalfordelingen er af fundamental betydning for både statistisk teori og praksis. Måledata behæftet med tilfældige fejl kan således ofte antages at være normalfordelte, hvilket udnyttes i statistiske modeller til dataanalyse (se regressionsanalyse og variansanalyse). Blandt normalfordelingens egenskaber kan fremhæves, at summen af uafhængige, normalfordelte tilfældige tal (stokastiske variable) igen er normalfordelt, og at summen af et stort antal uafhængige stokastiske variable med samme fordeling og endelig varians med god tilnærmelse er normalfordelt (se den centrale grænseværdisætning).

Normalfordelingen blev først indført i forbindelse med studiet af den centrale grænseværdisætning (jf. de Moivre-Laplaces sætning). I 1809 nåede C.F. Gauss frem til normalfordelingen som en fordeling, der matematisk passede med hans og Legendres teori for vurdering af tilfældige fejl, den såkaldte mindste kvadraters metode. Understregningen af normalfordelingens betydning i forbindelse med variansanalyse skyldes først og fremmest R. Fisher.

Læs mere i Den Store Danske

Kommentarer

Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.

Du skal være logget ind for at kommentere.

eller registrer dig