logo

Højreskæv fordeling: Hvad betyder det?

feature_right_skewed_histogram

Studerer du statistik? Så har du sandsynligvis hørt udtrykket 'normalfordeling', når du beskriver data. Men hvad med sætningen 'skæv ret'? Hvordan ser et højreskævt histogram ud? Og hvad forårsager det?

I denne artikel giver vi dig eksempler på histogrammer skævt til højre og forklarer, hvordan disse adskiller sig fra normalfordelingsgrafer.

Funktionsbillede: Monika sted /Wikimedia Commons

Hvad er normalfordeling?

Før vi forklarer, hvad det betyder, når data er skævt rigtigt, lad os gennemgå definitionen af ​​normalfordeling.

Med normalfordeling, to eller flere variabler deler en direkte sammenhæng for at lave en symmetrisk datasæt , hvorpå venstre halvdel spejler højre halvdel. Disse grafer kaldes klokkekurver på grund af deres klart definerede, klokkelignende form:

body_normal_distribution-300x215

På en normalfordelingsgraf, middelværdien (gennemsnit), medianen og tilstanden er alle ens . Disse punkter repræsenterer alle midten af ​​dataene eller toppen af ​​grafen.

Hvad betyder skævt rigtigt?

Mens normalfordeling er en af ​​de mest almindelige former for distribution, følger ikke alle datasæt denne grundlæggende kurve. Med andre ord, nogle histogrammer er skæve til højre eller venstre .

Med højreskæv fordeling (også kendt som 'positivt skæv fordeling) falder de fleste data til højre eller positive side af grafens top. Dermed, histogrammet skæver på en sådan måde, at dets højre side (eller 'hale') er længere end dets venstre side.

body_right_skewed_histogram

Eksempel på et højreskævt histogram.

På et højreskævt histogram er middelværdien, medianen og tilstanden alle forskellige. I dette tilfælde er tilstanden det højeste punkt i histogrammet, hvorimod medianen og middelværdien falder til højre for det (eller visuelt til højre for toppen). Noter det den ringe vilje altid være til højre for medianen .

body_skewed_right_left

Graf A er skæv til højre, mens graf B er skæv til venstre. Med højreskæve grafer kommer middelværdien altid til højre for tilstanden (dvs. toppen). ( Asitgoes /Wikimedia Commons) )

Disse funktioner gør det i sidste ende svært at tildele en typisk værdi da der ikke er noget tydeligt midtpunkt på en højreskæv graf. I modsætning hertil kan du med normalfordeling, fordi middelværdien, medianen og tilstanden alle er ens og kommer i centrum af datasættet, nemt bruge denne værdi til mere præcist at generalisere dataene.

Hvad forårsager et højreskævt histogram?

Data skævt til højre er normalt et resultat af en nedre grænse i et datasæt (hvorimod data skævt til venstre er et resultat af en højere grænse). Så hvis datasættets nedre grænser er ekstremt lave i forhold til resten af ​​dataene, vil dette få dataene til at skæve til højre.

En anden årsag til skævhed er opstartseffekter . For eksempel, hvis en procedure i starten har mange succeser i løbet af en lang opstartsperiode, kan dette skabe en positiv skævvridning på dataene. (På den modsatte side kan en opstartsperiode med adskillige indledende fejl forskyde data negativt.)