Varians er en måleværdi, der bruges til at finde, hvordan dataene spredes vedrørende middelværdien eller gennemsnitsværdien af datasættet. Det bruges til at finde ud af, hvordan fordelingsdataene er spredt ud over middelværdien eller gennemsnitsværdien. Symbolet, der bruges til at definere variansen, er σ2. Det er kvadratet af standardafvigelsen.
Der er to typer varians, der bruges i statistik,
- Prøvevarians
- Befolkningsvarians
Populationsvariansen bruges til at bestemme, hvordan hvert datapunkt i en bestemt population svinger eller er spredt ud, mens stikprøvevariansen bruges til at finde gennemsnittet af de kvadrerede afvigelser fra middelværdien.
I denne artikel vil vi lære om Varians (prøve, population), deres formler, egenskaber og andre i detaljer.
Indholdsfortegnelse
- Hvad er varians?
- Typer af varians
- Varians symbol
- Varians eksempel
- Variansformel
- Eksempel på variansformel
- Formel for befolkningsvarians
- Variansformel for grupperede data
- Variansformel for ugrupperede data
- Formel til beregning af varians
- Hvordan beregner man varians?
- Varians og standardafvigelse
- Varians og kovarians
- Variansegenskaber
- Eksempler på variansformel
- Resumé – Varians
- Ofte stillede spørgsmål om Variance
Hvad er varians?
Vi måler de forskellige værdier af dataene, og disse værdier bruges til en række forskellige formål. Dataene kan gives i to typer grupperede data eller ugrupperede (diskrete) data. Hvis dataene er givet i form af klasseintervaller, kaldes det grupperede data, mens hvis dataene er givet i form af et enkelt datapunkt, omtales det som et diskret eller ugrupperet datapunkt. Varians er målet for spredningen af dataene vedrørende dataens middelværdi. Det fortæller os, hvordan dataene er spredt i den givne dataværdi. Vi kan nemt beregne stikprøvevariansen og populationsvariansen for både grupperede og ugrupperede data.
Varians Definition
Varians er et statistisk mål, der kvantificerer spredningen eller spredningen af et sæt datapunkter. Det angiver, hvor meget de enkelte datapunkter i et datasæt adskiller sig fra datasættets middelværdi (gennemsnit).
Typer af varians
Vi kan definere variansen af de givne data i to typer,
- Befolkningsvarians
- Prøvevarians
Lad os nu lære om dem i detaljer.
Befolkningsvarians
Befolkningsvarians bruges til at finde spredningen af den givne befolkning. Befolkningen defineres som en gruppe mennesker, og alle personer i den gruppe er en del af befolkningen. Den fortæller os om, hvordan befolkningen i en gruppe varierer i forhold til middelbefolkningen.
Alle medlemmer af en gruppe er kendt som befolkningen. Når vi ønsker at finde ud af, hvordan hvert datapunkt i en given population varierer eller er spredt ud, bruger vi populationsvariansen. Det bruges til at give den kvadrerede afstand af hvert datapunkt fra populationens middelværdi.
Prøvevarians
Hvis populationsdataene er meget store, bliver det vanskeligt at beregne populationsvariansen af datasættet. I så fald tager vi en stikprøve af data fra det givne datasæt og finder variansen af det datasæt, som kaldes prøvevarians. Mens vi beregner stikprøvegennemsnittet, sørger vi for at beregne stikprøvegennemsnittet, dvs. middelværdien af stikprøvedatasættet og ikke populationsgennemsnittet. Vi kan definere prøvevariansen som middelværdien af kvadratet af forskellen mellem prøvedatapunktet og prøvegennemsnittet.
Varianssymbol
Symbolet for varians er typisk repræsenteret af det græske bogstav sigma i kvadrat (σ²), når der refereres til populationsvariansen. For prøvevarians er det ofte angivet med s².
Varians eksempel
Vi kan forstå begrebet varians ved hjælp af eksemplet diskuteret nedenfor.
Find populationsvariansen af dataene {4,6,8,10}
Løsning:
Middel = (4+6+8+10)/4 = 7
4 (4-7)2 9 6 (6-7)2 1 8 (8-7)2 1 10 (10-7)2 9 Varians = (9+1+1+9)/4 = 20/4 = 5
Således er variansen af dataene 5
Variansformel
Variansen for et datasæt er angivet med symbolet σ2. For befolkningsdata er dens formel lig med summen af kvadrerede forskelle mellem dataindtastninger fra gennemsnittet divideret med antallet af indtastninger. Mens vi for eksempeldata dividerer tællerværdien med forskellen mellem antallet af indtastninger og enhed.
Eksempel på variansformel
Hvis datasættet er en prøve, er variansformlen givet ved,
s 2 = ∑ (x jeg - x) 2 /(n – 1)
hvor,
- x er gennemsnittet af prøvedatasættet
- n er det samlede antal observationer
Formel for befolkningsvarians
Hvis vi har et befolkningsdatasæt, skrives formlen som,
s 2 = ∑ (x jeg - x) 2 /n
hvor,
- x er gennemsnittet af befolkningsdatasættet
- n er det samlede antal observationer
Vi kan også beregne variansen for grupperede og ugrupperede datasæt. Forskellige formler for variansen er,
terminal kali linux
Variansformel for grupperede data
For grupperede data diskuteres variansformlen nedenfor,
Eksempelvariansformel for grupperede data (σ 2 ) = ∑ f(m jeg - x) 2 /(n-1)
Populationsvariansformel for grupperede data (s 2 ) = ∑ f(m jeg - x) 2 /n
hvor,
- f er frekvensen af hvert interval
- m jeg er midtpunktet af i'etthinterval
- x er gennemsnittet af de grupperede data
For grupperede data beregnes gennemsnittet som,
Middel = ∑ (f jeg x jeg ) / ∑ f jeg
Variansformel for ugrupperede data
For ugrupperede data diskuteres variansformlen nedenfor,
- Eksempelvariansformel for ugrupperede data (s 2 ) = ∑ (x jeg - x) 2 /(n-1)
- Befolkningsvariansformel for ugrupperede data (s 2 ) = ∑ (x jeg - x) 2 /n
hvor x er gennemsnittet af de grupperede data
Formel til beregning af varians
Formlen, der bruges til at beregne variansen, er diskuteret på billedet nedenfor,

Hvordan beregner man varians?
Generelt betyder varians populationsstandardvarians. Trinene til at beregne variansen af et givet sæt værdier er,
Trin 1: Beregn middelværdien af observationen ved hjælp af formlen (Middelværdi = Sum af observationer/antal observationer)
Trin 2: Beregn de kvadrerede forskelle mellem dataværdierne og middelværdien. (Dataværdi – middelværdi)2
Trin 3: Beregn gennemsnittet af de kvadrerede forskelle af de givne værdier, som kaldes variansen af datasættet.
(Varians = Sum af kvadratiske forskelle / Antal observationer)
Varians og standardafvigelse
Varians og Standardafvigelse begge er mål for den centrale tendens, der bruges til at fortælle os om, i hvilket omfang datasættets værdier afviger i forhold til datasættets centrale eller middelværdi.
Der er et klart forhold mellem varians og standardafvigelse for et givet datasæt.
Varians = (Standardafvigelse) 2
Varians er defineret som kvadratet af standardafvigelsen, dvs. at tage kvadratet af standardafvigelsen for enhver gruppe af data giver os variansen af dette datasæt. varians defineres ved hjælp af symbolet s 2 hvorimod s bruges til at definere standardafvigelsen for datasættet. Varians af datasættet er udtrykt i kvadrerede enheder, mens standardafvigelsen af datasættet er udtrykt i en enhed svarende til middelværdien af datasættet.
Lær mere: Varians og standardafvigelse
Varians af binomial fordeling
Binomial fordeling er den diskrete sandsynlighedsfordeling, der fortæller os antallet af positive udfald i et binomialeksperiment udført n antal gange. Resultatet af det binomiale forsøg er 0 eller 1, dvs. enten positivt eller negativt.
I det binomiale eksperiment af n forsøg og hvor sandsynligheden for hvert forsøg er givet s , så er variansen af binomialfordelingen givet ved hjælp af,
s 2 = np (1 – p)
hvor 'f.eks' er defineret som middelværdien af værdierne af binomialfordelingen.
Varians af Poisson Distribution
Giftfordeling er defineret som en diskret sandsynlighedsfordeling, der bruges til at definere sandsynligheden for 'n' antallet af hændelser, der finder sted inden for 'x' tidsperioden. Middelværdien i Poisson-fordelingen er defineret af symbolet l.
I Poisson-fordelingen er middelværdien og variansen af det givne datasæt ens. Variansen af Poisson-fordelingen er givet ved hjælp af formlen,
s 2 = λ
Varians af ensartet fordeling
I en ensartet fordeling er sandsynlighedsfordelingsdataene kontinuerlige. Resultatet i disse eksperimenter ligger i intervallet mellem en specifik øvre grænse og en specifik nedre grænse, og derfor kaldes disse fordelinger også rektangulære fordelinger. Hvis den øvre grænse eller den maksimale grænse er b og den nedre grænse eller minimumsgrænsen er a, så beregnes variansen af den ensartede fordeling ved hjælp af formlen,
s 2 = (1/12)(b – a) 2
Middelværdien af den ensartede fordeling er givet ved hjælp af formlen,
Middel = (b + a) / 2
hvor,
- b er den øvre grænse for den ensartede fordeling
- -en er den nedre grænse for den ensartede fordeling
Varians og kovarians
Varians af datasættet definerer volatiliteten af alle værdierne af datasættet i forhold til middelværdien af datasættet. Kovarians fortæller os, hvordan de tilfældige variable er relateret til hinanden, og den fortæller os, hvordan ændringen i en variabel påvirker ændringen i andre variable.
Kovarians kan være positiv eller negativ, den positive kovarians betyder, at begge variabler bevæger sig i samme retning i forhold til middelværdien, hvorimod negativ kovarians betyder, at begge variabler bevæger sig i modsatte retninger i forhold til middelværdien.
For to stokastiske variable x og y, hvor x er den afhængige variabel, og y er den uafhængige variabel, beregnes kovariansen ved hjælp af formlen nævnt i nedenstående vedhæftede billede.

Variansegenskaber
Varians er meget brugt i matematik, statistik og andre grene af videnskaben til en række forskellige formål. Varians har forskellige egenskaber, som er meget brugt til at løse forskellige problemer. Nogle af de grundlæggende egenskaber ved variansen er,
- Varians af datasættet er den ikke-negative mængde, og nulværdien af varians betyder, at alle værdierne af datasættet er ens.
- En højere værdi af variansen fortæller os, at alle dataværdierne i datasættet er vidt spredte, dvs. de er langt væk fra middelværdien af datasættet.
- En lavere værdi af variansen fortæller os, at alle dataværdierne i datasættet er tæt på hinanden, dvs. de er meget tæt på middelværdien af datasættet.
For enhver konstant 'c'
- Var(x + c) = Var(x)
hvor x er en tilfældig variabel
- Var(cx) = c2
hvor x er en tilfældig variabel
Også hvis -en og b er den konstante værdi og x er en tilfældig variabel,
- Var(ax + b) = a2
For uafhængige variable x1, x2, x3…,xnvi ved det,
- Hvor (x1+ x2+……+ xn) = Var(x1) + Hvor(x2) +……..+Hvor(xn)
Folk læser også:
- Betyde
- Mode
- Forskellen mellem varians og standardafvigelse
Eksempler på variansformel
Eksempel 1: Beregn variansen af prøvedataene: 7, 11, 15, 19, 24.
Løsning:
Vi har dataene 7, 11, 15, 19, 24
Find gennemsnittet af dataene.
x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2Ved at bruge formlen for varians får vi,
java streng tilføjes2= ∑ (xjeg- x)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2
Eksempel 2: Beregn antallet af observationer, hvis variansen af data er 12 og summen af kvadrerede forskelle af data fra middelværdien er 156.
Løsning:
Vi har,
(xjeg- x)2= 156
s2= 12
Ved at bruge formlen for varians får vi,
s2= ∑ (xjeg- x)2/n
12 = 156/n
n = 156/12
n = 13
Eksempel 3: Beregn variansen for de givne data
| xjeg | fjeg |
|---|---|
| 10 | 1 |
| 4 | 3 |
| 6 | 5 |
| 8 | 1 |
Løsning:
Middelværdi (x̄) = ∑(fjegxjeg)/∑(fjeg)
= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6n = ∑(fjeg) = 1+3+5+1 = 10
xjeg
fjeg
fjegxjeg
(xjeg- x)
(xjeg- x)2
fjeg(xjeg- x)2
10 1 10 4 16 16 4 3 12 -2 4 12 6 5 30 0 0 0 8 1 8 2 4 8 Nu,
s 2 = (∑ jeg n f jeg (x jeg - x) 2 /n)
= [(16 + 12 + 0 +8)/10]
= 3,6Varians(σ2) = 3,6
Eksempel 4: Find variansen af følgende datatabel
| Klasse | Frekvens |
|---|---|
| 0-10 | 3 |
| 10-20 | 6 |
| 20-30 | 4 |
| 30-40 | 2 |
| 40-50 | 1 |
Løsning:
Klasse
Xi
fjeg
f×Xi
Xi – μ
(Xi – μ)2
f×(Xi – μ)2
0-10
5
3
femten
-femten
225
675
10-20
femten
6
90
-5
25
150
20-30
25
4
100
skuespiller zeenat aman5
25
100
30-40
35
2
70
femten
225
450
40-50
Fire. Fem
1
Fire. Fem
25
625
625
Total
16
320
2000
Middelværdi (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20s 2 = (∑ jeg n f jeg (x jeg – m) 2 /n)
= [(2000)/(16)]
= (125)Variansen af et givet datasæt er 125.
Resumé – Varians
Varians er et statistisk mål, der viser, hvor meget værdierne i et datasæt afviger fra gennemsnittet. Det hjælper os med at forstå spredningen eller spredningen af datapunkter. Der er to hovedtyper af varians: populationsvarians, som måler, hvordan datapunkter i en hel population spredes, og stikprøvevarians, som måler, hvordan datapunkter i en stikprøve spredes. Varians er angivet med σ² og er kvadratet af standardafvigelsen. For at beregne varians skal du finde middelværdien af dataene, trække middelværdien fra hvert datapunkt, kvadrere forskellene og derefter gennemsnittet af disse kvadrerede forskelle. Varians er vigtig, fordi den hjælper os med at forstå variabiliteten i et datasæt. En høj varians indikerer, at datapunkter er spredt vidt ud, mens en lav varians indikerer, at de er tæt på gennemsnittet. Varians er altid ikke-negativ, da det indebærer at kvadrere forskellene.
Ofte stillede spørgsmål om Variance
Hvad er varians i statistik?
Varians er defineret som spredningen af datasættets værdier i forhold til datasættets middelværdi. Variansen af datasættet fortæller, i hvor høj grad værdierne i et bestemt datasæt spredes fra middelværdien.
Hvad er symbolet på varians?
Vi bruger symbolerne σ2, s2 og Var(x) for at angive variansen af datasættet.
Hvad er variansformlen?
Varians af datasættet beregnes ved hjælp af formlen,
s 2 = E[( X – m ) 2 ]
Hvad fortæller Varians?
Varians bruges til at finde omfanget af spredningen af dataene, dvs. det fortæller os, hvordan værdierne i et datasæt er spredt ud i forhold til middelværdien. For den større variansværdi er værdierne vidt spredt i forhold til middelværdien, mens værdierne med hensyn til den mindre variansværdi er tæt spredt i forhold til middelværdien
Hvad er forholdet mellem varians og standardafvigelse?
For det givne datasæt er variansen af datasættet kvadratet på standardafvigelsen for det datasæt. Denne sammenhæng er udtrykt som,
Varians = (Standardafvigelse) 2
Hvordan beregner du varians?
For at beregne varians finder du først middelværdien (gennemsnittet) af datasættet. Træk derefter middelværdien fra hvert datapunkt og kvadrater resultatet. Til sidst, gennemsnit disse kvadratiske forskelle.
Hvorfor er varians vigtig?
Varians er afgørende for at forstå fordelingen af data i et datasæt. Det hjælper med at bestemme, hvor spredt datapunkterne er ud fra gennemsnitsværdien, hvilket indikerer variabiliteten eller konsistensen i dataene.
Hvad er forskellen mellem varians og standardafvigelse?
Mens både varians og standardafvigelse måler dataspredning, er standardafvigelsen kvadratroden af variansen. Standardafvigelse er udtrykt i de samme enheder som dataene, hvilket gør det mere fortolkbart til at angive spredningen.
Kan varians være negativ?
Nej, varians kan ikke være negativ. Da det beregnes som gennemsnittet af de kvadrerede forskelle fra middelværdien, er den resulterende værdi altid ikke-negativ.