logo

Varians

Varians er en måleværdi, der bruges til at finde, hvordan dataene spredes vedrørende middelværdien eller gennemsnitsværdien af ​​datasættet. Det bruges til at finde ud af, hvordan fordelingsdataene er spredt ud over middelværdien eller gennemsnitsværdien. Symbolet, der bruges til at definere variansen, er σ2. Det er kvadratet af standardafvigelsen.

Der er to typer varians, der bruges i statistik,



  • Prøvevarians
  • Befolkningsvarians

Populationsvariansen bruges til at bestemme, hvordan hvert datapunkt i en bestemt population svinger eller er spredt ud, mens stikprøvevariansen bruges til at finde gennemsnittet af de kvadrerede afvigelser fra middelværdien.

I denne artikel vil vi lære om Varians (prøve, population), deres formler, egenskaber og andre i detaljer.

Indholdsfortegnelse



Hvad er varians?

Vi måler de forskellige værdier af dataene, og disse værdier bruges til en række forskellige formål. Dataene kan gives i to typer grupperede data eller ugrupperede (diskrete) data. Hvis dataene er givet i form af klasseintervaller, kaldes det grupperede data, mens hvis dataene er givet i form af et enkelt datapunkt, omtales det som et diskret eller ugrupperet datapunkt. Varians er målet for spredningen af ​​dataene vedrørende dataens middelværdi. Det fortæller os, hvordan dataene er spredt i den givne dataværdi. Vi kan nemt beregne stikprøvevariansen og populationsvariansen for både grupperede og ugrupperede data.

Varians Definition

Varians er et statistisk mål, der kvantificerer spredningen eller spredningen af ​​et sæt datapunkter. Det angiver, hvor meget de enkelte datapunkter i et datasæt adskiller sig fra datasættets middelværdi (gennemsnit).

Typer af varians

Vi kan definere variansen af ​​de givne data i to typer,



  • Befolkningsvarians
  • Prøvevarians

Lad os nu lære om dem i detaljer.

Befolkningsvarians

Befolkningsvarians bruges til at finde spredningen af ​​den givne befolkning. Befolkningen defineres som en gruppe mennesker, og alle personer i den gruppe er en del af befolkningen. Den fortæller os om, hvordan befolkningen i en gruppe varierer i forhold til middelbefolkningen.

Alle medlemmer af en gruppe er kendt som befolkningen. Når vi ønsker at finde ud af, hvordan hvert datapunkt i en given population varierer eller er spredt ud, bruger vi populationsvariansen. Det bruges til at give den kvadrerede afstand af hvert datapunkt fra populationens middelværdi.

Prøvevarians

Hvis populationsdataene er meget store, bliver det vanskeligt at beregne populationsvariansen af ​​datasættet. I så fald tager vi en stikprøve af data fra det givne datasæt og finder variansen af ​​det datasæt, som kaldes prøvevarians. Mens vi beregner stikprøvegennemsnittet, sørger vi for at beregne stikprøvegennemsnittet, dvs. middelværdien af ​​stikprøvedatasættet og ikke populationsgennemsnittet. Vi kan definere prøvevariansen som middelværdien af ​​kvadratet af forskellen mellem prøvedatapunktet og prøvegennemsnittet.

Varianssymbol

Symbolet for varians er typisk repræsenteret af det græske bogstav sigma i kvadrat (σ²), når der refereres til populationsvariansen. For prøvevarians er det ofte angivet med s².

Varians eksempel

Vi kan forstå begrebet varians ved hjælp af eksemplet diskuteret nedenfor.

Find populationsvariansen af ​​dataene {4,6,8,10}

Løsning:

Middel = (4+6+8+10)/4 = 7

4 (4-7)2 9
6 (6-7)2 1
8 (8-7)2 1
10 (10-7)2 9

Varians = (9+1+1+9)/4 = 20/4 = 5

Således er variansen af ​​dataene 5

Variansformel

Variansen for et datasæt er angivet med symbolet σ2. For befolkningsdata er dens formel lig med summen af ​​kvadrerede forskelle mellem dataindtastninger fra gennemsnittet divideret med antallet af indtastninger. Mens vi for eksempeldata dividerer tællerværdien med forskellen mellem antallet af indtastninger og enhed.

Eksempel på variansformel

Hvis datasættet er en prøve, er variansformlen givet ved,

s 2 = ∑ (x jeg - x) 2 /(n – 1)

hvor,

  • x er gennemsnittet af prøvedatasættet
  • n er det samlede antal observationer

Formel for befolkningsvarians

Hvis vi har et befolkningsdatasæt, skrives formlen som,

s 2 = ∑ (x jeg - x) 2 /n

hvor,

  • x er gennemsnittet af befolkningsdatasættet
  • n er det samlede antal observationer

Vi kan også beregne variansen for grupperede og ugrupperede datasæt. Forskellige formler for variansen er,

terminal kali linux

Variansformel for grupperede data

For grupperede data diskuteres variansformlen nedenfor,

Eksempelvariansformel for grupperede data (σ 2 ) = ∑ f(m jeg - x) 2 /(n-1)

Populationsvariansformel for grupperede data (s 2 ) = ∑ f(m jeg - x) 2 /n

hvor,

  • f er frekvensen af ​​hvert interval
  • m jeg er midtpunktet af i'etthinterval
  • x er gennemsnittet af de grupperede data

For grupperede data beregnes gennemsnittet som,

Middel = ∑ (f jeg x jeg ) / ∑ f jeg

Variansformel for ugrupperede data

For ugrupperede data diskuteres variansformlen nedenfor,

  • Eksempelvariansformel for ugrupperede data (s 2 ) = ∑ (x jeg - x) 2 /(n-1)
  • Befolkningsvariansformel for ugrupperede data (s 2 ) = ∑ (x jeg - x) 2 /n

hvor x er gennemsnittet af de grupperede data

Formel til beregning af varians

Formlen, der bruges til at beregne variansen, er diskuteret på billedet nedenfor,

Variansformel

Hvordan beregner man varians?

Generelt betyder varians populationsstandardvarians. Trinene til at beregne variansen af ​​et givet sæt værdier er,

Trin 1: Beregn middelværdien af ​​observationen ved hjælp af formlen (Middelværdi = Sum af observationer/antal observationer)

Trin 2: Beregn de kvadrerede forskelle mellem dataværdierne og middelværdien. (Dataværdi – middelværdi)2

Trin 3: Beregn gennemsnittet af de kvadrerede forskelle af de givne værdier, som kaldes variansen af ​​datasættet.

(Varians = Sum af kvadratiske forskelle / Antal observationer)

Varians og standardafvigelse

Varians og Standardafvigelse begge er mål for den centrale tendens, der bruges til at fortælle os om, i hvilket omfang datasættets værdier afviger i forhold til datasættets centrale eller middelværdi.

Der er et klart forhold mellem varians og standardafvigelse for et givet datasæt.

Varians = (Standardafvigelse) 2

Varians er defineret som kvadratet af standardafvigelsen, dvs. at tage kvadratet af standardafvigelsen for enhver gruppe af data giver os variansen af ​​dette datasæt. varians defineres ved hjælp af symbolet s 2 hvorimod s bruges til at definere standardafvigelsen for datasættet. Varians af datasættet er udtrykt i kvadrerede enheder, mens standardafvigelsen af ​​datasættet er udtrykt i en enhed svarende til middelværdien af ​​datasættet.

Lær mere: Varians og standardafvigelse

Varians af binomial fordeling

Binomial fordeling er den diskrete sandsynlighedsfordeling, der fortæller os antallet af positive udfald i et binomialeksperiment udført n antal gange. Resultatet af det binomiale forsøg er 0 eller 1, dvs. enten positivt eller negativt.

I det binomiale eksperiment af n forsøg og hvor sandsynligheden for hvert forsøg er givet s , så er variansen af ​​binomialfordelingen givet ved hjælp af,

s 2 = np (1 – p)

hvor 'f.eks' er defineret som middelværdien af ​​værdierne af binomialfordelingen.

Varians af Poisson Distribution

Giftfordeling er defineret som en diskret sandsynlighedsfordeling, der bruges til at definere sandsynligheden for 'n' antallet af hændelser, der finder sted inden for 'x' tidsperioden. Middelværdien i Poisson-fordelingen er defineret af symbolet l.

I Poisson-fordelingen er middelværdien og variansen af ​​det givne datasæt ens. Variansen af ​​Poisson-fordelingen er givet ved hjælp af formlen,

s 2 = λ

Varians af ensartet fordeling

I en ensartet fordeling er sandsynlighedsfordelingsdataene kontinuerlige. Resultatet i disse eksperimenter ligger i intervallet mellem en specifik øvre grænse og en specifik nedre grænse, og derfor kaldes disse fordelinger også rektangulære fordelinger. Hvis den øvre grænse eller den maksimale grænse er b og den nedre grænse eller minimumsgrænsen er a, så beregnes variansen af ​​den ensartede fordeling ved hjælp af formlen,

s 2 = (1/12)(b – a) 2

Middelværdien af ​​den ensartede fordeling er givet ved hjælp af formlen,

Middel = (b + a) / 2

hvor,

  • b er den øvre grænse for den ensartede fordeling
  • -en er den nedre grænse for den ensartede fordeling

Varians og kovarians

Varians af datasættet definerer volatiliteten af ​​alle værdierne af datasættet i forhold til middelværdien af ​​datasættet. Kovarians fortæller os, hvordan de tilfældige variable er relateret til hinanden, og den fortæller os, hvordan ændringen i en variabel påvirker ændringen i andre variable.

Kovarians kan være positiv eller negativ, den positive kovarians betyder, at begge variabler bevæger sig i samme retning i forhold til middelværdien, hvorimod negativ kovarians betyder, at begge variabler bevæger sig i modsatte retninger i forhold til middelværdien.

For to stokastiske variable x og y, hvor x er den afhængige variabel, og y er den uafhængige variabel, beregnes kovariansen ved hjælp af formlen nævnt i nedenstående vedhæftede billede.

Kovariansformel

Variansegenskaber

Varians er meget brugt i matematik, statistik og andre grene af videnskaben til en række forskellige formål. Varians har forskellige egenskaber, som er meget brugt til at løse forskellige problemer. Nogle af de grundlæggende egenskaber ved variansen er,

  • Varians af datasættet er den ikke-negative mængde, og nulværdien af ​​varians betyder, at alle værdierne af datasættet er ens.
  • En højere værdi af variansen fortæller os, at alle dataværdierne i datasættet er vidt spredte, dvs. de er langt væk fra middelværdien af ​​datasættet.
  • En lavere værdi af variansen fortæller os, at alle dataværdierne i datasættet er tæt på hinanden, dvs. de er meget tæt på middelværdien af ​​datasættet.

For enhver konstant 'c'

  • Var(x + c) = Var(x)

hvor x er en tilfældig variabel

  • Var(cx) = c2

hvor x er en tilfældig variabel

Også hvis -en og b er den konstante værdi og x er en tilfældig variabel,

  • Var(ax + b) = a2

For uafhængige variable x1, x2, x3…,xnvi ved det,

  • Hvor (x1+ x2+……+ xn) = Var(x1) + Hvor(x2) +……..+Hvor(xn)

Folk læser også:

  • Betyde
  • Mode
  • Forskellen mellem varians og standardafvigelse

Eksempler på variansformel

Eksempel 1: Beregn variansen af ​​prøvedataene: 7, 11, 15, 19, 24.

Løsning:

Vi har dataene 7, 11, 15, 19, 24

Find gennemsnittet af dataene.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2

Ved at bruge formlen for varians får vi,

java streng tilføje

s2= ∑ (xjeg- x)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2

Eksempel 2: Beregn antallet af observationer, hvis variansen af ​​data er 12 og summen af ​​kvadrerede forskelle af data fra middelværdien er 156.

Løsning:

Vi har,

(xjeg- x)2= 156

s2= 12

Ved at bruge formlen for varians får vi,

s2= ∑ (xjeg- x)2/n

12 = 156/n

n = 156/12

n = 13

Eksempel 3: Beregn variansen for de givne data

xjeg

fjeg

10 1
4 3
6 5
8 1

Løsning:

Middelværdi (x̄) = ∑(fjegxjeg)/∑(fjeg)

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(fjeg) = 1+3+5+1 = 10

xjeg

fjeg

fjegxjeg

(xjeg- x)

(xjeg- x)2

fjeg(xjeg- x)2

10 1 10 4 16 16
4 3 12 -2 4 12
6 5 30 0 0 0
8 1 8 2 4 8

Nu,

s 2 = (∑ jeg n f jeg (x jeg - x) 2 /n)

= [(16 + 12 + 0 +8)/10]
= 3,6

Varians(σ2) = 3,6

Eksempel 4: Find variansen af ​​følgende datatabel

Klasse

Frekvens

0-10 3
10-20 6
20-30 4
30-40 2
40-50 1

Løsning:

Klasse

Xi

fjeg

f×Xi

Xi – μ

(Xi – μ)2

f×(Xi – μ)2

0-10

5

3

femten

-femten

225

675

10-20

femten

6

90

-5

25

150

20-30

25

4

100

skuespiller zeenat aman

5

25

100

30-40

35

2

70

femten

225

450

40-50

Fire. Fem

1

Fire. Fem

25

625

625

Total

16

320

2000

Middelværdi (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

s 2 = (∑ jeg n f jeg (x jeg – m) 2 /n)

= [(2000)/(16)]
= (125)

Variansen af ​​et givet datasæt er 125.

Resumé – Varians

Varians er et statistisk mål, der viser, hvor meget værdierne i et datasæt afviger fra gennemsnittet. Det hjælper os med at forstå spredningen eller spredningen af ​​datapunkter. Der er to hovedtyper af varians: populationsvarians, som måler, hvordan datapunkter i en hel population spredes, og stikprøvevarians, som måler, hvordan datapunkter i en stikprøve spredes. Varians er angivet med σ² og er kvadratet af standardafvigelsen. For at beregne varians skal du finde middelværdien af ​​dataene, trække middelværdien fra hvert datapunkt, kvadrere forskellene og derefter gennemsnittet af disse kvadrerede forskelle. Varians er vigtig, fordi den hjælper os med at forstå variabiliteten i et datasæt. En høj varians indikerer, at datapunkter er spredt vidt ud, mens en lav varians indikerer, at de er tæt på gennemsnittet. Varians er altid ikke-negativ, da det indebærer at kvadrere forskellene.

Ofte stillede spørgsmål om Variance

Hvad er varians i statistik?

Varians er defineret som spredningen af ​​datasættets værdier i forhold til datasættets middelværdi. Variansen af ​​datasættet fortæller, i hvor høj grad værdierne i et bestemt datasæt spredes fra middelværdien.

Hvad er symbolet på varians?

Vi bruger symbolerne σ2, s2 og Var(x) for at angive variansen af ​​datasættet.

Hvad er variansformlen?

Varians af datasættet beregnes ved hjælp af formlen,

s 2 = E[( X – m ) 2 ]

Hvad fortæller Varians?

Varians bruges til at finde omfanget af spredningen af ​​dataene, dvs. det fortæller os, hvordan værdierne i et datasæt er spredt ud i forhold til middelværdien. For den større variansværdi er værdierne vidt spredt i forhold til middelværdien, mens værdierne med hensyn til den mindre variansværdi er tæt spredt i forhold til middelværdien

Hvad er forholdet mellem varians og standardafvigelse?

For det givne datasæt er variansen af ​​datasættet kvadratet på standardafvigelsen for det datasæt. Denne sammenhæng er udtrykt som,

Varians = (Standardafvigelse) 2

Hvordan beregner du varians?

For at beregne varians finder du først middelværdien (gennemsnittet) af datasættet. Træk derefter middelværdien fra hvert datapunkt og kvadrater resultatet. Til sidst, gennemsnit disse kvadratiske forskelle.

Hvorfor er varians vigtig?

Varians er afgørende for at forstå fordelingen af ​​data i et datasæt. Det hjælper med at bestemme, hvor spredt datapunkterne er ud fra gennemsnitsværdien, hvilket indikerer variabiliteten eller konsistensen i dataene.

Hvad er forskellen mellem varians og standardafvigelse?

Mens både varians og standardafvigelse måler dataspredning, er standardafvigelsen kvadratroden af ​​variansen. Standardafvigelse er udtrykt i de samme enheder som dataene, hvilket gør det mere fortolkbart til at angive spredningen.

Kan varians være negativ?

Nej, varians kan ikke være negativ. Da det beregnes som gennemsnittet af de kvadrerede forskelle fra middelværdien, er den resulterende værdi altid ikke-negativ.