Korrelation betyder grundlæggende en gensidig forbindelse mellem to eller flere sæt data. I statistik bruges bivariate data eller to tilfældige variabler til at finde sammenhængen mellem dem. Det korrelationskoefficient er generelt målingen af korrelationen mellem de bivariate data, som grundlæggende angiver, hvor meget to stokastiske variable er korreleret med hinanden.
Hvis korrelationskoefficienten er 0, er de bivariate data ikke korreleret med hinanden.
Hvis korrelationskoefficienten er -1 eller +1, er de bivariate data stærkt korrelerede med hinanden.
r=-1 angiver stærk negativ sammenhæng, og r=1 angiver stærk positiv sammenhæng.
Generelt, hvis korrelationskoefficienten er tæt på -1 eller +1, kan vi sige, at de bivariate data er stærkt korrelerede med hinanden.
Korrelationskoefficienten beregnes vha Pearsons korrelationskoefficient som er givet af:

Korrelationskoefficient
Hvor,
- r: Korrelationskoefficient.
: Værdier af variablen x. y_i: Værdier af variablen y.n: Antal prøver taget i datasættet.Tæller: Kovarians af x og y.Nævner: Produkt af standardafvigelse af x og standardafvigelse af y.
I denne artikel skal vi se, hvordan man finder korrelationskoefficienter i Excel.
Eksempel: Overvej følgende datasæt:

Sådan finder du korrelationskoefficienten i Excel:
1. Brug af CORREL-funktionen
I Excel for at finde korrelationskoefficienten brug formlen:
=CORREL(matrix1,matrix2) matrix1: matrix af variabel x matrix2: matrix af variabel y For at indsætte matrix1 og matrix2 skal du blot vælge celleområdet for begge.
1. Lad os finde korrelationskoefficienten for variablerne og X og Y1.

Korrelationskoefficient for x og y1
array1 : Sæt af værdier af X. Celleområdet er fra A2 til A6.
array2 : Sæt af værdier af Y1. Celleområdet er fra B2 til B6.
På samme måde kan du finde korrelationskoefficienterne for (X , Y2) og (X , Y3) ved hjælp af Excel-formlen. Endelig er korrelationskoefficienterne som følger:
Fra ovenstående tabel kan vi udlede, at:
X og Y1 har negativ korrelationskoefficient.
X og Y2 har positiv korrelationskoefficient.
støbt ind til snorX og Y3 er ikke korrelerede, da korrelationskoefficienten er næsten nul.
Eksempel: Lad os nu fortsætte til de yderligere to metoder ved hjælp af et nyt datasæt. Overvej følgende datasæt:

Brug af dataanalyse
Vi kan også analysere det givne datasæt og beregne korrelationskoefficienten: Følg nedenstående trin for at gøre det:
Trin 1: Først skal du aktivere Dataanalyse ToolPak i Excel. At muliggøre :
- Gå til Fil fanen i øverste venstre hjørne af Excel-vinduet og vælg Muligheder .
- Det Excel-indstillinger dialogboksen åbnes. Gå nu til Tilføjelser mulighed og i Styre vælg Excel-tilføjelser fra rullemenuen.
- Klik på Gå knap.
- Dialogboksen Tilføjelser åbnes. I denne markerer du muligheden Analyse ToolPak .
- Klik Okay !

Fanen Dataanalyse tilføjet
Trin 2: Klik nu på Data efterfulgt af Dataanalyse . En dialogboks vises.
Trin 3: Vælg i dialogboksen Korrelation fra listen over muligheder. Klik Okay !
Trin 4: Korrelationsmenuen vises.
Trin 5: I denne menu angives først Indgangsområde . Indtastningsområdet er celleområdet for X- og Y1-kolonner som fremhævet på billedet nedenfor.
Trin 6: Lever også Outputområde som det cellenummer, hvor du vil vise resultatet. Som standard vises output i det nye Excel-ark i tilfælde af, at du ikke angiver noget outputområde.
Trin 7: Tjek Etiketter i første række mulighed hvis du har etiketter i datasættet. I vores tilfælde har kolonne 1 label X og kolonne 2 har label Y1.
Trin 8: Klik på OK.
Trin 9: Dataanalysetabellen er nu klar. Her kan du se korrelationskoefficienten mellem X og Y1 i analysetabellen.
På samme måde kan du finde korrelationskoefficienter for XY2 og for XY3. Endelig er alle korrelationskoefficienterne:

Brug af PEARSON-funktionen
Det ligner nøjagtigt CORREL-funktionen, som vi har diskuteret i ovenstående afsnit. Syntaksen for PEARSON-funktionen er:
=PEARSON(array1,array2) matrix1: matrix af variabel x matrix2: matrix af variabel y For at indsætte matrix1 og matrix2 skal du blot vælge celleområdet for begge.
Lad os finde korrelationskoefficienten for X og Y1 i datasættet i eksempel 2 ved hjælp af PEARSON-funktionen.
Formlen returnerer korrelationskoefficienten for X og Y1. På samme måde kan du gøre for andre.
De endelige korrelationskoefficienter er: