logo

Pandas DataFrame corr() Metode

Pandaer dataframe.corr() bruges til at finde den parvise korrelation af alle kolonner i Pandas Dataframe i Python. Nogen NaN værdier udelukkes automatisk. For at ignorere ikke-numeriske værdier, brug parameteren numeric_only = True. I denne artikel vil vi lære om DataFrame.corr()-metoden i Python .

Pandas DataFrame corr() Metodesyntaks

Syntaks: DataFrame.corr(self, method='pearson', min_periods=1, numeric_only = False)

Parametre:



  • metode:
    • pearson: standard korrelationskoefficient
    • kendall: Kendall Tau korrelationskoefficient
    • spearman: Spearman rang korrelation
  • min_perioder: Minimum antal observationer påkrævet pr. søjlepar for at få et gyldigt resultat. I øjeblikket kun tilgængelig for pearson og spearman korrelation
  • numeric_only : Om kun de numeriske værdier skal betjenes eller ej. Den er som standard indstillet til False.

Vender tilbage: count :y : DataFrame

array.fra java

Pandas Data Correlations corr() Metode

En god korrelation afhænger af brugen, men det er sikkert at sige, at du har mindst 0,6 (eller -0,6) for at kalde det en god korrelation. Et simpelt eksempel til at vise, hvordan korrelation fungerer i Python .

Python3




import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())>

>

>

Produktion

 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>

Oprettelse af prøvedataramme

Udskrivning af de første 10 rækker af datarammen.

Bemærk: Korrelationen af ​​en variabel med sig selv er 1. For et link til CSV-filen Brugt i Kode, klik her

Python3

polymorfi java




# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]>

>

>

Produktion

Pandas datakorrelationer

Python Pandas DataFrame corr() Metodeeksempler

Find sammenhæng mellem kolonnerne ved hjælp af pearson-metoden

Her bruger vi corr()-funktionen til at finde korrelationen mellem kolonnerne i datarammen ved hjælp af 'Pearson'-metoden. Vi har kun fire numeriske kolonner i datarammen. Outputdatarammen kan fortolkes som for enhver celle, rækkevariabelkorrelation med kolonnevariablen er værdien af ​​cellen. Som tidligere nævnt er korrelationen af ​​en variabel med sig selv 1. Af den grund er alle diagonale værdier 1,00.

Python3

preg_match




# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)>

>

>

Produktion

Pandas datakorrelationer

Find sammenhæng mellem kolonnerne ved hjælp af Kendall-metoden

Brug Pandas df.corr()-funktion til at finde korrelationen mellem kolonnerne i datarammen ved hjælp af 'kendall'-metoden. Outputdatarammen kan fortolkes som for enhver celle, rækkevariabelkorrelation med kolonnevariablen er værdien af ​​cellen. Som tidligere nævnt er korrelationen af ​​en variabel med sig selv 1. Af den grund er alle diagonale værdier 1,00.

Python3




# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)>

int til streng c++
>

>

Produktion

dataframe.corr