logo

Hvordan sorterer man Pandas DataFrame?

Vi kan udføre sortering i Pandas Dataframe. Denne artikel vil diskutere, hvordan man sorterer Pandas DataFrame ved hjælp af forskellige metoder i Python .

Sortering af datarammer i pandaer

Oprettelse af en Pandas dataramme til demonstration, Her har vi lavet en dataramme, hvori vi vil udføre forskellige sorteringsfunktioner.

Python3






tegn til int i java

# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list>=> [[>'Afghanistan'>,>1952>,>8425333>,>'Asia'>],> >[>'Australia'>,>1957>,>9712569>,>'Oceania'>],> >[>'Brazil'>,>1962>,>76039390>,>'Americas'>],> >[>'China'>,>1957>,>637408000>,>'Asia'>],> >[>'France'>,>1957>,>44310863>,>'Europe'>],> >[>'India'>,>1952>,>3.72e>+>08>,>'Asia'>],> >[>'United States'>,>1957>,>171984000>,>'Americas'>]]> # creating a pandas dataframe> df>=> pd.DataFrame(age_list, columns>=>[>'Country'>,>'Year'>,> >'Population'>,>'Continent'>])> df>

>

>

Produktion

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering af Pandas dataramme

For at sortere datarammen i pandaer skal funktionen sort_værdier() anvendes. Pandaer sort_values() kan sortere datarammen i stigende eller faldende rækkefølge.

Pandas DataFrame-sortering i stigende rækkefølge

Kodestykket sorterer DataFrame df i stigende rækkefølge baseret på kolonnen 'Land'. Den gemmer eller viser dog ikke den sorterede dataramme.

Python3




# Sorting by column 'Country'> df.sort_values(by>=>[>'Country'>])>

>

>

Produktion:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

java kort

Sortering af Pandas DataFrame i faldende rækkefølge

DataFrame df vil blive sorteret i faldende rækkefølge baseret på kolonnen Population, hvor det land, der har den højeste befolkning, vises øverst i DataFrame.

Python3




# Sorting by column 'Population'> df.sort_values(by>=>[>'Population'>], ascending>=>False>)>

>

>

Produktion:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sorter Pandas DataFrame Baseret på Sampling

Her sorterer vi en DataFrame (df>) baseret på 'Population'-kolonnen, og arrangere rækker med manglende værdier i 'Population' for at blive vist først. Detsort_values()>metode medna_position='first'>argument opnår dette ved at prioritere rækker med manglende værdier i begyndelsen af ​​den sorterede DataFrame.

Python3




# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by>=>[>'Population'>], na_position>=>'first'>)>

>

>

Produktion:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering af datarammer efter flere kolonner

I dette eksempel sorterer vi en DataFrame (df>) primært efter kolonnen 'Land' i stigende rækkefølge og inden for hver landegruppe efter kolonnen 'Kontinent'. Den resulterende DataFrame sorteres baseret på den angivne kolonnerækkefølge, hvilket skaber et sorteret datasæt.

Python3




# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by>=>[>'Country'>,>'Continent'>])>

>

>

Produktion:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering af datarammer efter kolonner, men i en anden rækkefølge

I dette eksempel sorterer vi en DataFrame (df>) først efter kolonnen 'Land' i faldende rækkefølge og inden for hver landegruppe efter kolonnen 'Kontinent' i stigende rækkefølge. Den resulterende DataFrame er organiseret baseret på de angivne kolonnesorteringskriterier.

Python3


binære trætyper



# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by>=>[>'Country'>,>'Continent'>],> >ascending>=>[>False>,>True>])>

>

>

Produktion:

Sorter Pandas DataFrame

Sorter Pandas DataFrame