logo

Måder at filtrere Pandas DataFrame efter kolonneværdier

Filtrering af en Pandas DataFrame ved hjælp af kolonneværdier er en almindelig operation, mens du kører med information i Python. Du kan bruge forskellige metoder og teknikker til at opnå dette. Her er adskillige måder at filtrere en Pandas DataFrame fra gennem kolonneværdier.

I dette indlæg vil vi se forskellige måder at filtrere Pandas Dataframe efter kolonneværdier. Lad os først oprette en dataramme:



Python3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Produktion:

Dataramme

Valg af rækker af Pandas Dataframe baseret på en bestemt kolonneværdi ved hjælp af '>', '=', '=', '<=', '!=' operator.

Eksempel 1: Valg af alle rækker fra den givne dataramme, hvor 'Procentdel' er større end 75 vha. [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Produktion:

output dataramme

Eksempel 2: Valg af alle rækker fra den givne dataramme, hvor 'Procentdel' er større end 70 vha. sted [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produktion:

output dataramme-1

Valg af de rækker af Pandas Dataframe, hvis kolonneværdi er til stede på listen ved hjælp af du() metoden for datarammen.

Eksempel 1: Valg af alle rækkerne fra den givne dataramme, hvori 'Stream' er til stede i valglisten vha [ ] .

Python3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produktion:

output dataramme-2

Eksempel 2: Valg af alle rækkerne fra den givne dataramme, hvori 'Stream' er til stede i valglisten vha sted [ ] .

Python




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produktion:

output dataramme-3

Valg af rækker af Pandas Dataframe baseret på flere kolonnebetingelser ved hjælp af '&'-operatoren.

Eksempel 1: Valg af alle rækkerne fra den givne dataramme, hvor 'Alder' er lig med 22, og 'Strøm' er til stede i valglisten vha. [ ] .

Python3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produktion:

output dataramme-4

Eksempel 2: Valg af alle rækkerne fra den givne dataramme, hvor 'Alder' er lig med 22, og 'Strøm' er til stede i valglisten vha. sted [ ] .

Python3




streng til char i java

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produktion:

output dataramme-5