Pandas bibliotek i Python er meget nyttigt til manipulation af matematiske data og er meget udbredt inden for maskinlæring. Det omfatter mange metoder til dets korrekte funktion. placere() og iloc() er en af disse metoder. Disse bruges til at udskære data fra Pandas DataFrame . De hjælper med praktisk udvælgelse af data fra DataFrame i Python . De bruges til at filtrere dataene i henhold til nogle betingelser.
Forskellen mellem loc() og iloc() i Pandas DataFrame
Her vil vi se forskellen mellem loc() og iloc() Funktion i Pandas DataFrame. For at se og sammenligne forskellen mellem disse to, vil vi oprette et eksempel på en dataramme, som vi vil bruge i hele afsnittet. Virkningen af begge disse metoder er forklaret i prøvedatasættet af biler.
python3
np.sammenkæde
# importing the module> import> pandas as pd> > # creating a sample dataframe> data>=> pd.DataFrame({>'Brand'>: [>'Maruti'>,>'Hyundai'>,>'Tata'>,> >'Mahindra'>,>'Maruti'>,>'Hyundai'>,> >'Renault'>,>'Tata'>,>'Maruti'>],> >'Year'>: [>2012>,>2014>,>2011>,>2015>,>2012>,> >2016>,>2014>,>2018>,>2019>],> >'Kms Driven'>: [>50000>,>30000>,>60000>,> >25000>,>10000>,>46000>,> >31000>,>15000>,>12000>],> >'City'>: [>'Gurgaon'>,>'Delhi'>,>'Mumbai'>,> >'Delhi'>,>'Mumbai'>,>'Delhi'>,> >'Mumbai'>,>'Chennai'>,>'Ghaziabad'>],> >'Mileage'>: [>28>,>27>,>25>,>26>,>28>,> >29>,>24>,>21>,>24>]})> > # displaying the DataFrame> display(data)> |
>
>
Produktion
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 1 Hyundai 2014 30000 Delhi 27 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 24 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Python loc() funktion
Det loc() funktion er etiketbaseret datavalgsmetode, hvilket betyder, at vi skal videregive navnet på den række eller kolonne, som vi vil vælge. Denne metode inkluderer det sidste element af intervallet, der sendes i det, i modsætning til iloc(). loc() kan acceptere de boolske data i modsætning til iloc(). Mange operationer kan udføres ved at bruge metoden loc() som f.eks
Eksempel 1: Valg af data i henhold til nogle betingelser
I dette eksempel bruger kodenloc>funktion til at vælge og vise rækker fra DataFrame, hvor mærket er 'Maruti' og kilometertallet er større end 25, hvilket viser relevant information om Maruti-biler med høj kilometertal.
python3
# selecting cars with brand 'Maruti' and Mileage>25> display(data.loc[(data.Brand>=>=> 'Maruti'>) & (data.Mileage>>25>)])> |
>
>
Produktion
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 4 Maruti 2012 10000 Mumbai 28>
Eksempel 2: Valg af rækker fra DataFrame
I dette eksempel bruger kodenloc>funktion til at udtrække og vise rækker med indekser fra 2 til 5 (inklusive) fra DataFrame, hvilket giver information om et specifikt udvalg af biler i datasættet.
python3
maven repository
# selecting range of rows from 2 to 5> display(data.loc[>2>:>5>])> |
>
>
Produktion
streng til heltal
Brand Year Kms Driven City Mileage 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29>
Eksempel 3: Opdatering af værdien af enhver kolonne
I dette eksempel bruger kodenloc>funktion til at opdatere 'Kilometertal'-værdierne til 22 for biler i DataFrame, hvor produktionsåret er før 2015. Den ændrede DataFrame vises derefter, hvilket afspejler ændringerne i kolonnen Kilometertal.
python3
# updating values of Mileage if Year <2015> data.loc[(data.Year <>2015>), [>'Mileage'>]]>=> 22> display(data)> |
>
>
q3 måneder
Produktion
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 22 1 Hyundai 2014 30000 Delhi 22 2 Tata 2011 60000 Mumbai 22 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 22 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 22 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Python iloc() funktion
Det iloc() funktion er en indekseret-baseret udvælgelsesmetode, hvilket betyder, at vi skal passere et heltalsindeks i metoden for at vælge en bestemt række/kolonne. Denne metode inkluderer ikke det sidste element i området, der sendes i det i modsætning til loc(). iloc() accepterer ikke de boolske data i modsætning til loc(). Operationer udført ved hjælp af iloc() er:
Eksempel 1: Valg af rækker ved hjælp af heltalsindekser
I dette eksempel anvender kodeniloc>funktion til at udtrække og vise specifikke rækker med indeks 0, 2, 4 og 7 fra DataFrame, der viser information om udvalgte biler i datasættet.
python3
# selecting 0th, 2nd, 4th, and 7th index rows> display(data.iloc[[>0>,>2>,>4>,>7>]])> |
>
>
streng for lang
Produktion
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 2 Tata 2011 60000 Mumbai 25 4 Maruti 2012 10000 Mumbai 28 7 Tata 2018 15000 Chennai 21>
Eksempel 2: Valg af et område af kolonner og rækker samtidigt
I dette eksempel bruger kodeniloc>funktion til at udtrække og vise en delmængde af DataFrame, inklusive række 1 til 4 og kolonne 2 til 4. Dette giver information om et specifikt udvalg af biler og deres relevante attributter i datasættet.
python3
# selecting rows from 1 to 4 and columns from 2 to 4> display(data.iloc[>1>:>5>,>2>:>5>])> |
>
>
Produktion
Kms Driven City Mileage 1 30000 Delhi 27 2 60000 Mumbai 25 3 25000 Delhi 26 4 10000 Mumbai 28>