logo

Tilføjelse af ny kolonne til eksisterende DataFrame i Pandas

Tilføjelse af nye kolonner til en eksisterende DataFrame er en grundlæggende opgave i dataanalyse ved hjælp af Pandaer . Det giver dig mulighed for at berige dine data med yderligere information og lette yderligere analyse og manipulation. Denne artikel vil udforske forskellige metoder til at tilføje nye kolonner, herunder enkel tildeling, deninsert()>metode, denassign()>metode. Lad os diskutere tilføjelse af nye kolonner til Pandas eksisterende DataFrame.

Hvad er Pandas DataFrame?

EN Pandas DataFrame er en todimensionel, størrelsesmutbar, potentielt heterogen tabelformet datastruktur med mærkede akser (rækker og kolonner). Det er en grundlæggende datastruktur i Python-datavidenskabens økosystem og giver en effektiv måde at arbejde med tabeldata på.



Her er nogle nøglefunktioner i en Pandas DataFrame:

  • Datarepræsentation: Gemmer data i et tabelformat med rækker og kolonner.
  • Heterogene datatyper: Kan indeholde forskellige datatyper i forskellige kolonner (f.eks. heltal, flydende, strenge, booleaner).
  • Mærkning: Hver række og kolonne har en etiket (indeks- og kolonnenavne).
  • Foranderlig: Tillader datamanipulation og modifikation.
  • Kraftige operationer: Giver forskellige funktioner og metoder til dataanalyse, manipulation og udforskning.
  • Udvidbar: Kan tilpasses og udvides med yderligere funktionaliteter gennem biblioteker og brugerdefinerede funktioner.

Der er flere måder at tilføje en ny kolonne til en eksisterende dataramme i Pandas i Python :

  • Oprettelse af en prøvedataramme
  • Ved hjælp af Dataframe.insert() metode
  • Ved hjælp af Dataframe.assign() metode
  • Brug af ordbog
  • Brug af liste
  • Ved brug af .placere()
  • Tilføjelse af mere end én kolonne i eksisterende dataramme

Oprettelse af en prøvedataramme

Her opretter vi en prøvedataramme:



Python3






import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> print>(df)>

>

>

Produktion:

   Name Height Qualification     0    Jai 5.1 Msc   1    Princi 6.2 MA   2   Gaurav 5.1 Msc   3   Anuj 5.2 Msc>

Bemærk, at længden af ​​din liste skal svare til længden af ​​indekskolonnen, ellers vil den vise en fejl.

Tilføj en ny kolonne til en eksisterende Datframe ved hjælp af DataFrame.insert()

Det giver frihed til at tilføje en kolonne på enhver position, vi kan lide, og ikke kun i slutningen. Det giver også forskellige muligheder for at indsætte kolonneværdierne.

Python3

int parseint




import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(>2>,>'Age'>, [>21>,>23>,>24>,>21>],>True>)> # Observe the result> print>(df)>

>

>

Produktion:

  Name Height Age Qualification     0   Jai 5.1 21 Msc   1   Princi 6.2 23 MA   2   Gaurav 5.1 24 Msc   3    Anuj 5.2 21 Msc>

Tilføjelse af kolonner til Pandas DataFrame ved hjælp af Dataframe.assign()

Denne metode vil oprette en ny dataramme med en ny kolonne tilføjet til den gamle dataramme.

Python3




første ordens logik

import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2>=> df.assign(address>=>[>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>])> print>(df2)>

>

>

Produktion:

   Name Height Qualification address     0    Jai 5.1 Msc Delhi   1    Princi 6.2 MA Bangalore   2    Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Pandaer Føj kolonne til DataFrame ved hjælp af en ordbog

Vi kan bruge en Python ordbog for at tilføje en ny kolonne i pandas DataFrame. Brug en eksisterende kolonne, da nøgleværdierne og deres respektive værdier vil være værdierne for en ny kolonne.

Python3




# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address>=> {>'Delhi'>:>'Jai'>,>'Bangalore'>:>'Princi'>,> >'Patna'>:>'Gaurav'>,>'Chennai'>:>'Anuj'>}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Provide 'Address' as the column name> df[>'Address'>]>=> address> # Observe the output> print>(df)>

>

>

Produktion:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Tilføjelse af en ny kolonne til en Pandas DataFrame ved hjælp af List

I dette eksempel, Pandaer tilføjer nye kolonner fra listen Adresser til en eksisterende Pandas DataFrame ved hjælp af en ordbog og en liste.

Python3




# Declare a list that is to be converted into a column> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Using 'Address' as the column name> # and equating it to the list> df[>'Address'>]>=> address> print>(df)>

>

>

Produktion:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Tilføj en ny kolonne til en eksisterende Pandas DataFrame ved hjælp af Dataframe.loc()

I dette eksempel opretter det en Pandas DataFrame med navndf>med kolonnerne Navn, Højde og Kvalifikation og tilføjer en ny kolonne Adresse ved hjælp afloc>attribut.

Python3




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> # Create the list of new column values> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Add the new column using loc> df.loc[:,>'Address'>]>=> address> print>(df)>

>

>

Produktion:

  Name Height Qualification Address     0    Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3   Anuj 5.2 Msc Patna>

Tilføjelse af mere end én kolonne i eksisterende dataramme

I dette eksempel udvider den en eksisterende Pandas DataFramedf>med to nye kolonner, Alder og Stat, ved hjælp af deres respektive datalister.

Python3




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>],> >'Address'>: [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]}> df>=> pd.DataFrame(data)> # Define new data for additional columns> age>=> [>22>,>25>,>23>,>24>]> state>=> [>'NCT'>,>'Karnataka'>,>'Tamil Nadu'>,>'Bihar'>]> # Add multiple columns using dictionary assignment> new_data>=> {>'Age'>: age,>'State'>: state }> df>=> df.assign(>*>*>new_data)> print>(df)>

>

java sorteringsliste

>

Produktion:

   Name Height Qualification Address Age State     0    Jai 5.1 Msc Delhi 22 NCT   1   Princi 6.2 MA Bangalore 25 Karnataka   2    Gaurav 5.1 Msc Chennai 23 Tamil Nadu   3   Anuj 5.2 Msc Patna 24 Bihar>

Konklusion

Forståelse af, hvordan man tilføjer nye kolonner til DataFrames er afgørende for dataudforskning og -manipulation i Pandas. Valget af den passende metode afhænger af den specifikke kontekst og det ønskede resultat. Ved at mestre disse teknikker kan du effektivt manipulere, analysere og få værdifuld indsigt fra dine data.