logo

Forskellige måder at skabe Pandas Dataframe på

Pandas DataFrame er en 2-dimensionel mærket datastruktur som en tabel med rækker og kolonner. Størrelsen og værdierne af DataFrame kan ændres, dvs. kan ændres.

DataFrame bruges mest i dataanalyse og datamanipulation. Det lader dig gemme data i tabelform som SQL-database, MS Excel eller Google Sheets, hvilket gør det nemmere at udføre aritmetiske operationer på dataene.



Det er det mest brugte Panda-objekt. Det DataFrame() funktion bruges til at oprette en DataFrame i Pandas. Du kan også oprette Pandas DataFrame på flere måder.

Pandas Dataframe() Syntaks

pandas.DataFrame(data, indeks, kolonner)

javascript opkaldsfunktion fra html

Parametre:

  • data : Det er et datasæt, hvorfra der skal oprettes en DataFrame. Det kan være en liste, ordbog, skalarværdi, serier og arrays osv.
  • indeks : Det er valgfrit, som standard starter indekset for DataFrame fra 0 og slutter ved den sidste dataværdi (n-1). Den definerer rækkeetiketten eksplicit.
  • kolonner : Denne parameter bruges til at angive kolonnenavne i DataFrame. Hvis kolonnenavnet ikke er defineret som standard, vil det tage en værdi fra 0 til n-1.

Vender tilbage:

  • DataFrame objekt

Nu hvor vi har diskuteret DataFrame()-funktionen, lad os se på forskellige måder at oprette en DataFrame på:



Forskellige måder at oprette dataramme i Python

Der er flere måder at oprette en Pandas dataramme i Python . Du kan oprette en DataFrame med følgende metoder:

  • Opret Pandas DataFrame ved hjælp af DataFrame()-funktionen
  • Opret Pandas DataFrame fra listen over lister
  • Opret Pandas DataFrame fra ordbogen for ndarray/list
  • Opret Pandas DataFrame fra listen over ordbøger
  • Opret Pandas DataFrame fra en ordbog over serier
  • Oprettelse af DataFrame ved hjælp af zip()-funktionen
  • Oprettelse af en DataFrame ved eksplicit at bevise indeksetiketten

Opret en tom DataFrame ved hjælp af DataFrame()-metoden

DataFrame i Python kan oprettes af DataFrame()-funktionen i Pandas bibliotek . Kald blot funktionen med DataFrame-konstruktøren for at oprette en DataFrame.

Eksempel : Oprettelse af en tom DataFrame ved hjælp af DataFrame()-funktionen i Python



Python3




# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df>=> pd.DataFrame()> # Printing Empty DataFrame> print>(df)>

>

>

Produktion:

Empty DataFrame Columns: [] Index: []>

Opret DataFrame fra lister over lister

For at oprette en Pandas DataFrame fra en liste af lister, kan du bruge pd.DataFrame()-funktionen. Denne funktion tager en liste over lister som input og opretter en DataFrame med det samme antal rækker og kolonner som inputlisten.

Eksempel : Oprettelse af DataFrame fra lister over lister ved hjælp af DataFrame()-metoden

Python3




# Import pandas library> import> pandas as pd> # initialize list of lists> data>=> [[>'tom'>,>10>], [>'nick'>,>15>], [>'juli'>,>14>]]> # Create the pandas DataFrame> df>=> pd.DataFrame(data, columns>=>[>'Name'>,>'Age'>])> # print dataframe.> print>(df)>

>

>

pandaer og numpy

Produktion:

 Name Age 0 tom 10 1 nick 15 2 juli 14>

Opret DataFrame fra Dictionary of ndArray/Lists

For at oprette DataFrame fra en ordbog af ndarrays /lister, skal alle arrays være af samme længde. Hvis et indeks passeres, skal længdeindekset være lig med længden af ​​arrays.

Hvis der ikke passeres noget indeks, vil indekset som standard være range(n), hvor n er array-længden.

Eksempel : Oprettelse af DataFrame fra en ordbog over ndarray/lister

Python3




# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'nick'>,>'krish'>,>'jack'>],> >'Age'>: [>20>,>21>,>19>,>18>]}> # Create DataFrame> df>=> pd.DataFrame(data)> # Print the output.> print>(df)>

>

>

Produktion:

 Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>

Bemærk: Når du opretter DataFrame ved hjælp af en ordbog, vil nøglerne til ordbogen som standard være kolonnenavne. Vi kan også angive kolonnenavne eksplicit ved hjælp af kolonneparameter.

Opret DataFrame fra Liste over ordbøger

Pandas DataFrame kan oprettes ved at bestå lister over ordbøger som inputdata. Som standard tages ordbogsnøgler som kolonner.

Python3




# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data>=> [{>'a'>:>1>,>'b'>:>2>,>'c'>:>3>},> >{>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates DataFrame.> df>=> pd.DataFrame(data)> # Print the data> print>(df)>

>

>

Produktion:

a b c 0 1 2 3 1 10 20 30>

Et andet eksempel er at oprette en Pandas DataFrame ved at sende lister med ordbøger og rækkeindekser .

Python3




abstrakt klasse
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data>=> [{>'b'>:>2>,>'c'>:>3>}, {>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df>=> pd.DataFrame(data, index>=>[>'first'>,>'second'>])> # Print the data> print>(df)>

>

>

Produktion:

b c a first 2 3 NaN second 20 30 10.0>

Opret DataFrame fra en ordbog over serier

For at oprette en DataFrame fra en ordbog af serie , kan en ordbog sendes til en DataFrame. Det resulterende indeks er foreningen af ​​alle rækkerne af beståede indekserede.

Eksempel: Oprettelse af en DataFrame fra en ordbog over serier.

Python3


java int til char



# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d>=> {>'one'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>]),> >'two'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>])}> # creates Dataframe.> df>=> pd.DataFrame(d)> # print the data.> print>(df)>

>

>

Produktion:

 one two a 10 10 b 20 20 c 30 30 d 40 40>

Opret DataFrame ved hjælp af zip()-funktionen

To lister kan slås sammen ved at bruge zip() funktion . Opret nu Pandas DataFrame ved at kalde pd.DataFrame()-funktionen.

Eksempel: Oprettelse af DataFrame ved hjælp af zip() funktion.

Python3

riv kort




# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name>=> [>'tom'>,>'krish'>,>'nick'>,>'juli'>]> # List2> Age>=> [>25>,>30>,>26>,>22>]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples>=> list>(>zip>(Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df>=> pd.DataFrame(list_of_tuples,> >columns>=>[>'Name'>,>'Age'>])> # Print data.> print>(df)>

>

>

Produktion:

 Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>

Opret en DataFrame ved at bevise indeksetiketten eksplicit

For at oprette en DataFrame ved eksplicit at angive indeksetiketten, kan du bruge indeksparameteren for pd.DataFrame()-konstruktøren. Indeksparameteren tager en liste over indeksetiketter som input, og DataFrame vil bruge disse etiketter til rækkerne i DataFrame.

Eksempel: Oprettelse af en DataFrame ved eksplicit at bevise indeksetiketten

Python3




# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'Jack'>,>'nick'>,>'juli'>],> >'marks'>: [>99>,>98>,>95>,>90>]}> # Creates pandas DataFrame.> df>=> pd.DataFrame(data, index>=>[>'rank1'>,> >'rank2'>,> >'rank3'>,> >'rank4'>])> # print the data> print>(df)>

>

>

Produktion:

 Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>

Konklusion

Python Pandas DataFrame ligner en tabel med rækker og kolonner. Det er en todimensionel datastruktur og er meget nyttig til dataanalyse og datamanipulation.

I denne tutorial har vi diskuteret flere måder at skabe en Pandas DataFrame på. Med denne tutorial vil du være i stand til at håndtere ethvert komplekst krav til oprettelse af DataFrame.