logo

Python Pandas-serien

Pandas-serien kan defineres som et endimensionelt array, der er i stand til at lagre forskellige datatyper. Vi kan nemt konvertere listen, tuplen og ordbogen til serier ved hjælp af ' serie ' metode. Rækkeetiketterne for serier kaldes indekset. En serie kan ikke indeholde flere kolonner. Den har følgende parameter:

    data:Det kan være en hvilken som helst liste, ordbog eller skalarværdi.indeks:Værdien af ​​indekset skal være unik og hashbar. Det skal være af samme længde som data. Hvis vi ikke passerer noget indeks, standard np.arrange(n) vil blive brugt.dtype:Det refererer til datatypen for serier.kopi:Det bruges til at kopiere data.

Oprettelse af en serie:

Vi kan oprette en serie på to måder:

  1. Opret en tom serie
  2. Opret en serie ved hjælp af input.

Opret en tom serie:

Vi kan nemt oprette en tom serie i Pandas, hvilket betyder, at den ikke vil have nogen værdi.

Syntaksen, der bruges til at oprette en tom serie:

 = pandas.Series() 

Eksemplet nedenfor opretter et objekt af typen Empty Series, der ikke har nogen værdier og som har standard datatype, dvs. flyde 64 .

Eksempel

 import pandas as pd x = pd.Series() print (x) 

Produktion

 Series([], dtype: float64) 

Oprettelse af en serie ved hjælp af input:

Vi kan oprette serier ved at bruge forskellige input:

  • Array
  • Dict
  • Skalær værdi

Oprettelse af serier fra Array:

Før du opretter en serie, skal vi først importere nusset modul og brug derefter array()-funktionen i programmet. Hvis dataene er ndarray, skal det beståede indeks være af samme længde.

Hvis vi ikke passerer et indeks, så som standard indeks på område(n) sendes, hvor n definerer længden af ​​et array, dvs. [0,1,2,.... range(len(array))-1 ].

Eksempel

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Produktion

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Opret en serie fra dict

Vi kan også lave en serie fra dict. Hvis ordbogsobjektet sendes som input, og indekset ikke er specificeret, tages ordbogsnøglerne i en sorteret rækkefølge for at konstruere indekset .

Hvis indekset er bestået, vil værdier, der svarer til en bestemt etiket i indekset, blive udtrukket fra ordbog .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Produktion

hvad er en stak i java
 x 0.0 y 1.0 z 2.0 dtype: float64 

Opret en serie ved hjælp af Scalar:

Download youtube vlc media player

Hvis vi tager skalarværdierne, skal indekset angives. Den skalære værdi vil blive gentaget for at matche længden af ​​indekset.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Produktion

 0 4 1 4 2 4 3 4 dtype: int64 

Adgang til data fra serier med Position:

Når du har oprettet objektet Series, kan du få adgang til dets indekser, data og endda individuelle elementer.

Dataene i serien kan tilgås svarende til dataene i ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Produktion

 1 

Serieobjektattributter

Attributten Series er defineret som enhver information relateret til Series-objektet, såsom størrelse, datatype. osv. Nedenfor er nogle af de attributter, som du kan bruge til at få oplysninger om Series-objektet:

Egenskaber Beskrivelse
Series.indeks Definerer indekset for serien.
Serie.form Det returnerer en tuple af formen af ​​dataene.
Series.dtype Det returnerer datatypen for dataene.
Serie.størrelse Det returnerer størrelsen af ​​dataene.
Serie.tom Det returnerer True, hvis Serieobjektet er tomt, ellers returnerer det falsk.
Serie.hasnans Den returnerer True, hvis der er nogen NaN-værdier, ellers returnerer den falsk.
Series.nbytes Det returnerer antallet af bytes i dataene.
Serien er jeg Det returnerer antallet af dimensioner i dataene.
Serie.varestørrelse Det returnerer størrelsen af ​​varens datatype.

Henter Index array og data array for et serieobjekt

Vi kan hente indeksarrayet og dataarrayet for et eksisterende serieobjekt ved at bruge attributterne indeks og værdier.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Produktion

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Henter typer (dtype) og typestørrelse (varestørrelse)

Du kan bruge attributten dtype med serieobjekt som dtype til at hente datatypen for et individuelt element i et serieobjekt, du kan bruge emnestørrelse attribut for at vise antallet af bytes, der er allokeret til hvert dataelement.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Produktion

 int64 8 float64 8 

Henter form

Formen på Series-objektet definerer det samlede antal elementer inklusive manglende eller tomme værdier (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Produktion

 (4,) (3,) 

Henter dimension, størrelse og antal bytes:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Produktion

 1 1 4 3 32 24 

Kontrol af tomhed og tilstedeværelse af NaN'er

For at kontrollere, at serieobjektet er tomt, kan du bruge tom attribut . Tilsvarende, for at kontrollere, om et serieobjekt indeholder nogle NaN-værdier eller ej, kan du bruge hassan attribut.

Eksempel

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Produktion

 False False True True False False 4 3 3 3 

Serie funktioner

Der er nogle funktioner, der bruges i serier, som er som følger:

Funktioner Beskrivelse
Pandas Series.map() Kortlæg værdierne fra to serier, der har en fælles kolonne.
Pandas Series.std() Beregn standardafvigelsen for det givne sæt tal, DataFrame, kolonne og rækker.
Pandas Series.to_frame() Konverter serieobjektet til datarammen.
Pandas Series.value_counts() Returnerer en serie, der indeholder antal unikke værdier.