Pandas-serien kan defineres som et endimensionelt array, der er i stand til at lagre forskellige datatyper. Vi kan nemt konvertere listen, tuplen og ordbogen til serier ved hjælp af ' serie ' metode. Rækkeetiketterne for serier kaldes indekset. En serie kan ikke indeholde flere kolonner. Den har følgende parameter:
Oprettelse af en serie:
Vi kan oprette en serie på to måder:
- Opret en tom serie
- Opret en serie ved hjælp af input.
Opret en tom serie:
Vi kan nemt oprette en tom serie i Pandas, hvilket betyder, at den ikke vil have nogen værdi.
Syntaksen, der bruges til at oprette en tom serie:
= pandas.Series()
Eksemplet nedenfor opretter et objekt af typen Empty Series, der ikke har nogen værdier og som har standard datatype, dvs. flyde 64 .
Eksempel
import pandas as pd x = pd.Series() print (x)
Produktion
Series([], dtype: float64)
Oprettelse af en serie ved hjælp af input:
Vi kan oprette serier ved at bruge forskellige input:
- Array
- Dict
- Skalær værdi
Oprettelse af serier fra Array:
Før du opretter en serie, skal vi først importere nusset modul og brug derefter array()-funktionen i programmet. Hvis dataene er ndarray, skal det beståede indeks være af samme længde.
Hvis vi ikke passerer et indeks, så som standard indeks på område(n) sendes, hvor n definerer længden af et array, dvs. [0,1,2,.... range(len(array))-1 ].
Eksempel
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Produktion
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Opret en serie fra dict
Vi kan også lave en serie fra dict. Hvis ordbogsobjektet sendes som input, og indekset ikke er specificeret, tages ordbogsnøglerne i en sorteret rækkefølge for at konstruere indekset .
Hvis indekset er bestået, vil værdier, der svarer til en bestemt etiket i indekset, blive udtrukket fra ordbog .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Produktion
hvad er en stak i java
x 0.0 y 1.0 z 2.0 dtype: float64
Opret en serie ved hjælp af Scalar:
Download youtube vlc media player
Hvis vi tager skalarværdierne, skal indekset angives. Den skalære værdi vil blive gentaget for at matche længden af indekset.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Produktion
0 4 1 4 2 4 3 4 dtype: int64
Adgang til data fra serier med Position:
Når du har oprettet objektet Series, kan du få adgang til dets indekser, data og endda individuelle elementer.
Dataene i serien kan tilgås svarende til dataene i ndarray.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Produktion
1
Serieobjektattributter
Attributten Series er defineret som enhver information relateret til Series-objektet, såsom størrelse, datatype. osv. Nedenfor er nogle af de attributter, som du kan bruge til at få oplysninger om Series-objektet:
Egenskaber | Beskrivelse |
---|---|
Series.indeks | Definerer indekset for serien. |
Serie.form | Det returnerer en tuple af formen af dataene. |
Series.dtype | Det returnerer datatypen for dataene. |
Serie.størrelse | Det returnerer størrelsen af dataene. |
Serie.tom | Det returnerer True, hvis Serieobjektet er tomt, ellers returnerer det falsk. |
Serie.hasnans | Den returnerer True, hvis der er nogen NaN-værdier, ellers returnerer den falsk. |
Series.nbytes | Det returnerer antallet af bytes i dataene. |
Serien er jeg | Det returnerer antallet af dimensioner i dataene. |
Serie.varestørrelse | Det returnerer størrelsen af varens datatype. |
Henter Index array og data array for et serieobjekt
Vi kan hente indeksarrayet og dataarrayet for et eksisterende serieobjekt ved at bruge attributterne indeks og værdier.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Produktion
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Henter typer (dtype) og typestørrelse (varestørrelse)
Du kan bruge attributten dtype med serieobjekt som dtype til at hente datatypen for et individuelt element i et serieobjekt, du kan bruge emnestørrelse attribut for at vise antallet af bytes, der er allokeret til hvert dataelement.
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Produktion
int64 8 float64 8
Henter form
Formen på Series-objektet definerer det samlede antal elementer inklusive manglende eller tomme værdier (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Produktion
(4,) (3,)
Henter dimension, størrelse og antal bytes:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Produktion
1 1 4 3 32 24
Kontrol af tomhed og tilstedeværelse af NaN'er
For at kontrollere, at serieobjektet er tomt, kan du bruge tom attribut . Tilsvarende, for at kontrollere, om et serieobjekt indeholder nogle NaN-værdier eller ej, kan du bruge hassan attribut.
Eksempel
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Produktion
False False True True False False 4 3 3 3
Serie funktioner
Der er nogle funktioner, der bruges i serier, som er som følger:
Funktioner | Beskrivelse |
---|---|
Pandas Series.map() | Kortlæg værdierne fra to serier, der har en fælles kolonne. |
Pandas Series.std() | Beregn standardafvigelsen for det givne sæt tal, DataFrame, kolonne og rækker. |
Pandas Series.to_frame() | Konverter serieobjektet til datarammen. |
Pandas Series.value_counts() | Returnerer en serie, der indeholder antal unikke værdier. |