logo

Pandas DataFrame.describe()

Describe() metoden bruges til at beregne nogle statistiske data som f.eks percentil, middel og std af de numeriske værdier af Series eller DataFrame. Den analyserer både numeriske serier og objektserier og også DataFrame-søjlesæt af blandede datatyper.

Syntaks

 DataFrame.describe(percentiles=None, include=None, exclude=None) 

Parametre

    percentil:Det er en valgfri parameter, som er en listelignende datatype af tal, der skal falde mellem 0 og 1. Dens standardværdi er [.25, .5, .75], som returnerer den 25., 50. og 75. percentil.omfatte:Det er også en valgfri parameter, der inkluderer listen over datatyper, mens den beskriver DataFrame. Dens standardværdi er Ingen.udelukke:Det er også en valgfri parameter, der ekskluderer listen over datatyper, mens den beskriver DataFrame. Dens standardværdi er Ingen.

Vender tilbage

Det returnerer den statistiske oversigt over Series og DataFrame.

Eksempel 1

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() 

Produktion

 count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64 

Eksempel 2

 import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() 

Produktion

 count 4 unique 3 top q freq 2 dtype: object 

Eksempel 3

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) 

Produktion

 categorical count 3 unique 3 top u freq 1 

Eksempel 4

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object]) 

Produktion

 categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0