Describe() metoden bruges til at beregne nogle statistiske data som f.eks percentil, middel og std af de numeriske værdier af Series eller DataFrame. Den analyserer både numeriske serier og objektserier og også DataFrame-søjlesæt af blandede datatyper.
Syntaks
DataFrame.describe(percentiles=None, include=None, exclude=None)
Parametre
Vender tilbage
Det returnerer den statistiske oversigt over Series og DataFrame.
Eksempel 1
import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe()
Produktion
count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64
Eksempel 2
import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe()
Produktion
count 4 unique 3 top q freq 2 dtype: object
Eksempel 3
import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category'])
Produktion
categorical count 3 unique 3 top u freq 1
Eksempel 4
import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object])
Produktion
categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0