Det numpy-modul i Python giver en funktion kaldet numpy.histogram() . Denne funktion repræsenterer frekvensen af antallet af værdier, der sammenlignes med et sæt værdiområder. Denne funktion ligner hist() funktion af matplotlib.pyplot .
Med enkle ord bruges denne funktion til at beregne histogrammet for datasættet.
Syntaks:
numpy.histogram(x, bins=10, range=None, normed=None, weights=None, density=None)
Parametre:
x: array_like
Denne parameter definerer et fladt array, over hvilket histogrammet beregnes.
bins: int eller sekvens af str eller skalarer (valgfrit)
Hvis denne parameter er defineret som et heltal, definerer den i det givne interval antallet af ens-bredde bins. Ellers defineres en række af beholderkanter, som monotont øges. Det inkluderer også den yderste højre kant, som giver mulighed for uensartede skraldebredder. Den seneste version af numpy giver os mulighed for at indstille bin-parametre som en streng, der definerer en metode til at beregne optimal bin-bredde.
rækkevidde: (flydende, flydende)(valgfrit)
strengværdi af
Denne parameter definerer de nederste og øvre områder af beholderne. Som standard er intervallet (x.min(), x.max()) . Værdierne ignoreres, som er uden for området. Områderne for det første element skal være lig med eller mindre end det andet element.
normeret: bool (valgfrit)
Denne parameter er den samme som densitetsargumentet, men den kan give det forkerte output for ulige beholderbredder.
vægte: array_like (valgfrit)
Denne parameter definerer et array, der indeholder vægte og har samme form som 'x' .
densitet: bool (valgfrit)
Hvis det er sat til True, vil det resultere i antallet af prøver i hver bin. Hvis dens værdi er False, vil tæthedsfunktionen resultere i værdien af sandsynlighedsdensitetsfunktionen i bin.
Vender tilbage:
hist: række
alfabetet nummereret
Tæthedsfunktionen returnerer værdierne af histogrammet.
edge_bin: et array af float dtype
Denne funktion returnerer beholderkanterne (længde(hist+1)) .
Eksempel 1:
import numpy as np a=np.histogram([1, 5, 2], bins=[0, 1, 2, 3]) a
Produktion:
(array([0, 1, 1], dtype=int64), array([0, 1, 2, 3]))
I ovenstående kode
- Vi har importeret numpy med alias navn np.
- Vi har erklæret variablen 'a' og tildelt den returnerede værdi af np.histogram() fungere.
- Vi har bestået et array og værdien af bin i funktionen.
- Til sidst forsøgte vi at udskrive værdien af 'en' .
I outputtet viser det et ndarray, der indeholder histogrammets værdier.
Eksempel 2:
import numpy as np x=np.histogram(np.arange(6), bins=np.arange(7), density=True) x
Produktion:
mysql unikke nøgle
(array([0.16666667, 0.16666667, 0.16666667, 0.16666667, 0.16666667, 0.16666667]), array([0, 1, 2, 3, 4, 5, 6]))
Eksempel 3:
import numpy as np x=np.histogram([[1, 3, 1], [1, 3, 1]], bins=[0,1,2,3]) x
Produktion:
(array([0, 4, 2], dtype=int64), array([0, 1, 2, 3]))
Eksempel 4:
import numpy as np a = np.arange(8) hist, bin_edges = np.histogram(a, density=True) hist bin_edges
Produktion:
array([0.17857143, 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0.17857143]) array([0. , 0.7, 1.4, 2.1, 2.8, 3.5, 4.2, 4.9, 5.6, 6.3, 7. ])
Eksempel 5:
import numpy as np a = np.arange(8) hist, bin_edges = np.histogram(a, density=True) hist hist.sum() np.sum(hist * np.diff(bin_edges))
Produktion:
array([0.17857143, 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0.17857143]) 1.4285714285714288 1.0
I ovenstående kode
- Vi har importeret numpy med alias navn np.
- Vi har lavet et array 'en' ved brug af np.arange() fungere.
- Vi har deklareret variabler 'histor' og 'bin_edges' og derefter tildelt den returnerede værdi af np.histogram() fungere.
- Vi har passeret rækken 'en' og sæt 'massefylde' til True i funktionen.
- Vi forsøgte at udskrive værdien af 'histor' .
- Og til sidst forsøgte vi at beregne summen af histogramværdier vha hist.sum() og np.sum() hvor vi har videregivet histogramværdier og kanter af beholderen.
I outputtet viser det et ndarray, der indeholder værdierne af histogrammet og summen af histogramværdier.