logo

Optælling i Python

I denne artikel vil vi diskutere, hvordan vi kan skabe en tælle plot ved at bruge det søfødte bibliotek, og hvordan de forskellige parametre kan bruges til at udlede resultater fra funktionerne i vores datasæt.

Seaborn bibliotek

Det søfødte bibliotek er meget brugt blandt dataanalytikere, galaksen af ​​plots, det indeholder, giver den bedst mulige repræsentation af vores data.

Det søfødte bibliotek kan importeres til vores arbejdsmiljø vha.

python liste initialisere
 import seaborn as sns 

Lad os nu diskutere, hvorfor vi bruger countplot, og hvad er betydningen af ​​dets parametre.

Tælleplot

Tællediagrammet bruges til at repræsentere forekomsten(tallene) af observationen, der er til stede i den kategoriske variabel.

Det bruger konceptet med et søjlediagram til den visuelle afbildning.

Parametre-

Følgende parametre er specificeret, når vi opretter et tælleplot, lad os få en kort idé om dem-

    x og y-Denne parameter specificerer de data, vi henviser til til repræsentation, og observerer derefter de fremhævede mønstre.farve-Denne parameter angiver den farve, der kan give et godt udseende til vores plot.palet-Det tager værdien af ​​paletten. Det bruges mest til at vise farvetonevariablen.nuance-Denne parameter angiver kolonnenavnet.data-Denne parameter specificerer den dataramme, vi gerne vil tage til repræsentationen. For eksempel kan data være en matrix.undvige-Denne parameter er valgfri, og den accepterer en boolsk værdi som input.mætning-Denne parameter accepterer en flydende værdi. En variation i intensiteten af ​​farver kan observeres, når vi specificerer dette.hue_order-Parameteren hue_order tager strenge som input.kwargs-Parameteren kwargs specificerer nøgle- og værditilknytningerne.økse-Parameteren akse er valgfri og bruges til at tage akser, som plots oprettes på.orientere-Parameteren orientering er valgfri og fortæller orienteringen af ​​plottet, som vi har brug for, vandret eller lodret.

Lad os nu se, hvad der er de forskellige måder at repræsentere vores egenskaber på.

I det første eksempel vil vi oprette et tælleplot for en enkelt variabel. Vi har taget datasættet 'tip' til at implementere det samme.

1. Værdien tæller for en enkelt variabel

Eksempel -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',data=df) plt.show() 

Produktion:

Optælling i Python

I det næste eksempel vil vi bruge hue-parameteren og oprette et tælleplot.

Følgende program illustrerer det samme-

2. Repræsenterer to kategoriske variable ved hjælp af farvetoneparameter

Eksempel -

lytteport
 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',hue='smoker',data=df) plt.show() 

Produktion:

Optælling i Python

I det næste eksempel vil vi overveje y-aksen og lave et vandret tælleplot.

Følgende program illustrerer det samme-

3. Oprettelse af vandrette plots

Eksempel -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(y='sex',hue='smoker',data=df) plt.show() 

Produktion:

Optælling i Python

Lad os nu se på, hvordan farvepaletter kan forbedre præsentationen af ​​vores data.

I det næste eksempel vil vi bruge parameteren 'palette'.

Følgende program illustrerer det samme-

4. Brug af farvepaletter

Input-

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex', data=df, palette='Set1') plt.show() 

Produktion:

Optælling i Python

I det næste eksempel vil vi bruge parameteren farve og lad os se, hvordan det virker?

Følgende program illustrerer det samme-

5. Brug af parameteren 'farve'

Eksempel -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',hue='Sex', data=df, color='green') plt.show() 

Produktion:

Optælling i Python

Nu vil vi bruge parameteren 'mætning' og se, hvordan det påvirker repræsentationen af ​​vores data.

Følgende program illustrerer det samme-

numpy standardafvigelse

6. Brug af parameteren 'mætning'

Eksempel -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',data=df, color='green', saturation=0.1) plt.show() 

Produktion:

Optælling i Python

Og til sidst i det sidste eksempel vil vi bruge parametrene linjebredde og kantfarve.

    Brug af matplotlib.axes.Axes.bar()

Eksempel -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') sns.countplot(x='Sex', data=df, color='green', facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette('BrBG',2)) plt.show() 

Produktion:

Optælling i Python