Datavisualisering er den teknik, der bruges til at levere indsigt i data ved hjælp af visuelle signaler såsom grafer, diagrammer, kort og mange andre. Dette er nyttigt, da det hjælper med intuitiv og nem forståelse af de store mængder data og derved træffe bedre beslutninger vedrørende det. Når vi bruger et stort antal af et datasæt, afkortes det. I denne artikel skal vi se, hvordan du udskriver det hele Pandas dataramme eller serie uden trunkering.
Udskriv en hel Pandas DataFrame i Python
Som standard udskrives hele datarammen ikke, hvis længden overstiger standardlængden, outputtet afkortes som vist nedenfor:
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> # Loading irirs dataset> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> display(df)> |
>
>
Produktion:
Der er 4 metoder til at udskrive hele pandas dataramme:
- Brug metoden to_string()
- Brug pd.option_context() metoden
- Brug pd.set_options() metoden
- Brug pd.to_markdown() metoden
Metode 1: Brug to_string()
Selvom denne metode er den enkleste af alt, er den ikke tilrådelig for meget store datasæt (i millionrækkefølgen), fordi den konverterer hele datarammen til et strengobjekt, men fungerer meget godt for datarammer i størrelsesordenen tusindvis.
Syntaks: DataFrame.to_string(buf=Ingen, columns=Ingen, col_space=Ingen, header=True, index=True, na_rep='NaN', formatters=Ingen, float_format=Ingen, index_names=True, justify=Ingen, max_rows=Ingen, max_cols=Ingen, show_dimensions=False, decimal='.', line_width=Ingen)
Eksempel: I dette eksempel bruger viload_iris>funktion fra scikit-learn til at indlæse Iris-datasættet, og opretter derefter en pandas DataFrame (df>) indeholdende datasættets funktioner og til sidst konverterer hele DataFrame til en strengrepræsentation ved hjælp af to_string()> og viser det.
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # Convert the whole dataframe as a string and display> display(df.to_string())> |
java int til dobbelt
>
>
Produktion:
Metode 2: Brug af pd.option_context()
Pandaer tillader ændring af indstillinger via option_context() metode og set_option() metoder. Begge metoder er identiske med én forskel, at man senere ændrer indstillingerne permanent, og førstnævnte gør det kun inden for kontekstadministratorens omfang.
Syntaks: pandas.option_context(*args)
Eksempel: I dette eksempel bruger vi Iris-datasættet fra scikit-learn, skaber en pandas DataFrame (df>) med specificerede formateringsindstillinger og udskriver DataFrame i en midlertidig kontekst, hvor visningsindstillinger, såsom maksimale rækker, kolonner og præcision, kun ændres for lokalt omfang.
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # The scope of these changes made to> # pandas settings are local to with statement.> with pd.option_context(>'display.max_rows'>,>None>,> >'display.max_columns'>,>None>,> >'display.precision'>,>3>,> >):> >print>(df)> |
>
tegn til streng
>
Produktion:
Metode 3: Brug af pd.set_option()
Denne metode ligner pd.option_context()-metoden og tager de samme parametre som beskrevet for metode 2, men i modsætning til pd.option_context() omfang og effekt er på hele scriptet, dvs. alle datarammeindstillingerne ændres permanent
Brug for eksplicit at nulstille værdien pd.reset_option('alle') metoden skal bruges til at fortryde ændringerne.
Syntaks: pandas.set_option(pat, værdi)
Eksempel: Denne kode ændrer globale panda-visningsmuligheder for at vise alle rækker og kolonner med ubegrænset bredde og præcision for den givne DataFrame (df>). Den nulstiller derefter indstillingerne til deres standardværdier og viser DataFrame igen, hvilket illustrerer gendannelsen af standardindstillingerne.
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # Permanently changes the pandas settings> pd.set_option(>'display.max_rows'>,>None>)> pd.set_option(>'display.max_columns'>,>None>)> pd.set_option(>'display.width'>,>None>)> pd.set_option(>'display.max_colwidth'>,>->1>)> # All dataframes hereafter reflect these changes.> display(df)> print>(>'**RESET_OPTIONS**'>)> # Resets the options> pd.reset_option(>'all'>)> display(df)> |
>
>
Produktion:
Metode 4: Brug to_markdown()
Denne metode ligner to_string()-metoden, da den også konverterer datarammen til et strengobjekt og tilføjer styling og formatering til den.
Syntaks: DataFrame.to_markdown(buf=Ingen, mode='wt', index=True,, **kwargs)
Eksempel: Denne kode bruger Iris-datasættet fra scikit-learn til at skabe en pandas DataFrame (df>), og derefter udskriver den en formateret Markdown-repræsentation af DataFrame ved hjælp af to_markdown()>metode .
Python3
midterknap css
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=>data.feature_names)> # Converts the dataframe into str object with formatting> print>(df.to_markdown())> |
>
>
Produktion: