logo

R – Datarammer

R Programmeringssprog er et open source programmeringssprog, der er meget udbredt som et statistisk software- og dataanalyseværktøj. Datarammer i R-sprog er generiske dataobjekter af R, der bruges til at gemme tabeldata.

Datarammer kan også fortolkes som matricer, hvor hver kolonne i en matrix kan være af forskellige datatyper. R DataFrame består af tre hovedkomponenter, data, rækker og kolonner.



R Data Frames Struktur

Som du kan se på billedet nedenfor, er det sådan en dataramme er opbygget.

Dataene præsenteres i tabelform, hvilket gør det lettere at betjene og forstå.

R - Data FramesGeeksforgeeks

R – Datarammer



Opret dataramme i programmeringssprog R

Brug for at oprette en R-dataramme data.frame() funktion, og send derefter hver af de vektorer, du har oprettet, som argumenter til funktionen.

R






# R program to create dataframe> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # print the data frame> print>(friend.data)>

>

>

Produktion:

 friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>

Få strukturen i R-datarammen

Man kan få strukturen af ​​R-datarammen vha str() funktion i R.

Det kan vise selv den interne struktur af store lister, som er indlejret. Det giver one-liner output til de grundlæggende R-objekter, der fortæller brugeren om objektet og dets bestanddele.

R




regex i java

# R program to get the> # structure of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using str()> print>(>str>(friend.data))>

>

>

Produktion:

'data.frame': 5 obs. of 2 variables:  $ friend_id : int 1 2 3 4 5  $ friend_name: chr 'Sachin' 'Sourav' 'Dravid' 'Sehwag' ... NULL>

Resumé af data i R-datarammen

I R-datarammen kan den statistiske opsummering og arten af ​​dataene fås ved at anvende Resumé() fungere.

Det er en generisk funktion, der bruges til at fremstille resultatresuméer af resultaterne af forskellige modeltilpasningsfunktioner. Funktionen påberåber sig bestemte metoder, som afhænger af klassen af ​​det første argument.

R




# R program to get the> # summary of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using summary()> print>(>summary>(friend.data))>

>

>

Produktion:

 friend_id friend_name   Min. :1 Length:5   1st Qu.:2 Class :character   Median :3 Mode :character   Mean :3   3rd Qu.:4   Max. :5>

Udtræk data fra dataramme i R

At udtrække data fra en R-dataramme betyder at få adgang til dens rækker eller kolonner. Man kan udtrække en specifik kolonne fra en R-dataramme ved hjælp af dens kolonnenavn.

R




# R program to extract> # data from the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Extracting friend_name column> result <->data.frame>(friend.data$friend_name)> print>(result)>

>

>

Produktion:

 friend.data.friend_name 1 Sachin 2 Sourav 3 Dravid 4 Sehwag 5 Dhoni>

Udvid Data Frame i R Language

En dataramme i R kan udvides ved at tilføje nye kolonner og rækker til den allerede eksisterende R-dataramme.

R


parallel bearbejdning



# R program to expand> # the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Expanding data frame> friend.data$location <->c>(>'Kolkata'>,>'Delhi'>,> >'Bangalore'>,>'Hyderabad'>,> >'Chennai'>)> resultant <- friend.data> # print the modified data frame> print>(resultant)>

>

>

Produktion:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

I R kan man udføre forskellige typer operationer på en dataramme som få adgang til rækker og kolonner, vælge delmængden af ​​datarammen, redigere datarammer, slette rækker og kolonner i en dataramme , etc.

Vær sød at henvise til DataFrame Operations i R at vide om alle typer operationer, der kan udføres på en dataramme.

Få adgang til elementer i R Data Frame

Vi kan vælge og få adgang til ethvert element fra dataramme ved at bruge enkelt$>,beslag[ ] or>dobbelte beslag[[]]>for at få adgang til kolonner fra en dataramme.

R




# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Access Items using []> friend.data[1]> # Access Items using [[]]> friend.data[[>'friend_name'>]]> # Access Items using $> friend.data$friend_id>

>

>

Produktion:

 friend_id 1 1 2 2 3 3 4 4 5 5 Access Items using [[]] [1] 'Sachin' 'Sourav' 'Dravid' 'Sehwag' 'Dhoni'   Access Items using $ [1] 1 2 3 4 5>

Antal rækker og kolonner

Vi kan finde ud af, hvor mange rækker og kolonner der er parsant i vores dataramme ved at bruge dim funktion.

R




# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # find out the number of rows and clumns> dim>(friend.data)>

>

>

Produktion:

[1] 5 2>

Tilføj rækker og kolonner i R Data Frame

Du kan nemt tilføje rækker og kolonner i en R DataFrame. Indsættelse hjælper med at udvide den allerede eksisterende DataFrame uden behov for en ny.

Lad os se på, hvordan man tilføjer rækker og kolonner i en DataFrame? med et eksempel:

Tilføj rækker i R Data Frame

For at tilføje rækker i en dataramme kan du bruge en indbygget funktion rbind().

hvordan man ændrer streng til int

Følgende eksempel demonstrerer arbejdet med rbind() i R Data Frame.

R




# Creating a dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new row for a new product> New_Product <->c>(104,>'Sunglasses'>, 39.99, 40)> Products <->rbind>(Products, New_Product)> # Print the updated dataframe after adding the new product> cat>(>' Updated dataframe after adding a new product: '>)> print>(Products)>

>

>

Produktion:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new product:   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 4 104 Sunglasses 39.99 40>

Tilføj kolonner i R Data Frame

For at tilføje kolonner i en dataramme kan du bruge en indbygget funktion cbind().

Følgende eksempel demonstrerer arbejdet med cbind() i R Data Frame .

R




# Existing dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new column for 'Discount' to the dataframe> Discount <->c>(5, 10, 8)># New column values for discount> Products <->cbind>(Products, Discount)> # Rename the added column> colnames>(Products)[>ncol>(Products)] <->'Discount'> # Renaming the last column> # Print the updated dataframe after adding the new column> cat>(>' Updated dataframe after adding a new column 'Discount': '>)> print>(Products)>

>

>

Produktion:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new column 'Discount':   Product_ID Product_Name Price Stock Discount 1 101 T-Shirt 15.99 50 5 2 102 Jeans 29.99 30 10 3 103 Shoes 49.99 25 8>

Fjern rækker og kolonner

En dataramme i R fjerner kolonner og rækker fra den allerede eksisterende R-dataramme.

Fjern række i R DataFrame

R




library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove a row with friend_id = 3> data <->subset>(data, friend_id != 3)> data>

>

>

Produktion:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai   # Remove a row with friend_id = 3   friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

I ovenstående kode oprettede vi først en dataramme kaldet data med tre kolonner: ven_id , ven_navn , og Beliggenhed . Til at fjerne en række med ven_id lig med 3, brugte vi delmængde() funktion og specificerede tilstanden ven_id != 3 . Dette fjernede rækken med ven_id lig med 3.

Fjern kolonne i R DataFrame

R


alfabet efter tal



library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove the 'location' column> data <->select>(data, -location)> data>

>

>

Produktion:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>Fjern kolonnen 'location' friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>

For at fjerne Beliggenhed kolonne brugte vi Vælg() funktion og specificeret -Beliggenhed . Det tegn angiver, at vi ønsker at fjerne Beliggenhed kolonne. Den resulterende dataramme data vil kun have to kolonner: ven_id og ven_navn .

Kombination af datarammer i R

Der er 2 måder at kombinere datarammer i R. Du kan enten kombinere dem lodret eller vandret.

Lad os se på begge tilfælde med eksempler:

Kombiner R-dataramme lodret

Hvis du vil kombinere 2 datarammer lodret, kan du bruge rbind() funktion. Denne funktion fungerer for kombination af to eller flere datarammer.

R




# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Name =>c>(>'Charlie'>,>'David'>),> >Age =>c>(28, 35),> >Score =>c>(90, 85)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using rbind()> combined_df <->rbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

>

Produktion:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Name Age Score 1 Charlie 28 90 2 David 35 85  Combined Dataframe:   Name Age Score 1 Alice 25 80 2 Bob 30 75 3 Charlie 28 90 4 David 35 85>

Kombiner R-dataramme horisontalt:

Hvis du vil kombinere 2 datarammer vandret, kan du bruge cbind() funktion. Denne funktion fungerer for kombination af to eller flere datarammer.

R




# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Height =>c>(160, 175),> >Weight =>c>(55, 70)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using cbind()> combined_df <->cbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

>

Produktion:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Height Weight 1 160 55 2 175 70  Combined Dataframe:   Name Age Score Height Weight 1 Alice 25 80 160 55 2 Bob 30 75 175 70>

Læs også:

  • R – Objekter
  • Datastrukturer i R-programmering

I denne artikel har vi dækket R datarammer, og alle grundlæggende handlinger som oprettelse, adgang, oversigt, tilføjelse og fjernelse. Denne artikel har til formål at gøre dig fortrolig med datarammer i R, så du kan bruge det i dine projekter.

Håber dette hjælper dig med at forstå konceptet med datarammer i R, og du kan nemt implementere R dataramme i dine projekter.