I denne artikel vil vi lære, hvordan du bruger lm()-funktionen til at tilpasse lineære modeller i R-programmeringssproget.
En lineær model bruges til at forudsige værdien af en ukendt variabel baseret på uafhængige variable. Det bruges mest til at finde ud af forholdet mellem variabler og prognoser. Funktionen lm() bruges til at tilpasse lineære modeller til datarammer i R-sproget. Det kan bruges til at udføre regression, enkelt stratum variansanalyse og analyse af kovarians til at forudsige værdien svarende til data, der ikke er i datarammen. Disse er meget nyttige til at forudsige prisen på fast ejendom, vejrudsigt osv.
For at tilpasse en lineær model i R-sproget ved at bruge lm() funktion, Vi bruger først data.frame()-funktionen til at skabe en eksempeldataramme, der indeholder værdier, der skal tilpasses på en lineær model ved hjælp af regressionsfunktion. Så bruger vi lm()-funktionen til at tilpasse en bestemt funktion til en given dataramme.
Syntaks:
lm(fitting_formula, dataframe)
Parameter:
fitting_formula: bestemmer formlen for den lineære model. dataramme: bestemmer navnet på den dataramme, der indeholder dataene.
Derefter kan vi bruge summary()-funktionen til at se resuméet af den lineære model. summary()-funktionen fortolker de vigtigste statistiske værdier til analysen af den lineære model.
navne på byer i USA
Syntaks:
resumé(lineær_model)
Resuméet indeholder følgende nøgleoplysninger:
- Residual Standard Error: bestemmer standardafvigelsen for fejlen, hvor kvadratroden af variansen trækker n minus 1 + # af de involverede variable i stedet for at dividere med n-1. Multiple R-Squared: bestemmer, hvor godt din model passer til dataene. Justeret R-Squared: normaliserer Multiple R-Squared ved at tage højde for, hvor mange prøver du har, og hvor mange variabler du bruger. F-Statistic: er en global test, der kontrollerer, om mindst én af dine koefficienter er ikke-nul.
Eksempel: Eksempel for at vise brugen af lm() funktion.
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)> |
>
>
Produktion:
Opkald:
lm(formel = y ~ x^2, data = df)
Rester:
1 2 3 4 5
2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00
Koefficienter:
Skøn Std. Fejl t værdi Pr(>|t|)
(Skæring) -7,0000 3,0876 -2,267 0,10821
x 6,0000 0,9309 6,445 0,00757 **
—
Signif. koder: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 ' ' 1
Resterende standardfejl: 2,944 ved 3 frihedsgrader
Multiple R-kvadrat: 0,9326, Justeret R-kvadrat: 0,9102
F-statistik: 41,54 på 1 og 3 DF, p-værdi: 0,007575
Diagnostiske plots
De diagnostiske plots hjælper os med at se sammenhængen mellem forskellige statistiske værdier af modellen. Det hjælper os med at analysere omfanget af outliers og effektiviteten af den monterede model. For at se diagnostiske plots af en lineær model, bruger vi plot()-funktionen i R-sproget.
Syntaks:
plot (lineær_model)
Eksempel: Diagnostiske plots for ovenstående tilpassede lineære model.
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)> |
>
>
Produktion:

Plotning af lineær model
Vi kan plotte ovenstående tilpassede lineære model for at visualisere den godt ved at bruge abline() metoden. Vi plotter først et scatterplot af datapunkter og overlejrer det derefter med et ablineplot af den lineære model ved at bruge abline()-funktionen.
Syntaks:
plot(df$x, df$y)
statisk javaabline(Lineær_model)
Eksempel: Plot lineær model
R
streng til int
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)> |
>
>
Produktion:

Forudsige værdier for ukendte datapunkter ved hjælp af den tilpassede model
For at forudsige værdier for nye input ved hjælp af ovenstående tilpassede lineære model, bruger vi funktionen forudsige(). Predict()-funktionen tager modellen og datarammen med ukendte datapunkter og forudsiger værdien for hvert datapunkt i henhold til den tilpassede model.
Syntaks:
forudsige (model, data)
Parameter:
model: bestemmer den lineære model. data: bestemmer datarammen med ukendte datapunkter.
Eksempel: Forudsigelse af nye input
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )> |
>
>
Produktion:
1 2 3 83 89 95>