logo

Machine Learning Algoritmer

Maskinlæringsalgoritmer er beregningsmodeller, der gør det muligt for computere at forstå mønstre og forudsige eller foretage vurderinger baseret på data uden behov for eksplicit programmering. Disse algoritmer danner grundlaget for moderne kunstig intelligens og bruges i en lang række applikationer, herunder billed- og talegenkendelse, naturlig sprogbehandling, anbefalingssystemer, svindeldetektion, autonome biler osv.

Det her Maskinlæringsalgoritmer artiklen vil dække alle de væsentlige algoritmer for maskinlæring som Støtte vektormaskine, beslutningstagning, logistisk regression, naiv bayees-klassifikator, tilfældig skov, k-mean clustering, forstærkningslæring, vektor, hierarkisk clustering, xgboost, adaboost, logistik osv.



Typer af maskinlæringsalgoritmer

Der er tre typer af maskinlæringsalgoritmer.

  1. Superviseret læring
    • Regression
    • Klassifikation
  2. Uovervåget læring
    • Klynger
    • Dimensionalitetsreduktion
  3. Forstærkende læring

Typer af maskinlæringsalgoritmer

download youtube video med vlc

1. Overvåget læringsalgoritme

Superviseret læring er en type maskinlæringsalgoritmer, hvor vi brugte mærket datasæt til at træne modellen eller algoritmerne. Målet med algoritmen er at lære en kortlægning fra inputdata til output-etiketter, så den kan lave forudsigelser eller klassifikationer på nye, usete data.

Overvågede Machine Learning Algoritmer

  1. Lineær model:
    • Regression
      • Almindelig mindste kvadratisk regression
      • Simpel lineær regression
      • Multipel lineær regression
      • Polynomisk regression
      • Ortogonal Matching Pursuit (OMP)
      • Bayesiansk regression
      • Kvantil regression
      • Isotonisk regression
      • Trinvis regression
      • Mindste vinkel regression (LARS)
    • Klassifikation:
    • Regulering :
      • Lasso (L1-regularisering)
      • Ridge (L2-regularisering)
        • Ridge regression
        • Ridge Classifier
      • Elastisk net
      • LARS Lasso
  2. K-Nærmeste Naboer (KNN):
    • Brute Force Algoritmer
    • Ball Tree og KD Tree Algoritmer
    • Klassificering af K-Nærmeste Naboer (KNN).
    • K-Nærmeste Naboer (KNN) Regressor
  3. Support Vector Machines:
    • Support Vector Machines Regressor
    • Forskellige kernefunktioner i SVM
  4. Stokastisk gradientnedstigning
    • Stokastisk Gradient Descent Classifier
    • Stokastisk Gradient Descent Regressor
    • Forskellige tabsfunktioner i SGD
  5. Beslutningstræ:
    • Decision Tree Algoritmer
      • Iterative Dichotomiser 3 (ID3) Algoritmer
      • C5. Algoritmer
      • Klassifikations- og regressionstræsalgoritmer
    • Decision Tree Classifier
    • Decision Tree Regressor
  6. Ensemble læring:
    • Bagning (Bootstrap Aggregating)
    • Boost
      • AdaBoost
      • XGBoost
      • CatBoost
      • Gradient Boosting Machines (GBM)
      • LightGBM
    • Stabling
  7. Generativ model
    • Naiv Bayes
      • Gaussisk naiv Bayes
      • Multinomial Naive Bayes
      • Bernoulli Naive Bayes
    • Gaussiske processer
      • Gaussisk procesregression (GPR)
      • Gaussisk procesklassificering (GPC)
    • Gaussisk diskriminationsanalyse
      • Lineær diskriminationsanalyse (LDA)
      • Quadratic Diskriminant Analyse (QDA)
    • Bayesianske trosnetværk
    • Skjulte Markov-modeller (HMM'er)
  8. Tidsserieprognose:
    • Tidsserievisualisering og analyse:
      • Tidsseriekomponenter: Trend, sæsonbestemt og støj
      • Tidsserienedbrydningsteknikker
      • Sæsonjustering og forskel
      • Autokorrelation og partielle autokorrelationsfunktioner
      • Augmented Dickey-Fuller Test
      • Sæsonbestemt nedbrydning af tidsserier (STL-dekomponering)
      • Box-Jenkins metodik til ARIMA-modeller
    • Algoritmer for tidsserieprognoser:
      • Glidende gennemsnit (MA) og vægtet glidende gennemsnit
      • Eksponentielle udjævningsmetoder (simpel, dobbelt og tredobbelt)
      • Autoregressive (AR) modeller
      • Glidende gennemsnit (MA) modeller
      • Autoregressive Integrated Moving Average (ARIMA) modeller
      • Sæsonbestemt nedbrydning af tidsserier af Loess (STL)
      • Sæsonbestemte Autoregressive Integrated Moving Average (SARIMA) modeller
      • ARIMAX og SARIMAX modeller
  9. Overvåget dimensionsreduktionsteknik:
    • Lineær diskriminationsanalyse (LDA)

Nogle af de overvågede maskinlæringsalgoritmer kan bruges til både klassificering og regression med en lille smule modifikation

  • Multiclass og multioutput algoritmer:
    • Multiklasse klassifikation
      • OneVsRest Classifier
    • Multilabel klassificering
    • Multioutput regression

Metrics for klassificerings- og regressionsalgoritmer:

  • Regressionsmålinger:
    • Mean squared error (MSE)
    • Root mean squared error (RMSE)
    • Gennemsnitlig absolut fejl (MAE)
    • R-kvadrat
    • Justeret R-kvadrat
  • Klassificeringsmålinger:
  • Sandsynlighedskalibrering
    • Kalibreringskurver
    • Kalibrering af en klassifikator

Krydsvalideringsteknik:

  • K-fold krydsvalidering
  • Stratificeret k-fold krydsvalidering
  • Udelad-en-ud krydsvalidering
  • Shuffle Split Krydsvalidering
  • Krydsvalidering af tidsserier

Optimeringsteknik:

  • Gradient nedstigning
    • Stokastisk gradientnedstigning
    • Mini-batch Gradient Descent
    • Momentum-baseret Gradient Descent
  • Newton-baserede optimeringsteknikker
    • Newtons algoritme
    • Kvasi-Newton-metoder (BFGS, L-BFGS)
    • Konjugeret gradient
  • Lokale søgeoptimeringsteknikker
    • Bakkebestigning
    • Tabu-søgning

2. Uovervåget læringsalgoritme

Uovervåget læring er en type maskinlæringsalgoritmer, hvor algoritmerne bruges til at finde mønstrene, strukturen eller relationen i et datasæt ved hjælp af et ikke-navngivet datasæt. Det udforsker dataens iboende struktur uden foruddefinerede kategorier eller etiketter.

java sammenkædede strenge

Uovervågede Machine Learning-algoritmer

  • Klynger
    • Centroid-baserede metoder
    • Distributionsbaserede metoder
    • Forbindelsesbaserede metoder
      • Hierarkisk klyngedannelse
        • Agglomerativ klyngedannelse
        • Splittende klyngedannelse
      • Affinitetsudbredelse
    • Densitetsbaserede metoder
      • DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
      • OPTICS (bestillingspunkter for at identificere klyngestrukturen)
  • Foreningen regel minedrift
    • Apriori algoritme
    • FP-vækst (hyppig mønstervækst)
    • ECLAT (Equivalence Class Clustering og bottom-up Lattice Traversal)
  • Anomali detektion:
    • Z-score
    • Local Outlier Factor (LOF)
    • Isolation Skov
  • Dimensionalitetsreduktionsteknik:
    • Principal Component Analysis (PCA)
    • t-distribueret Stokastisk Neighbor Embedding (t-SNE)
    • Ikke-negativ matrixfaktorisering (NMF)
    • Uafhængig komponentanalyse (ICA)
    • Faktor Analyse
    • Latent Dirichlet Allocation (LDA)
    • Isomap
    • Locally Linear Embedding (LLE)
    • Latent Semantisk Analyse (LSA)

3. Forstærkende læring

Forstærkende læring er en type maskinlæringsalgoritmer, hvor en agent lærer at træffe successive beslutninger ved at interagere med sine omgivelser. Agenten modtager feedback i form af incitamenter eller straffe baseret på sine handlinger. Agentens formål er at opdage optimale taktikker, der maksimerer kumulative belønninger over tid gennem forsøg og fejl. Forstærkende læring bruges ofte i scenarier, hvor agenten skal lære at navigere i et miljø, spille spil, styre robotter eller træffe domme i usikre situationer.

Forstærkende læring

  • Modelbaserede metoder:
    • Markov beslutningsprocesser (MDP'er)
    • Bellmans ligning
    • Værdi iteration algoritme
    • Monte Carlo træsøgning
  • Modelfri metoder:
    • Værdibaserede metoder:
      • Q-Learning
      • SOVS
      • Monte Carlo metoder
    • Politikbaserede metoder:
      • FORSTÆRK Algoritme
      • Skuespiller-kritisk algoritme
    • Skuespillerkritiske metoder
      • Asynchronous Advantage Actor-Critic (A3C)

Liste over populære maskinlæringsalgoritmer

Her er en liste over de 10 mest populære Machine Learning-algoritmer.

1. Lineær regression

Lineær regression er en simpel algoritme, der bruges til at kortlægge det lineære forhold mellem inputfunktioner og en kontinuerlig målvariabel. Det fungerer ved at tilpasse en linje til dataene og derefter bruge linjen til at forudsige nye værdier.

2. Logistisk regression

Logistisk regression er en udvidelse af lineær regression, der bruges til klassifikationsopgaver for at estimere sandsynligheden for, at en instans tilhører en bestemt klasse.

3. SVM (Support Vector Machine)

SVM'er er overvågede læringsalgoritmer, der kan udføre klassifikations- og regressionsopgaver. Den finder et hyperplan, der bedst adskiller klasser i feature space.

4. KNN (K-nærmeste nabo)

KNN er en ikke-parametrisk teknik, der kan bruges til klassificering såvel som regression. Det fungerer ved at identificere de k mest lignende datapunkter til et nyt datapunkt og derefter forudsige etiketten for det nye datapunkt ved hjælp af etiketterne for disse datapunkter.

5. Beslutningstræ

Beslutningstræer er en type overvåget læringsteknik, der kan bruges til klassificering såvel som regression. Det fungerer ved at segmentere dataene i mindre og mindre grupper, indtil hver gruppe kan klassificeres eller forudsiges med høj grad af nøjagtighed.

6. Tilfældig Skov

Tilfældige skove er en type ensemblelæringsmetode, der anvender et sæt beslutningstræer til at lave forudsigelser ved at aggregere forudsigelser fra individuelle træer. Det forbedrer præcisionen og modstandsdygtigheden af ​​enkeltbeslutningstræer. Det kan bruges til både klassifikations- og regressionsopgaver.

hvad er hashset java

7. Naive Bayes

Naive Bayes er en probabilistisk klassifikator baseret på Bayes' sætning, der bruges til klassifikationsopgaver. Det fungerer ved at antage, at funktionerne i et datapunkt er uafhængige af hinanden.

8. PCA (Principal Component Analysis)

PCA er en dimensionsreduktionsteknik, der bruges til at transformere data til et rum med lavere dimensioner og samtidig bevare så meget varians som muligt. Det fungerer ved at finde de retninger i de data, der indeholder mest variation, og derefter projicere dataene på disse retninger.

9. Apriori-algoritmer

Apriori-algoritme er en traditionel dataminingteknik til mining af associationsregler i transaktionsdatabaser eller datasæt. Det er designet til at afdække links og mønstre mellem ting, der jævnligt forekommer sammen i transaktioner. Apriori registrerer hyppige varesæt, som er grupper af varer, der vises sammen i transaktioner med et givet minimumsunderstøttelsesniveau.

10. K-Means Clustering

K-Means clustering er en uovervåget læringstilgang, der kan bruges til at gruppere datapunkter. Det fungerer ved at finde k klynger i dataene, så datapunkterne i hver klynge ligner hinanden så meget som muligt, mens de forbliver så adskilte som muligt fra datapunkterne i andre klynger.

while og do while loop i java

Oplev de grundlæggende begreber, der driver maskinlæring ved at lære top 10 algoritmer , såsom lineær regression, beslutningstræer og neurale netværk.

Machine Learning Algoritme – ofte stillede spørgsmål

1. Hvad er en algoritme i Machine Learning?

Maskinlæringsalgoritmer er teknikker baseret på statistiske koncepter, der gør det muligt for computere at lære af data, opdage mønstre, lave forudsigelser eller udføre opgaver uden behov for eksplicit programmering. Disse algoritmer er bredt klassificeret i de tre typer, dvs. superviseret læring, uovervåget læring og forstærkningslæring.

2. Hvad er typer af Machine Learning?

Der er hovedsageligt tre typer maskinlæring:

  • Overvåget algoritme
  • Uovervåget algoritme
  • Forstærkningsalgoritme

3. Hvilken ML-algoritme er bedst til forudsigelse?

Den ideelle maskinlæringsmetode til forudsigelse bestemmes af en antal kriterier , herunder problemets art, typen af ​​data og de unikke krav. Support Vector Machines, Random Forests og Gradient Boosting-tilgange er populære til forudsigelsesarbejdsbelastninger. Valget af en algoritme bør på den anden side baseres på test og evaluering af det specifikke problem og det aktuelle datasæt.

4. Hvad er de 10 populære maskinelæringsalgoritmer?

Nedenfor er listen over de 10 mest brugte Machine Learning (ML) algoritmer:

  1. Lineær regression
  2. Logistisk regression
  3. SVM (Support Vector Machine)
  4. KNN (K-nærmeste nabo)
  5. Beslutningstræ
  6. Tilfældig Skov
  7. Naiv Bayes
  8. PCA (Principal Component Analysis)
  9. Apriori algoritmer
  10. K-Betyder Clustering