logo

Maskinlæringsmodeller

En maskinlæringsmodel er defineret som en matematisk repræsentation af outputtet af træningsprocessen. Machine learning er studiet af forskellige algoritmer, der kan forbedres automatisk gennem erfaring og gamle data og bygge modellen. En maskinlæringsmodel ligner computersoftware designet til at genkende mønstre eller adfærd baseret på tidligere erfaringer eller data. Indlæringsalgoritmen opdager mønstre i træningsdataene, og den udsender en ML-model, som fanger disse mønstre og foretager forudsigelser om nye data.

Maskinlæringsmodeller

Lad os forstå et eksempel på ML-modellen, hvor vi laver en app til at genkende brugerens følelser baseret på ansigtsudtryk. Så det er muligt at skabe en sådan app af maskinlæringsmodeller, hvor vi træner en model ved at fodre billeder af ansigter med forskellige følelser mærket på dem. Når denne app bruges til at bestemme brugerens humør, læser den alle fodrede data og bestemmer derefter enhver brugers humør.

Derfor kan vi med enkle ord sige, at en Machine learning model er en forenklet repræsentation af noget eller en proces. I dette emne vil vi diskutere forskellige maskinlæringsmodeller og deres teknikker og algoritmer .

Hvad er Machine Learning Model?

Machine Learning-modeller kan forstås som et program, der er blevet trænet til at finde mønstre i nye data og lave forudsigelser. Disse modeller er repræsenteret som en matematisk funktion, der tager anmodninger i form af inputdata, laver forudsigelser på inputdata og derefter giver et output som svar. Først trænes disse modeller over et sæt data, og derefter får de en algoritme til at ræsonnere over data, udtrække mønsteret fra feeddata og lære af disse data. Når først disse modeller er blevet trænet, kan de bruges til at forudsige det usete datasæt.

Der findes forskellige typer maskinlæringsmodeller baseret på forskellige forretningsmål og datasæt.

Klassificering af maskinlæringsmodeller:

Baseret på forskellige forretningsmål og datasæt er der tre læringsmodeller for algoritmer. Hver maskinlæringsalgoritme falder ind i en af ​​de tre modeller:

  • Superviseret læring
  • Uovervåget læring
  • Forstærkende læring
Maskinlæringsmodeller

Superviseret læring er yderligere opdelt i to kategorier:

  • Klassifikation
  • Regression

Uovervåget læring er også opdelt i følgende kategorier:

  • Klynger
  • Foreningsregel
  • Dimensionalitetsreduktion

1. Overvågede maskinlæringsmodeller

Supervised Learning er den enkleste maskinlæringsmodel til at forstå, hvor inputdata kaldes træningsdata og har en kendt etiket eller et resultat som output. Så det fungerer efter princippet om input-output-par. Det kræver, at man laver en funktion, der kan trænes ved hjælp af et træningsdatasæt, og derefter anvendes den på ukendte data og laver en forudsigelig præstation. Superviseret læring er opgavebaseret og testet på mærkede datasæt.

Vi kan implementere en overvåget læringsmodel på simple virkelige problemer. For eksempel har vi et datasæt bestående af alder og højde; så kan vi bygge en overvåget læringsmodel til at forudsige personens højde baseret på deres alder.

Supervised Learning-modeller er yderligere klassificeret i to kategorier:

Regression

I regressionsproblemer er output en kontinuerlig variabel. Nogle almindeligt anvendte regressionsmodeller er som følger:

a) Lineær regression

Lineær regression er den enkleste maskinlæringsmodel, hvor vi forsøger at forudsige en outputvariabel ved hjælp af en eller flere inputvariable. Repræsentationen af ​​lineær regression er en lineær ligning, som kombinerer et sæt inputværdier(x) og forudsagt output(y) for sættet af disse inputværdier. Det er repræsenteret i form af en linje:

Y = bx+ c.

Maskinlæringsmodeller

Hovedformålet med den lineære regressionsmodel er at finde den bedste tilpasningslinje, der passer bedst til datapunkterne.

Lineær regression udvides til multipel lineær regression (find et plan med bedst tilpasning) og polynomiel regression (find den bedste tilpasningskurve).

b) Beslutningstræ

tegn til int java

Beslutningstræer er de populære maskinlæringsmodeller, der kan bruges til både regressions- og klassifikationsproblemer.

Et beslutningstræ bruger en trælignende struktur af beslutninger sammen med deres mulige konsekvenser og udfald. I denne bruges hver intern node til at repræsentere en test på en attribut; hver gren bruges til at repræsentere resultatet af testen. Jo flere noder et beslutningstræ har, jo mere nøjagtigt bliver resultatet.

Fordelen ved beslutningstræer er, at de er intuitive og nemme at implementere, men de mangler nøjagtighed.

Beslutningstræer er meget udbredt i operationsforskning, specifikt i beslutningsanalyse, strategisk planlægning , og hovedsageligt inden for maskinlæring.

c) Tilfældig Skov

Random Forest er ensemblelæringsmetoden, som består af en lang række beslutningstræer. Hvert beslutningstræ i en tilfældig skov forudsiger et udfald, og forudsigelsen med flertallet af stemmer betragtes som udfaldet.

En tilfældig skovmodel kan bruges til både regressions- og klassifikationsproblemer.

Til klassifikationsopgaven tages udfaldet af den tilfældige skov fra flertallet af stemmerne. Hvorimod resultatet i regressionsopgaven er taget fra middelværdien eller gennemsnittet af forudsigelserne genereret af hvert træ.

d) Neurale netværk

Neurale netværk er delmængden af ​​maskinlæring og er også kendt som kunstige neurale netværk. Neurale netværk er opbygget af kunstige neuroner og designet på en måde, der ligner den menneskelige hjernes struktur og funktion. Hver kunstig neuron forbinder med mange andre neuroner i et neuralt netværk, og sådanne millioner af forbundne neuroner skaber en sofistikeret kognitiv struktur.

Maskinlæringsmodeller

Neurale netværk består af en flerlagsstruktur, der indeholder et inputlag, et eller flere skjulte lag og et outputlag. Da hver neuron er forbundet med en anden neuron, overfører den data fra et lag til den anden neuron i de næste lag. Endelig når data det sidste lag eller outputlag i det neurale netværk og genererer output.

Neurale netværk er afhængige af træningsdata for at lære og forbedre deres nøjagtighed. Et perfekt trænet og præcist neuralt netværk kan dog hurtigt gruppere data og blive et kraftfuldt maskinlærings- og kunstig intelligens-værktøj. Et af de mest kendte neurale netværk er Googles søgealgoritme.

Klassifikation

Klassifikationsmodeller er den anden type Supervised Learning-teknikker, som bruges til at generere konklusioner fra observerede værdier i kategorisk form. For eksempel kan klassificeringsmodellen identificere, om e-mailen er spam eller ej; en køber vil købe produktet eller ej osv. Klassificeringsalgoritmer bruges til at forudsige to klasser og kategorisere outputtet i forskellige grupper.

Ved klassificering er der designet en klassificeringsmodel, der klassificerer datasættet i forskellige kategorier, og hver kategori tildeles en etiket.

Der er to typer klassifikationer i maskinlæring:

    Binær klassifikation: Hvis problemet kun har to mulige klasser, kaldet en binær klassifikator. For eksempel kat eller hund, ja eller nej,Multi-klasse klassifikation: Hvis problemet har mere end to mulige klasser, er det en multi-class klassifikator.

Nogle populære klassifikationsalgoritmer er som nedenfor:

a) Logistisk regression

Logistisk regression bruges til at løse klassifikationsproblemerne i maskinlæring. De ligner lineær regression, men bruges til at forudsige de kategoriske variabler. Den kan forudsige output i enten Ja eller Nej, 0 eller 1, Sand eller Falsk osv. Men i stedet for at give de nøjagtige værdier, giver den de sandsynlige værdier mellem 0 og 1.

b) Support Vector Machine

Support vector machine eller SVM er den populære maskinlæringsalgoritme, som er meget brugt til klassificerings- og regressionsopgaver. Men specifikt bruges det til at løse klassifikationsproblemer. Hovedformålet med SVM er at finde de bedste beslutningsgrænser i et N-dimensionelt rum, som kan adskille datapunkter i klasser, og den bedste beslutningsgrænse er kendt som Hyperplane. SVM vælger den ekstreme vektor for at finde hyperplanet, og disse vektorer er kendt som støttevektorer.

Maskinlæringsmodeller

c) Naive Bayes

Naiv Bayes er en anden populær klassifikationsalgoritme, der bruges i maskinlæring. Det kaldes sådan, da det er baseret på Bayes teorem og følger den naive (uafhængige) antagelse mellem de træk, der er givet som:

Maskinlæringsmodeller

Hver naive Bayes-klassifikator antager, at værdien af ​​en specifik variabel er uafhængig af enhver anden variabel/funktion. For eksempel hvis en frugt skal klassificeres ud fra farve, form og smag. Så gul, oval og sød vil blive genkendt som mango. Her er hver funktion uafhængig af andre funktioner.

2. Maskinlæringsmodeller uden opsyn

Ikke-supervised Machine learning-modeller implementerer læringsprocessen modsat overvåget læring, hvilket betyder, at det gør det muligt for modellen at lære af det umærkede træningsdatasæt. Baseret på det umærkede datasæt forudsiger modellen outputtet. Ved hjælp af uovervåget læring lærer modellen skjulte mønstre fra datasættet af sig selv uden nogen overvågning.

Ikke-superviserede læringsmodeller bruges hovedsageligt til at udføre tre opgaver, som er som følger:

    Klynger
    Clustering er en uovervåget læringsteknik, der involverer clustering eller famling af datapunkterne i forskellige klynger baseret på ligheder og forskelle. Objekterne med flest ligheder forbliver i samme gruppe, og de har ingen eller meget få ligheder fra andre grupper.
    Clustering algoritmer kan bruges i vid udstrækning i forskellige opgaver som f.eks Billedsegmentering, Statistisk dataanalyse, Markedssegmentering , etc.
    Nogle almindeligt anvendte Clustering-algoritmer er K-betyder Clustering, hierarkisk Clustering, DBSCAN , etc.
    Maskinlæringsmodeller Foreningens regellæring
    Association regellæring er en uovervåget læringsteknik, som finder interessante relationer mellem variabler inden for et stort datasæt. Hovedformålet med denne læringsalgoritme er at finde et dataelements afhængighed af et andet dataelement og kortlægge disse variabler i overensstemmelse hermed, så det kan generere maksimal profit. Denne algoritme anvendes hovedsageligt i Market Basket analyse, web-brug mining, kontinuerlig produktion , etc.
    Nogle populære algoritmer for læring af Associationsregel er Apriori-algoritme, Eclat, FP-vækstalgoritme. Dimensionalitetsreduktion
    Antallet af funktioner/variabler, der er til stede i et datasæt, er kendt som dimensionaliteten af ​​datasættet, og den teknik, der bruges til at reducere dimensionaliteten, er kendt som dimensionalitetsreduktionsteknikken.
    Selvom flere data giver mere nøjagtige resultater, kan det også påvirke modellens/algoritmens ydeevne, såsom problemer med overfitting. I sådanne tilfælde anvendes dimensionsreduktionsteknikker.
    ' Det er en proces med at konvertere datasættet med højere dimensioner til datasæt med mindre dimensioner, hvilket sikrer, at det giver lignende information .'
    Forskellige dimensionsreduktionsmetoder som f.eks som PCA (Principal Component Analysis), Singular Value Decomposition osv.

Forstærkende læring

Ved forstærkningslæring lærer algoritmen handlinger for et givet sæt tilstande, der fører til en måltilstand. Det er en feedback-baseret læringsmodel, der tager feedback-signaler efter hver tilstand eller handling ved at interagere med omgivelserne. Denne feedback fungerer som en belønning (positiv for hver god handling og negativ for hver dårlig handling), og agentens mål er at maksimere de positive belønninger for at forbedre deres præstationer.

Modellens adfærd i forstærkende læring ligner menneskelig læring, da mennesker lærer ting ved erfaringer som feedback og interagerer med omgivelserne.

Nedenfor er nogle populære algoritmer, der kommer under forstærkningslæring:

    Q-læring:Q-learning er en af ​​de populære modelfrie algoritmer for forstærkningslæring, som er baseret på Bellman-ligningen.

Det har til formål at lære den politik, der kan hjælpe AI-agenten til at tage den bedste handling for at maksimere belønningen under en specifik omstændighed. Den inkorporerer Q-værdier for hvert tilstand-handling-par, der angiver belønningen for at følge en given tilstandssti, og den forsøger at maksimere Q-værdien.

    State-Action-Reward-State-Action (SARSA):SARSA er en On-policy algoritme baseret på Markov beslutningsprocessen. Den bruger handlingen udført af den aktuelle politik til at lære Q-værdien. SARSA-algoritmen står for State Action Reward State Action, som symboliserer tuple (s, a, r, s', a'). Deep Q Network:DQN eller Deep Q Neural netværk er Q-learning inden for det neurale netværk. Det er dybest set ansat i et stort statsrumsmiljø, hvor det ville være en kompleks opgave at definere en Q-tabel. Så i et sådant tilfælde, i stedet for at bruge Q-tabel, bruger det neurale netværk Q-værdier for hver handling baseret på tilstanden.

Træning af maskinlæringsmodeller

Når først maskinlæringsmodellen er bygget, trænes den for at få de passende resultater. For at træne en maskinlæringsmodel har man brug for en enorm mængde forbehandlede data. Her betyder forbehandlede data data i struktureret form med reducerede nulværdier osv. Hvis vi ikke leverer forbehandlede data, så er der store chancer for, at vores model kan præstere forfærdeligt.

Hvordan vælger man den bedste model?

I ovenstående afsnit har vi diskuteret forskellige maskinlæringsmodeller og algoritmer. Men et mest forvirrende spørgsmål, der kan opstå for enhver nybegynder, 'hvilken model skal jeg vælge?'. Så svaret er, at det hovedsageligt afhænger af forretningskravet eller projektkravet. Udover dette afhænger det også af tilknyttede attributter, mængden af ​​det tilgængelige datasæt, antallet af funktioner, kompleksitet osv. Men i praksis anbefales det, at vi altid starter med den enkleste model, der kan anvendes på den enkelte problem og derefter gradvist øge kompleksiteten og teste nøjagtigheden ved hjælp af parameterjustering og krydsvalidering.

Forskellen mellem maskinlæringsmodel og algoritmer

Et af de mest forvirrende spørgsmål blandt begyndere er, om maskinlæringsmodeller er, og algoritmer er de samme? For i forskellige tilfælde inden for maskinlæring og datavidenskab bruges disse to udtryk i flæng.

Svaret på dette spørgsmål er nej, og maskinlæringsmodellen er ikke det samme som en algoritme. På en enkel måde, en ML-algoritme er som en procedure eller metode, der kører på data for at opdage mønstre fra dem og generere modellen. Samtidig er en Machine learning model er som et computerprogram, der genererer output eller laver forudsigelser . Mere specifikt, når vi træner en algoritme med data, bliver den en model.

 Machine Learning Model = Model Data + Prediction Algorithm