logo

Typer af maskinlæring

Machine learning er en delmængde af AI, som gør det muligt for maskinen automatisk at lære af data, forbedre ydeevnen fra tidligere erfaringer og komme med forudsigelser . Machine learning indeholder et sæt algoritmer, der arbejder på en enorm mængde data. Data føres til disse algoritmer for at træne dem, og på baggrund af træning bygger de modellen og udfører en specifik opgave.

Typer af maskinlæring

Disse ML-algoritmer hjælper med at løse forskellige forretningsproblemer som regression, klassificering, prognose, klyngedannelse og foreninger osv.

Med udgangspunkt i metoderne og måden at lære på er maskinlæring opdelt i hovedsageligt fire typer, som er:

  1. Supervised Machine Learning
  2. Uovervåget maskinlæring
  3. Semi-Supervised Machine Learning
  4. Forstærkende læring
Typer af maskinlæring

I dette emne vil vi give en detaljeret beskrivelse af typerne af Machine Learning sammen med deres respektive algoritmer:

1. Supervised Machine Learning

Som navnet antyder, Overvåget maskinlæring er baseret på supervision. Det betyder i den overvågede læringsteknik, at vi træner maskinerne ved hjælp af det 'mærkede' datasæt, og på baggrund af træningen forudsiger maskinen outputtet. Her angiver de mærkede data, at nogle af inputs allerede er mappet til outputtet. Mere dyrebart kan vi sige; først træner vi maskinen med input og tilsvarende output, og derefter beder vi maskinen om at forudsige outputtet ved hjælp af testdatasættet.

Lad os forstå overvåget læring med et eksempel. Antag, at vi har et input-datasæt med billeder af katte og hunde. Så først vil vi give maskinen træning i at forstå billederne, såsom form og størrelse på halen på kat og hund, øjenform, farve, højde (hunde er højere, katte er mindre) osv. Efter afslutningen af ​​træningen indtaster vi billedet af en kat og beder maskinen om at identificere objektet og forudsige outputtet. Nu er maskinen veltrænet, så den vil tjekke alle objektets funktioner, såsom højde, form, farve, øjne, ører, hale osv., og finde ud af, at det er en kat. Så den vil placere den i Kat-kategorien. Dette er processen for, hvordan maskinen identificerer objekterne i Supervised Learning.

Hovedmålet med den superviserede læringsteknik er at kortlægge inputvariablen(x) med outputvariablen(y). Nogle virkelige anvendelser af superviseret læring er Risikovurdering, svindeldetektion, spamfiltrering, etc.

Kategorier af overvåget maskinlæring

Overvåget maskinlæring kan klassificeres i to typer problemer, som er angivet nedenfor:

    Klassifikation Regression

a) Klassificering

Klassifikationsalgoritmer bruges til at løse klassifikationsproblemer, hvor outputvariablen er kategorisk, såsom ' Ja eller nej, mand eller kvinde, rød eller blå osv . Klassifikationsalgoritmerne forudsiger de kategorier, der er til stede i datasættet. Nogle eksempler fra den virkelige verden på klassifikationsalgoritmer er Spamregistrering, e-mailfiltrering osv.

Nogle populære klassifikationsalgoritmer er angivet nedenfor:

    Tilfældig skovalgoritme Beslutningstræ-algoritme Logistisk regression algoritme Support Vector Machine Algorithm

b) Regression

Regressionsalgoritmer bruges til at løse regressionsproblemer, hvor der er en lineær sammenhæng mellem input- og outputvariable. Disse bruges til at forudsige kontinuerlige outputvariabler, såsom markedstendenser, vejrudsigelse osv.

Nogle populære regressionsalgoritmer er angivet nedenfor:

    Simpel lineær regression algoritme Multivariat regressionsalgoritme Beslutningstræ-algoritme Lasso regression

Fordele og ulemper ved Supervised Learning

Fordele:

  • Siden overvåget læring arbejde med det mærkede datasæt, så vi kan have en nøjagtig idé om klasserne af objekter.
  • Disse algoritmer er nyttige til at forudsige outputtet på grundlag af tidligere erfaringer.

Ulemper:

  • Disse algoritmer er ikke i stand til at løse komplekse opgaver.
  • Det kan forudsige det forkerte output, hvis testdataene er forskellige fra træningsdataene.
  • Det kræver masser af beregningstid at træne algoritmen.

Anvendelser af superviseret læring

Nogle almindelige anvendelser af Supervised Learning er angivet nedenfor:

    Billedsegmentering:
    Overvågede læringsalgoritmer bruges til billedsegmentering. I denne proces udføres billedklassificering på forskellige billeddata med foruddefinerede etiketter.Medicinsk diagnose:
    Overvågede algoritmer bruges også på det medicinske område til diagnoseformål. Det gøres ved at bruge medicinske billeder og tidligere mærkede data med etiketter for sygdomstilstande. Med en sådan proces kan maskinen identificere en sygdom for de nye patienter.Opdagelse af svindel -Supervised Learning klassifikationsalgoritmer bruges til at identificere svindeltransaktioner, svindelkunder osv. Det gøres ved at bruge historiske data til at identificere de mønstre, der kan føre til mulig svindel.Spam detektion -I spam-detektion og -filtrering bruges klassifikationsalgoritmer. Disse algoritmer klassificerer en e-mail som spam eller ikke spam. Spam-e-mails sendes til spam-mappen.Tale genkendelse -Overvågede læringsalgoritmer bruges også til talegenkendelse. Algoritmen trænes med stemmedata, og forskellige identifikationer kan udføres ved hjælp af samme, såsom stemmeaktiverede adgangskoder, stemmekommandoer mv.

2. Uovervåget maskinlæring

Uovervåget læring g er forskellig fra Supervised learning-teknikken; som navnet antyder, er der ikke behov for supervision. Det betyder, i uovervåget maskinlæring, at maskinen trænes ved hjælp af det umærkede datasæt, og maskinen forudsiger outputtet uden overvågning.

I uovervåget læring trænes modellerne med de data, der hverken er klassificerede eller mærkede, og modellen handler på disse data uden nogen som helst supervision.

Hovedformålet med den uovervågede læringsalgoritme er at gruppere eller kategorisere det usorterede datasæt efter ligheder, mønstre og forskelle. Maskiner bliver bedt om at finde de skjulte mønstre fra inputdatasættet.

Lad os tage et eksempel for at forstå det mere værdifuldt; antag, at der er en kurv med frugtbilleder, og vi indtaster den i maskinlæringsmodellen. Billederne er totalt ukendte for modellen, og maskinens opgave er at finde objekternes mønstre og kategorier.

Så nu vil maskinen opdage sine mønstre og forskelle, såsom farveforskel, formforskel, og forudsige outputtet, når det testes med testdatasættet.

Kategorier af uovervåget maskinlæring

Uovervåget læring kan yderligere klassificeres i to typer, som er angivet nedenfor:

    Klynger Foreningen

1) Klynger

Klyngeteknikken bruges, når vi vil finde de iboende grupper fra dataene. Det er en måde at gruppere objekterne i en klynge, således at objekterne med flest ligheder forbliver i én gruppe og har færre eller ingen ligheder med objekterne i andre grupper. Et eksempel på klyngealgoritmen er at gruppere kunderne efter deres købsadfærd.

Nogle af de populære klyngealgoritmer er angivet nedenfor:

    K-Means Clustering-algoritme Mean-shift algoritme DBSCAN-algoritme Hovedkomponentanalyse Uafhængig komponentanalyse

2) Forening

Association regellæring er en uovervåget læringsteknik, som finder interessante relationer mellem variabler inden for et stort datasæt. Hovedformålet med denne læringsalgoritme er at finde et dataelements afhængighed af et andet dataelement og kortlægge disse variabler i overensstemmelse hermed, så det kan generere maksimal profit. Denne algoritme anvendes hovedsageligt i Market Basket analyse, web-brug mining, kontinuerlig produktion , etc.

Nogle populære algoritmer for læring af Associationsregel er Apriori-algoritme, Eclat, FP-vækstalgoritme.

Fordele og ulemper ved uovervåget læringsalgoritme

Fordele:

  • Disse algoritmer kan bruges til komplicerede opgaver sammenlignet med de overvågede, fordi disse algoritmer fungerer på det umærkede datasæt.
  • Ikke-overvågede algoritmer er at foretrække til forskellige opgaver, da det er nemmere at få det umærkede datasæt sammenlignet med det mærkede datasæt.

Ulemper:

  • Outputtet af en uovervåget algoritme kan være mindre nøjagtigt, da datasættet ikke er mærket, og algoritmer er ikke trænet med det nøjagtige output fra tidligere.
  • Det er sværere at arbejde med uovervåget læring, da det fungerer med det umærkede datasæt, der ikke kortlægges med outputtet.

Anvendelser af uovervåget læring

    Netværksanalyse:Uovervåget læring bruges til at identificere plagiat og copyright i dokumentnetværksanalyse af tekstdata til videnskabelige artikler.Anbefalingssystemer:Anbefalingssystemer bruger i vid udstrækning uovervågede læringsteknikker til at bygge anbefalingsapplikationer til forskellige webapplikationer og e-handelswebsteder.Anomali detektion:Anomalidetektion er en populær anvendelse af uovervåget læring, som kan identificere usædvanlige datapunkter i datasættet. Det bruges til at opdage svigagtige transaktioner.Enkeltværdinedbrydning:Singular Value Decomposition eller SVD bruges til at udtrække bestemte oplysninger fra databasen. For eksempel at udtrække information om hver bruger, der befinder sig på et bestemt sted.

3. Semi-Supervised Learning

Semi-Supervised learning er en type Machine Learning-algoritme, der ligger mellem Supervised og Unsupervised Machine learning . Den repræsenterer mellemvejen mellem overvåget (med mærkede træningsdata) og uovervåget læring (uden mærkede træningsdata) algoritmer og bruger kombinationen af ​​mærkede og umærkede datasæt i løbet af træningsperioden.

EN Selvom semi-overvåget læring er mellemvejen mellem overvåget og ikke-overvåget læring og opererer på data, der består af nogle få etiketter, består det for det meste af umærkede data. Da etiketter er dyre, men til virksomhedsformål, kan de have få etiketter. Det er helt anderledes end superviseret og uovervåget læring, da de er baseret på tilstedeværelsen og fraværet af etiketter.

For at overvinde ulemperne ved overvåget læring og uovervåget læringsalgoritmer introduceres begrebet semi-overvåget læring . Hovedformålet med semi-superviseret læring er effektivt at bruge alle tilgængelige data, snarere end kun mærkede data som i superviseret læring. Til at begynde med klynges lignende data sammen med en uovervåget læringsalgoritme, og det hjælper yderligere med at mærke de umærkede data til mærkede data. Det skyldes, at mærkede data er en forholdsvis dyrere anskaffelse end umærkede data.

Vi kan forestille os disse algoritmer med et eksempel. Superviseret læring er, hvor en studerende er under opsyn af en instruktør i hjemmet og på college. Yderligere, hvis den studerende selv analyserer det samme koncept uden hjælp fra instruktøren, kommer det under uovervåget læring. Under semi-superviseret læring skal den studerende revidere sig selv efter at have analyseret det samme koncept under vejledning af en instruktør på college.

Fordele og ulemper ved Semi-supervised Learning

Fordele:

  • Det er enkelt og nemt at forstå algoritmen.
  • Det er yderst effektivt.
  • Det bruges til at løse ulemperne ved Supervised og Unsupervised Learning algoritmer.

Ulemper:

  • Gentagelsesresultater er muligvis ikke stabile.
  • Vi kan ikke anvende disse algoritmer til data på netværksniveau.
  • Nøjagtigheden er lav.

4. Forstærkende læring

Forstærkende læring fungerer på en feedback-baseret proces, hvor en AI-agent (en softwarekomponent) automatisk udforsker sine omgivelser ved at slå og spore, handle, lære af erfaringer og forbedre sin ydeevne. Agent bliver belønnet for hver god handling og bliver straffet for hver dårlig handling; derfor er målet med forstærkningslæringsagent at maksimere belønningen.

I forstærkende læring er der ingen mærkede data som overvåget læring, og agenter lærer kun af deres erfaringer.

10 af 40

Forstærkningslæringsprocessen ligner et menneske; for eksempel lærer et barn forskellige ting ved oplevelser i dets daglige liv. Et eksempel på forstærkende læring er at spille et spil, hvor spillet er miljøet, en agents bevægelser ved hvert trin definerer tilstande, og agentens mål er at få en høj score. Agent modtager feedback i form af straf og belønninger.

På grund af sin måde at arbejde på, er forstærkende læring ansat inden for forskellige områder som f.eks Spilteori, Operationsforskning, Informationsteori, multiagentsystemer.

Et forstærkende læringsproblem kan formaliseres vha Markov Decision Process (MDP). I MDP interagerer agenten konstant med miljøet og udfører handlinger; ved hver handling reagerer miljøet og genererer en ny tilstand.

Kategorier af forstærkningslæring

Forstærkende læring er hovedsageligt kategoriseret i to typer metoder/algoritmer:

    Positiv forstærkningslæring:Positiv forstærkningslæring specificerer at øge tendensen til, at den påkrævede adfærd ville opstå igen ved at tilføje noget. Det øger styrken af ​​agentens adfærd og påvirker den positivt.Negativ forstærkningslæring:Negativ forstærkningslæring virker stik modsat den positive RL. Det øger tendensen til, at den specifikke adfærd ville opstå igen ved at undgå den negative tilstand.

Real-world Use cases of Reinforcement Learning

    Computerspil:
    RL-algoritmer er meget populære i spilapplikationer. Det bruges til at opnå supermenneskelige præstationer. Nogle populære spil, der bruger RL-algoritmer er AlphaGO og AlphaGO Zero .Ressourcestyring:
    Papiret 'Resource Management with Deep Reinforcement Learning' viste, hvordan man bruger RL i computeren til automatisk at lære og planlægge ressourcer til at vente på forskellige job for at minimere den gennemsnitlige jobopbremsning.Robotik:
    RL bruges i vid udstrækning i robotapplikationer. Robotter bruges i industri- og fremstillingsområdet, og disse robotter bliver gjort mere kraftfulde med forstærkningslæring. Der er forskellige industrier, der har deres vision om at bygge intelligente robotter ved hjælp af AI og Machine learning-teknologi.Tekst Mining
    Text-mining, en af ​​de store applikationer af NLP, bliver nu implementeret ved hjælp af Reinforcement Learning fra Salesforce-virksomheden.

Fordele og ulemper ved forstærkningslæring

Fordele

  • Det hjælper med at løse komplekse problemer i den virkelige verden, som er svære at løse med generelle teknikker.
  • Læringsmodellen for RL ligner menneskers læring; derfor kan de mest nøjagtige resultater findes.
  • Hjælper med at opnå langsigtede resultater.

Ulempe

  • RL-algoritmer foretrækkes ikke til simple problemer.
  • RL-algoritmer kræver enorme data og beregninger.
  • For meget forstærkende læring kan føre til en overbelastning af tilstande, som kan svække resultaterne.

Dimensionalitetens forbandelse begrænser forstærkningslæring for rigtige fysiske systemer.