Machine learning er en delmængde af AI, som gør det muligt for maskinen automatisk at lære af data, forbedre ydeevnen fra tidligere erfaringer og komme med forudsigelser . Machine learning indeholder et sæt algoritmer, der arbejder på en enorm mængde data. Data føres til disse algoritmer for at træne dem, og på baggrund af træning bygger de modellen og udfører en specifik opgave.
Disse ML-algoritmer hjælper med at løse forskellige forretningsproblemer som regression, klassificering, prognose, klyngedannelse og foreninger osv.
Med udgangspunkt i metoderne og måden at lære på er maskinlæring opdelt i hovedsageligt fire typer, som er:
- Supervised Machine Learning
- Uovervåget maskinlæring
- Semi-Supervised Machine Learning
- Forstærkende læring
I dette emne vil vi give en detaljeret beskrivelse af typerne af Machine Learning sammen med deres respektive algoritmer:
1. Supervised Machine Learning
Som navnet antyder, Overvåget maskinlæring er baseret på supervision. Det betyder i den overvågede læringsteknik, at vi træner maskinerne ved hjælp af det 'mærkede' datasæt, og på baggrund af træningen forudsiger maskinen outputtet. Her angiver de mærkede data, at nogle af inputs allerede er mappet til outputtet. Mere dyrebart kan vi sige; først træner vi maskinen med input og tilsvarende output, og derefter beder vi maskinen om at forudsige outputtet ved hjælp af testdatasættet.
Lad os forstå overvåget læring med et eksempel. Antag, at vi har et input-datasæt med billeder af katte og hunde. Så først vil vi give maskinen træning i at forstå billederne, såsom form og størrelse på halen på kat og hund, øjenform, farve, højde (hunde er højere, katte er mindre) osv. Efter afslutningen af træningen indtaster vi billedet af en kat og beder maskinen om at identificere objektet og forudsige outputtet. Nu er maskinen veltrænet, så den vil tjekke alle objektets funktioner, såsom højde, form, farve, øjne, ører, hale osv., og finde ud af, at det er en kat. Så den vil placere den i Kat-kategorien. Dette er processen for, hvordan maskinen identificerer objekterne i Supervised Learning.
Hovedmålet med den superviserede læringsteknik er at kortlægge inputvariablen(x) med outputvariablen(y). Nogle virkelige anvendelser af superviseret læring er Risikovurdering, svindeldetektion, spamfiltrering, etc.
Kategorier af overvåget maskinlæring
Overvåget maskinlæring kan klassificeres i to typer problemer, som er angivet nedenfor:
a) Klassificering
Klassifikationsalgoritmer bruges til at løse klassifikationsproblemer, hvor outputvariablen er kategorisk, såsom ' Ja eller nej, mand eller kvinde, rød eller blå osv . Klassifikationsalgoritmerne forudsiger de kategorier, der er til stede i datasættet. Nogle eksempler fra den virkelige verden på klassifikationsalgoritmer er Spamregistrering, e-mailfiltrering osv.
Nogle populære klassifikationsalgoritmer er angivet nedenfor:
b) Regression
Regressionsalgoritmer bruges til at løse regressionsproblemer, hvor der er en lineær sammenhæng mellem input- og outputvariable. Disse bruges til at forudsige kontinuerlige outputvariabler, såsom markedstendenser, vejrudsigelse osv.
Nogle populære regressionsalgoritmer er angivet nedenfor:
Fordele og ulemper ved Supervised Learning
Fordele:
- Siden overvåget læring arbejde med det mærkede datasæt, så vi kan have en nøjagtig idé om klasserne af objekter.
- Disse algoritmer er nyttige til at forudsige outputtet på grundlag af tidligere erfaringer.
Ulemper:
- Disse algoritmer er ikke i stand til at løse komplekse opgaver.
- Det kan forudsige det forkerte output, hvis testdataene er forskellige fra træningsdataene.
- Det kræver masser af beregningstid at træne algoritmen.
Anvendelser af superviseret læring
Nogle almindelige anvendelser af Supervised Learning er angivet nedenfor:
Overvågede læringsalgoritmer bruges til billedsegmentering. I denne proces udføres billedklassificering på forskellige billeddata med foruddefinerede etiketter.
Overvågede algoritmer bruges også på det medicinske område til diagnoseformål. Det gøres ved at bruge medicinske billeder og tidligere mærkede data med etiketter for sygdomstilstande. Med en sådan proces kan maskinen identificere en sygdom for de nye patienter.
2. Uovervåget maskinlæring
Uovervåget læring g er forskellig fra Supervised learning-teknikken; som navnet antyder, er der ikke behov for supervision. Det betyder, i uovervåget maskinlæring, at maskinen trænes ved hjælp af det umærkede datasæt, og maskinen forudsiger outputtet uden overvågning.
I uovervåget læring trænes modellerne med de data, der hverken er klassificerede eller mærkede, og modellen handler på disse data uden nogen som helst supervision.
Hovedformålet med den uovervågede læringsalgoritme er at gruppere eller kategorisere det usorterede datasæt efter ligheder, mønstre og forskelle. Maskiner bliver bedt om at finde de skjulte mønstre fra inputdatasættet.
Lad os tage et eksempel for at forstå det mere værdifuldt; antag, at der er en kurv med frugtbilleder, og vi indtaster den i maskinlæringsmodellen. Billederne er totalt ukendte for modellen, og maskinens opgave er at finde objekternes mønstre og kategorier.
Så nu vil maskinen opdage sine mønstre og forskelle, såsom farveforskel, formforskel, og forudsige outputtet, når det testes med testdatasættet.
Kategorier af uovervåget maskinlæring
Uovervåget læring kan yderligere klassificeres i to typer, som er angivet nedenfor:
1) Klynger
Klyngeteknikken bruges, når vi vil finde de iboende grupper fra dataene. Det er en måde at gruppere objekterne i en klynge, således at objekterne med flest ligheder forbliver i én gruppe og har færre eller ingen ligheder med objekterne i andre grupper. Et eksempel på klyngealgoritmen er at gruppere kunderne efter deres købsadfærd.
Nogle af de populære klyngealgoritmer er angivet nedenfor:
2) Forening
Association regellæring er en uovervåget læringsteknik, som finder interessante relationer mellem variabler inden for et stort datasæt. Hovedformålet med denne læringsalgoritme er at finde et dataelements afhængighed af et andet dataelement og kortlægge disse variabler i overensstemmelse hermed, så det kan generere maksimal profit. Denne algoritme anvendes hovedsageligt i Market Basket analyse, web-brug mining, kontinuerlig produktion , etc.
Nogle populære algoritmer for læring af Associationsregel er Apriori-algoritme, Eclat, FP-vækstalgoritme.
Fordele og ulemper ved uovervåget læringsalgoritme
Fordele:
- Disse algoritmer kan bruges til komplicerede opgaver sammenlignet med de overvågede, fordi disse algoritmer fungerer på det umærkede datasæt.
- Ikke-overvågede algoritmer er at foretrække til forskellige opgaver, da det er nemmere at få det umærkede datasæt sammenlignet med det mærkede datasæt.
Ulemper:
- Outputtet af en uovervåget algoritme kan være mindre nøjagtigt, da datasættet ikke er mærket, og algoritmer er ikke trænet med det nøjagtige output fra tidligere.
- Det er sværere at arbejde med uovervåget læring, da det fungerer med det umærkede datasæt, der ikke kortlægges med outputtet.
Anvendelser af uovervåget læring
3. Semi-Supervised Learning
Semi-Supervised learning er en type Machine Learning-algoritme, der ligger mellem Supervised og Unsupervised Machine learning . Den repræsenterer mellemvejen mellem overvåget (med mærkede træningsdata) og uovervåget læring (uden mærkede træningsdata) algoritmer og bruger kombinationen af mærkede og umærkede datasæt i løbet af træningsperioden.
EN Selvom semi-overvåget læring er mellemvejen mellem overvåget og ikke-overvåget læring og opererer på data, der består af nogle få etiketter, består det for det meste af umærkede data. Da etiketter er dyre, men til virksomhedsformål, kan de have få etiketter. Det er helt anderledes end superviseret og uovervåget læring, da de er baseret på tilstedeværelsen og fraværet af etiketter.
For at overvinde ulemperne ved overvåget læring og uovervåget læringsalgoritmer introduceres begrebet semi-overvåget læring . Hovedformålet med semi-superviseret læring er effektivt at bruge alle tilgængelige data, snarere end kun mærkede data som i superviseret læring. Til at begynde med klynges lignende data sammen med en uovervåget læringsalgoritme, og det hjælper yderligere med at mærke de umærkede data til mærkede data. Det skyldes, at mærkede data er en forholdsvis dyrere anskaffelse end umærkede data.
Vi kan forestille os disse algoritmer med et eksempel. Superviseret læring er, hvor en studerende er under opsyn af en instruktør i hjemmet og på college. Yderligere, hvis den studerende selv analyserer det samme koncept uden hjælp fra instruktøren, kommer det under uovervåget læring. Under semi-superviseret læring skal den studerende revidere sig selv efter at have analyseret det samme koncept under vejledning af en instruktør på college.
Fordele og ulemper ved Semi-supervised Learning
Fordele:
- Det er enkelt og nemt at forstå algoritmen.
- Det er yderst effektivt.
- Det bruges til at løse ulemperne ved Supervised og Unsupervised Learning algoritmer.
Ulemper:
- Gentagelsesresultater er muligvis ikke stabile.
- Vi kan ikke anvende disse algoritmer til data på netværksniveau.
- Nøjagtigheden er lav.
4. Forstærkende læring
Forstærkende læring fungerer på en feedback-baseret proces, hvor en AI-agent (en softwarekomponent) automatisk udforsker sine omgivelser ved at slå og spore, handle, lære af erfaringer og forbedre sin ydeevne. Agent bliver belønnet for hver god handling og bliver straffet for hver dårlig handling; derfor er målet med forstærkningslæringsagent at maksimere belønningen.
I forstærkende læring er der ingen mærkede data som overvåget læring, og agenter lærer kun af deres erfaringer.
10 af 40
Forstærkningslæringsprocessen ligner et menneske; for eksempel lærer et barn forskellige ting ved oplevelser i dets daglige liv. Et eksempel på forstærkende læring er at spille et spil, hvor spillet er miljøet, en agents bevægelser ved hvert trin definerer tilstande, og agentens mål er at få en høj score. Agent modtager feedback i form af straf og belønninger.
På grund af sin måde at arbejde på, er forstærkende læring ansat inden for forskellige områder som f.eks Spilteori, Operationsforskning, Informationsteori, multiagentsystemer.
Et forstærkende læringsproblem kan formaliseres vha Markov Decision Process (MDP). I MDP interagerer agenten konstant med miljøet og udfører handlinger; ved hver handling reagerer miljøet og genererer en ny tilstand.
Kategorier af forstærkningslæring
Forstærkende læring er hovedsageligt kategoriseret i to typer metoder/algoritmer:
Real-world Use cases of Reinforcement Learning
RL-algoritmer er meget populære i spilapplikationer. Det bruges til at opnå supermenneskelige præstationer. Nogle populære spil, der bruger RL-algoritmer er AlphaGO og AlphaGO Zero .
Papiret 'Resource Management with Deep Reinforcement Learning' viste, hvordan man bruger RL i computeren til automatisk at lære og planlægge ressourcer til at vente på forskellige job for at minimere den gennemsnitlige jobopbremsning.
RL bruges i vid udstrækning i robotapplikationer. Robotter bruges i industri- og fremstillingsområdet, og disse robotter bliver gjort mere kraftfulde med forstærkningslæring. Der er forskellige industrier, der har deres vision om at bygge intelligente robotter ved hjælp af AI og Machine learning-teknologi.
Text-mining, en af de store applikationer af NLP, bliver nu implementeret ved hjælp af Reinforcement Learning fra Salesforce-virksomheden.
Fordele og ulemper ved forstærkningslæring
Fordele
- Det hjælper med at løse komplekse problemer i den virkelige verden, som er svære at løse med generelle teknikker.
- Læringsmodellen for RL ligner menneskers læring; derfor kan de mest nøjagtige resultater findes.
- Hjælper med at opnå langsigtede resultater.
Ulempe
- RL-algoritmer foretrækkes ikke til simple problemer.
- RL-algoritmer kræver enorme data og beregninger.
- For meget forstærkende læring kan føre til en overbelastning af tilstande, som kan svække resultaterne.
Dimensionalitetens forbandelse begrænser forstærkningslæring for rigtige fysiske systemer.