UOVERVÅGET MASKINLÆRING

I det forrige emne lærte vi overvåget maskinlæring, hvor modeller trænes ved hjælp af mærkede data under overvågning af træningsdata. Men der kan være mange tilfælde, hvor vi ikke har mærkede data og skal finde de skjulte mønstre fra det givne datasæt. Så for at løse sådanne typer sager i maskinlæring har vi brug for uovervågede læringsteknikker.

Hvad er uovervåget læring?

Som navnet antyder, er uovervåget læring en maskinlæringsteknik, hvor modeller ikke overvåges ved hjælp af træningsdatasæt. I stedet finder modellerne selv de skjulte mønstre og indsigter fra de givne data. Det kan sammenlignes med læring, som foregår i den menneskelige hjerne, mens man lærer nye ting. Det kan defineres som:

hvad er regex java

Uovervåget læring er en type maskinlæring, hvor modeller trænes ved hjælp af umærket datasæt og får lov til at handle på disse data uden nogen overvågning.

Ikke-overvåget læring kan ikke anvendes direkte på et regressions- eller klassifikationsproblem, fordi vi i modsætning til overvåget læring har inputdata, men ingen tilsvarende outputdata. Målet med uovervåget læring er at find den underliggende struktur af datasættet, grupper disse data efter ligheder og repræsentere datasættet i et komprimeret format .

Eksempel: Antag, at den uovervågede læringsalgoritme får et inputdatasæt, der indeholder billeder af forskellige typer katte og hunde. Algoritmen trænes aldrig på det givne datasæt, hvilket betyder, at den ikke har nogen idé om datasættets funktioner. Opgaven for den uovervågede læringsalgoritme er at identificere billedfunktionerne på egen hånd. Uovervåget læringsalgoritme vil udføre denne opgave ved at gruppere billeddatasættet i grupperne i henhold til ligheder mellem billeder.

Hvorfor bruge uovervåget læring?

Nedenfor er nogle hovedårsager, som beskriver vigtigheden af uovervåget læring:

Uovervåget læring er nyttigt til at finde nyttig indsigt fra dataene.
Uovervåget læring minder meget om, at et menneske lærer at tænke ud fra egne erfaringer, hvilket gør det tættere på den rigtige AI.
Uovervåget læring arbejder på umærkede og ukategoriserede data, som gør uovervåget læring vigtigere.
I den virkelige verden har vi ikke altid inputdata med det tilsvarende output, så for at løse sådanne tilfælde har vi brug for uovervåget læring.

Arbejde med uovervåget læring

Arbejdet med uovervåget læring kan forstås af nedenstående diagram:

jframe

Her har vi taget et umærket inputdata, hvilket betyder, at det ikke er kategoriseret, og tilsvarende output er heller ikke givet. Nu føres disse umærkede inputdata til maskinlæringsmodellen for at træne dem. For det første vil den fortolke de rå data for at finde de skjulte mønstre fra dataene og derefter anvende passende algoritmer såsom k-betyder clustering, beslutningstræ osv.

Når den først anvender den passende algoritme, opdeler algoritmen dataobjekterne i grupper i henhold til lighederne og forskellene mellem objekterne.

Typer af uovervåget læringsalgoritme:

Den uovervågede læringsalgoritme kan yderligere kategoriseres i to typer problemer:

Klynger: Clustering er en metode til at gruppere objekterne i klynger, således at objekter med flest ligheder forbliver i en gruppe og har mindre eller ingen ligheder med objekter i en anden gruppe. Klyngeanalyse finder fællestræk mellem dataobjekterne og kategoriserer dem efter tilstedeværelsen og fraværet af disse fællestræk.Foreningen: En associationsregel er en uovervåget læringsmetode, som bruges til at finde sammenhænge mellem variabler i den store database. Det bestemmer det sæt af elementer, der forekommer sammen i datasættet. Associationsregel gør marketingstrategi mere effektiv. Såsom folk, der køber X-vare (antag et brød), er også tilbøjelige til at købe Y-vare (smør/syltetøj). Et typisk eksempel på associationsregel er markedskurvanalyse.

Bemærk: Vi vil lære disse algoritmer i senere kapitler.

Uovervågede læringsalgoritmer:

Nedenfor er listen over nogle populære uovervågede læringsalgoritmer:

K-betyder klyngedannelse KNN (k-nærmeste naboer) Hierarkisk klyngedannelse Anomali påvisning Neurale netværk Principiel komponentanalyse Uafhængig komponentanalyse Apriori algoritme Enkeltværdinedbrydning

Fordele ved uovervåget læring

Uovervåget læring bruges til mere komplekse opgaver sammenlignet med overvåget læring, fordi vi i uovervåget læring ikke har mærkede inputdata.
Uovervåget læring er at foretrække, da det er let at få umærkede data sammenlignet med mærkede data.

Ulemper ved uovervåget læring

Ikke-superviseret læring er i sagens natur sværere end superviseret læring, da den ikke har tilsvarende output.
Resultatet af den uovervågede læringsalgoritme kan være mindre nøjagtig, da inputdata ikke er mærket, og algoritmer ikke kender det nøjagtige output på forhånd.

TechCodeview