Hyperparametre i maskinlæring er de parametre, der er eksplicit defineret af brugeren for at kontrollere indlæringsprocessen. Disse hyperparametre bruges til at forbedre indlæringen af modellen, og deres værdier sættes før indlæringsprocessen af modellen startes.
I dette emne skal vi diskutere et af de vigtigste begreber inden for maskinlæring, dvs. Hyperparametre, deres eksempler, hyperparameterjustering, kategorier af hyperparametre, hvordan er hyperparameter forskellig fra parameter i Machine Learning? Men før vi starter, lad os først forstå hyperparameteren.
Hvad er hyperparametre?
I Machine Learning/Deep Learning er en model repræsenteret ved dens parametre. I modsætning hertil involverer en træningsproces at vælge de bedste/optimale hyperparametre, der bruges af indlæring af algoritmer for at give det bedste resultat. Så hvad er disse hyperparametre? Svaret er, ' Hyperparametre er defineret som de parametre, der er eksplicit defineret af brugeren for at styre læringsprocessen.'
Her antyder præfikset 'hyper', at parametrene er parametre på øverste niveau, som bruges til at styre læringsprocessen. Værdien af hyperparameteret vælges og indstilles af maskinlæringsingeniøren, før indlæringsalgoritmen begynder at træne modellen. Disse er derfor eksterne i forhold til modellen, og deres værdier kan ikke ændres under træningsprocessen .
java multithreading
Nogle eksempler på hyperparametre i maskinlæring
- K'et i kNN eller K-Nearest Neighbor-algoritmen
- Læringshastighed for træning af et neuralt netværk
- Tog-test split-forhold
- Batchstørrelse
- Antal epoker
- Grene i beslutningstræet
- Antal klynger i Clustering Algorithm
Forskel mellem parameter og hyperparameter?
Der er altid en stor forvirring mellem parametre og hyperparametre eller modelhyperparametre. Så for at fjerne denne forvirring, lad os forstå forskellen mellem dem begge og hvordan de er relateret til hinanden.
Modelparametre:
Modelparametre er konfigurationsvariabler, der er interne i modellen, og en model lærer dem på egen hånd. For eksempel , W Vægte eller koefficienter af uafhængige variable i den lineære regressionsmodel . eller Vægte eller koefficienter af uafhængige variable i SVM, vægt og skævheder i et neuralt netværk, klynge centroid i klynge. Nogle nøglepunkter for modelparametre er som følger:
- De bruges af modellen til at lave forudsigelser.
- De læres af modellen fra selve dataene
- Disse indstilles normalt ikke manuelt.
- Disse er delen af modellen og nøglen til en maskinlæringsalgoritme.
Modelhyperparametre:
Hyperparametre er de parametre, der er eksplicit defineret af brugeren for at styre læringsprocessen. Nogle nøglepunkter for modelparametre er som følger:
- Disse defineres normalt manuelt af maskinlæringsingeniøren.
- Man kan ikke kende den nøjagtige bedste værdi for hyperparametre for det givne problem. Den bedste værdi kan bestemmes enten ved tommelfingerreglen eller ved forsøg og fejl.
- Nogle eksempler på hyperparametre er indlæringshastigheden for træning af et neuralt netværk, K i KNN-algoritmen,
Kategorier af hyperparametre
Overordnet set kan hyperparametre opdeles i to kategorier, som er angivet nedenfor:
Hyperparameter til optimering
Processen med at vælge de bedste hyperparametre, der skal bruges, kaldes hyperparameterjustering, og justeringsprocessen er også kendt som hyperparameteroptimering. Optimeringsparametre bruges til at optimere modellen.
Nogle af de populære optimeringsparametre er angivet nedenfor:
Bemærk: Indlæringshastighed er en afgørende hyperparameter for at optimere modellen, så hvis der er et krav om kun at indstille en enkelt hyperparameter, foreslås det at justere indlæringshastigheden.
Hyperparameter for specifikke modeller
Hyperparametre, der er involveret i modellens struktur, er kendt som hyperparametre for specifikke modeller. Disse er givet nedenfor:
Det er vigtigt at specificere antallet af skjulte enheders hyperparameter for det neurale netværk. Det skal være mellem størrelsen på inputlaget og størrelsen på outputlaget. Mere specifikt skal antallet af skjulte enheder være 2/3 af størrelsen på inputlaget plus størrelsen af outputlaget.
For komplekse funktioner er det nødvendigt at angive antallet af skjulte enheder, men det bør ikke overpasse modellen.
Konklusion
Hyperparametre er de parametre, der er eksplicit defineret til at styre læringsprocessen, før en maskinlæringsalgoritme anvendes på et datasæt. Disse bruges til at specificere modellens indlæringskapacitet og kompleksitet. Nogle af hyperparametrene bruges til optimering af modellerne, såsom batchstørrelse, indlæringshastighed osv., og nogle er specifikke for modellerne, såsom Antal skjulte lag osv.