Prosessen med å trene en maskinlæringsmodell innebærer å utsette den for enorme mengder data for å gjøre den i stand til å lære mønstre og ta spådommer eller beslutninger uten å være eksplisitt programmert for hvert scenario. I løpet av opplæringsfasen gjennomgår maskinlæringsmodellen en serie iterasjoner der den justerer sine interne parametere for å minimere feil og forbedre ytelsen på den gitte oppgaven.
Veiledning under opplæring refererer til nivået av menneskelig intervensjon som kreves for å veilede læringsprosessen til modellen. Behovet for tilsyn kan variere avhengig av typen maskinlæringsalgoritme som brukes, kompleksiteten til oppgaven og kvaliteten på dataene som gis for opplæring.
I veiledet læring, som er en type maskinlæring hvor modellen trenes på merkede data, er tilsyn essensielt. Merkede data betyr at hvert inngangsdatapunkt er paret med riktig utgang, slik at modellen kan lære kartleggingen mellom innganger og utganger. Under overvåket trening kreves menneskelig tilsyn for å gi de riktige etikettene for treningsdataene, evaluere modellens spådommer og justere modellens parametere basert på tilbakemelding.
For eksempel, i en overvåket bildegjenkjenningsoppgave, hvis målet er å trene en modell til å klassifisere bilder av katter og hunder, må en menneskelig veileder merke hvert bilde som enten en katt eller en hund. Modellen vil da lære av disse merkede eksemplene for å lage spådommer på nye, usette bilder. Veilederen ville evaluere modellens spådommer og gi tilbakemelding for å forbedre nøyaktigheten.
På den annen side krever ikke uovervåket læringsalgoritmer ikke merkede data for trening. Disse algoritmene lærer mønstre og strukturer fra inndataene uten eksplisitt veiledning. Uovervåket læring brukes ofte til oppgaver som clustering, avviksdeteksjon og dimensjonalitetsreduksjon. Ved uovervåket læring kan maskinen lære selvstendig uten behov for menneskelig tilsyn under trening.
Semi-veiledet læring er en hybrid tilnærming som kombinerer elementer av både veiledet og ikke-overvåket læring. I denne tilnærmingen trenes modellen på en kombinasjon av merkede og umerkede data. De merkede dataene gir en viss veiledning for å veilede læringsprosessen, mens de umerkede dataene lar modellen oppdage ytterligere mønstre og relasjoner i dataene.
Forsterkende læring er et annet paradigme for maskinlæring der en agent lærer å ta sekvensielle beslutninger ved å samhandle med et miljø. I forsterkende læring mottar agenten tilbakemelding i form av belønning eller straff basert på handlingene dens. Agenten lærer å maksimere sin kumulative belønning over tid gjennom prøving og feiling. Mens forsterkende læring ikke krever eksplisitt veiledning i tradisjonell forstand, kan menneskelig tilsyn være nødvendig for å designe belønningsstrukturen, sette læringsmålene eller finjustere læringsprosessen.
Behovet for veiledning under maskinlæringstrening avhenger av læringsparadigmet som brukes, tilgjengeligheten av merkede data og oppgavens kompleksitet. Veiledet læring krever menneskelig tilsyn for å gi merkede data og evaluere modellens ytelse. Uovervåket læring krever ikke veiledning, da modellen lærer uavhengig av umerkede data. Semi-veiledet læring kombinerer elementer av både veiledet og uovervåket læring, mens forsterkende læring innebærer læring gjennom interaksjon med et miljø.
Andre nyere spørsmål og svar vedr EITC/AI/GCML Google Cloud Machine Learning:
- Hva er tekst til tale (TTS) og hvordan fungerer det med AI?
- Hva er begrensningene ved å jobbe med store datasett i maskinlæring?
- Kan maskinlæring hjelpe til med dialog?
- Hva er TensorFlow-lekeplassen?
- Hva betyr egentlig et større datasett?
- Hva er noen eksempler på algoritmens hyperparametre?
- Hva er ensamble learning?
- Hva om en valgt maskinlæringsalgoritme ikke er egnet, og hvordan kan man sørge for å velge den riktige?
- Hva er nøkkelparametrene som brukes i nevrale nettverksbaserte algoritmer?
- Hva er TensorBoard?
Se flere spørsmål og svar i EITC/AI/GCML Google Cloud Machine Learning