En merket data, i sammenheng med kunstig intelligens (AI) og spesifikt i domenet til Google Cloud Machine Learning, refererer til et datasett som har blitt kommentert eller merket med spesifikke etiketter eller kategorier. Disse etikettene fungerer som grunnsannheten eller referansen for opplæring av maskinlæringsalgoritmer. Ved å assosiere datapunkter med deres tilsvarende etiketter, kan maskinlæringsmodellen lære å gjenkjenne mønstre og lage spådommer basert på nye, usynlige data.
Merkede data spiller en avgjørende rolle i veiledet læring, som er en vanlig tilnærming innen maskinlæring. I overvåket læring trenes modellen på et merket datasett for å lære forholdet mellom inngangsfunksjoner og deres tilsvarende utdataetiketter. Denne opplæringsprosessen lar modellen generalisere kunnskapen sin og lage nøyaktige spådommer på nye, usynlige data.
For å illustrere dette konseptet, la oss vurdere et eksempel på en maskinlæringsoppgave innen bildegjenkjenning. Anta at vi ønsker å bygge en modell som kan klassifisere bilder av dyr i ulike kategorier som katter, hunder og fugler. Vi vil trenge et merket datasett der hvert bilde er knyttet til sin korrekte etikett. For eksempel vil et bilde av en katt bli merket som "katt", et bilde av en hund som "hund" og så videre.
Det merkede datasettet vil bestå av en samling bilder og deres tilsvarende etiketter. Hvert bilde vil bli representert av et sett med funksjoner, for eksempel pikselverdier eller representasjoner på høyere nivå hentet fra bildet. Etikettene vil indikere riktig kategori eller klasse som hvert bilde tilhører.
I løpet av opplæringsfasen vil maskinlæringsmodellen bli presentert med det merkede datasettet. Det ville lære å identifisere mønstre og forhold mellom inngangsfunksjonene og de tilsvarende etikettene. Modellen vil oppdatere sine interne parametere for å minimere forskjellen mellom dens spådommer og de sanne etikettene i treningsdataene.
Når modellen er opplært, kan den brukes til å lage spådommer på nye, usette bilder. Gitt et umerket bilde, vil modellen analysere funksjonene og forutsi den mest sannsynlige etiketten basert på den lærte kunnskapen fra det merkede datasettet. For eksempel, hvis modellen forutsier at et bilde inneholder en katt, betyr det at den har gjenkjente mønstre i bildet som indikerer en katt.
Merkede data er en grunnleggende komponent i opplæring av maskinlæringsmodeller. Den gir den nødvendige informasjonen for modellen å lære av og gjøre nøyaktige spådommer. Ved å assosiere datapunkter med deres tilsvarende etiketter, kan modellen lære å gjenkjenne mønstre og generalisere kunnskapen til usynlige data.
Andre nyere spørsmål og svar vedr EITC/AI/GCML Google Cloud Machine Learning:
- Hva er tekst til tale (TTS) og hvordan fungerer det med AI?
- Hva er begrensningene ved å jobbe med store datasett i maskinlæring?
- Kan maskinlæring hjelpe til med dialog?
- Hva er TensorFlow-lekeplassen?
- Hva betyr egentlig et større datasett?
- Hva er noen eksempler på algoritmens hyperparametre?
- Hva er ensamble learning?
- Hva om en valgt maskinlæringsalgoritme ikke er egnet, og hvordan kan man sørge for å velge den riktige?
- Trenger en maskinlæringsmodell veiledning under opplæringen?
- Hva er nøkkelparametrene som brukes i nevrale nettverksbaserte algoritmer?
Se flere spørsmål og svar i EITC/AI/GCML Google Cloud Machine Learning