Hvorfor er evalueringen 80% for trening og 20% for evaluering, men ikke det motsatte?

by Nguyen Xuan Tung / Torsdag 17 august 2023 / Publisert i Kunstig intelligens, EITC/AI/GCML Google Cloud Machine Learning, Første trinn i maskinlæring, De 7 trinnene med maskinlæring

Tildelingen av 80 % vekt til trening og 20 % vekt til evaluering i sammenheng med maskinlæring er en strategisk beslutning basert på flere faktorer. Denne fordelingen tar sikte på å finne en balanse mellom å optimalisere læringsprosessen og å sikre nøyaktig evaluering av modellens ytelse. I dette svaret vil vi fordype oss i årsakene bak dette valget og utforske den didaktiske verdien det gir.

For å forstå begrunnelsen bak 80 % opplæring og 20 % evalueringsdeling, er det avgjørende å forstå de syv trinnene i maskinlæring. Disse trinnene, som inkluderer datainnsamling, dataforberedelse, modelltrening, modellevaluering, modellinnstilling, modelldistribusjon og modellovervåking, danner et omfattende rammeverk for å bygge maskinlæringsmodeller.

Det første trinnet, datainnsamling, innebærer å samle inn relevante data for å trene modellen. Disse dataene blir deretter forhåndsbehandlet og klargjort i dataforberedelsesfasen. Når dataene er klare, starter modellopplæringsfasen, hvor modellen eksponeres for opplæringsdatasettet for å lære mønstre og sammenhenger. Modellens ytelse blir deretter evaluert ved hjelp av et eget datasett i modellevalueringsfasen.

Beslutningen om å allokere 80 % vekt til trening og 20 % vekt til evaluering stammer fra det faktum at trening er den primære fasen hvor modellen lærer av dataene. Under trening justerer modellen sine interne parametere for å minimere forskjellen mellom dens predikerte utganger og de faktiske utgangene i treningsdatasettet. Denne prosessen involverer iterativt å oppdatere modellens parametere ved å bruke optimaliseringsalgoritmer som gradientnedstigning.

Ved å tildele trening en høyere vekt, prioriterer vi modellens evne til å lære av dataene og fange opp komplekse mønstre. Treningsfasen er der modellen tilegner seg sin kunnskap og generaliserer fra treningsdatasettet for å lage spådommer om usynlige data. Jo mer treningsdata modellen utsettes for, jo bedre kan den lære og generalisere. Derfor, ved å dedikere en betydelig del av evalueringsprosessen til opplæring, sikres det at modellen har tilstrekkelig eksponering for treningsdataene for effektiv læring.

På den annen side spiller evalueringsfasen en avgjørende rolle for å vurdere modellens ytelse på usett data. Evalueringsdatasettet, som er atskilt fra opplæringsdatasettet, fungerer som en proxy for virkelige scenarier. Det lar oss måle hvor godt modellen kan generalisere læringen til nye og usynlige tilfeller. Evaluering av modellens ytelse er avgjørende for å måle dens nøyaktighet, presisjon, tilbakekalling eller andre relevante beregninger, avhengig av det spesifikke problemdomenet.

De 20 % vektingen som gis til evaluering sikrer at modellen er grundig testet på usynlige data og gir en realistisk vurdering av dens evner. Denne evalueringsfasen hjelper til med å avdekke potensielle problemer som overtilpasning, undertilpasning eller skjevhet i modellens spådommer. Den muliggjør også finjustering av hyperparametre og modellarkitektur for å forbedre ytelsen.

For å illustrere dette konseptet, la oss vurdere et praktisk eksempel. Anta at vi trener en maskinlæringsmodell for å klassifisere bilder av katter og hunder. I løpet av treningsfasen lærer modellen å skille mellom egenskapene til katter og hunder ved å analysere et stort datasett med merkede bilder. Jo flere bilder modellen kan trene på, jo bedre blir den til å skille mellom de to klassene.

Når opplæringen er fullført, blir modellen evaluert ved hjelp av et eget datasett som inneholder bilder den aldri har sett før. Denne evalueringsfasen tester modellens evne til å generalisere dens læring og nøyaktig klassifisere nye, usette bilder. Ved å allokere 20 % vekt til evaluering, sikrer vi at modellens ytelse vurderes grundig på usynlige data, noe som gir et pålitelig mål på effektiviteten.

Fordelingen av 80 % vekt til trening og 20 % vekting til evaluering i maskinlæring er et strategisk valg som tar sikte på å optimalisere læringsprosessen samtidig som man sikrer nøyaktig vurdering av modellens ytelse. Ved å dedikere en betydelig del av evalueringsprosessen til opplæring, prioriterer vi modellens evne til å lære av dataene og fange opp komplekse mønstre. Samtidig tester evalueringsfasen modellen grundig på usynlige data, og gir en realistisk vurdering av dens evner.

Andre nyere spørsmål og svar vedr EITC/AI/GCML Google Cloud Machine Learning:

Se flere spørsmål og svar i EITC/AI/GCML Google Cloud Machine Learning

Flere spørsmål og svar:

Field: Kunstig intelligens
program: EITC/AI/GCML Google Cloud Machine Learning (gå til sertifiseringsprogrammet)
Lekse: Første trinn i maskinlæring (gå til relatert leksjon)
Emne: De 7 trinnene med maskinlæring (gå til relatert emne)

Merket under: Kunstig intelligens, Dataklargjøring, Maskinlæring, Modellevaluering, Modelltrening, Optimaliseringsalgoritmer

EITCA Academy

Hvorfor er evalueringen 80% for trening og 20% for evaluering, men ikke det motsatte?

Andre nyere spørsmål og svar vedr EITC/AI/GCML Google Cloud Machine Learning:

Flere spørsmål og svar:

EITCA Academy er en del av det europeiske rammeverket for IT-sertifisering

Valgbarhet for EITCA Academy 80% EITCI DSJC Subsidie support

EITCA Academy

Logg inn på kontoen din av ditt brukernavn eller e-postadresse

FORGÅ DIN DETALJER?

OPPRETT EN KONTO

Hvorfor er evalueringen 80% for trening og 20% ​​for evaluering, men ikke det motsatte?

Andre nyere spørsmål og svar vedr EITC/AI/GCML Google Cloud Machine Learning:

Flere spørsmål og svar:

Valgbarhet for EITCA Academy 80% EITCI DSJC Subsidie ​​support

Hvorfor er evalueringen 80% for trening og 20% for evaluering, men ikke det motsatte?

Valgbarhet for EITCA Academy 80% EITCI DSJC Subsidie support