Når du bruker en Google-modell og trener den på din egen instans, avhenger spørsmålet om Google beholder forbedringene som er gjort fra treningsdataene dine, av flere faktorer, inkludert den spesifikke Google-tjenesten eller -verktøyet du bruker og vilkårene for bruk knyttet til det verktøyet. I sammenheng med Google Clouds maskinlæringstjenester krever forståelsen av hvordan data håndteres en nærmere titt på den underliggende arkitekturen og retningslinjene som styrer personvern og bruk av data.
Google Cloud tilbyr en rekke maskinlæringstjenester og verktøy, for eksempel Google Cloud AI Platform, TensorFlow og AutoML, hver med sitt eget sett med funksjoner og muligheter. Når du trener en modell ved å bruke disse tjenestene, er det viktige hensyn angående personvern og modelloppdateringer.
1. Dataeierskap og personvern: Google Clouds vilkår for bruk fastsetter generelt at kundene beholder eierskapet til dataene sine. Dette betyr at all data du bruker til å trene en modell på Google Cloud forblir din eiendom. Google er forpliktet til å beskytte personvernet og konfidensialiteten til kundedata, og skytjenestene deres er utformet for å sikre samsvar med ulike databeskyttelsesforskrifter, for eksempel GDPR.
2. Modellopplæring og forbedringer: Når du trener en maskinlæringsmodell ved hjelp av Google Cloud-tjenester, deles vanligvis ikke forbedringene eller oppdateringene til modellen som et resultat av treningsdataene dine med Google med mindre annet er uttrykkelig angitt. Den opplærte modellen og eventuelle forbedringer som følge av dataene dine forblir innenfor din kontroll og blir ikke automatisk integrert i Googles globale modeller.
3. Federert læring: I noen scenarier bruker Google teknikker som forent læring, der modellforbedringer samles fra flere kilder uten å dele de underliggende dataene. I slike tilfeller sendes bare modelloppdateringer tilbake til en sentral server, og individuelle datapunkter deles ikke. Dette er imidlertid en spesifikk tilnærming og gjelder ikke universelt for alle maskinlæringstjenester i Google Cloud.
4. Tjenestespesifikke retningslinjer: Det er viktig å se gjennom de spesifikke vilkårene og betingelsene knyttet til Google Cloud-tjenesten du bruker. Noen tjenester kan tilby alternativer for å bidra til en delt modell eller dra nytte av kollektive forbedringer, men disse vil kreve eksplisitt samtykke og deltakelse.
5. Praktisk eksempel: Tenk på et scenario der du bruker Google AI Platform for å trene opp en tilpasset bildegjenkjenningsmodell for bedriften din. Du laster opp datasettet ditt, trener modellen og oppnår forbedret nøyaktighet. I henhold til Google Clouds standardpraksis, beholdes forbedringene som er gjort i modellen din i prosjektet ditt, og Google har ikke tilgang til eller bruker disse forbedringene til egne formål. Den trente modellen din forblir isolert fra Googles forhåndstrente modeller med mindre du velger å dele den gjennom en bestemt funksjon eller et bestemt program som involverer samarbeid.
Når du trener en Google-modell på din egen instans, beholdes forbedringene som er gjort fra treningsdataene dine vanligvis i miljøet ditt og deles ikke med Google, med mindre det er en spesifikk avtale eller funksjon som forenkler slik deling. Det er viktig å forstå tjenestevilkårene og retningslinjer for datahåndtering for den bestemte Google Cloud-tjenesten du bruker.
Andre nyere spørsmål og svar vedr EITC/AI/GCML Google Cloud Machine Learning:
- Kan mer enn én modell brukes i maskinlæringsprosessen?
- Kan maskinlæring tilpasse hvilken algoritme som skal brukes avhengig av et scenario?
- Hva er den enkleste veien til grunnleggende didaktisk AI-modellopplæring og distribusjon på Google AI Platform ved hjelp av et gratis nivå/prøveperiode med en GUI-konsoll på en trinnvis måte for en absolutt nybegynner uten programmeringsbakgrunn?
- Hvordan trene og distribuere en enkel AI-modell i Google Cloud AI Platform via det grafiske grensesnittet til GCP-konsollen i en trinnvis veiledning?
- Hva er den enkleste trinnvise prosedyren for å praktisere distribuert AI-modelltrening i Google Cloud?
- Hva er den første modellen man kan jobbe med, med noen praktiske forslag til å begynne med?
- Er algoritmene og prediksjonene basert på innspill fra den menneskelige siden?
- Hva er hovedkravene og de enkleste metodene for å lage en modell for naturlig språkbehandling? Hvordan kan man lage en slik modell ved hjelp av tilgjengelige verktøy?
- Krever bruk av disse verktøyene et månedlig eller årlig abonnement, eller er det en viss mengde gratis bruk?
- Hva er en epoke i sammenheng med treningsmodellparametere?
Se flere spørsmål og svar i EITC/AI/GCML Google Cloud Machine Learning