TensorFlow Lite er en lettvektsløsning levert av TensorFlow for å kjøre maskinlæringsmodeller på mobile og IoT-enheter. Når TensorFlow Lite-tolken behandler en objektgjenkjenningsmodell med en ramme fra et mobilenhetskamera som inngang, involverer utdataene vanligvis flere stadier for til slutt å gi spådommer angående objektene som er tilstede i bildet.
For det første mates inngangsrammen fra mobilenhetens kamera inn i TensorFlow Lite-tolken. Tolken forhåndsbehandler deretter inndatabildet ved å konvertere det til et format som passer for maskinlæringsmodellen. Dette forbehandlingstrinnet innebærer vanligvis å endre størrelsen på bildet for å matche inngangsstørrelsen som forventes av modellen, normalisering av pikselverdier og potensielt bruk av andre transformasjoner som er spesifikke for modellarkitekturen.
Deretter sendes det forhåndsbehandlede bildet gjennom objektgjenkjenningsmodellen i TensorFlow Lite-tolkeren. Modellen behandler bildet ved å bruke dets innlærte parametere og arkitektur for å generere spådommer om objektene som er tilstede i rammen. Disse spådommene inkluderer vanligvis informasjon som klasseetikettene til objektene som er oppdaget, deres plassering i bildet og konfidensskårene knyttet til hver prediksjon.
Når modellen har gjort sine spådommer, sender TensorFlow Lite-tolken ut denne informasjonen i et strukturert format som kan brukes av applikasjonen som bruker modellen. Denne utgangen kan variere avhengig av de spesifikke kravene til applikasjonen, men inkluderer vanligvis de oppdagede objektklassene, avgrensende bokser som skisserer objektene i bildet, og de tilhørende konfidensskårene.
For eksempel, hvis objektgjenkjenningsmodellen er opplært til å oppdage vanlige objekter som biler, fotgjengere og trafikkskilt, kan utdataene fra TensorFlow Lite-tolken inkludere spådommer som "bil" med en avgrensningsboks som spesifiserer plasseringen av bilen i bilde og en konfidensscore som indikerer modellens sikkerhet om prediksjonen.
Utdataene fra TensorFlow Lite-tolken for en maskinlæringsmodell for objektgjenkjenning som behandler en ramme fra et mobilenhetskamera involverer å forhåndsbehandle inndatabildet, sende det gjennom modellen for slutning og gi spådommer om objektene som er tilstede i bildet i et strukturert format egnet for videre behandling av søknaden.
Andre nyere spørsmål og svar vedr EITC/AI/TFF TensorFlow Fundamentals:
- Hvordan kan man bruke et innebygd lag til å automatisk tildele riktige akser for et plott av representasjon av ord som vektorer?
- Hva er hensikten med maksimal pooling i et CNN?
- Hvordan brukes funksjonsutvinningsprosessen i et konvolusjonelt nevralt nettverk (CNN) på bildegjenkjenning?
- Er det nødvendig å bruke en asynkron læringsfunksjon for maskinlæringsmodeller som kjører i TensorFlow.js?
- Hva er TensorFlow Keras Tokenizer API-parameteren for maksimalt antall ord?
- Kan TensorFlow Keras Tokenizer API brukes til å finne de vanligste ordene?
- Hva er TOCO?
- Hva er forholdet mellom en rekke epoker i en maskinlæringsmodell og nøyaktigheten av prediksjon fra å kjøre modellen?
- Produserer pakkens nabo-API i Neural Structured Learning av TensorFlow et utvidet treningsdatasett basert på naturlige grafdata?
- Hva er Pack Neighbors API i Neural Structured Learning av TensorFlow?
Se flere spørsmål og svar i EITC/AI/TFF TensorFlow Fundamentals