For å programmatisk trekke ut etiketter fra bilder ved hjelp av Python og Vision API, kan du utnytte de kraftige egenskapene til Google Cloud Vision API. Vision API gir et omfattende sett med bildeanalysefunksjoner, inkludert etikettdeteksjon, som lar deg identifisere og trekke ut etiketter fra bilder automatisk.
For å komme i gang må du sette opp et Google Cloud-prosjekt og aktivere Vision API. Når du har gjort det, kan du installere de nødvendige Python-bibliotekene ved å kjøre følgende kommando:
python pip install google-cloud-vision
Deretter må du autentisere applikasjonen din for å få tilgang til Vision API. Du kan gjøre dette ved å opprette en tjenestekontonøkkel og sette miljøvariabelen `GOOGLE_APPLICATION_CREDENTIALS` til å peke på banen til nøkkelfilen. Dette kan gjøres ved å bruke følgende kode:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Nå kan du bruke Vision API til å programmatisk trekke ut etiketter fra bilder. Følgende kodebit viser hvordan du gjør dette:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
I denne koden lager vi først en forekomst av `ImageAnnotatorClient`-klassen fra `google.cloud.vision`-biblioteket. Vi leser deretter bildefilen, lager et "Bilde"-objekt fra filinnholdet og sender det til Vision API for etikettdeteksjon. API-svaret inneholder en liste over etikettkommentarer, som vi trekker ut beskrivelsene av etikettene fra.
Du kan nå kalle "extract_labels" funksjonen ved å sende stien til bildefilen du vil analysere. Det vil returnere en liste over etiketter hentet fra bildet.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Dette vil sende ut de utpakkede etikettene fra bildet.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API bruker avanserte maskinlæringsmodeller for å analysere bilder og identifisere objekter, scener og andre visuelle funksjoner. Den kan nøyaktig oppdage et bredt spekter av etiketter, noe som gjør det til et verdifullt verktøy for ulike applikasjoner som bildeklassifisering, innholdsmoderering og visuelt søk.
For å programmatisk trekke ut etiketter fra bilder ved hjelp av Python og Vision API, må du sette opp et Google Cloud-prosjekt, aktivere Vision API, installere de nødvendige Python-bibliotekene, autentisere applikasjonen din og deretter bruke Vision API til å utføre etikettdeteksjon på Bilder. De utpakkede etikettene kan brukes til videre analyse eller for å forbedre forståelsen av bildeinnholdet.
Andre nyere spørsmål og svar vedr EITC/AI/GVAPI Google Vision API:
- Hva er noen forhåndsdefinerte kategorier for objektgjenkjenning i Google Vision API?
- Aktiverer Google Vision API ansiktsgjenkjenning?
- Hvordan kan visningsteksten legges til bildet når man tegner objektkanter ved hjelp av "draw_vertices"-funksjonen?
- Hva er parametrene til "draw.line"-metoden i den medfølgende koden, og hvordan brukes de til å tegne linjer mellom verdier for hjørner?
- Hvordan kan putebiblioteket brukes til å tegne objektgrenser i Python?
- Hva er formålet med "draw_vertices"-funksjonen i den angitte koden?
- Hvordan kan Google Vision API hjelpe til med å forstå former og objekter i et bilde?
- Hvordan kan brukere utforske visuelt like bilder anbefalt av API?
- Hva er de forskjellige elementene i responsobjektet til Google Vision APIs nettdeteksjonsfunksjon?
- Hvordan hjelper Web Detection-funksjonen til å generere tagger for opplastede bilder?
Se flere spørsmål og svar i EITC/AI/GVAPI Google Vision API