Hvordan kan vi visuelt identifisere og fremheve de oppdagede objektene i et bilde ved hjelp av putebiblioteket?

by EITCA Academy / Lørdag, 30 desember 2023 / Publisert i Kunstig intelligens, EITC/AI/GVAPI Google Vision API, Avansert bildeforståelse, Objektdeteksjon, Eksamensgjennomgang

For å visuelt identifisere og fremheve oppdagede objekter i et bilde ved hjelp av Pillow-biblioteket, kan vi følge en trinn-for-trinn-prosess. Pillow-biblioteket er et kraftig Python-bildebibliotek som gir et bredt spekter av bildebehandlingsmuligheter. Ved å kombinere egenskapene til Pillow-biblioteket med objektdeteksjonsfunksjonaliteten til Google Vision API, kan vi oppnå denne oppgaven effektivt.

Her er trinnene for å visuelt identifisere og fremheve oppdagede objekter i et bilde ved hjelp av Pillow-biblioteket:

1. Installer de nødvendige bibliotekene: Begynn med å installere de nødvendige bibliotekene. Installer pute ved å bruke kommandoen `pip install pillow`. I tillegg må du sette opp Google Vision API og installere Google Cloud-klientbiblioteket for Python.

2. Autentiser med Google Vision API: For å bruke Google Vision API må du autentisere applikasjonen din. Følg dokumentasjonen fra Google for å få den nødvendige legitimasjonen.

3. Last inn og analyser bildet: Bruk Pillow-biblioteket til å laste inn bildet du vil analysere. Du kan bruke `Image.open()`-metoden for å åpne bildefilen. Når bildet er lastet inn, konverter det til et format som er kompatibelt med Google Vision API, for eksempel JPEG eller PNG.

4. Send bildet til Google Vision API: Bruk Google Cloud-klientbiblioteket for Python til å sende bildet til Google Vision API for gjenkjenning av objekter. Dette kan gjøres ved å opprette et forespørselsobjekt med bildedataene og kalle den aktuelle metoden, for eksempel `image_annotator_client.object_localization().annotate_image()`.

5. Hent objektdeteksjonsresultatene: Trekk ut objektdeteksjonsresultatene fra svaret mottatt fra Google Vision API. Svaret vil inneholde informasjon om de oppdagede objektene, for eksempel deres avgrensingsbokser, etiketter og konfidenspoeng.

6. Tegn avgrensningsrammer på bildet: Bruk Pillow-biblioteket til å tegne avgrensningsrammer rundt de oppdagede objektene på bildet. Du kan bruke `ImageDraw.Draw()`-metoden for å lage et tegneobjekt, og deretter bruke `draw.rectangle()`-metoden for å tegne avgrensningsboksene.

7. Legg til etiketter og score til bildet: For å forbedre visualiseringen kan du legge til etiketter og konfidenspoeng til bildet. Bruk `draw.text()`-metoden fra Pillow-biblioteket for å overlappe etikettene og partiturene på bildet.

8. Lagre og vis det kommenterte bildet: Lagre det kommenterte bildet ved å bruke `Image.save()`-metoden fra Pillow-biblioteket. Du kan velge ønsket format, for eksempel JPEG eller PNG. Vis eventuelt det kommenterte bildet ved å bruke `Image.show()`-metoden.

Ved å følge disse trinnene kan du visuelt identifisere og fremheve de oppdagede objektene i et bilde ved hjelp av Pillow-biblioteket. Kombinasjonen av de kraftige bildebehandlingsmulighetene til Pillow og objektdeteksjonsfunksjonaliteten til Google Vision API muliggjør effektiv og nøyaktig analyse av bilder.

Eksempel:

python
from PIL import Image, ImageDraw
from google.cloud import vision

# Load and analyze the image
image_path = 'path/to/your/image.jpg'
image = Image.open(image_path)
image_data = image.tobytes()

# Authenticate with the Google Vision API
client = vision.ImageAnnotatorClient.from_service_account_json('path/to/your/credentials.json')

# Send the image to the Google Vision API for object detection
response = client.object_localization(image=vision.Image(content=image_data))
objects = response.localized_object_annotations

# Draw bounding boxes on the image
draw = ImageDraw.Draw(image)
for obj in objects:
    bbox = obj.bounding_poly.normalized_vertices
    draw.rectangle([(bbox[0].x * image.width, bbox[0].y * image.height),
                    (bbox[2].x * image.width, bbox[2].y * image.height)],
                   outline='red', width=3)

    # Add labels and scores to the image
    label = obj.name
    score = obj.score
    draw.text((bbox[0].x * image.width, bbox[0].y * image.height - 15),
              f'{label} ({score:.2f})', fill='red')

# Save and display the annotated image
annotated_image_path = 'path/to/save/annotated_image.jpg'
image.save(annotated_image_path)
image.show()

I dette eksemplet laster og analyserer vi først bildet ved hjelp av Pillow-biblioteket. Deretter autentiserer vi med Google Vision API og sender bildet for objektdeteksjon. Vi henter gjenstandsdeteksjonsresultatene og bruker Pillow-biblioteket til å tegne avgrensningsbokser rundt de oppdagede objektene på bildet. I tillegg legger vi til etiketter og konfidenspoeng til bildet. Til slutt lagrer og viser vi det kommenterte bildet.

Andre nyere spørsmål og svar vedr Avansert bildeforståelse:

Se flere spørsmål og svar i Avansert bildeforståelse

Flere spørsmål og svar:

Field: Kunstig intelligens
program: EITC/AI/GVAPI Google Vision API (gå til sertifiseringsprogrammet)
Lekse: Avansert bildeforståelse (gå til relatert leksjon)
Emne: Objektdeteksjon (gå til relatert emne)
Eksamensgjennomgang

Merket under: Kunstig intelligens, Google Vision API, Bildebehandling, Objektdeteksjon, Putebibliotek, Python

EITCA Academy

Hvordan kan vi visuelt identifisere og fremheve de oppdagede objektene i et bilde ved hjelp av putebiblioteket?

Andre nyere spørsmål og svar vedr Avansert bildeforståelse:

Flere spørsmål og svar:

EITCA Academy er en del av det europeiske rammeverket for IT-sertifisering

Valgbarhet for EITCA Academy 80% EITCI DSJC Subsidie support

EITCA Academy

Logg inn på kontoen din av ditt brukernavn eller e-postadresse

FORGÅ DIN DETALJER?

OPPRETT EN KONTO

Hvordan kan vi visuelt identifisere og fremheve de oppdagede objektene i et bilde ved hjelp av putebiblioteket?

Andre nyere spørsmål og svar vedr Avansert bildeforståelse:

Flere spørsmål og svar:

Valgbarhet for EITCA Academy 80% EITCI DSJC Subsidie ​​support

Valgbarhet for EITCA Academy 80% EITCI DSJC Subsidie support