Hvordan får du tilgang til den utpakkede teksten fra et bilde ved hjelp av Google Vision API?

by EITCA Academy / Onsdag 27 desember 2023 / Publisert i Kunstig intelligens, EITC/AI/GVAPI Google Vision API, Forståelse av tekst i visuelle data, Oppdage og trekke ut tekst fra håndskrift, Eksamensgjennomgang

For å få tilgang til den utpakkede teksten fra et bilde ved hjelp av Google Vision API, kan du følge en rekke trinn som involverer bruk av funksjonene for optisk tegngjenkjenning (OCR) til API. OCR-teknologien i Google Vision API gjør det mulig å oppdage og trekke ut tekst fra bilder, inkludert håndskrift. Denne funksjonaliteten er spesielt nyttig i applikasjoner som krever analyse og forståelse av tekstinformasjon som finnes i visuelle data.

For det første må du sette opp det nødvendige miljøet for å jobbe med Google Vision API. Dette innebærer å opprette et prosjekt i Google Cloud Console, aktivere Vision API og skaffe den nødvendige autentiseringslegitimasjonen som en API-nøkkel eller tjenestekontonøkkel.

Når miljøet ditt er satt opp, kan du bruke Vision APIs `asyncBatchAnnotateFiles`-metode for å utføre OCR på en bildefil. Denne metoden lar deg sende en liste over bildefiler for behandling og motta resultatene asynkront. Alternativt kan du bruke `asyncBatchAnnotateImages`-metoden for å behandle en liste med bilder direkte.

For å trekke ut tekst fra et bilde, må du opprette en forekomst av `AnnotateImageRequest`-objektet og spesifisere de ønskede funksjonene. I dette tilfellet vil du sette "TEXT_DETECTION"-funksjonen for å indikere at du vil trekke ut tekst fra bildet. Du kan også spesifisere tilleggsparametere som språkhintet for å forbedre nøyaktigheten til OCR.

Deretter må du kode bildefilen inn i en base64-kodet streng og lage en forekomst av "Image"-objektet ved å bruke de kodede bildedataene. Dette `Image`-objektet bør legges til `AnnotateImageRequest`-objektet som ble opprettet tidligere.

Etter å ha satt opp forespørselen, kan du sende den til Vision API ved å bruke `batchAnnotateImages`- eller `batchAnnotateFiles`-metoden, avhengig av din valgte tilnærming. API-en vil behandle bildet og returnere et svar som inneholder den utpakkede teksten.

For å få tilgang til den utpakkede teksten fra svaret, kan du iterere over `textAnnotations`-feltet til `AnnotateImageResponse`-objektet. Dette feltet inneholder en liste over "EntityAnnotation"-objekter, som hver representerer et oppdaget tekstelement i bildet. `Description`-feltet til hvert `EntityAnnotation`-objekt inneholder den utpakkede teksten.

Her er en eksempelkodebit i Python som viser hvordan du får tilgang til den utpakkede teksten fra et bilde ved hjelp av Google Vision API:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

I dette eksemplet tar «extract_text_from_image»-funksjonen banen til en bildefil som input og bruker Google Cloud Vision-klientbiblioteket til å sende en forespørsel til Vision API. Den utpakkede teksten skrives deretter ut.

For å få tilgang til den utpakkede teksten fra et bilde ved hjelp av Google Vision API, må du sette opp miljøet, opprette et `AnnotateImageRequest`-objekt med de ønskede funksjonene, kode bildefilen, sende forespørselen til API-en og hente den utpakkede teksten fra svaret. OCR-funksjonene til Vision API gjør det mulig å oppdage og trekke ut tekst fra bilder, inkludert håndskrift.

Andre nyere spørsmål og svar vedr Oppdage og trekke ut tekst fra håndskrift:

Flere spørsmål og svar:

Field: Kunstig intelligens
program: EITC/AI/GVAPI Google Vision API (gå til sertifiseringsprogrammet)
Lekse: Forståelse av tekst i visuelle data (gå til relatert leksjon)
Emne: Oppdage og trekke ut tekst fra håndskrift (gå til relatert emne)
Eksamensgjennomgang

Merket under: Kunstig intelligens, Google Cloud Vision API, Bildebehandling, OCR, Optical Character Recognition, Tekstutvinning

EITCA Academy

Hvordan får du tilgang til den utpakkede teksten fra et bilde ved hjelp av Google Vision API?

Andre nyere spørsmål og svar vedr Oppdage og trekke ut tekst fra håndskrift:

Flere spørsmål og svar:

EITCA Academy er en del av det europeiske rammeverket for IT-sertifisering

Valgbarhet for EITCA Academy 80% EITCI DSJC Subsidie support

EITCA Academy

Logg inn på kontoen din av ditt brukernavn eller e-postadresse

FORGÅ DIN DETALJER?

OPPRETT EN KONTO

Hvordan får du tilgang til den utpakkede teksten fra et bilde ved hjelp av Google Vision API?

Andre nyere spørsmål og svar vedr Oppdage og trekke ut tekst fra håndskrift:

Flere spørsmål og svar:

Valgbarhet for EITCA Academy 80% EITCI DSJC Subsidie ​​support

Valgbarhet for EITCA Academy 80% EITCI DSJC Subsidie support