AutoML Tables er et kraftig maskinlæringsverktøy levert av Google Cloud som lar brukere bygge og distribuere maskinlæringsmodeller uten behov for omfattende programmerings- eller datavitenskapsekspertise. Den automatiserer prosessen med funksjonsutvikling, modellvalg, hyperparameterinnstilling og modellevaluering, og gjør den tilgjengelig for brukere med varierende nivåer av maskinlæringskunnskap.
Når det gjelder datatyper, kan AutoML Tables håndtere et bredt spekter av strukturerte datatyper. Strukturerte data refererer til data som er organisert i et tabellformat, med rader som representerer forekomster eller eksempler og kolonner som representerer funksjoner eller variabler. AutoML Tables kan håndtere både numeriske og kategoriske datatyper, slik at brukere kan jobbe med ulike datasett.
1. Numeriske data: AutoML Tables støtter ulike numeriske datatyper, inkludert heltall og flyttall. Disse datatypene er egnet for å representere kontinuerlige eller diskrete numeriske verdier. For eksempel, hvis vi har et datasett med boligpriser, vil priskolonnen bli representert som en numerisk datatype.
2. Kategoriske data: AutoML Tables støtter også kategoriske datatyper, som representerer diskrete verdier som faller inn i bestemte kategorier. Kategoriske data kan videre deles inn i to undertyper:
en. Nominelle data: Nominelle data representerer kategorier som ikke har noen iboende rekkefølge eller hierarki. Hvis vi for eksempel har et datasett med tilbakemeldinger fra kunder, kan sentimentkolonnen ha kategorier som «positiv», «nøytral» og «negativ». AutoML Tables kan håndtere slike nominelle kategoriske data.
b. Ordinaldata: Ordinaldata representerer kategorier som har en bestemt rekkefølge eller hierarki. Hvis vi for eksempel har et datasett med filmvurderinger, kan vurderingskolonnen ha kategorier som «dårlig», «rettferdig», «bra» og «utmerket». AutoML Tables kan håndtere slike ordinære kategoriske data og ta hensyn til rekkefølgen på kategoriene under modelltrening.
3. Tekstdata: AutoML Tables gir også støtte for tekstdata. Tekstdata er vanligvis ustrukturerte og krever forhåndsbehandling for å konvertere dem til et strukturert format som er egnet for maskinlæring. AutoML Tables kan håndtere tekstdata ved å bruke teknikker som tekstinnbygging eller pose-of-word-representasjon. Hvis vi for eksempel har et datasett med kundeanmeldelser, kan anmeldelsesteksten transformeres til numeriske funksjoner ved hjelp av teknikker som ordinnbygging, som deretter kan brukes av AutoML Tables for modelltrening.
4. Tidsseriedata: AutoML Tables kan håndtere tidsseriedata, som er data samlet over en sekvens av tidsintervaller. Tidsseriedata er ofte påtruffet i forskjellige domener som finans, værvarsling og aksjemarkedsanalyse. AutoML Tables kan håndtere tidsseriedata ved å inkorporere tidsrelaterte funksjoner som tidsstempler og etterslepende variabler.
AutoML-tabeller kan håndtere et bredt spekter av strukturerte datatyper, inkludert numeriske, kategoriske (både nominelle og ordinære), tekst- og tidsseriedata. Denne allsidigheten lar brukere utnytte kraften til AutoML Tables for et mangfoldig sett med maskinlæringsoppgaver på tvers av forskjellige domener.
Andre nyere spørsmål og svar vedr AutoML-tabeller:
- Hvordan kan man bytte mellom Vertex AI og AutoML-tabeller?
- Hvorfor ble AutoML Tables avviklet, og hva følger etter dem?
- Hvordan kan brukere distribuere modellen sin og få spådommer i AutoML-tabeller?
- Hvilke alternativer er tilgjengelige for å angi et treningsbudsjett i AutoML Tables?
- Hvilken informasjon gir kategorien Analyser i AutoML-tabeller?
- Hvordan kan brukere importere treningsdataene sine til AutoML-tabeller?