GUIDE · GOOGLE AI API
Google AI API: Bygg med Gemini
Komplett guide til Google AI API (Gemini API) for utviklere. Lær oppsett, autentisering, modellvalg og priser. Bygg AI-applikasjoner med multimodal input, grounding og context caching.
Hva er Google AI API?
Google AI API er Googles utviklerplattform for Gemini-modellene. Mens Gemini-appen på gemini.google.com er et ferdig chatprodukt, gir API-et deg direkte tilgang til modellene som programmerbare byggesteiner. Du kan sende tekst, bilder, video og lyd til modellene og bygge helt egne applikasjoner med AI-funksjonalitet. Alt fra smarte chatboter og dokumentanalyseverktøy til bildeklassifisering og kodegeneratorer.
Hovedportalen for utviklere er ai.google.dev. Her finner du dokumentasjon, hurtigstartguider, referanser og kodeeksempler for alle Gemini-modellene. Google AI Studio på aistudio.google.com er det visuelle grensesnittet der du kan teste modellene direkte i nettleseren, eksperimentere med ulike parametere og generere API-nøkler uten å skrive en eneste linje kode.
Det er viktig å forstå forskjellen mellom Google AI API og Vertex AI. Google AI API (via ai.google.dev) er designet for utviklere og startups som vil komme raskt i gang. Det er enkelt oppsett med API-nøkler og et sjønerøst gratisnivå. Vertex AI (via Google Cloud) er enterpriseplattformen med IAM-basert tilgangsstyring, VPC-nettverk, SLA-er og compliance-sertifiseringer. Modellene er de samme, men infrastrukturen rundt er forskjellig. For de aller fleste som starter ut, er Google AI API det riktige valget.
Oppsett og autentisering
Det første du trenger er en API-nøkkel. Gå til aistudio.google.com, logg inn med Google-kontoen din, og klikk på "Get API key". Du kan opprette en nøkkel knyttet til et nytt eller eksisterende Google Cloud-prosjekt. Hele prosessen tar under ett minutt, og du trenger ikke legge inn betalingsinformasjon for å bruke gratisnivået.
Når du har nøkkelen, installerer du den offisielle SDK-en. For JavaScript og TypeScript kjører du "npm install @google/genai". For Python bruker du "pip install google-genai". Google lanserte disse nye, forenklede SDK-pakkene i 2025, og de har erstattet de eldre pakkene @google/generative-ai og google-generativeai. De nye pakkene har et renere API med bedre støtte for streaming, function calling og multimodal input.
Beste praksis er å lagre API-nøkkelen som en miljøvariabel. Opprett en .env-fil med linjen GOOGLE_AI_API_KEY=din-nøkkel-her, og legg .env i .gitignore slik at nøkkelen ikke havner på GitHub. I koden leser du nøkkelen med process.env.GOOGLE_AI_API_KEY. I produksjon bruker du hemmelighetshåndtering i skyplattformen din, som Vercel Environment Variables eller Google Cloud Secret Manager.
Hvis du senere trenger enterprise-funksjoner som finkornet tilgangsstyring eller dataisolering, kan du migrere til Vertex AI uten å endre modellkallene. SDK-en støtter begge backends, så overgangen er smertefri.
Ditt første API-kall med Gemini
Her er et enkelt eksempel i JavaScript. Først importerer du GoogleGenAI fra @google/genai. Så oppretter du en klientinstans med API-nøkkelen din. Deretter kaller du client.models.generateContent med modellnavnet, for eksempel "gemini-2.5-flash", og en tekstprompt. Svaret finner du i response.text. Det er bokstavelig talt fire linjer kode for å få et svar fra en av verdens mest avanserte AI-modeller.
For streaming, som gir en mye bedre brukeropplevelse i sanntidsapplikasjoner, bruker du generateContentStream i stedet. Da får du svaret chunk for chunk etter hvert som modellen genererer det, i stedet for å vente på hele teksten. Dette er spesielt viktig for chatboter og interaktive grensesnitt der brukeren ser teksten bygge seg opp i sanntid.
Et viktig konsept er tokens. En token er omtrent tre til fire tegn på norsk. Både det du sender inn og det modellen svarer med telles. Gemini-modellene har ekstremt store kontekstvinduer. Gemini 2.5 Pro støtter opptil en million tokens input, noe som betyr at du kan sende med hundrevis av sider med dokumenter i en enkelt forespørsel. Hold system-instruksjonen konsis og bruk maxOutputTokens-parameteren for å kontrollere lengden på svarene.
Du kan også sende med en systemInstruction-parameter som setter konteksten for samtalen, tilsvarende system-meldingen i OpenAI API. Bruk den til å definere chatbotens personlighet, språk og oppførsel. For eksempel: "Du er en norskspraklig kundeserviceassistent for Nettbutikken AS. Svar alltid høflig og konsist."
Modeller og priser
Gemini 2.5 Pro er flaggskipmodellen og en av de sterkeste AI-modellene på markedet i 2026. Den utmerker seg på kompleks resonnering, koding, matematikk og analyse av store dokumenter. Med et kontekstvindu på en million tokens kan den behandle enorme mengder informasjon. I gratisnivået får du et begrenset antall forespørsler per dag. I betalingsnivået koster den 1,25 dollar per million input-tokens og 10 dollar per million output-tokens for forespørsler under 200 000 tokens.
Gemini 2.5 Flash er den raske og kostnadseffektive modellen. Den er designet for oppgaver som krever høy gjennomstrømming og lav latens, som sanntidschat, klassifisering og enklere tekstbehandling. Flash-modellen har også resonneringsevner via en "thinking"-modus og støtter en million tokens kontekst. Prisen er betydelig lavere: 0,15 dollar per million input-tokens og 0,60 dollar per million output-tokens i standardmodus. Dette gjør den til en av de billigste avanserte modellene på markedet.
Det som gjør Google AI API spesielt attraktivt for utviklere er det sjønerøse gratisnivået. Du kan bruke både Gemini 2.5 Pro og Flash helt gratis, med begrensninger på antall forespørsler per minutt og per dag. For hobbyprosjekter, prototyping og små applikasjoner er gratisnivået ofte mer enn nok. Ingen andre store AI-leverandører tilbyr like kraftige modeller uten krav om betalingsinformasjon.
Google tilbyr også Gemini 2.0 Flash for de som trenger en ekstra rask modell, samt eldre modeller som Gemini 1.5 Pro og Flash til reduserte priser. Embeddings-modellen text-embedding-004 er tilgjengelig for vektorsøk og RAG-løsninger. Du finner oppdatert prisinformasjon på ai.google.dev/pricing.
Avanserte funksjoner
Multimodal input er der Gemini virkelig skiller seg ut. Du kan sende bilder, video, lyd og PDF-er direkte i API-kallet sammen med tekst. Last opp et bilde og be modellen beskrive det, analyser en video og få en oppsummering, eller send en lydfil og få en transkripsjon. Gemini kan også behandle flere modaliteter samtidig. For eksempel kan du sende et bilde av en kvittering sammen med teksten "trekk ut beløpet og datoen" og få strukturert data tilbake.
Grounding med Google Søk er en kraftig funksjon som lar Gemini hente fersk informasjon fra nettet for å underbygge svarene sine. Når du aktiverer grounding, vil modellen automatisk søke på Google når det er relevant, og inkludere referanser i svaret. Dette reduserer hallusinasjoner dramatisk og gjør modellen nyttig for spørsmål om aktuelle hendelser, priser og annen informasjon som endrer seg ofte. Ingen andre store API-leverandører har like tett integrasjon mellom søkemotor og AI-modell.
Context caching lar deg lagre store mengder kontekst som du bruker gjentatte ganger, slik at du slipper å sende det på nytt med hver forespørsel. Hvis du for eksempel har et stort dokument som mange brukere stiller spørsmål om, kan du cache dokumentet én gang og bare betale for input-tokens den første gangen. Etterfølgende forespørsler mot den cachede konteksten er betydelig billigere. Dette er uvurderlig for RAG-løsninger og dokumentanalyse i stor skala.
Code execution er en innebygd funksjon der Gemini kan skrive og kjøre Python-kode for å løse oppgaver som krever beregninger, dataanalyse eller visualisering. Modellen genererer kode, kjører den i et sandkassemiljø, og returnerer resultatet. Dette er spesielt nyttig for matematiske problemer, databehandling og generering av grafer. I tillegg støtter API-et function calling for å la modellen samhandle med dine egne systemer og API-er, på samme måte som OpenAI sin function calling.
Google AI API vs. OpenAI vs. Anthropic
De tre store API-leverandørene har ulike styrker, og valget avhenger av hva du bygger. Google AI API skinner med multimodal input, det enorme kontekstvinduet på en million tokens, grounding med Google Søk, og det sjønerøse gratisnivået. Hvis du trenger å analysere store dokumenter, behandle video og lyd, eller bygge en prototype uten å betale noe som helst, er Gemini det naturlige valget.
OpenAI API har det største økosystemet og flest tredjepartsintegrasjoner. GPT-5 og o3-modellene er sterke på resonnering og koding, og function calling og structured outputs er velmodne funksjoner. OpenAI har også det største utviklerfellesskapet, så du finner flest eksempler, guider og biblioteker. Velg OpenAI hvis du trenger det bredeste økosystemet og de mest kamptestede API-ene.
Anthropic API med Claude-modellene er kjent for nøyaktighet, sikkerhet og lange kontekstvinduer. Claude er spesielt sterk på koding, analyse og oppgaver som krever forsiktig resonnering. Anthropic fokuserer tungt på AI-sikkerhet, noe som gir trygge og pålitelige svar. Velg Anthropic hvis nøyaktighet og sikkerhet er toppprioritet.
En smart strategi er å ikke låse seg til én leverandør. Vercel AI SDK (ai-sdk.dev) lar deg bytte mellom Google, OpenAI og Anthropic med én linje kode. Start med Google AI API for prototyping takket være gratisnivået, test med flere leverandører for å finne den beste modellen for din spesifikke oppgave, og optimaliser prisen i produksjon. Alle tre plattformene forbedrer seg raskt, så det som er best i dag kan endre seg i morgen.