Google har lansert File Search, et verktøy integrert i Gemini som skal forenkle dokumentbasert bruk av kunstlig intelligens (KI).
File Search er beskrevet som et abstraksjonslag over en hel RAG-pipeline og skal fjerne behovet for å manuelt dele opp, embedde og vektorisere dokumenter før semantisk søk. Verktøyet er implementert som en Tool direkte i Gemini API og håndterer hele datalivet: sikker lagring av opplastede dokumenter, intelligent chunking, generering av embeddings med gemini-embedding-001, indeksering for rask vektorsøk, og innsetting av relevante kontekstbiter i prompten til Gemini. Svar fra modellen inkluderer automatisk grunnlagsmetadata med sitater som viser hvilke dokumenter og deler som ble brukt. File Search støtter en rekke filformater, blant annet PDF, DOCX, TXT, JSON og ulike programmeringsfiler. Google oppgir at lagring og embedding av selve spørringene er gratis, mens embedding av opprinnelig dokumentinnhold kan koste så lavt som $0.15 per 1 million tokens. Google viser også eksempler på bruk via Python-kode og peker på behov for en Gemini API-nøkkel.
Hvorfor relevant for Norge: Funksjonene kan være direkte relevante for norske virksomheter og offentlige etater som trenger semantisk søk og dokumenttilknytning i egne databaser. Temaet berører aktører innen AI Norge og hører naturlig hjemme i AI-nyheter.
Kilde: https://towardsdatascience.com/introducing-googles-file-search-tool | Sammendraget er KI-generert med OpenAI API av Ainy.no
