Chroma har lansert Context-1, en 20B parameter agentisk søkemodell som er spesialdesignet for multi-hop henting. Modellen er utviklet for å håndtere komplekse forespørseler ved å finne relevante dokumenter og overlevere dem til en nedstrøms modell for endelig svar.
Lytt til artikkelen
Få innholdet lest opp med naturlig AI-stemme.
AI-forklart
Hva er Chroma Context-1 og hvordan fungerer den?
Context-1 er en 20 milliarder parameter stor agentisk søkemodell utviklet av Chroma for å håndtere komplekse multi-hop søk. Modellen bryter ned forespørsler i delspørsmål og søker effektivt i store datakilder ved hjelp av en Mixture of Experts-arkitektur. Den har også en funksjon som fjerner irrelevante dokumenter underveis for å opprettholde søkekvaliteten.
- Kort forklart: Context-1 er en spesialisert AI-modell for komplekse søk som bruker flere steg for å hente relevante dokumenter.
- Hvorfor det er relevant: Modellen reduserer kostnader og øker hastigheten på søk i store datamengder, noe som er nyttig for norske utviklere og selskaper.
- Det viktigste å vite: Context-1 bruker en Mixture of Experts-arkitektur og en selvredigerende mekanisme for å forbedre presisjonen i søk med begrenset kontekstvindu.

Chroma Context-1: Optimalisert for multi-hop henting
Context-1 er bygget på gpt-oss-20B, en Mixture of Experts (MoE) arkitektur som er finjustert med Supervised Fine-Tuning (SFT) og Reinforcement Learning (RL). I motsetning til tradisjonelle RAG-systemer, som ofte opplever høy latens og kostnader ved å håndtere store mengder data, er Context-1 designet for å bryte ned forespørselen i målrettede delspørsmål og utføre flere verktøykall samtidig. Dette gjør at modellen kan søke effektivt i store datakilder.
En av de mest bemerkelsesverdige funksjonene i Context-1 er Self-Editing Context, som tillater modellen å fjerne irrelevante dokumenter underveis i søket. Dette reduserer såkalt ‘context rot’ og opprettholder høy kvalitet på henting selv med begrenset kontekstvindu. Chroma har også utviklet et verktøy for å generere syntetiske multi-hop oppgaver, kalt context-1-data-gen, som sikrer at modellen blir testet på komplekse resonneringsoppgaver i ulike domener som finans og patenter.
Hva skjer videre?
AIny kort vurdering: Context-1 gir norske utviklere mulighet til å implementere mer effektive AI-løsninger for komplekse søk. Den reduserte kostnaden og økte hastigheten kan være avgjørende for norske selskaper som ønsker å utnytte AI-teknologi. Med denne modellen kan man forvente mer presise resultater i datadrevne prosjekter, noe som kan styrke konkurranseevnen i det nordiske markedet.
Kilde: Marktechpost
Les denne saken også på engelsk
Read in EnglishLes også: Bluesky lanserer Attie, en AI-app for tilpassede strømmer

