Bedrifter må planlegge målemetoder og risiko før de bygger kunstlig intelligens (KI)-løsninger.
Før utvikling bør man klart definere hva KI-løsningen skal oppnå og hvordan suksess ser ut. Dette innebærer å bryte ned målet i konkrete KPIer og planlegge hvordan disse skal måles, i stedet for å basere seg på tilfeldige tilbakemeldinger. Testscenarier må velges med tanke på hvilke brukssituasjoner som er viktige, og kjøres nok ganger til å gi et statistisk grunnlag. Å sette mål og målestandarder før arbeidet begynner reduserer risikoen for at man i etterkant velger lett målbare eller oppnåelige metrikker. Begrepet målingsvaliditet handler om å måle det som faktisk betyr noe, ikke bare det som er billig å måle. For løsninger basert på store språkmodeller er det også vesentlig å avklare risikotoleranse tidlig, fordi slike modeller kan gi ikke-deterministiske og av og til uventede svar.
Dette er relevant for norske bedrifter som vurderer KI i produkter eller tjenester, og for AI-nyheter om hvordan prosjekter bør evalueres for å sikre verdi for kunder og virksomhet.
Kilde: https://towardsdatascience.com/advance-planning-for-ai-project-evaluation | Sammendraget er KI-generert med OpenAI API og kvalitetssikret av redaksjonen i Ainy.no
