Amazon beskriver en arbeidsflyt for å finjustere Nova-modeller og bruke on-demand inferens for forbedret strukturert dokumentuttrekk.
Multimodal finjustering tilpasser visuelle LLM-er til oppgaver som krever både bilde- og tekstforståelse, fordi standardmodeller ofte ikke treffer på spesialiserte dokumenter. Et vanlig bruksområde er dokumentbehandling med ekstraksjon av strukturerte data fra komplekse oppsett som fakturaer, bestillingsskjemaer og skatteblanketter; artikkelen viser et praktisk eksempel med tax form data extraction og et åpent GitHub-eksempel som dekker dataforberedelse til produksjonsdistribusjon. Amazon Bedrock tilbyr on-demand inferens med pay-per-token for Nova, slik at tilpasning kan gi bedre nøyaktighet samtidig som betalingsmodell forblir pay-as-you-go. For dokumentuttrekk beskrives tre hovedtilnærminger: zero-shot prompting, few-shot prompting og finjustering. Tilpasningsmetoder inkluderer parameter-effektiv finjustering (PEFT) eller full finjustering, samt distillasjon for å lage mindre modeller. Annotering kan automatiseres ved bruk av historiske ERP-data (for eksempel SAP), manuelt utføres eller støttes av en lærer-modell. Teknikkene gjelder for anvendelser av kunstlig intelligens (KI) i dokumentarbeidsflyter.
AI nyheter: Metodene for automatisk annotering fra ERP som SAP og modelltilpasning er direkte anvendelige for norske virksomheter som håndterer fakturaer, skjemaer og andre strukturerte dokumenter.
Kilde: https://aws.amazon.com/blogs/machine-learning/optimizing-document-ai-and-structured-outputs-by-fine-tuning-amazon-nova-models-and-on-demand-inference | Sammendraget er KI-generert med OpenAI API av Ainy.no
