Anthropic‑modellen Sonnet 4.5 genererte Python-kode for et geometrisk punktgitter på fem sekunder, mens GPT‑4o året før brukte rundt to timer og mer enn 40 iterasjoner for å komme fram til en fungerende løsning.
Puslespillet handler om et kryssformet rutenett med punkter (to øverste rader med 2 punkter, to midtrader med 6 punkter, to nederste rader med 2 punkter) og spørsmålet er hvor mange ulike kvadrater som kan trekkes med hjørnene på disse punktene; forfatteren oppgir svaret 21 kvadrater. GPT‑4o klarte etter mye veiledning å frambringe en korrekt Python‑basert løsning. Sonnet 4.5, som omtales som et av de ledende kodemodellene fra Anthropic, ga først et direkte svar som inneholdt feil (først total 18, deretter korrigert til 17), men genererte deretter Python‑kode i løpet av cirka fem sekunder.
Dette er relevant for norske utviklere og forskere som følger kunstlig intelligens (KI), og for AI-nyheter fordi det illustrerer hvordan nye modeller raskt forbedrer evnen til å skrive fungerende kode.
Kilde: https://towardsdatascience.com/this-puzzle-shows-just-how-far-llms-have-progressed-in-little-over-a-year | Sammendraget er KI-generert med OpenAI API av Ainy.no