DeepMind lanserer Gemini Robotics for fysisk resonnering

Google DeepMind presenterer Gemini Robotics, to modeller som gir roboter avansert fysisk resonnering og handling.

Systemet består av Gemini Robotics‑ER 1.5, en vision‑language‑modell (VLM) for planlegging og resonnering som kan hente data via digitale verktøy, og Gemini Robotics 1.5 (Vision‑Language‑Action), som omsetter planer til motoriske kommandoer med en intern resonneringssløyfe og løpende justeringer. I AI-nyheter fra DeepMind beskrives systemet som bygget på Gemini foundation models og et nytt steg innen kunstlig intelligens (KI) for fysiske agenter. Bevegelsesstrategier lært på Aloha 2 kan overføres til andre plattformer som Apollo og Franka. ER 1.5 oppnår toppresultater på 15 akademiske benchmarks, og begge modellene har semantiske og fysiske sikkerhetsmekanismer; ER 1.5 er tilgjengelig via Google AI Studio, mens VLA 1.5 er hos utvalgte partnere. Relevans for Norge: teknologien kan være aktuell for norske forsknings- og industrimiljøer som jobber med robotikk.

Kilde: https://qudata.com/en/news/advanced-ai-physical-reasoning-and-action | Sammendraget er KI-generert med OpenAI API av Ainy.no