Hastighet

Amazon beskriver hvordan stemme‑AI-modellen Nova Sonic kan integreres med telefoni for sanntids, naturlige samtaler.

Amazon Nova Sonic er en tale‑til‑tale generativmodell for kunstlig intelligens (KI) som tilbyr lav latenstid, naturlig taleturtaking, forståelse av ulike aksenter og uttrykksfulle stemmer, og håndterer avbrytelser. Modellen er tilgjengelig gjennom Amazon Bedrock sitt bidireksjonale streaming‑API og kan kobles til bedriftsdata og eksterne verktøy. Vanlige brukstilfeller er automatiserte kundesenter, AI‑resepsjonister og utgående påminnelser/kampanjer. For SIP‑infrastruktur kreves en applikasjonsserver som håndterer SIP‑signalering og RTP‑mediestrømmer og opprettholder en streaming‑tilkobling til Nova Sonic; eksempelimplementasjoner finnes i Java (mjSIP) og JavaScript (SIP.js). Lyd flyter bidireksjonalt mellom RTP og Nova Sonic, med anbefalte porter for SIP (5060) og RTP (typisk 10000–20000). Distribusjon kan skje på EC2 eller med containerisering på ECS, og tilgang krever riktige IAM‑tillatelser. Integrasjoner med Vonage, Twilio, Genesys og Amazon Connect gir alternativer uten full teleinfrastruktur. I AI-nyheter omtales spesielt Vonages direkte integrasjon som forenkler koblingen mellom samtaler og Nova Sonic.

Løsningen er relevant for norske virksomheter som benytter skybaserte telefontjenester og kundesenterdrift, og berører aktører i AI Norge som arbeider med talebaserte kundeløsninger.

Kilde: https://aws.amazon.com/blogs/machine-learning/building-ai-powered-voice-applications-amazon-nova-sonic-telephony-integration-guide | Sammendraget er KI-generert med OpenAI API og kvalitetssikret av redaksjonen i Ainy.no

Les også:

Google lanserer Interactions API for mer strukturert KI

Relatert AI Nyheter