Adobe presenterte nye Firefly-verktøy som genererer tale og lydspor på Max-konferansen.
I Firefly, Adobes hub for kunstlig intelligens (KI), lanserte selskapet nye AI-drevne lydverktøy tilgjengelige i beta: Generate speech og Generate soundtrack. Generate speech lar brukere laste opp manus på opptil 7 500 tegn eller skrive direkte, velge blant 50 stemmer med alder- og kjønnsmerking (inkludert ikke-binære alternativer) og 20 språk, samt legge inn pauser, toneendringer og fonetisk uttale for å rette navn; ElevenLabs’ flerspråklige V2-modell tilbys også som alternativ. Generate soundtrack gir musikk med universell lisens for ubegrenset bruk, avviser forespørsler som nevner artister av opphavsrettshensyn, analyserer videoer opptil fem minutter og foreslår et «Mad Libs»-prompt med stemning, sjanger og formål før den genererer fire musikalske varianter på under to minutter. Adobe introduserte også Firefly Image Model 5, prompt-basert redigering, en multitrack videotidslinje, partnerskap med Topaz Labs, og mulighet for egne tilpassede modeller.
Dette er relevant for norske innholdsprodusenter, småbedrifter, mediehus og utdanningsinstitusjoner som bruker digitale verktøy i produksjon, fordi løsningene kan forenkle stemmeopptak, musikklisensiering og arbeidsflyt; dette er betydelige AI-nyheter.
Kilde: https://cnet.com/tech/services-and-software/adobe-turns-up-the-volume-on-ai-with-new-ways-to-generate-soundtracks-and-audio | Sammendraget er KI-generert med OpenAI API av Ainy.no