Uitleg
Tekst-naar-video is stap voorbij tekst-naar-beeld: gegeven een tekstbeschrijving, genereert het model video-sequenties. Dit is veel complexer omdat je temporale coherentie moet behouden.
Modellen als OpenAI's Sora tonen dit het mogelijk is, maar het is nog steeds zeer computationeel duur en niet wijd beschikbaar. De kwaliteit verbetert maar blijft achter bij échte video's.
Tekst-naar-video kan revolutionair zijn voor filmmaking, publiciteit en content-creatie wanneer het rijp is.
⚡ Voorbeelden
- •Sora kan video's genereren van beschrijvingen als "een dame in winterkleding loopt door sneeuwstad"
- •Nog niet openbaar beschikbaar maar tonen mogelijkheden voor film en marketing
- •Grote uitdagingen met bewegings-consistentie en fysica-realisme
Trefwoorden
video-synthesetemporale-generatiemultimodale-aiopkomende-technologie