Uitleg
Tekst-naar-beeld (text-to-image) is het genereren van afbeeldingen gegeven textuelle beschrijvingen. Het combineert NLP (tekstbegrip) met generatieve modellen (afbeeldingsopbouw).
Modellen gebruiken embedding-ruimten waar woorden en afbeeldings-features op dezelfde manier worden gerepresenteerd. Dit stelt het model in staat afbeeldingen te creëren die tekstbeschrijvingen matchen.
Tekst-naar-beeld heeft explosief groeien de afgelopen jaren. Het is grondslag van systemen als DALL-E, Midjourney en Stable Diffusion.
⚡ Voorbeelden
- •Bedrijven gebruiken tekst-naar-beeld voor snelle prototyping van product-designs
- •Contentmakers gebruiken het voor illustrations die anderszins duur zou zijn
- •Onderzoekers gebruiken het om concepten visueel uit te drukken
Trefwoorden
cross-modal-generatiecreatieve-synthesemultimodale-aicontrole