Tekst-naar-Beeld

Q: Wat is Tekst-naar-Beeld?

AI-taak waarbij afbeeldingen worden gegenereerd op basis van tekstbeschrijvingen.

Uitleg

Tekst-naar-beeld (text-to-image) is het genereren van afbeeldingen gegeven textuelle beschrijvingen. Het combineert NLP (tekstbegrip) met generatieve modellen (afbeeldingsopbouw).

Modellen gebruiken embedding-ruimten waar woorden en afbeeldings-features op dezelfde manier worden gerepresenteerd. Dit stelt het model in staat afbeeldingen te creëren die tekstbeschrijvingen matchen.

Tekst-naar-beeld heeft explosief groeien de afgelopen jaren. Het is grondslag van systemen als DALL-E, Midjourney en Stable Diffusion.

⚡ Voorbeelden

•Bedrijven gebruiken tekst-naar-beeld voor snelle prototyping van product-designs
•Contentmakers gebruiken het voor illustrations die anderszins duur zou zijn
•Onderzoekers gebruiken het om concepten visueel uit te drukken

Trefwoorden

cross-modal-generatiecreatieve-synthesemultimodale-aicontrole

Gerelateerde termen

Gerelateerde begrippen

Image Generation, Multimodaal Model, Diffusiemodel

Uitleg

⚡ Voorbeelden

Trefwoorden

Gerelateerde termen

Gerelateerde begrippen

Over deze term

Wat is Tekst-naar-Beeld?