Tekst-naar-Beeld

AI-taak waarbij afbeeldingen worden gegenereerd op basis van tekstbeschrijvingen.

Uitleg

Tekst-naar-beeld (text-to-image) is het genereren van afbeeldingen gegeven textuelle beschrijvingen. Het combineert NLP (tekstbegrip) met generatieve modellen (afbeeldingsopbouw).

Modellen gebruiken embedding-ruimten waar woorden en afbeeldings-features op dezelfde manier worden gerepresenteerd. Dit stelt het model in staat afbeeldingen te creëren die tekstbeschrijvingen matchen.

Tekst-naar-beeld heeft explosief groeien de afgelopen jaren. Het is grondslag van systemen als DALL-E, Midjourney en Stable Diffusion.

Voorbeelden

  • Bedrijven gebruiken tekst-naar-beeld voor snelle prototyping van product-designs
  • Contentmakers gebruiken het voor illustrations die anderszins duur zou zijn
  • Onderzoekers gebruiken het om concepten visueel uit te drukken

Trefwoorden

cross-modal-generatiecreatieve-synthesemultimodale-aicontrole

Gerelateerde termen

Over deze term

Wat is Tekst-naar-Beeld?

AI-taak waarbij afbeeldingen worden gegenereerd op basis van tekstbeschrijvingen.