Image Captioning

AI-taak waarbij automatisch beschrijvende tekst voor afbeeldingen wordt gegenereerd.

Uitleg

Image captioning is het genereren van tekstuele beschrijvingen van afbeeldingen. Het combineert computer vision (begrijpen wat in de afbeelding staat) met natural language processing (werken wat daarover te zeggen).

Moderne image captioning gebruikmaakt van architecturen die afbeeldingen analyseren (via CNN) en vervolgens tekst genereren (via RNN of transformer). Het model leert associaties tussen visuele elementen en woorden.

Image captioning heeft veel praktische toepassingen: het helpt blinden afbeeldingen te beschrijven, verbetert SEO van websites en ondersteunt content creation.

Voorbeelden

  • Een model beschrijft een afbeelding als: "Een bruine hond speelt in het park op een zonnige dag"
  • Alt-tekst generators gebruiken image captioning om websites toegankelijker te maken
  • Sociale media platforms gebruiken het om afbeelding-zoeken te verbeteren met gegenereerde beschrijvingen

Trefwoorden

tekst-generatieafbeelding-analysemultimodale-AIbeschrijving

Gerelateerde termen

Gerelateerde begrippen

Beeldherkenning, Multimodaal Model

Over deze term

Wat is Image Captioning?

AI-taak waarbij automatisch beschrijvende tekst voor afbeeldingen wordt gegenereerd.