Data Augmentatie

Techniek om trainingsdata te vergroten door kunstmatige variaties van bestaande data te creëren.

Uitleg

Data augmentatie is een belangrijk concept in machine learning waarbij je trainingsset wordt vergrroot door variaties van bestaande samples te genereren. Voor afbeeldingen kan dit rotaties, flip, zoom, helderheid-aanpassingen etc. inhouden.

Deze techniek is waardevol omdat het de hoeveelheid trainingsdata effectief verhoogt zonder nieuwe data te hoeven verzamelen. Het helpt ook het model robuuster te maken: het leert van verschillende perspectieven en omstandigheden.

Data augmentatie is vooral belangrijk als je beperkt trainingsdata hebt. Het kan overtraining voorkomen en generaliseringsfouten verminderen. Het is bijna universeel standaard in computer vision-projecten.

Voorbeelden

  • Een dataset van 1.000 afbeeldingen van katten kan worden uitgebreid tot 10.000 door rotaties, spiegelingen en zoom-niveaus
  • Medische imaging augmenteert data omdat patiënt-scans schaars zijn: kleine rotaties en flip van scan-afbeeldingen worden gebruikt
  • Autonoom rijden augmenteert trainingsdata met verschillende weersomstandigheden (regen, sneeuw simuleren via pixelmutaties)

Trefwoorden

training-data-vergrotingregularisatieovertraining-preventierobustheid

Gerelateerde termen

Gerelateerde begrippen

Training, Beeldclassificatie

Over deze term

Wat is Data Augmentatie?

Techniek om trainingsdata te vergroten door kunstmatige variaties van bestaande data te creëren.