Uitleg
Overfitting is een veelvoorkomend probleem in machine learning. Het model leert niet alleen de onderliggende patronen, maar ook de "ruis" en specifieke eigenaardigheden van trainingsdata.
Stel je voor: je leert alle juiste antwoorden van een examen uit je hoofd, inclusief veronderstellingen van de leraar. Je haalt hoog op dat examen, maar als er een ander examen is met dezelfde vragen maar andere antwoorden, doe je slecht.
Je kunt overfitting herkennen door trainings- en validatiefouten te vergelijken: als trainingsfouten laag zijn maar validatiefouten hoog, overfits je. Technieken om dit te voorkomen: regularisatie, vroeg stoppen, dropout, en meer trainingsdata verzamelen.
⚡ Voorbeelden
- •Een model memoriseert huisprijzen per adres exact, maar kan niet goed generaliseren naar onbekende adressen
- •Een beeldherkenningsmodel leert achtergrond te gebruiken in plaats van het object zelf
- •Een taalmodel leert exact trainingsteksten zonder echte taalkennis