Uitleg
Feature engineering is het kunst- en vakwerk van het creëren van effectieve inputvariabelen (features) voor machine learning-modellen. Goede features leiden tot betere modellen; slechte features leiden tot slechte resultaten, ongeacht het algoritme.
Feature engineering omvat: het creëren van nieuwe features door bestaande te combineren, het transformeren van features (logaritmie, normalisering), het schalen van features, en het selecteren van relevante features. Domeinkennis is cruciaal: experts weten welke features belangrijk zijn.
Automatische feature selection-methoden helpen, maar menselijke intuïtie is onvervangbaar. De uitdrukking "garbage in, garbage out" onderstreept dat data-kwaliteit en feature-kwaliteit fundamenteel zijn. Feature engineering is typisch 70-80% van het ML-werk.
⚡ Voorbeelden
- •Voor huizenprijsprognose: creëer feature "prijs per vierkante meter" uit prijs en grootte
- •Voor email-spam: creëer features voor woordfrequentie, verzender-domein, aanwezigheid van links
- •Voor weersvoorspellingen: zonnecyclus-features verbeteren temperatuur-modellen