Uitleg
K-Nearest Neighbors (KNN) is een van de eenvoudigste machine learning-algoritmen. Voor elk nieuw datapunt kijkt het naar de k dichtstbijzijnde punten in de trainingsset en gebruikt hun labels om het nieuwe punt te classificeren.
Voor classificatie stemt KNN: de meest voorkomende klasse onder de k buren wordt gekozen. Voor regressie wordt het gemiddelde van de k buurwaarden gebruikt. De waarde van k is cruciaal - een kleine k kan overfitten, een grote k kan underfitting veroorzaken.
KNN is begrijpelijk en werkt goed voor kleine datasets. Het nadeel is dat KNN rekenintensief is omdat het alle trainingsgegevens moet opslaan en afstanden moet berekenen. Het presteert ook slecht in hoog-dimensionale ruimtes (curse of dimensionality).
⚡ Voorbeelden
- •Een film-aanbevelingssysteem vindt films die het meest op door gebruiker geliefde films lijken
- •Creditcard-fraudedetectie gebruikt KNN om verdachte transacties te vinden die anders zijn dan normale
- •Biedsystemen gebruiken KNN om vergelijkbare eigendomsprijzen te vinden