Uitleg
Clustering is een ongecontroleerde leermethod waarbij het algoritme zelf patronen zoekt in data zonder dat labels worden gegeven. Het doel is om soortgelijke gegevenspunten in groepen (clusters) samen te brengen, terwijl punten in verschillende clusters verschillend zijn.
Het verschil met classificatie is dat clustering geen labels of vooraf bepaalde klassen nodig heeft. In plaats daarvan ontdekt het algoritme natuurlijke groepperingen in de data. K-means is een populair clusteringalgoritme dat gegevenspunten in K clusters verdeelt.
Clustering wordt gebruikt voor: klantsegmentatie (welke klanten zijn vergelijkbaar?), aanbevelingssystemen, document-clustering, en anomaliedetectie. Het helpt bedrijven inzicht te krijgen in hun data.
⚡ Voorbeelden
- •Een retailer clustert klanten op basis van aankoopgedrag om doelgerichte marketingcampagnes te creëren
- •DNA-sequencing clustert gelijke genomen om evolutionaire relaties te begrijpen
- •Clustering identificeert bedrijfssegmenten die vergelijkbare financiële patronen vertonen