Uitleg
Naive Bayes is een probabilistische classificatie-algoritme gebaseerd op Bayes-stelling, een fundamenteel concept in waarschijnlijkheidstheorie. Het berekent P(klasse|features) door P(features|klasse) te schatten en Bayes-regel toe te passen.
De "naive" aanname is dat alle features onafhankelijk zijn gegeven de klasse. Dit is meestal niet waar in werkelijkheid, maar het vereenvoudigt berekeningen aanzienlijk en werkt verrassend goed. Naive Bayes is snel, schaalbaar, en werkt goed voor tekstuele data.
Varianten zijn: Gaussian Naive Bayes (continue features), Multinomial Naive Bayes (tekstuele data), Bernoulli Naive Bayes (binaire features). Ondanks de naïeve aanname presteert Naive Bayes goed voor spam-filtering, sentimentanalyse, en tekstuele classificatie.
⚡ Voorbeelden
- •Spam-filters gebruiken Naive Bayes: P(spam|woorden) gebaseerd op woord-voorkomen
- •Sentimentanalyse: P(positief|woorden) bepaald door woordfrequenties in trainingsset
- •Documentclassificatie categoriseert berichten op basis van woord-waarschijnlijkheden