Manuel Möller
Automatische E-Mail-Filterung mit maschinellem Lernen
Trotz SpamAssassin und Bayesschen Filtern ärgert sich ein
gewöhnlicher E-Mail-Nutzer ständing über Spam. Mails lesen heisst
zuerst einmal, den Spam als solchen zu erkennen und auszusortieren.
Diese Arbeit macht keinen Spass. Damit ist eine wichtige Bedingung
erfüllt, um sie dem Computer zu überlassen.
Der Vortrag beschäftigt sich mit einem rel. neuen Ansatz,
natürlichsprachliche Texte automatisch in die Klassen
erwuenscht/unerwuenscht einzuteilen. Dabei soll von von einigen
Hintergrundinformationen über die verwendeten Support Vector Machines
bis hin zu einer experimentellen Anwendung im Mailsystem des Autors
ein Überblick gegeben werden, wie man solch eine Aufgabe unter Linux
angehen kann.