HCS Übung 3: Computer Vision By: Patrick Denk - 1532726 Oleg Arenz - 1316382 Theo Kischka - 1390243 Jan-Michael Heller - 1532645 19.05.2018 test1234 1 1
Bayes Decision Theorie Gesichtserkennung Spam-Mail erkennung Übersicht: Bayes Decision Theorie Gesichtserkennung Spam-Mail erkennung 19.05.2018 test1234 2
Spam-Mail Erkennung Möglichkeiten eine Spam E-Mail zu erkennen: Mail beinhaltet bestimmte Schlagwörter Mail wird an viele Benutzer geschickt Mail kommt von einem bestimmten Absender (IP Adresse) Mail enthält Viren im Anhang 19.05.2018 test1234 3
Spam-Mail Erkennung In unserem Beispiel verwenden wir die Kriterien 1 und 3: Mail beinhaltet bestimmte Schlagwörter Mail kommt von einem bestimmten Absender (IP Adresse) 19.05.2018 test1234 4
A Priori Wahrscheinlichkeiten Wir nehmen an unser Algorithmus ist unvoreingenommen und behandelt alle ankommenden E-Mails gleich Wahrscheinlichkeit dass E-Mail M eine Spam-Mail ist: P(SPAM) = 0.5 Wahrscheinlichkeit dass E-Mail M keine Spam-Mail ist: P(NOSPAM) = 0.5 19.05.2018 test1234 5
Likelihood Wahrscheinlichkeit dass es sich bei der E-Mail von Absender A um Spam handelt: P(A,SPAM) = 0.7 Wahrscheinlichkeit dass es sich bei der E-Mail von Absender A um kein Spam handelt: P(A,NOSPAM) = 0.3 19.05.2018 test1234 6
Likelihood Wahrscheinlichkeit dass es sich bei E-Mail mit Schlagwort B um Spam handelt: P(B,SPAM) = 0.7 Wahrscheinlichkeit dass es sich bei E-Mail mit Schlagwort B um kein Spam handelt: P(B,NOSPAM) = 0.3 Kann so für jedes Wort fortgeführt werden. Die Wahrscheinlichkeiten lassen sich z.B. aus bereits erhaltenen und klassifizierten E-Mails berechnen. 19.05.2018 test1234 7
Naive Bayes klassifikator Wir nehmen an, dass alle Merkmale statistisch unabhängig sind. Dadurch lässt sich der Naive Bayes klassifikator anwenden: Sowie den in unserem Fall günstigen 2 Klassenproblem klassifikator: 19.05.2018 test1234 8
Naive Bayes klassifikator Welcher sich zum Likelihood Ratio Test vereinfachen lässt: In unserem Fall verwenden wir den Faktor Q, der uns eine Zahl angibt, an der man ablesen kann wie wahrscheinlich es sich um eine Spam E-Mail handelt Q = Mit C1 = SPAM und C2 = NOSPAM sowie xi = A,B,… 19.05.2018 test1234 9
Naive Bayes klassifikator Abschließend kann der Nutzer einen Schwellwert vorgeben ab dem Nachrichten als Spam behandelt werden: z.B.: ab eine Q Wert von > 5 wird die E-Mail als Spam behandelt 19.05.2018 test1234 10