Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Bigbackground Statistische Methoden in der Hochenergiephysik Sebastian Naumann 5. Februar 2005 v e r s u s s m a l l s i g n a l s.

Ähnliche Präsentationen


Präsentation zum Thema: "Bigbackground Statistische Methoden in der Hochenergiephysik Sebastian Naumann 5. Februar 2005 v e r s u s s m a l l s i g n a l s."—  Präsentation transkript:

1 bigbackground Statistische Methoden in der Hochenergiephysik Sebastian Naumann 5. Februar 2005 v e r s u s s m a l l s i g n a l s

2 S. Naumann - Statistische Methoden in der HEPNr. 2 Übersicht Allgemeines Root Einfache Schnitte Likelihood-Methode Neuronale Netze Range-Searching

3 S. Naumann - Statistische Methoden in der HEPNr. 3 Allgemeines Statistik: mathematische Disziplin, die sich mit der Analyse von Daten und der Überprüfung von Hypothesen mit den Mitteln der Wahrscheinlich- keitsrechnung beschäftig. Die ersten statistischen Methoden wurden im Zusammenhang mit Glücksspielen entwickelt (Huygens, Bernoulli, Laplace, Pascal).

4 S. Naumann - Statistische Methoden in der HEPNr. 4 Allgemeines Statistik Theorie Experiment Modelle Hypothesen PDFs Monte Carlo Beobach- tungen Messergebnisse

5 S. Naumann - Statistische Methoden in der HEPNr. 5 Allgemeines Besondere Anforderungen an statistische Methoden in der Hochenergiephysik: hohe Ereignisraten kleine Verzweigungsverhältnisse Effizienz bzgl. Schnelligkeit, Datenvolumen und korrekter Signalklassifikation

6 S. Naumann - Statistische Methoden in der HEPNr. 6 Allgemeines Beispiel: Messung in zwei Variablen Experiment: Theorie: Aufgabe: Trenne Signal- von Untergrund-Ereignissen B S

7 S. Naumann - Statistische Methoden in der HEPNr. 7 Allgemeines Signal-Effizienz: Signal-Reinheit: Signal-over-noise:

8 S. Naumann - Statistische Methoden in der HEPNr. 8 Root ist ein Framework für C++ wird seit 1994 entwickelt, federführend am CERN wird an allen großen Einrichtungen der Kern- und Teilchenphysik genutzt, zunehmend auch in anderen Bereichen (Medizin, Wirtschaft)

9 S. Naumann - Statistische Methoden in der HEPNr. 9 Root Befehlszeilen- Interpreter und Skript- Prozessor Templates für graphische Benutzer- oberflächen Tools für I/O, Histogramme, Fitting...

10 S. Naumann - Statistische Methoden in der HEPNr. 10 Einfache Schnitte 1331

11 S. Naumann - Statistische Methoden in der HEPNr. 11 Einfache Schnitte

12 S. Naumann - Statistische Methoden in der HEPNr. 12 Likelihood-Methode Idee: schneide nicht direkt auf den einzelnen Variablen x i sondern auf einer Diskriminante Die Diskriminante bildet den Vektor (x 1,...,x n ) auf einen Skalar ab und ermöglicht die Trennung von Signal und Untergrund Verwende dazu Wahrscheinlichkeitsverteilungen (z.B. aus Monte Carlo): Normierung:

13 S. Naumann - Statistische Methoden in der HEPNr. 13 Likelihood-Methode Wahrscheinlichkeit, dass ein gemessener Wert x i aus der Klasse j {s,b} stammt: Likelihood-Funktion:

14 S. Naumann - Statistische Methoden in der HEPNr. 14 Likelihood-Methode Signal-Likelihood für das zweidimensionale Beispiel:

15 S. Naumann - Statistische Methoden in der HEPNr. 15 Likelihood-Methode Background-Likelihood für das zweidimensionale Beispiel:

16 S. Naumann - Statistische Methoden in der HEPNr. 16 Likelihood-Methode

17 S. Naumann - Statistische Methoden in der HEPNr. 17 Likelihood-Methode Klassische SchnitteLikelihood-Methode Vergleich:

18 S. Naumann - Statistische Methoden in der HEPNr. 18 Neuronale Netze Nervenzelle:Modellneuron: Leistungsmerkmale neuronaler Netwerke: Parallelität, Fehlertoleranz, Assoziation, Abstraktion, Mustererkennung, Lernfähigkeit...

19 S. Naumann - Statistische Methoden in der HEPNr. 19 Mathematische Beschreibung des Modellneurons: Eingabevektor: Gewichtsvektor: –ω i >0 exzitatorische Synapse (verstärkende Erregung) –ω i <0 inhibitorische Synapse (hemmende Erregung) Schwelle: Aktivierung: Transferfunktion:(z.B. Heavyside-Stufenfkt.) Ausgabewert/Aktivität: Neuronale Netze

20 S. Naumann - Statistische Methoden in der HEPNr. 20 Neuronale Netze Klassifikation nach Netz-Topologie Beispiel: das Feedforward-Netz Theorem von Kolmogorov: Sofern die Zahl der Knoten (Neuronen) unbegrenzt ist, genügt schon eine versteckte Schicht, um beliebige stetige Funktionen n m zu realisieren Mehrschicht-Perzeptron Gewichtsmatrix

21 S. Naumann - Statistische Methoden in der HEPNr. 21 Neuronale Netze Training (überwachtes Lernen): Optimierung der Gewichte des Netzes auf Grundlage von Beispielpaaren von Eingabe- und gewünschten Ausgabevektoren (Targetvektoren) Die Startwerte für die Gewichte werden häufig randomisiert Die Trainingsdaten (Trainingsmuster) stammen z.B. aus Monte Carlo-Simulationen Nach erfolgreichem Training (bekannte Gewichte) kann ein neuronales Netz sogar in die Hardware implementiert werden ( Geschwindigkeit).

22 S. Naumann - Statistische Methoden in der HEPNr. 22 Neuronale Netze Ein Feedforward-Netz mit 1 versteckten Schicht und einem Ausgabeknoten kann 2 Klassen separieren. Zweidimensionales XOR-Problem: Eingabeschicht: nicht linear separierbarAusgabeschicht: linear separierbar

23 S. Naumann - Statistische Methoden in der HEPNr. 23 Range-Searching Die Idee der PDE-RS-Methode: Probability Density Estimation based on Range-Searching Zähle in der Nachbarschaft des zu klassifizierenden Events die Signal- und Untergrund-Ereignisse aus einer Monte Carlo-Simulation Durchsuche dabei ein kleines Volumen im n-dimensionalen Phasenraum: Berechne die Diskrimante:

24 S. Naumann - Statistische Methoden in der HEPNr. 24 Range-Searching Der PDE-RS-Algorithmus: Die Events aus der Monte Carlo-Simulation werden in je einem n-dimensionalen Tree für Signal und Background abgelegt...

25 S. Naumann - Statistische Methoden in der HEPNr. 25 Range-Searching Beispiel 1: background rejection:

26 S. Naumann - Statistische Methoden in der HEPNr. 26 Range-Searching Beispiel 2:

27 S. Naumann - Statistische Methoden in der HEPNr. 27 Range-Searching Vergleich: Neuronale Netze Training des Netzwerks erforderlich Hardware-Implementierung möglich PDE-RS Großer Arbeitsspeicher erforderlich Transparente Methode (Fehlerabschätzung) Die Ergebnisse sind (je nach Fall) für beide Methoden von vergleichbarer Qualität.

28 S. Naumann - Statistische Methoden in der HEPNr. 28 Zusammenfassung Die Hochenergiephysik stellt hohe Anforderungen an statistische Methoden Eine wichtige Aufgabe ist die Klassifizierung von Messwerten in Signal und Untergrund Eine bessere Möglichkeit als einfache Schnitte bietet die Likelihood-Diskriminante Insbesondere bei höher-dimensionalen Problemen sind leistungsfähige Methoden neuronale Netze sowie die PDE-RS-Technik

29 S. Naumann - Statistische Methoden in der HEPNr. 29 Quellen V. Blobel, E. Lohrmann: Statistische und numerische Methoden der Datenanalyse. Stuttgart, 1998 G. Cowan: Statistical Data Analysis. Oxford, 1998 S. Udluft: Untersuchungen zu Neuronalen Netzen als Vertextrigger im H1-Experiment bei HERA. München, 1996 T. Carli, B. Koblitz: A Multi-variate Discrimination Technique Based on Range-Searching. In: NIM A (501), 2003


Herunterladen ppt "Bigbackground Statistische Methoden in der Hochenergiephysik Sebastian Naumann 5. Februar 2005 v e r s u s s m a l l s i g n a l s."

Ähnliche Präsentationen


Google-Anzeigen