Modellierung kohärenter Streulicht-Messprozesse für deterministische Nanostrukturen und stochastische Oberflächendefekte G. Goch und S. Simon Fachgebiet.

Slides:



Advertisements
Ähnliche Präsentationen
FPGA-Anwendung in der digitalen Bildverarbeitung
Advertisements

Anzahl der ausgefüllten und eingesandten Fragebögen: 211
PC-Kauf im IV. Quartal 1998 Dipl.-Ing. Jörg Dannenberg
Anwendungsbeispiele Vertrieb durch:
Institut für Angewandte Mikroelektronik und Datentechnik
Institut für Angewandte Mikroelektronik und Datentechnik Fachbereich Elektrotechnik und Informationstechnik, Universität Rostock Holger Harms, Harald Widiger,
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Arbeitsbereich Technische Aspekte Multimodaler Systeme Universität Hamburg Fachbereich Informatik Oberseminar TAMS Grundlagen omnidirektionaler Sichtsysteme.
Abteilung EHS Eingebettete Hardware-/Software-Systeme Prof. Dr. Wolfgang Nebel Carsten Beth PDA Hörgerät Entwicklung eines PDA-basierten Hörgerätes.
1 Energiebewusste Compilierung für digitale Signalprozessoren Markus Lorenz Peter Marwedel Universität Dortmund Lehrstuhl Informatik XII Projekt Prozessorarchitekturen.
0 Energieeffiziente Compilierung für Digitale Signalprozessoren Markus Lorenz Peter Marwedel Rainer Leupers Projekt Prozessorarchitekturen und Compilertechniken.
= = = = 47 = 47 = 48 = =
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
von Dennis Braun Till Meyenburg Marvin Barghorn
Embedded Applications
Martin zur Nedden, HU Berlin 1 Physik an Hadron-Collidern, WS 2006/2007 Kap 1, Intermezzo: Beispiele von hadronischen Kollisions- Experimenten D0 am Tevatron.
Astronomisch, Physikalische und Mathematische Geodäsie II
Datenmanagement in Sensornetzen PRESTO - Feedback gesteuertes Datenmanagement - SS 2007 Sören Wenzlaff.
Dipl.-Ing. (FH) Carsten Büttner, MSc.
Computergrafik Vom Dreieck zum Ego-Shooter Olaf Müller
Polychromatische Rauheitsmessung
Polychromatische Rauheitsmessung
Christian Steinle, Joachim Gläß, Reinhard Männer
Atomemission : Optische Systeme
AWA 2007 Natur und Umwelt Natürlich Leben
Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.
Informationstechnologie
INSTITUT FÜR DATENTECHNIK UND KOMMUNIKATIONS- NETZE 1 Harald Schrom ViEWcon08.
Fachprojekte „Entwurf Eingebetteter Systeme”
Institut Nachrichtentechnik HTWK Leipzig Nachrichten- und Kommunikationstechnik 1.
Kurzformaufgaben Mit welcher Zahl geht die Zahlenreihe ...5, 4, 8, 7, 14… weiter?  13  28  15  9.
Driss Harrou FH D Fachhochschule Düsseldorf 1 Aufgabenstellung - Erstellung eines modularisierten Akquirierungsprogramms für die aerodynamischen Messgrößen.
Mikrocomputertechnik-Labor SS‘04
20:00.
CPLD/FPGA-Programmierung mit E-blocks. Wozu die CPLD/FPGA-Programmierung untersuchen? Zusammenhang zur modernen Digitalen Elektronik Verschwinden der.
1 Seminar zu Experimentelle Methoden der Teilchenphysik Der Trigger von ATLAS - Wolf Behrenhoff, Der Trigger im ATLAS-Experiment – LHC Grundlagen.
Neue digitale Luftbildkameras
Performance-Steigerung durch schnelle Festplatten Ulrich Dinger.
Übersicht Motivation Konzeption Umsetzung/ Implementierung
2 Zugang zum Internet 2.1 Grundlagen 2.2 Internet-Provider
Präsentation von Alexander Schönfeld
Laubscher Präzision AG Täuffelen
Quelle: Fachreferat von Mathias Herbst 1.
Köln, 5. März 2004Dr. Thomas Wolf, UB Heidelberg Vom Projekt zum Regelbetrieb: Digitalisierung an der UB Heidelberg.
Erfolgs Plan 2+2=9 x4=21.
FPGA... ein Versuch. Uli Schäfer 1. Historie: PLD Uli Schäfer 2 Schaltungsgrösse wächst drastisch mit Zahl der Eingänge CPLD = Array + Flipflops + macro.
Fahrspurerkennung in Videoechtzeit mit SoC
Performancevergleich DSP vs. FPGA
3.4 CPU-Chips und Busse CPU-Chips
Institut für Hochenergiephysik der Österreichischen Akademie der Wissenschaften 16. December December 2003 Das Experiment CMS am Large Hadron.
Embedded Systems Prof. Dr. H. Kristl
Bitte F5 drücken.
Ein Vortrag von Simon Bayer
Vienna University of Technology Pirker Simon 1. Überblick Definition Motivation Vorteile Entwurf von VP Pirker Simon 2.
DDR vs. RDRAM Ein Vergleich von Speichertechnologien Bernhard Fiser Stefan Schönauer.
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Numerische Analyse von Rotman-Linsen zur Strahlformung von Antennengruppen.
DV-Treffen, Folie 1 Renate Dohmen PC-Cluster für trivial-parallele Applikationen Renate Dohmen MPI für Plasmaphysik, Rechenzentrum Motivation Hardware,
Central Processing Unit von David Kleuker und Thomas Auner
B.Sc. Medizintechnik Kompetenzfeld Sensorsignalverarbeitung
Christian Steinle, Andreas Kugel, Reinhard Männer
Folie Einzelauswertung der Gemeindedaten
Neue Technologien für innovative Produkte
Schwimmen : Die Anzahl 2: Die Bestzeit.
ein Entwicklungsprojekt an der INTEC
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
SEMINARVORTRAG, AACHEN, RUBEN SCHWARZWALD Grundlagen der Kameragestützten Objekterkennung in Echtzeit Betreuer: Prof. Dr. Walter Hillen Dipl.-Ing.
PC Aufrüsten, Auftrag 1 Systemtools, Benchmark
Wellenfrontmessung bei sFLASH Diplomanden- und Doktoranden-Seminar 02/07/2010 Ulrich Hipp Universität Hamburg.
 Präsentation transkript:

Modellierung kohärenter Streulicht-Messprozesse für deterministische Nanostrukturen und stochastische Oberflächendefekte G. Goch und S. Simon Fachgebiet Mess-, Steuerungs- und Regelungstechnik Hochschule Bremen G. Goch, S. Simon

Gliederung Einleitung - Ziel: Neue Entwurfsmethodik für Streulicht-Messprozesse basierend auf Computer-Simulationen 2. Modellierungsansatz für Streulicht, Oberflächen, Aufbau 3. Algorithmenentwurf, Simulation Herausforderung: Rechenzeit ~ PC: Tage bis Monate Gewählter Lösungsansatz für das Hardware/Software-System (HW/SW-System) 5. Zusammenfassung G. Goch, S. Simon

Streulichtmessverfahren Optische Verfahren für die Oberflächen-Charakterisierung Konventionelle Streulichtverfahren Speckle-Verfahren Angle Resolved Scattering Reflexionsmessung Total Integrated Scattering Diffuseness Measurement winkelabhängig Speckle-Korrelation Specklemuster-Beleuchtung Speckle-Kontrast wellenlängenabhängig Speckle-Korrelation wellenlängenabhängig G. Goch, S. Simon

Polychromatisches Streulichtmess-Verfahren für Rauheitsmessungen CCD- Kamera Speckle-Muster Chip f Linse Rauheitsabhängige Speckle-Elongation Strahlteiler Polychromatische Lichtquelle  das ist eine Lichtquelle, die Licht ausreichender zeitlicher Kohärenz liefert. Ausreichend bedeutet hier: Das Licht muss zumindest so kohärent sein, dass im Streulicht Speckles entstehen. (unkohärentes Licht würde nur eine (gleichmäßige) Streukeule erzeugen) Das Licht darf aber nur partiell zeitlich kohärent sein, d.h. es muss ein Lichtwellenlängenspektrum enthalten, damit bei der Lichtstreuung mittels Winkeldispersion die Speckle mit zunehmendem Streulichtwinkel elongieren. Die statistischen Eigenschaften des Specklemusters werden bestimmt von: Lichtspektrum (Zentralwellenlänge, spektrale Breite) Messaufbau-Parameter (Lichtstrahldurchmesser, Linsenbrennweite) Statistische Eigenschaften der Oberfläche (Rauheit, Oberflächensteigungen) Der letzte Punkt führt schließlich dazu, dass der Effekt der Speckle-Elongation rauheitsabhängig ist!!!! Polychromatische Lichtquelle (Laser / LED) Raue Oberfläche G. Goch, S. Simon

Computer-Simulation von Streulichtmessprozessen Polychromatische Lichtquelle (Laser / LED) Raue Oberfläche Linse Strahlteiler f Speckle-Muster CCD- Kamera Chip Computer- Simulationen Neue Oberflächentypen: Strukturen u. Mikrotopographien: Ziel: Entwicklung und Evaluierung neuer Meßverfahren vereinfachen: keine Anschaffungskosten für Evaluierung kürzere Evaluierungszeit dargestelltes Beispiel: polychromatische Rauheitsmessung Mess- Objekte, (Messaufbau) Neue Auswerte verfahren Simula- tionen Wochen, Monate Stunden!, Tage G. Goch, S. Simon

Entwurfsmethodik für Streulicht-Messprozesse Theorie (Optik, Signal- verar beitung) Computer- Simulationen DFG-Projekt DFG-Projekt : Schnittmenge aus 3 wissenschaftlichen Bereichen Experiment (Messtechnik) G. Goch, S. Simon

Simulationsmodell - Oberflächenmodell Zufallswerte (normalverteilt) Oberflächenmodell (Höhe in nm) x- Position y- 3000 5 Filterung Skalierung Erzeugung des Oberflächenmodells: normalverteilte Zufallswerte generieren (1 pro Flächenelement) Fourier-Transformation Filtern (Gaußglocke im Ortsfrequenzbereich) zum Glätten im Frequenzbereich Inverse Fourier-Tr. Skalieren, um gewpnschten Rq-Wert einzustellen Dargestellt sind 1. und 5. y- Position x- Position G. Goch, S. Simon

Simulationsmodell - Streufeldmodell Beleuchtung a , b: Durchmesser des Leuchtflecks Amplitudenverteilung S0(x,y) 1 Streufeldmodell (wird auf Oberflächenmodell angewendet) 1. Beleuchtung Darstellung der Amplitudenverteilung S0 des Laserstrahls: e-Funktion, die mit Abstand zum Mittelpunkt abfällt Amplituden durch Farbunterschiede angedeutet G. Goch, S. Simon

Simulationsmodell - Streufeldmodell Specklebild γ φ Optische Achse Gangunterschied der Teilwellen: 2. Gangunterschied der einzelnen Teilwellen, die in einem Raumpunkt zusammenlaufen (entspr. Pixel) Gangunterschied wird durch 3 Parameter bestimmt: x-Position, y-Position, Höhenunterschied G. Goch, S. Simon

Simulationsmodell - Streufeldmodell Specklebild γ φ Optische Achse Phasendifferenz der Teilwellen: 3. Phasendifferenz der Teilwellen: Gangunterschied auf Wellenlänge beziehen G. Goch, S. Simon

Simulationsmodell - Streufeldmodell Specklebild γ φ Optische Achse Elektisches Feld in einem Pixel: 4. Elektrisches Feld in einem Pixel: durch Summation der Beiträge aller Teilwellen G. Goch, S. Simon nx,ny: Anzahl FE

Simulationsmodell - Streufeldmodell Specklebild γ φ Optische Achse Bestrahlungstärke in einem Pixel: 5. Bestrahlungsstärke proportional zum Amplitudenquadrat des Elektrischen Feldes G. Goch, S. Simon

Berechnungsaufwand mit Pentium 4 / 3GHz (0,5 GOPS) 33 min Berechnungsaufwand für: Flächenelemente: 100x100 FE Bildgröße: 768x576 Pixel Anzahl der Bilder: 3 (Wellenlängen) Anzahl verschiedener Operationen Anzahl λ FE Bildgröße Abschätzung des Rechenaufwandes:  Anz. FE * Anz. Pixel * Anz. Wellenlängen * Anz. Operationen Addition, Multiplikation, Cosinus/Sinus-Berechnungen sind unterschiedlich schnell Vereinfachung: Cos entspricht 20 Additionen  ca. 50 Additionen Vereinfachung: PC kann 0,5 Millarden Operatione pro Sekunde berechnen  33 Minuten für KLEINES BILD (100x100) mit Pentium 4 / 3GHz (0,5 GOPS) 33 min FE: FlächenElement OP: OPerations GOP: GigaOPerations GOPS: GigaOPerations per Second G. Goch, S. Simon

Rechenaufwand quadratisch Berechnungsaufwand Mit Anzahl der FE / Kante steigt der Rechenaufwand quadratisch Anzahl FE Simulationszeit für Test: minimal: gewünscht: 100 x 100 1000 x 1000 10000 x 10000 0,5 h 2 d 200 d Rechenaufwand steigt quadratisch mit Kantenlänge (Elementen pro Kante) Abschätzung der Rechenzeit für gewünschte Oberflächengrößen: ------- Rechenzeit wird zu großem Problem ------------- wie kann man schneller werden ? G. Goch, S. Simon

Hardware-Beschleunigung Quantitativer Leistungssprung: 430 MioTransistoren (Pentium4 ~ 55Mio) Qualitativer Plattform FPGAs: 440 Multiplizierer+ 4 mP-Kerne + RAM FPGAs = Field Programmable Gate Array Ansatz: CoProzessor auf Hardware Ansatz: Hardware-Beschleunigung mit FPGAs - Ja, FPGAs sind bekannt, ABER Qualitativer und Quantitativer Leistungssprung in den letzten 2-3 Jahren: 10 mal Mehr Transistoren als ein PC-Prozessor, mehr Komponenten: 440 Multiplizierer FPGAS generell: beliebig oft programmierbar auch während der PC Themen abarbeitet. zusätzliche festen Hardwarekerne: z.B. Multiplizierer, Prozessoren PARALLELITAET ! durch gleichzeitiges Abarbeiten von Algorithmen in verschiedenen „Gebieten“ (Orten) des FPGAs Wichtig: Wir erforschen Felder, d.h. Arrays von Co-Prozessoren und Kommunikationsstrukturen zwischen den Prozessoren Genauere Infos zu dem Angestrebten Baustein: Virtex 2 Pro 100: ~ 11000 CLB (Configurable Logic Blocks) mit je 4 „Slices“ (~44000) mit je 2 LUT (Look Up Table) mit 4 Eingängen / 1 Ausgang (Bool‘sche Fkt.) 2 FF (FlipFlop) zum speichern der Ausgänge der LUTs insg. je 88000 es können also max. 88000 boolsche Verknüpfungen mit 4 Eingangssignalen parallel ausgeführt werden und die Ergebnisse abgespeichert werden. Parallelität: Realisierung auf Addierer-Ebene G. Goch, S. Simon

Rechenzeitevalution Faktor 300…1000 Hardware System Operationen / FE / Pixel Zeit / FE / Pixel in ns Bearbeitungszeit / Bild /Tausend € Kosten ADD MUL COS 100x100 FE 1e3x1e3 FE 1e4x1e4 FE Pentium4 / 3 GHz MatLab 4 (0,58) (0,37) 2 (0,006) 351 78 min 5,4 d 1,5 y 0,5 … 1 C (FP) (0,44) (0,17) (0,023) 120 27 min 1,8 d 184 d (INT) 82 (1,16) 94 21 min 1,4 d 144 d PC-Cluster 278 PCs C (INT) (322) (47) 0,34 4,5 s 8 min 12,5 h ~ 100 CPU,MB,RAM FPGA XC2VP100 52 (165) 10 Genauere Rechenzeitevaluation für Steufeldsimulation Gegenüberstellung PC – PC-Cluster - FPGA für PC: Unterscheidung  MatLab  Floating-Point-Modell in C  Integer-Modell in C für PC-Cluster: Soviele PCs, so dass Rechenzeit vergleichbar mit FPGA für FPGA: realistische Annahme: 60 % Auslastung (Fläche, verwendete Resourcen) bei 100 MHz WAS IST ZU SEHEN ? linke 3 Spalten: Anzahl der unterschiedlichen Operationen für gewähltes Modell mit durchschnittlichem Durchsatz mittlere Spalte: Zeit in ns , die pro Pixel und FE und Wellenlänge berechnet werden muß, um ein Bild zu simulieren  Gesamtzeit = Wert * #FE * #Pixel * #Wellenlängen rechte 3 Spalten: geschätzte Simulationszeit für ein Bild mit unterschiedliches Anzahl FE ganz rechte Spalte: geschätzte Anschaffungskosten INTERPRETATION: ein PC für große Oberflächenmodelle zu langsam (0,5 – 1,5 Jahre für ein !! Bild) FPGA Faktor 300 – 1000 mal schneller als ein PC. Simulationszeit ist akzeptabel. PC-Cluster ist bei gleicher Geschwindigkeit wie FPGA um Faktor 10 teurer als FPGA dabei sind nur Kosten für wenige Komponenten wie CPU, Motherboard und Speicher in der Kalkulation enthalten zusätzlicher Aufwand Platzbedarf, Administration G. Goch, S. Simon Faktor 300…1000

Bearbeitungszeit / Bild Rechenzeitevalution Hardware System Zeit /ns FE / Pixel Bearbeitungszeit / Bild Kosten/ Tausend € 100x100 FE 1e3x1e3 FE 1e4x1e4 FE Pentium4 / 3 GHz MatLab 351 78 min 5,4 d 1,5 y 0,5 … 1 C (FP) 120 27 min 1,8 d 184 d (INT) 94 21 min 1,4 d 144 d PC-Cluster 278 PCs C (INT) 0,34 4,5 s 8 min 12,5 h ~ 100 CPU,MB,RAM FPGA XC2VP100 10 Genauere Rechenzeitevaluation für Steufeldsimulation Gegenüberstellung PC – PC-Cluster - FPGA für PC: Unterscheidung  MatLab  Floating-Point-Modell in C  Integer-Modell in C für PC-Cluster: Soviele PCs, so dass Rechenzeit vergleichbar mit FPGA für FPGA: realistische Annahme: 60 % Auslastung (Fläche, verwendete Resourcen) bei 100 MHz WAS IST ZU SEHEN ? linke 3 Spalten: Anzahl der unterschiedlichen Operationen für gewähltes Modell mit durchschnittlichem Durchsatz mittlere Spalte: Zeit in ns , die pro Pixel und FE und Wellenlänge berechnet werden muß, um ein Bild zu simulieren  Gesamtzeit = Wert * #FE * #Pixel * #Wellenlängen rechte 3 Spalten: geschätzte Simulationszeit für ein Bild mit unterschiedliches Anzahl FE ganz rechte Spalte: geschätzte Anschaffungskosten INTERPRETATION: ein PC für große Oberflächenmodelle zu langsam (0,5 – 1,5 Jahre für ein !! Bild) FPGA Faktor 300 – 1000 mal schneller als ein PC. Simulationszeit ist akzeptabel. PC-Cluster ist bei gleicher Geschwindigkeit wie FPGA um Faktor 10 teurer als FPGA dabei sind nur Kosten für wenige Komponenten wie CPU, Motherboard und Speicher in der Kalkulation enthalten zusätzlicher Aufwand Platzbedarf, Administration Faktor 300…1000 G. Goch, S. Simon

Übertragbarkeit des Systems Modelle und Bildgenerierung SW FPGA (XC2VP100) FPGA – Karte HW PC Übersicht beabsichtigtes Simulationssystem: Software (SW) wird auf Hardware (HW) abgearbeitet: Teile auf Prozessor eines PCs: Ausgabe, Eingabe, Darstellung, Teile auf FPGA-Einsteckkarte für PC: Rechenzeitintensive Algorithmen Einfacher System-Aufbau Wenig Platzaufwand Einfacherer Systemaufbau im Vergleich zu PC-Clustern Einfache Systemreplikation: Frei zugängliches Simulationswerkzeug für die Wissenschaft zum Entwurf durch Systemsimulation von Messanordungen. G. Goch, S. Simon

Zukünftige Performance GMACS = Giga multiply and accumulate operations per second MatLab PC (3GHz,P4) FPGA Virtex 2 Virtex 4 Speed [GMACS] 0,21 0,26 30 256 Ausblick auf die Rechenleistung mit unserem Ansatz in 2-3 Jahren aufgrund angekündigter FPGAs => Fast ein Faktor 10!!! Werte werden vom Hersteller genannt Achtung: „andere Einheit“ - Vergleich anhand Multiply and ACcumulate (Multiplizieren und anschließend Addieren) Wird für Signalprozessoren zur Messung der Leistungsfähigkeit genannt. Es können in einem PC mehrere FPGAs betrieben werden, z.B. 10  Das ergibt ca. einen Faktor 10000 gegenüber einfachen PCs Im Testeinsatz Angekündigt Hardware-System mit 10 FPGAs : 2.560 GMACS G. Goch, S. Simon

Zusammenfassung: Interdisziplinäres Projekt Messtechnik Technische Inf. / Elektrotechnik Digitale Signalverarbeitung FPGA-Plattform- Architekturen (Beschleunigungs- Faktor 300..1000) Modelle Optik, Physik Algorithmen Approximationen Prozessor- Architekturen Software Ergebnisse: Ergebnisse: Zusammenfassung: Interdisziplinäres Projekt der Fachgebiete Messtechnik und Technische Informatik / Elektrotechnik Ergebnisse für Messtechnik: neue Methode, um Streulicht-Messprozesse zu entwickeln und evaluieren Ergebnisse für TI / Elektrotechnik: Architekturen für Co-Prozessor-Arrays Konzepte für Datenkommunikation für Mehrprozessorsysteme Gemeinsames Ergebnis Hardware (HW)/Software(SW)-Plattform zu Simulation von optischen Systemen mit akzeptabler Rechenzeit und Genauigkeit. - Neue Entwurfs- Methodik für Streulicht-Messpro- zesse basierend auf Simulationen. - HW/SW-Plattform zur Simulation optischer Systeme, verfügbar für andere Forschergruppen. - Optimierte Architekturen von Co-Prozessor-Arrays - Konzepte zur Datenkommuni- kation für die hohe Bandbreiten in Mehr-Prozessorsystemen G. Goch, S. Simon