Präsentation herunterladen
Veröffentlicht von:Susanne Albers Geändert vor über 11 Jahren
1
Modellierung kohärenter Streulicht-Messprozesse für deterministische Nanostrukturen und stochastische Oberflächendefekte G. Goch und S. Simon Fachgebiet Mess-, Steuerungs- und Regelungstechnik Hochschule Bremen G. Goch, S. Simon
2
Gliederung Einleitung - Ziel:
Neue Entwurfsmethodik für Streulicht-Messprozesse basierend auf Computer-Simulationen 2. Modellierungsansatz für Streulicht, Oberflächen, Aufbau 3. Algorithmenentwurf, Simulation Herausforderung: Rechenzeit ~ PC: Tage bis Monate Gewählter Lösungsansatz für das Hardware/Software-System (HW/SW-System) 5. Zusammenfassung G. Goch, S. Simon
3
Streulichtmessverfahren
Optische Verfahren für die Oberflächen-Charakterisierung Konventionelle Streulichtverfahren Speckle-Verfahren Angle Resolved Scattering Reflexionsmessung Total Integrated Scattering Diffuseness Measurement winkelabhängig Speckle-Korrelation Specklemuster-Beleuchtung Speckle-Kontrast wellenlängenabhängig Speckle-Korrelation wellenlängenabhängig G. Goch, S. Simon
4
Polychromatisches Streulichtmess-Verfahren für Rauheitsmessungen
CCD- Kamera Speckle-Muster Chip f Linse Rauheitsabhängige Speckle-Elongation Strahlteiler Polychromatische Lichtquelle das ist eine Lichtquelle, die Licht ausreichender zeitlicher Kohärenz liefert. Ausreichend bedeutet hier: Das Licht muss zumindest so kohärent sein, dass im Streulicht Speckles entstehen. (unkohärentes Licht würde nur eine (gleichmäßige) Streukeule erzeugen) Das Licht darf aber nur partiell zeitlich kohärent sein, d.h. es muss ein Lichtwellenlängenspektrum enthalten, damit bei der Lichtstreuung mittels Winkeldispersion die Speckle mit zunehmendem Streulichtwinkel elongieren. Die statistischen Eigenschaften des Specklemusters werden bestimmt von: Lichtspektrum (Zentralwellenlänge, spektrale Breite) Messaufbau-Parameter (Lichtstrahldurchmesser, Linsenbrennweite) Statistische Eigenschaften der Oberfläche (Rauheit, Oberflächensteigungen) Der letzte Punkt führt schließlich dazu, dass der Effekt der Speckle-Elongation rauheitsabhängig ist!!!! Polychromatische Lichtquelle (Laser / LED) Raue Oberfläche G. Goch, S. Simon
5
Computer-Simulation von Streulichtmessprozessen
Polychromatische Lichtquelle (Laser / LED) Raue Oberfläche Linse Strahlteiler f Speckle-Muster CCD- Kamera Chip Computer- Simulationen Neue Oberflächentypen: Strukturen u. Mikrotopographien: Ziel: Entwicklung und Evaluierung neuer Meßverfahren vereinfachen: keine Anschaffungskosten für Evaluierung kürzere Evaluierungszeit dargestelltes Beispiel: polychromatische Rauheitsmessung Mess- Objekte, (Messaufbau) Neue Auswerte verfahren Simula- tionen Wochen, Monate Stunden!, Tage G. Goch, S. Simon
6
Entwurfsmethodik für Streulicht-Messprozesse
Theorie (Optik, Signal- verar beitung) Computer- Simulationen DFG-Projekt DFG-Projekt : Schnittmenge aus 3 wissenschaftlichen Bereichen Experiment (Messtechnik) G. Goch, S. Simon
7
Simulationsmodell - Oberflächenmodell
Zufallswerte (normalverteilt) Oberflächenmodell (Höhe in nm) x- Position y- 3000 5 Filterung Skalierung Erzeugung des Oberflächenmodells: normalverteilte Zufallswerte generieren (1 pro Flächenelement) Fourier-Transformation Filtern (Gaußglocke im Ortsfrequenzbereich) zum Glätten im Frequenzbereich Inverse Fourier-Tr. Skalieren, um gewpnschten Rq-Wert einzustellen Dargestellt sind 1. und 5. y- Position x- Position G. Goch, S. Simon
8
Simulationsmodell - Streufeldmodell
Beleuchtung a , b: Durchmesser des Leuchtflecks Amplitudenverteilung S0(x,y) 1 Streufeldmodell (wird auf Oberflächenmodell angewendet) 1. Beleuchtung Darstellung der Amplitudenverteilung S0 des Laserstrahls: e-Funktion, die mit Abstand zum Mittelpunkt abfällt Amplituden durch Farbunterschiede angedeutet G. Goch, S. Simon
9
Simulationsmodell - Streufeldmodell
Specklebild γ φ Optische Achse Gangunterschied der Teilwellen: 2. Gangunterschied der einzelnen Teilwellen, die in einem Raumpunkt zusammenlaufen (entspr. Pixel) Gangunterschied wird durch 3 Parameter bestimmt: x-Position, y-Position, Höhenunterschied G. Goch, S. Simon
10
Simulationsmodell - Streufeldmodell
Specklebild γ φ Optische Achse Phasendifferenz der Teilwellen: 3. Phasendifferenz der Teilwellen: Gangunterschied auf Wellenlänge beziehen G. Goch, S. Simon
11
Simulationsmodell - Streufeldmodell
Specklebild γ φ Optische Achse Elektisches Feld in einem Pixel: 4. Elektrisches Feld in einem Pixel: durch Summation der Beiträge aller Teilwellen G. Goch, S. Simon nx,ny: Anzahl FE
12
Simulationsmodell - Streufeldmodell
Specklebild γ φ Optische Achse Bestrahlungstärke in einem Pixel: 5. Bestrahlungsstärke proportional zum Amplitudenquadrat des Elektrischen Feldes G. Goch, S. Simon
13
Berechnungsaufwand mit Pentium 4 / 3GHz (0,5 GOPS) 33 min
Berechnungsaufwand für: Flächenelemente: 100x100 FE Bildgröße: 768x576 Pixel Anzahl der Bilder: 3 (Wellenlängen) Anzahl verschiedener Operationen Anzahl λ FE Bildgröße Abschätzung des Rechenaufwandes: Anz. FE * Anz. Pixel * Anz. Wellenlängen * Anz. Operationen Addition, Multiplikation, Cosinus/Sinus-Berechnungen sind unterschiedlich schnell Vereinfachung: Cos entspricht 20 Additionen ca. 50 Additionen Vereinfachung: PC kann 0,5 Millarden Operatione pro Sekunde berechnen 33 Minuten für KLEINES BILD (100x100) mit Pentium 4 / 3GHz (0,5 GOPS) 33 min FE: FlächenElement OP: OPerations GOP: GigaOPerations GOPS: GigaOPerations per Second G. Goch, S. Simon
14
Rechenaufwand quadratisch
Berechnungsaufwand Mit Anzahl der FE / Kante steigt der Rechenaufwand quadratisch Anzahl FE Simulationszeit für Test: minimal: gewünscht: 100 x 100 1000 x 1000 10000 x 10000 0,5 h 2 d 200 d Rechenaufwand steigt quadratisch mit Kantenlänge (Elementen pro Kante) Abschätzung der Rechenzeit für gewünschte Oberflächengrößen: Rechenzeit wird zu großem Problem wie kann man schneller werden ? G. Goch, S. Simon
15
Hardware-Beschleunigung
Quantitativer Leistungssprung: 430 MioTransistoren (Pentium4 ~ 55Mio) Qualitativer Plattform FPGAs: 440 Multiplizierer+ 4 mP-Kerne + RAM FPGAs = Field Programmable Gate Array Ansatz: CoProzessor auf Hardware Ansatz: Hardware-Beschleunigung mit FPGAs - Ja, FPGAs sind bekannt, ABER Qualitativer und Quantitativer Leistungssprung in den letzten 2-3 Jahren: 10 mal Mehr Transistoren als ein PC-Prozessor, mehr Komponenten: 440 Multiplizierer FPGAS generell: beliebig oft programmierbar auch während der PC Themen abarbeitet. zusätzliche festen Hardwarekerne: z.B. Multiplizierer, Prozessoren PARALLELITAET ! durch gleichzeitiges Abarbeiten von Algorithmen in verschiedenen „Gebieten“ (Orten) des FPGAs Wichtig: Wir erforschen Felder, d.h. Arrays von Co-Prozessoren und Kommunikationsstrukturen zwischen den Prozessoren Genauere Infos zu dem Angestrebten Baustein: Virtex 2 Pro 100: ~ CLB (Configurable Logic Blocks) mit je 4 „Slices“ (~44000) mit je 2 LUT (Look Up Table) mit 4 Eingängen / 1 Ausgang (Bool‘sche Fkt.) 2 FF (FlipFlop) zum speichern der Ausgänge der LUTs insg. je 88000 es können also max boolsche Verknüpfungen mit 4 Eingangssignalen parallel ausgeführt werden und die Ergebnisse abgespeichert werden. Parallelität: Realisierung auf Addierer-Ebene G. Goch, S. Simon
16
Rechenzeitevalution Faktor 300…1000 Hardware System
Operationen / FE / Pixel Zeit / FE / Pixel in ns Bearbeitungszeit / Bild /Tausend € Kosten ADD MUL COS 100x100 FE 1e3x1e3 FE 1e4x1e4 FE Pentium4 / 3 GHz MatLab 4 (0,58) (0,37) 2 (0,006) 351 78 min 5,4 d 1,5 y 0,5 … 1 C (FP) (0,44) (0,17) (0,023) 120 27 min 1,8 d 184 d (INT) 82 (1,16) 94 21 min 1,4 d 144 d PC-Cluster 278 PCs C (INT) (322) (47) 0,34 4,5 s 8 min 12,5 h ~ 100 CPU,MB,RAM FPGA XC2VP100 52 (165) 10 Genauere Rechenzeitevaluation für Steufeldsimulation Gegenüberstellung PC – PC-Cluster - FPGA für PC: Unterscheidung MatLab Floating-Point-Modell in C Integer-Modell in C für PC-Cluster: Soviele PCs, so dass Rechenzeit vergleichbar mit FPGA für FPGA: realistische Annahme: 60 % Auslastung (Fläche, verwendete Resourcen) bei 100 MHz WAS IST ZU SEHEN ? linke 3 Spalten: Anzahl der unterschiedlichen Operationen für gewähltes Modell mit durchschnittlichem Durchsatz mittlere Spalte: Zeit in ns , die pro Pixel und FE und Wellenlänge berechnet werden muß, um ein Bild zu simulieren Gesamtzeit = Wert * #FE * #Pixel * #Wellenlängen rechte 3 Spalten: geschätzte Simulationszeit für ein Bild mit unterschiedliches Anzahl FE ganz rechte Spalte: geschätzte Anschaffungskosten INTERPRETATION: ein PC für große Oberflächenmodelle zu langsam (0,5 – 1,5 Jahre für ein !! Bild) FPGA Faktor 300 – 1000 mal schneller als ein PC. Simulationszeit ist akzeptabel. PC-Cluster ist bei gleicher Geschwindigkeit wie FPGA um Faktor 10 teurer als FPGA dabei sind nur Kosten für wenige Komponenten wie CPU, Motherboard und Speicher in der Kalkulation enthalten zusätzlicher Aufwand Platzbedarf, Administration G. Goch, S. Simon Faktor 300…1000
17
Bearbeitungszeit / Bild
Rechenzeitevalution Hardware System Zeit /ns FE / Pixel Bearbeitungszeit / Bild Kosten/ Tausend € 100x100 FE 1e3x1e3 FE 1e4x1e4 FE Pentium4 / 3 GHz MatLab 351 78 min 5,4 d 1,5 y 0,5 … 1 C (FP) 120 27 min 1,8 d 184 d (INT) 94 21 min 1,4 d 144 d PC-Cluster 278 PCs C (INT) 0,34 4,5 s 8 min 12,5 h ~ 100 CPU,MB,RAM FPGA XC2VP100 10 Genauere Rechenzeitevaluation für Steufeldsimulation Gegenüberstellung PC – PC-Cluster - FPGA für PC: Unterscheidung MatLab Floating-Point-Modell in C Integer-Modell in C für PC-Cluster: Soviele PCs, so dass Rechenzeit vergleichbar mit FPGA für FPGA: realistische Annahme: 60 % Auslastung (Fläche, verwendete Resourcen) bei 100 MHz WAS IST ZU SEHEN ? linke 3 Spalten: Anzahl der unterschiedlichen Operationen für gewähltes Modell mit durchschnittlichem Durchsatz mittlere Spalte: Zeit in ns , die pro Pixel und FE und Wellenlänge berechnet werden muß, um ein Bild zu simulieren Gesamtzeit = Wert * #FE * #Pixel * #Wellenlängen rechte 3 Spalten: geschätzte Simulationszeit für ein Bild mit unterschiedliches Anzahl FE ganz rechte Spalte: geschätzte Anschaffungskosten INTERPRETATION: ein PC für große Oberflächenmodelle zu langsam (0,5 – 1,5 Jahre für ein !! Bild) FPGA Faktor 300 – 1000 mal schneller als ein PC. Simulationszeit ist akzeptabel. PC-Cluster ist bei gleicher Geschwindigkeit wie FPGA um Faktor 10 teurer als FPGA dabei sind nur Kosten für wenige Komponenten wie CPU, Motherboard und Speicher in der Kalkulation enthalten zusätzlicher Aufwand Platzbedarf, Administration Faktor 300…1000 G. Goch, S. Simon
18
Übertragbarkeit des Systems
Modelle und Bildgenerierung SW FPGA (XC2VP100) FPGA – Karte HW PC Übersicht beabsichtigtes Simulationssystem: Software (SW) wird auf Hardware (HW) abgearbeitet: Teile auf Prozessor eines PCs: Ausgabe, Eingabe, Darstellung, Teile auf FPGA-Einsteckkarte für PC: Rechenzeitintensive Algorithmen Einfacher System-Aufbau Wenig Platzaufwand Einfacherer Systemaufbau im Vergleich zu PC-Clustern Einfache Systemreplikation: Frei zugängliches Simulationswerkzeug für die Wissenschaft zum Entwurf durch Systemsimulation von Messanordungen. G. Goch, S. Simon
19
Zukünftige Performance
GMACS = Giga multiply and accumulate operations per second MatLab PC (3GHz,P4) FPGA Virtex 2 Virtex 4 Speed [GMACS] 0,21 0,26 30 256 Ausblick auf die Rechenleistung mit unserem Ansatz in 2-3 Jahren aufgrund angekündigter FPGAs => Fast ein Faktor 10!!! Werte werden vom Hersteller genannt Achtung: „andere Einheit“ - Vergleich anhand Multiply and ACcumulate (Multiplizieren und anschließend Addieren) Wird für Signalprozessoren zur Messung der Leistungsfähigkeit genannt. Es können in einem PC mehrere FPGAs betrieben werden, z.B. 10 Das ergibt ca. einen Faktor gegenüber einfachen PCs Im Testeinsatz Angekündigt Hardware-System mit 10 FPGAs : GMACS G. Goch, S. Simon
20
Zusammenfassung: Interdisziplinäres Projekt
Messtechnik Technische Inf. / Elektrotechnik Digitale Signalverarbeitung FPGA-Plattform- Architekturen (Beschleunigungs- Faktor ) Modelle Optik, Physik Algorithmen Approximationen Prozessor- Architekturen Software Ergebnisse: Ergebnisse: Zusammenfassung: Interdisziplinäres Projekt der Fachgebiete Messtechnik und Technische Informatik / Elektrotechnik Ergebnisse für Messtechnik: neue Methode, um Streulicht-Messprozesse zu entwickeln und evaluieren Ergebnisse für TI / Elektrotechnik: Architekturen für Co-Prozessor-Arrays Konzepte für Datenkommunikation für Mehrprozessorsysteme Gemeinsames Ergebnis Hardware (HW)/Software(SW)-Plattform zu Simulation von optischen Systemen mit akzeptabler Rechenzeit und Genauigkeit. - Neue Entwurfs- Methodik für Streulicht-Messpro- zesse basierend auf Simulationen. - HW/SW-Plattform zur Simulation optischer Systeme, verfügbar für andere Forschergruppen. - Optimierte Architekturen von Co-Prozessor-Arrays - Konzepte zur Datenkommuni- kation für die hohe Bandbreiten in Mehr-Prozessorsystemen G. Goch, S. Simon
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.