Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Bytecodemanipulation 1 Vortrag im Rahmen des Seminars Generatives Computing 16.06.2004 Ronald Kutschke Daniel Haag Mirko Bleyh Markus Block.

Ähnliche Präsentationen


Präsentation zum Thema: "Bytecodemanipulation 1 Vortrag im Rahmen des Seminars Generatives Computing 16.06.2004 Ronald Kutschke Daniel Haag Mirko Bleyh Markus Block."—  Präsentation transkript:

1 Bytecodemanipulation 1 Vortrag im Rahmen des Seminars Generatives Computing Ronald Kutschke Daniel Haag Mirko Bleyh Markus Block

2 Bytecodemanipulation 2 Übersicht Motivation Classfile Format Java Virtual Machine Möglichkeiten Vor- / Nachteile Beispiel: Framework BCEL Weitere Anwendungsgebiete Fazit Quellen [ Einleitung ]

3 Bytecodemanipulation 3 Motivation Warum Bytecodemanipulation? Kein Sourcecode vorhanden Änderung am Bytecode einfacher, als am Sourcecode [ Einleitung ]

4 Bytecodemanipulation 4 Classfile Format [ Classfile Format ]

5 Bytecodemanipulation 5 Aufbau [ Classfile Format ]

6 Bytecodemanipulation 6 Beispiel (1) [ Classfile Format ]

7 Bytecodemanipulation 7 Beispiel (2) [ Classfile Format ]

8 Bytecodemanipulation 8 Beispiel (3) [ Classfile Format ]

9 Bytecodemanipulation 9 Constantpool (1) [ Classfile Format ]

10 Bytecodemanipulation 10 Constantpool (2) [ Classfile Format ]

11 Bytecodemanipulation 11 Constantpool (3) [ Classfile Format ]

12 Bytecodemanipulation 12 Inhalt Constantpool BaseType Character TypeInterpretation B byte signed byte C char Unicode character D double double-precision floating-point value F float single-precision floating-point value I int integer J long long integer L ; reference an instance of class S short signed short VvoidReturn type void Z boolean true or false [ reference one array dimension [ Classfile Format ]

13 Bytecodemanipulation 13 Methodendefinition [ Classfile Format ]

14 Bytecodemanipulation 14 Security class Login{ private String passwort = xyz;... public void login(String eingabe){ if(passwort.equals(eingabe)) { //login durchführen }... } [ Classfile Format ]

15 Bytecodemanipulation 15 Optimierung (1) [ Classfile Format ]

16 Bytecodemanipulation 16 Optimierung (2) [ Classfile Format ]

17 Bytecodemanipulation 17 Java Virtual Machine Zentrales Element der Java Technologie Verantwortlich für Plattform-Unabhängigkeit Abstrakte Rechenmaschine mit fester Anzahl an Instruktionen (Opcodes), die auf verschiedenen Speicherbereichen operiert Kennt keine Java Programmiersprache, lediglich das Bytecode-Format Kann in Hardware oder in Software realisiert werden [ JVM ]

18 Bytecodemanipulation 18 JVM Details Spezifizierte Aufgaben einer JVM: –Lesen von Bytecode –Ausführen der definierten Operationen Alles weitere ist dem Entwickler überlassen, also z.B. –Speicheranordnung der Runtime Data Areas –Algorithmus der Garbage-Collection –Ausführungsart der Operationen (Interpretieren oder in nativen Code kompilieren und dann ausführen) [ JVM ]

19 Bytecodemanipulation 19 JVM-Architektur [ JVM ]

20 Bytecodemanipulation 20 Motivation –Speicherort der Klassen kann sehr unterschiedlich sein: Lokales Dateisystem Entferntes Dateisystem Datenbank Internet [ Class Loader ] –Zentraler Punkt zum Laden von Klassen Erhöhte Sicherheit

21 Bytecodemanipulation 21 Aufgaben Um eine Klasse verwenden zu können, muss Folgendes von der VM bzw. dem Class Loader erledigt werden: [ Class Loader ] –Dynamisches Laden der Klasse: Finden der binären Repräsentation der Klasse (Bytecode) und erzeugen einer Klasse aus diesem –Linken der Klasse: Verifizieren Reservieren und Initialisieren von Speicher für Klassenvariablen Transformieren von symbolischen Referenzen in direkte Referenzen –Initialisieren der Klasse: Ausführen der Methode der Klasse, Initialisieren der Klassenvariablen

22 Bytecodemanipulation 22 Bootstrap Class Loader Problem: Der Class Loader selber ist auch eine Java Klasse! Wer lädt diesen? [ Class Loader ] Antwort: Der Bootstrap Class Loader: –Er ist Teil der JVM –Er ist zumeist in der selben Sprache wie die VM geschrieben –Wird beim Hochfahren der VM geladen –Lädt alle weiteren Class Loader und die Klassen des Java API –Nur vom ihm geladene Klassen werden als vertrauenswürdig eingestuft –JDK1.1: Benötigt unter Windows die CLASSPATH Umgebungsvariable –JDK1.2: System Class Loader durchsucht den CLASSPATH selber

23 Bytecodemanipulation 23 public class SimpleClassLoader extends ClassLoader { public synchronized Class loadClass(String name, boolean resolve) { Class c = findLoadedClass(name); if (c != null) return c; try { c = findSystemClass(name); if (c != null) return c; } catch (ClassNotFoundException e) {} try { RandomAccessFile file = new RandomAccessFile("test/" + name + ".class", "r"); byte data[] = new byte[(int)file.length()]; file.readFully(data); c = defineClass(name, data, 0, data.length); } catch (IOException e) {} if (resolve) resolveClass(c); return c; } [ Class Loader ]

24 Bytecodemanipulation 24 Parent Delegation Model Bezeichnet die Arbeitsteilung der verschiedenen Class Loader innerhalb einer JVM: –Seit JDK 1.2 vorgeschlagen, bereits in java.lang.ClassLoader realisisert –Jeder Class Loader besitzt Referenz auf Parent (ausser BCL) –Anfrage zum Laden einer Klasse wird immer erst an den Parent weitergegeben –Wenn Parent Klasse nicht finden, versucht es der CL selber [ Class Loader ]

25 Bytecodemanipulation 25 JVM-Architektur [ JVM ]

26 Bytecodemanipulation 26 Method Area: –Enthält alle Klassen-Informationen (Name, Superklasse, Constant Pool, Methoden-Informationen und –Bytecode, Exception-Table, Klassenvariablen, etc.) –Gehört logisch zum Heap [ Runtime Data Areas ] Heap: –Hier werden alle Objekt-Instanzen und Array gespeichert (d.h. Objekt-Referenzen zeigen auf Speicherbereiche im Heap): Instanzvariablen der Klasse des Objekts und aller Superklassen Zeiger auf den Speicherbereich der Klassendaten in der Method Area –Für alle Threads gemeinsam

27 Bytecodemanipulation 27 PC Register: –Jeder Thread hat eigenen PC Register –PC Register ist ein Wort groß –Enthält Adresse (nativer Pointer oder Offset des Bytecodes) der aktuell ausführenden Instruktion bzw. ist undefiniert beim Ausführen von nativem Code [ Runtime Data Areas ] Native Method Stack: –Führt Programm-Code aus, der nicht in Java geschrieben ist –Optional

28 Bytecodemanipulation 28 Java Stack: –Jeder Thread hat eigenen Stack –Nur zwei mögliche Operationen: PUSH und POP –Stack besteht aus einzelnen Stack Frames: zu jeder Methode gibt es einen Frame immer genau ein Frame ist aktuell (aktuelle Methode) bei Methodenaufruf wird ein Frame erzeugt und zum neuen aktuelle Frame am Stack ( push ) bei Methodenende ( return oder Exception ) wird der aktuelle Frame verworfen und der vorherige Frame wird zum aktuellen Frame ( pop ) –ein Thread kann nur auf seinen Stack zugreifen ! [ Runtime Data Areas ]

29 Bytecodemanipulation 29 Stack Frame [ Runtime Data Areas ] –Lokale Variablen: Als 0-basiertes Array aus Wörtern organisiert Enthält Parameter und lokale Variablen der jeweiligen Methode –Operanden-Stack: Als 0-basiertes Array aus Wörtern organisiert Lediglich PUSH und POP erlaubt (keine Indizierung möglich!) Hauptspeicherort von Operanden für Instruktionen –Frame Daten: Referenz auf Constant Pool der Klasse der Methode Daten zur Wiederherstellen des vorherigen Frames bei normalem Methodenende Exception Behandlung (Referenz auf Exception-Table der Methode) Weitere Daten...

30 Bytecodemanipulation 30 JVM-Architektur [ JVM ]

31 Bytecodemanipulation 31 3 unterschiedliche Bedeutungen: [ Execution Engine ] –Abstrakte Spezifikation: für jede Bytecode Instruktion wird spezifiziert, was gemacht werden soll, aber nicht wie! –Konkrete Implementierung: Interpretation, JIT-Kompilierung, etc. –Laufzeit-Instanz: Jeder Thread ist eine Instanz einer Execution Engine

32 Bytecodemanipulation 32 Implementierungen Interpretation –sehr einfach (1. Generation der VMs ) [ Execution Engine ] Just-in-Time Kompilierung –1. Ausführung einer Methode nativer Code Adaptive Optimierung –Mischung aus Interpretation und JIT Kompilierung –Code-Ausführung wird beobachtet – % der CPU Zeit % des Codes –wird z.B. in Suns HotSpot VM verwendet

33 Bytecodemanipulation 33 Funktionsweise der JVM Applet Demo... [ JVM ]

34 Bytecodemanipulation 34 Möglichkeiten Einfügen von Debuginformationen Einfügen von Tracinginformationen Besseres Handling von NullPointerExceptions Umbenennen von Variablen- und Methodennamen um Bytecode unleserlich zu machen (Obfuskator) Einfügen von Code zur Serialisierung (JDO) Bytecodeoptimierung [ Möglichkeiten ]

35 Bytecodemanipulation 35 Vorteile Sourcecode muss nicht vorliegen Code kann dynamisch zur Ladezeit verändert werden Einfügen von fest vorgegebenem Code, der von Programmierern nicht verändert werden kann [ Vor- / Nachteile ]

36 Bytecodemanipulation 36 Nachteile Aufwändig –Genaue Kenntnis des Classfile-Formats, der Opcodes und der VM sind Voraussetzung –Fehlen von Kommentaren Fehler erscheinen erst zur Laufzeit [ Vor- / Nachteile ]

37 Bytecodemanipulation 37 Byte Code Engineering Library (BCEL) Objektorientierte Bearbeitung des prozeduralen Bytecodes –Mappen sämtlicher Opcodes in Java Klassen Getrennte Packages zum –Analysieren und Inspizieren –Modifizieren und Erzeugen Manipulation nach der Compile- oder zur Ladezeit Bytecode Verifier Disassembler [ BCEL ]

38 Bytecodemanipulation 38 Verwendung von BCEL Einlesen und parsen des Classfiles -> JavaClass Auslesen der Klassenparameter (Methoden, Constant Pool, Felder, …) Generatoren der Klassenparameter erzeugen Manipulation über die Generator Objekte Ersetzen der alten Parameter durch die neuen aus den Generatorobjekten Zurückschreiben des Classfiles auf Festplatte [ BCEL ]

39 Bytecodemanipulation 39 Aufruf von statischen Methoden Hinzufügen der Methode zum Constant Pool Sichern der Referenz zur Methode Parameter auf den Stack legen Die Methode mit INVOKESTATIC(Methodenref) aufrufen Rückgabewert liegt nach dem Aufruf auf dem Stack [ BCEL ]

40 Bytecodemanipulation 40 Aufruf von nicht-statischen Methoden Hinzufügen der Methode zum Constant Pool Sichern der Referenz zur Methode Referenz des Methodenobjektes auf den Stack legen Parameter auf den Stack legen Die Methode mit INVOKEVIRUTAL(Methodenref) aufrufen Rückgabewert liegt nach dem Aufruf auf dem Stack [ BCEL ]

41 Bytecodemanipulation 41 Einfügen der Methodenaufrufe Gewünschte Methode finden Generator Objekt davon erstellen Codestelle innerhalb der Methode zum Einfügen finden Gewünschte Aufrufe einfügen [ BCEL ]

42 Bytecodemanipulation 42 Beispiel Einfügen von Hello from + Methodensignatur beim Aufruf jeder Methode einer Klasse (nach Compile Time) Einfügen von Tracing und Logging Informationen beim Aufruf und Verlassen jeder Methode einer Klasse (zur Loading Time) [ BCEL ]

43 Bytecodemanipulation 43 Weitere Frameworks BCEL Jikes Bytecode Toolkit (JikesBT) Javassist –Ermöglicht abstraktere Bytecode Manipulation über Method.append("System.out.println(\"Test\");"); [ Frameworks ]

44 Bytecodemanipulation 44 Fazit Bytecodemanipulation ermöglicht die Erweiterung, Optimierung und Anpassung von Classfiles Es ersetzt jedoch nicht das herkömmliche Programmieren in Java, da die Komplexität bedeutend höher ist [ Fazit ]

45 Bytecodemanipulation 45 Quellen (1) Analysis Of The Java Class File (Denis N. Antonioli, Markus Pilz) ftp://ftp.ifi.unizh.ch/pub/techreports/TR-98/ifi ps.gz The JavaTM Virtual Machine Specification Second Edition (Tim Lindholm, Frank Yellin) Inside the Java 2 Virtual Machine (Bill Venners) + Applets [ Quellen ]

46 Bytecodemanipulation 46 Quellen (2) Java Programming Dynamics (Dennis M. Sosnoski) BCEL Homepage Beispiele für BCEL Javassist Homepage JikesBT Homepage [ Quellen ]

47 Bytecodemanipulation 47 Fragen zum Thema?

48 Bytecodemanipulation 48 Kontakt Ronald Kutschke Daniel Haag Mirko Bleyh Markus Block


Herunterladen ppt "Bytecodemanipulation 1 Vortrag im Rahmen des Seminars Generatives Computing 16.06.2004 Ronald Kutschke Daniel Haag Mirko Bleyh Markus Block."

Ähnliche Präsentationen


Google-Anzeigen