Analogtechnik und Digitalisierung von Audio und Video

Slides:



Advertisements
Ähnliche Präsentationen
Spektrale Analysen in EMU-R: eine Einführung
Advertisements

Referat zum Thema: Soundkarte Von Julian Weger IT-Klasse 2482.
Schall – Töne, Klänge und Geräusche
Klassen (Zweck) Wozu legt man Klassen an? Überblick
Scanner.
Multimedia und Virtual Reality
Grundlagen der Schallausbreitung
Lic.Sc.Inf. Dr. Monique Jucquois-Delpierre
_____________________________ Einführung in die Bildbearbeitung Jucquois-Delpierre 1 Grundlagen Photoshop Ein zentraler Begriff bei Pixelgrafiken.
Die akustische Analyse von Sprachlauten.
Quellen-Filter Theorie der Sprachproduktion
Die akustische Analyse von Sprachlauten
Spektra von periodischen Signalen. Resonanz.
Spektrale Analysen in EMU-R: eine Einführung
Die Wahrnehmung von Durchsichtigkeit von Fabio Metelli
Farbe.
Fernseher LCD- Bildschirme.
Ein Seminar in Computer Grafik von Johannes Bochmann
Akustik nur in 7 I.
Akustik Untersuchung des Schalls
Versagt bei gesättigten Cyan-Tönen:
Digital Audio Medientyp digital audio representation
Digital Audio Medientyp digital audio representation
Wie macht man ein Sudoku? Transformations-Methode:
Versuche 1. Versuch: Eisenstab.
FRAGENKATALOG GRUNDLAGEN DES SCHALLS
Bildbearbeitung: Theorie
Angewandte Naturwissenschaften
Physik für Mediziner und Zahnmediziner
Signaltheorie Modulationsarten Betriebsarten Rauschsperren.
Bildbearbeitung im Unterricht
Bildbearbeitung GIMP Theorieteil
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Messgrößen für Schallwellen
Messgrößen für Schallwellen
Messgrößen für Schallwellen
Messgrößen für Schallwellen
Messung der Geschwindigkeit
Überlagerung von Schwingungen
Theorie Praktische Beispiele
Analog-Digital Umsetzer NI USB 6009 Blockschaltbild
Wahrscheinlichkeitsrechnung
Atommodelle.
Digitale Bilder Advanced IT Basics
Eine kleine Einführung für Studierende der Psychologie
Sampling, Rekonstruktion
Frequenz und Lautstärke
Ein Thermometer aus Flüssigkristallen
Audiowandlung und Formate
Aufgaben zur Lesekiste Bechertelefon (5)
Sonographie.
LED Hands-On-Days| Jo Kieker
1 Präsentation der Studienarbeit Wie funktioniert die Übertragung eines Sprachsignals beim Mobiltelefon? Referent: Michael Kunz Dauer: ca. 10 min Fach:
Bildbearbeitung: Theorie
Akkustik Geräusch - Ton - Klang.
Analog-Digital-Wandler
...ist eine Maßeinheit für die Datenmenge und den Informationsgehalt. Dabei ist 1 Bit die kleinste darstellbare Datenmenge, die beispielsweise durch eine.
Es wird verwendet in: Es ist die Bezeichnung von einer Datenmenge (0 und 1). Bit ist die kleinste darstellbare Datenmenge. Informatik Informationstechnik.
Bildbearbeitung: Bit Bit Byte Byte RGB RGB Farbe Farbe Auflösung Auflösung Dateiformat Dateiformat Clonpinsel Clonpinsel Kopierstempel Kopierstempel.
Clonpinsel/Kopierstempel
GRUNDBEGRIFFE.
Bit (Binary Digit): die kleinste EDV-technische Speichereinheit kann entweder den Wert eins (wahr) oder den Wert null (falsch) einnehmen Physikalisch.
Grundlagen Akustik Peter Espert.
Mp3 und co. – Audiobearbeitung am PC. Vorteile Audio am PC Audiofiles lassen sich einfacher verwalten und weiter verarbeiten als Kassettenaufnahmen.
Male alle Luftschwingungen blau an. Male alle Körperschwingungen rot an. hörendes Kind sprechendes Kind Das Bechertelefon Aufgaben zur Lesekiste Bechertelefon.
Streulicht seli GmbH Automatisierungstechnik Dieselstraße Neuenkirchen Tel. (49) (0) 5973 / Fax (49) (0) 5973 /
Konstruktion des Bildes
EINFÜHRUNG IN DIE BILDVERARBEITUNG Grafiktypen Rastergrafiken (bitmaps) Vektorengrafiken.
Achtung! Es gibt viele verschieden Arten von Bildsignalen!
Luftverdichtung Luftverdünnung Luftverdichtung
 Präsentation transkript:

Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Allgemein Physikalische Größen Schall, Helligkeit oder Temperatur Umwandlung in Spannungswerte die den physikalischen Größen proportional sind (analoge Signale). Diese analogen Signale müssen dann digitalisiert werden.

Audio Der Begriff Audio stammt von dem lateinischen Wort audire (hören) und dient als Sammelbegriff für akustisch wahrnehmbare Signale.

Töne Es existieren viel mehr Töne, als wir hören können, aber wir nehmen nur ein Teil dieser Töne wirklich wahr. Was sind Töne und wie werden sie dargestellt und digitalisiert ?

Physikalische Grundlagen Wenn Luft schwingt, entstehen Schallwellen. Treffen diese Schallwellen auf unser Ohr, neben wir diese als Töne wahr

Physikalische Grundlagen Tonquelle erzeugt Schallwellen Alle vibrierende Objekte erzeugen Schallwellen. Durch die Vibration wird das Medium stoßweise verdichtet. Schallwellen werden durch ein Medium transportiert (Luft, Wasser, Holz). In Luft ist die Schallgeschwindigkeit: 330m/s = 1188 km/h. Ohr wandelt diese in Abhängigkeit von Stärke und Häufigkeit in Töne durch das Trommelfell in Reize um. Der hörbare Bereich eines Menschen liegt zw. 20Hz und 20kHz.

Physikalische Grundlagen Transport von Schallwellen ist im Prinzip bei jedem Medium gleich Moleküle sind normaler Weise gleichweit voneinander entfernt. Nachdem verdichten, versuchen sie alten Abstand wieder herzustellen. Dabei bewegen sie sich vorwärts und rückwärts und verdichten dabei das Gebiet ihrer Nachbarn usw.

Physikalische Grundlagen

Physikalische Grundlagen Ein einzelnes Molekül bewegt sich nur ein Stück vorwärts. Betrachtet man das Gebiet, der Komprimierung, sieht man eine sich fortbewegende Schallwelle.

Physikalische Grundlagen Die einfachste Schwingung ist die Sinuskurve. Eine periodische Schwingung. Periodische Schwingungen sind alle Töne, die man als Klänge bezeichnen kann. Klavier, Glocke Nicht periodische Schwingungen erzeugen Geräusche Wasserrauschen

Erzeugung von komplexeren Schwingungen Nur sehr wenige Töne sind periodisch. Jeder Ton kann aber zerlegt werden in eine Reihe von Sinuskurven und andersherum.

Frequenzspektrum Da jeder Ton zerlegt werden kann, existiert eine Möglichkeit ein Spektrum anzugeben, der einen Ton charakterisiert. Einfach gesagt bestimmt die stärkste Frequenz die Tonhöhe.

Zusammenhänge von Schwingungen und Tönen Lautstärke und Amplitude Dass wir Töne in verschiedenen Lautstärken wahrnehmen, liegt daran, dass die Druckwellen unterschiedlich stark auf das Ohr treffen. Die Stärke der Schwingungen ist erkennbar an ihrer Amplitude. Damit bestimmt die Amplitude einer Schwingung die Lautstärke eines Tones. Die Schallintensität wird definiert als Leistung/Fläche. Als Schallpegel bezeichnet man den 10fachen dekadischen Logarithmus vom Verhältnis zweier Schallintensitäten. Er wird in Dezibel angegeben.

Umwandlung Die Umwandlung von Schallwellen bzw. Druckwellen in elektrische Signale.

Umwandeln von Schallwellen in Elektrizität Beim Auftreffen einer Druckwelle auf das Papier wird Spule je nach Stärke der Druckwelle in Richtung Magnet gedrückt. Dabei wird ein Impuls induziert. Je stärker die Druckwelle, desto stärker der Impuls.

Umwandeln von Elektrizität in Schallwellen Andersherum funktioniert es ebenso. Durch Induzieren eines Stromes in der Spule, erzeugt die Vor- und Zurückbewegung des Blattes Schwingungen. Mikrophone und Lautsprecher funktionieren nach diesem Prinzip.

Digitalisierung So wie es möglich ist Schallwellen in elektrische Signale umzuwandeln, kann man diese auch in digitale Werte konvertieren: Zwei Prozesse: Abtasten (Sampling) Periodisches Abtasten des kontinuierlichen analogen Signals Quantisierung Das Runden der ermittelten unbegrenztgenauen Werte analogen Werten auf einen digitalen Wertebereich.

Digitalisierung

Umwandlung von elektrischen Signalen in digitale Signale Dabei entstehen zwei Hauptprobleme, die für Informationsverlust sorgen: Die aufeinander folgenden digitalen Werte entsprechen einem bestimmten Intervall. Dieses Intervall hat eine bestimmte Breite. Digitale Werte sind diskrete, dass heißt, sie können nur einen bestimmten Wert annehmen.

Umwandlung von elektrischen Signalen in digitale Signale

Umwandlung von elektrischen Signalen in digitale Signale Diese beiden Probleme bestimmen den Hauptfehler digitaler Töne. Er kann kontrolliert werden durch die Änderung der Signalrepräsentation. Man kann den Fehler durch immer kleinere Intervalle verkleinern, aber niemals vollständig eliminieren. Faktoren wie Speicherplatz und Prozessorgeschwindigkeit setzen Grenzen. Daher ist es wichtig zu entscheiden, welche Fehler man tolerieren kann und welche Fehler verringert werden müssen - auf Kosten anderer Probleme.

Digitalisierung (technisch) Möglichkeiten ein Tonsignal abzutasten Pulsamplitudenmodulation ( PAM ) Pulsbreitenmodulation (PWM) Pulscodemodulation (PCM)

PAM Die analoge Signale werden übermittelt durch einen Serie von Impulsen, deren Amplitude die Soundstärke repräsentieren.

PAM Vorteil: Es ist einfach ein analoges Signal in ein PAM - Signal zu umzuwandeln und anderes herum. Folge: Die meisten ADCs und DACs benutzen PAM als ein Zwischenformat.

PWM Die analoge Signale werden übermittelt durch einen Serie von Impulsen, deren Länge die Soundstärke repräsentieren.

PWM Vorteil: In der Praxis werden die Amplituden der Signale oft zerstört. Die Umwandlung eines analogen Signals vor dem Transport durch Kabel oder Radioverbindungen in PWM, vermindert die Schwächung des Signals.

PCM Die analoge Signale werden übermittelt durch einen Serie von Impulsen, die den binären Daten des Samples entsprechen.

Sampling-Effekte Digitalisierte Daten werden charakterisiert durch die Abtastrate (Sampling-Rate ) Sampling-Rate Anzahl der Abtastungen/Messungen des analogen Signals / pro Sekunde Beispiele Audio – CDs : 44100 mal / pro Sekunde Telefonsysteme : 8000 mal / pro Sekunde

Sampling-Effekte Wichtige Entdeckung Die selben Entdeckungen ? Harry Nyquist (1889 – 1976) Ein analoges Signal kann exakt reproduziert werden, wenn die Abtastrate doppelt so hoch ist, wie die höchste Frequenz des analogen Signals. Claude E. Shannon 1948/49 mathematischer Beweis, dass es wirklich so ist Die selben Entdeckungen ? Nyquist-Limit, Abtasttheorem, Shannon-Theorem

Sampling-Effekte Ist die Abtastrate nicht doppelt so hoch, wie die höchste Frequenz – kann es zu Nebeneffekten kommen: Frequenz - Überlappungen (Aliasing) Quantisierungsrauschen Verzerrungen (Clipping)

Aliasing Beispiel: Aufnahme mit einer Abtastrate von 8 kHz Das Nyquist-Limit liegt damit bei 4 kHz Versucht man nun ein Signal mit 5 kHz aufzunehmen, erhält man beim Abspielen nur ein Signal von 3 kHz. Dies führt zu einem der wichtigsten Probleme in der Arbeit mit digitalem Sound.

Aliasing Das Problem: Ein digitales Sample kann durch mehrere Sinuswellen repräsentiert werden. Beim Abspielen kann es passieren, dass der DAC nicht das Signal auswählt, dass man gerne möchte. Er wählt immer nur Signale unterhalb der Nyquest-Limits.

Quantisierungsrauschen Quantisierung ist der Vorgang des Rundens von genauen analogen zu weniger genauen digitalen Werten. Digitale Daten werden repräsentiert durch diskrete Werte ( 8 Bit Integer oder auch 16 Bit Integer ) Originale analoge Werte sind aber keine Integer-Werte. Als Quantisierungsrauschen bezeichnet man den Fehler der beim Runden entsteht. Der entstehende Fehler ist zufällig und wird als eine Art des Rauschens wahrgenommen.

Quantisierungsrauschen Wie laut ist dieses Rauschen? Die Amplitude des Rauschens wird als „noise floor“ bezeichnet. Je kleiner sie ist, desto leiser ist das Rauschen. Bei einem 8 Bit-Sample haben wir Werte zwischen +127 bis -128 und der Fehler ist max. 0,5 ! Bei einem 16 Bit-Sample sind die Schritte wesentlich kleiner, dadurch wird das Rauschen leiser.

Quantisierungsrauschen Noch wichtiger ist die Frage, wie laut ist das Rauchschen im Verhältnis zum eigentlichen Ton. Das Verhältnis bezeichnet man als „signal-to-noise ratio“ ( SNR ) Je größer dieses Verhältnis ist, desto besser.

Beheben von Verzerrungen (Dithering) Das menschliche Ohr nimmt Verzerrung eher als Rauschen. Deshalb wird versucht, verschiedene Arten von Verzerrung in Hochfrequenzrauschen umzuwandeln. Diesen Prozess nennt man Dithering. Idee: „error – diffusion“ Wird beim Konvertieren von höher-auflösenden in niedriger-auflösende Signal angewandt. Man merkt sich den auftretenden Fehler und vermischt ihn mit den nachfolgenden Werten.

Clipping Eine Art der Verzerrung Die Spitzen der Sinuskurven werden abgeschnitten. Tritt auf, wenn Verstärkerschaltkreise gesättigt sind. In der Digitaltechnik, wenn es zu Variablenüberläufen kommt.

Video Der Begriff Video stammt von dem lateinischen Begriff videre (sehen) und bezeichnet Sequenzen von bewegten Bildern, die zur Bildschirmausgabe geeignet sind.

Physikalische Grundlagen Wie sieht der Mensch? Die 3-dimensionalen Welt wird auf die Netzhaut des Auges als ein 2-dimensionales Bild projeziert. Fotorezeptoren registrieren Lichtwellen zwischen 400 nm und 700 nm. Wie speichert eine Kamera ein Bild? Der Film besteht aus einer dünnen Schicht kleinster Teilchen, die eine chemische reagiere, je nach dem mit welcher Lichtintensität sie bestrahlt werden. Je dichter die Teilchen angeordnet sind, desto besser kann das Original reproduziert werden.

Allgemeines Digitalisieren Ein Bild aus der physikalischen Welt, wird in zwei Schritten digitalisiert. Sampling 2-dimensionaler Raum wird in kleine diskrete Regionen (Pixel oder auch Pel) unterteilt. Auch hier gilt Nyquist-Theorem – die Abtastrate sollte mindestens doppelt so groß sein, wie die höchste räumliche Frequenzkomponente. Quantisierung Jeder Region wird ein diskreter Wert zugewiesen, der der Amplitude des Signals ( z.B. der Helligkeit und/oder dem Farbwert ) entspricht.

Was wird abgetastet? Zweifarbtonbild (z.B.: Text in einem Buch): Es reicht ein Bit pro Pixel. Helligkeit und Farbe werden nicht verändert. Schwarzweißbild: Es wird nur der Luminanzwert zu jedem Pixel gespeichert. Die Farbe ist für das ganze Bild konstant, nur der Helligkeitswert wird abgespeicher. Farbbilder: Zu jedem Pixel werden 3 Komponenten gespeichert.

Farbschemata Licht ist die Mischung elektromagnetischer Wellen verschiedener Wellenlängen. Theoretisch ist es möglich, jede beliebige Farbe unter Verwendung von drei Grundkomponenten darzustellen. Praktisch gibt es einige Einschränkungen, der Farbquellen. Gängige Farbschemata: RGB ( Rot, Grün, Blau ) CMY ( Cyan, Magenta, Gelb ) YUV ( Luminanz, U und V sind Chrominanz-Komponenten ) YIQ ( ähnlich zu YUV ) HSV ( Hue (Farbton), Saturation (Sättigung), Value (Wert) )

Definitionen Chroma Chrominanz, C, Cr, Cb, U, V Luma Luminanz, Y Farbanteil des Videosignals. Komponentensignale enthalten ein Signal für die Differenz weiss-rot (Cr oder U) und weiss-blau (Cb oder V). Luma Luminanz, Y Helligkeitsanteil des Videosignals. Aus den drei Signalen RGB der Kamera wird ein gewichtetes Mittel berechnet, welches die Eigenschaften des menschlichen Auges berücksichtigt Grün 59%, Rot 30%, Blau 11%.

Sampling Wie wird abgetastet? Videobilder werden horizontal, vertikal und temporal abgetastet. Ein Bild besteht aus einer bestimmten Anzahl von Zeilen. Fernsehbilder (PAL – Standard für Europa) bestehen z.B. aus 625 Zeilen, von denen aber nur ca. 580 sichtbar sind. Die restlichen Zeilen sind scanning-overhead. Er wird genutzt für Blanking-Intervalle und zur Synchronisierung des Signals.

Analoges Video Es gibt unterschiedliche Fernsehformate, die sich unter anderem in der Frequenz der Bildwiederholungen und der Anzahl der Zeilen eines Bildes unterscheiden. Die bekanntesten sind: Pal / Secam Europa NTSC USA

PAL / SECAM 1966/67 Einführung in Deutschland 25 Voll- bzw. 50 Halbbilder / Sekunde PAL: QAM (Quadratur-Amplituden-Modulation) SECAM: FM (Frequenzmodulation) Verwendet zusätzl. Synchronisation für Farbtreue Dimension: 625 Zeilen(580 sichtbar) Seitenverhältnis 4:3 Bandbreite ist: 6.5 MHz Abtastrate liegt bei: 13.5 MHz

NTSC 1954 Einführung in den USA (Kanada, Japan) 30 Voll- bzw. 60 Halbbilder / Sekunde QAM ( Quadratur-Amplituden-Modulation) „Nether the same color“ – Farbverfälschung durch unkorrigierte Übertragungsfehler z. B. Hautfarbe als Olivgrün oder Knallrosa. NTSC-Fernsehgeräte haben einen Regler, um entsprechende Korrekturen vorzunehmen Dimension: 525 Zeilen(480 sichtbar) Seitenverhältnis 4:3 Bandbreite: 5.5 MHz

Digitalisierung Im Gegensatz zu den Druckwellen eines akustischen Signals kann eine diskrete Folge von Einzelbildern als kontinuierliche Sequenz wahrgenommen werden. Die Grenzfrequenz liegt bei etwa 16 Hz. Allerdings entsteht bis etwa 50 Hz ein Flimmereffekt durch die unvollkommene Speicherwirkung des Auges für optische Reize. Bei Fernsehgeräten wird ein Vollbild in zwei zeilenweise ineinandergeschachtelte Halbbilder geteilt. Es wird jeweils ein Halbbild nach dem anderen im Zeilensprungverfahren übertragen (Interlace-Verfahren). Zuerst werden alle ungeraden Zeilen übertragen, dann die geraden. Jedes Halbbild wird 25mal pro Sekunde dargestellt, also beträgt die Vertikalfrequenz eines Vollbildes 50 Hz, die Zeit zwischen zwei Halbbildern 20 msec.

Abtastmethoden Verschiedene Abtastmethoden 4:1:1 4:2:0 4:2:2 4:4:4 das Farbsignal wird nur bei jedem vierten Pixel, dafür aber in beiden Halbbildern horizontal verschoben abgetastet. 4:2:0 das Farbsignal wird nur bei jedem zweiten Halbbild und nur in halber Auflösung abgetastet 4:2:2 für professionelles digitales Video Jedes Pixel wird nach Luminanz (Y) und jedes zweite nach den Rot- und Blaudifferenzen (Cr und Cb) abgetastet. Dabei wird die Tatsache ausgenützt, dass das Auge weniger empfindlich auf die Farbe ist als auf die Helligkeit. 4:4:4 Hochqualitatives digitales Format Jedes Pixel, sowohl in Luminanz wie in den Blau- und Rotdifferenzen wird abgetastet Wird nur in Effektgeräten verwendet

Quantisierung Auch in der Videodigitalisierung werden kontinuierliche Signale in diskrete Werte umgewandelt. Für ein einpoliges Signal wie Luminanz, wird Quantisierung genutzt. Für ein zweipoliges Signal wie zum Beispiel die Farbdifferenz (Cb, Cr) wird mid-tread Quantisierung angewandt. Das sichert, dass der Nullwert nicht von Fehlern betroffen wird.

Sampling-Problems Wie auch bei Abtasten von Audiosignalen kann es zu Fehlern kommen. Noise ( Rauschen ), führt zu Verzerrungen des Bildes