Multimediatechnik / Audio Dipl. -Ing. Oliver Lietz http://www Multimediatechnik / Audio Dipl.-Ing. Oliver Lietz http://www.nanocosmos.de/lietz/mta Digitallabor: Server \\dsy100sv\MTA
Übersicht Organisatorisches Person Fachlicher Überblick Übungen
Organisatorisches Blockveranstaltung alle 2 Wo./2 Blöcke
Veranstaltung Multimediatechnik / Audio, Übung 2 SWS, Doppel-Block 14täglich Frage: 4-fach-Block-Termin? Prüfungsleistungen? Bitte per Email anmelden!
Übersicht Person
Person Dipl.-Ing. Elektrotechnik TU Berlin Nachrichtentechnik / Akustik / Informatik Neuer Lehrauftrag seit einer Woche Mitarbeiter am Heinrich-Hertz-Institut Berlin Forschung/Entwicklung MPEG-Codierung Gründer / Partner nanocosmos gmbh Entwicklung und Beratung für Multimedia-Software http://www.nanocosmos.de/lietz/ lietz@nanocosmos.de
Person Schwerpunkte: Geteilte Übung mit Dozent Michael Steppat Audioverarbeitung, Codecs, Formate, Sprachverarbeitung Weniger: Musik-Synthesizer Geteilte Übung mit Dozent Michael Steppat
Projekte Softwarecodecs (MP3, MPEG, H.264, DVD, HD) Softwareprodukte zur Video-/Audioverarbeitung Spezialentwicklungen für Kunden Forschungsnahe Entwicklung & Beratung
TranSpeaker Servergesteuerte Sprachsynthese (TTS) MP3-Streaming von übersetzten Texten
Inhalt Abtastung / Quantisierung Dateiformate
Material / Internet / Software Audacity (Audio Editor, OpenSource) Waveosaur (Audio Editor, Freeware) VirtualDub (Freeware Video Editor) zusätzliche Plugins Samplitude (kommerziell)
Audacity Audio-Editor mit Plugins´, VST-kompatibel [OpenSource]
Waveosaur Audio-Editor, Freeware
VirtualDub Video-Editor, auch zum Audio-Konvertieren [ OpenSource ]
Digitalisierung eines Signals Abtastung & Quantisierung = Puls-Code-Modulation (PCM)
Datenmenge PCM Beispiel: 44.1 kHz (Samples/Sekunde) 16 Bit/Sample Auflösung Datenmenge: 44100 * 2 Bytes = 88200 Bytes/Sekunde je Kanal
Dateiformate und Codecs Wave (Microsoft) Container/Kapselung verschiedener Formate (Codecs) RIFF-Datenpakete (Chunks), ähnlich AVI chunkID chunkSize wFormatTag (short) wChannels (unsigned short) dwSamplesPerSec (unsigned int) dwAvgBytesPerSec (unsigned int) wBlockAlign (unsigned short) wBitsPerSample (unsigned short)
Dateiformate und Codecs MP3 ISO-Standard „MPEG-Audio Layer 3“ Verlustbehaftete Komprimierung Kein spezieller Container wie WAVE „Elementarstrom“: nur Audio bzw. Video Audio+Video: MPEG-Programmstrom Aufbau in „Frames“ mit je gleichem Header: Syncword, Bitrate, Samplingrate, …
Audiocodierung Unkomprimiert: PCM Sampling-Frequenz, Auflösung (Bits) Z.B. 44,1 kHz, 16 Bits
Übung: Audiospur aus Video extrahieren VirtualDub.exe File/Open loriot.avi File/Properties: Formate für Bild und Ton File/Save As WAV: loriot1.wav Abspielen mit MediaPlayer Warum ist nichts zu hören? Darauf achten, dass PCM-Format verwendet wird!
Audioformate in AVI/WAVE AVI enthält verschiedene Formate, in diesem Fall: Video: XVID/MPEG-4 Audio: MP3 (MPEG Layer 3) „Direct Stream Copy“ kopiert Daten direkt „Full Processing Mode“ -> in PCM konvertieren Save As WAV…
Zeit- und Frequenzdarstellung Sprache „Es bleibt“ Frequenzen: hörbar ca. 20 Hz - 20 kHz Audacity „Analyse / Frequenzanalyse“
Filter / Equalizer Tiefpass: nur tiefe Frequenzen durchlassen Audacity: Effekt / Filter / Equalizer
Aufgaben Brandt.wav: Loriot.wav: Schneiden / Mischen: Bandpass-Filter, 1000-3000 Hz, Speichern als bandpass.wav Analyse/Frequenzanalyse, Screenshot speichern andere Filter ausprobieren: Abschnitt markieren, Amplifier / Verstärken / Normalisieren Loriot.wav: 2 Redner (z.B. Brandt und Sprecher) herausschneiden und speichern als Brandt1.wav, Kommentar.wav, jeweils ca. 20 Sekunden Schneiden / Mischen: Redner abwechselnd kurze Stellen hintereinander sprechen lassen Jeweils auf rechten/linken Kanal legen (Stereo/Lautstärke anpassen)
Stereo-Spuren bearbeiten Stereotonspur trennen Danach Spuren einzeln bearbeiten
Alias-Effekt Abtastfrequenz zu niedrig Aliasfrequenz
Aufgabe für Waveosaur (Aliasing) Datei öffnen, Brandt.wav Resampling: von 48 kHz nach 5 kHz Erst ohne, dann mit Filter !