Symbole&Signale Hamburg WS 04/05,

Slides:



Advertisements
Ähnliche Präsentationen
Ludwig van Beethoven Ludwig van Beethoven
Advertisements

Statistische Aspekte der PSG
Algebraische Zahlen: Exaktes Rechnen mit Wurzeln
Beat- und Metrumsextraktion mit gaußifizierten Einsatzzeiten Musikwissenschaftliches Institut Hamburg WS 2005/06 Klaus Frieler.
„The Petroushka Chord: A perceptual Investigation“
Rechnergestützte Musikanalyse Einführung Projektseminar Musikwissenschaftliches Institut Hamburg WS 2005/06 Leitung: Klaus Frieler.
Statistische Suche nach melodischen Prototypen
Auditory Scene Analysis
Beat- und Metrumsextraktion mit gaußifizierten Einsatzzeiten Klaus Frieler Universität Hamburg Musikwissenschaftliches Institut Seminar , SoSe 08.
Musikwissenschaftliches Institut
Digitalgeometrie mit Anwendungen zur Bildanalyse und Computergrafik
Grundlagen der Informatik
Kombinatorische Topologie in der 3d Geomodellierung
Ein Modellansatz zur Beschreibung von Vagheiten
Klaus Volbert 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Sommersemester 2004.
On a Buzzword: Hierachical Structure David Parnas.
Heuristiken und Kontexteinflüsse
FH-Hof Optimierungsverfahren für kombinatorische Probleme Richard Göbel.
Was ist die artikulatorische Grundlage von Locus-Gleichungen? Hauptseminar: Modelle der Sprachproduktion & - perzeption Dozent: Prof. Dr. Jonathan Harrington.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (02 – Funktionenklassen) Tobias Lauer.
Kapitel 1 Das Schubfachprinzip
Kapitel 1 Die natürlichen und die ganze Zahlen. Kapitel 1: Die natürlichen und die ganzen Zahlen © Beutelspacher/Zschiegner April 2005 Seite 2 Inhalt.
Kapitel 6 Differenzierbarkeit. Kapitel 6: Differenzierbarkeit © Beutelspacher Juni 2005 Seite 2 Inhalt 6.1 Die Definition 6.2 Die Eigenschaften 6.3 Extremwerte.
Neuronale Grundlagen der Gestaltwahrnehmung
Beispiele für Ausdrucksalgebren
Reinforcement Learning
Modellierungsmethoden in der Verhaltenstherapie
Die Gestaltpsychologie: von Elisabeth Hertenstein
So animieren Sie Kreisdiagramme mit der Eingangs-Animation „Rad“
2 5 SS 2006V_4_Fuzzy_Control_Teil2 1 Was ist CI (Computational Intelligence) Jörg Krone, Ulrich Lehmann, Hans Brenig, Oliver Drölle, Udo Reitz, Michael.
Folie 1 Kapitel II. Vom Raumbegriff zu algebraischen Strukturen Neubeginn: Herleitung des Begriffs Vektorraum aus intuitiven Vorstellungen über den Raumbegriff.
§8 Gruppen und Körper (8.1) Definition: Eine Gruppe G ist eine Menge zusammen mit einer Verknüpfung, die jedem Paar (a,b) von Elementen aus G ein weiteres.
Projekt: Routeninstruktionen mit Sprache und Skizzen
Wiederholung und Beispiele
Variationsformalismus für das freie Teilchen
§10 Vektorraum. Definition und Beispiele
Wissenserwerb mit Texten, Bildern und Diagrammen nach Wolfgang Schnotz
Ausgleichungsrechnung II
Effiziente Algorithmen
Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.
Geoinformation II Vorlesung 4 SS 2001 Voronoi-Diagramme.
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/ /23.1.
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Hartmut Klauck Universität Frankfurt SS
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
§3 Allgemeine lineare Gleichungssysteme
Einführung in die Programmierung Wintersemester 2013/14 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Shape Similarity 27. Februar 2006 Michael Keller.
Erfindervon Fuzzy Logic
Ludwig van Beethoven Ludwig van Beethoven
Religiöse Vielfalt – Bedrohung oder Chance?
Studieren Lernen Claudia Lischke-Arzt.
Feature-Integration-Theory Merkmals-Integrations-Theorie
Produktvergleich durch Werbung und Fragebogen
Langzeitaufgaben. Merkmale Die Aufgabenstellung enthält bewusst Begriffe aus der Alltagssprache in ihrer eher diffusen Bedeutung (optimal, sinnvoll, effektiv),
Analyse der Laufzeit von Algorithmen
Gestaltwahrnehmung Seminar: Visuelle Wahrnehmung
Vom graphischen Differenzieren
Unscharfe Anfragen in Multimedia- Datenbanksystemen Seminar Multimedia-Datenbanken WS 2001/2002 Silvana Runow.
Seminar Computing with words WS2001/02 1 Linguistische Hecken Simon Meyer.
Die Gestaltpsychologie
Folie 1 §8 Gruppen und Körper (8.1) Definition: Eine Gruppe G ist eine Menge zusammen mit einer Verknüpfung, die jedem Paar (a,b) von Elementen aus G ein.
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
Prognose von Zeitreihen Hans Nübel Hans Nübel Prognose von Zeitreihen Aufbau 1.Motivation 2.Holt-Winters-Verfahren 3.Prognose.
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
 Präsentation transkript:

Symbole&Signale Hamburg WS 04/05, 14.1.2005 Segmentierung Anfang des Segmentierungssegments Klaus Frieler Symbole&Signale Hamburg WS 04/05, 14.1.2005

Aufbau Einleitung Lerdahl & Jackendoffs GTTM D.Temperleys Modell (Grouper) E. Cambouropoulos LBDM Was noch? Zusammenfassung/Ausblick

Einleitung Begriff der Gruppierung Vorbemerkung: Wir reden im Folgenden ausschließlich über monophone Melodien Musiktheorie, eigene Hörererfahrung und perzeptive Studien machen klar, dass Melodien i.A. als Abfolge von einzelnen Gruppen gehört wird. Die Zerlegung einer Melodien in einzelne Gruppen heißt Segmentierung. Segmentierung wird heutzutage als unabhängig von Metrik angenommen.

Einleitung Begriff der Gruppierung Segmentierung ist i.A. hierarchisch Klassische Musiktheorie spricht von Motiven, Untermotiven, Phrasen, Satzperioden, Abschnitten bis hin zu großen Formteilen wie Exposition, Durchführung, Reprise etc. Aber: Inter- und intrasubjektive Varianz: „Richtige“ Gruppierung schwer zu definieren. Oft mehrdeutig.

Einleitung Gestaltpsychologie Die Gruppierung von Einzelementen zu Gestalten ist allgemeines Wahrnehmungsphänomen In dieser Form erforscht von den Gestaltpsychologen Anfang des 20.Jhd. Wichtige Gestaltpsychologen: Wertheimer, Koffka, Köhler Direkte Linie zu Stumpf, Wundt, von Ehrenfels Gestalttheorie schon immer stark musikalisch orientiert.

Einleitung Gestaltpsychologie Was ist eine Gestalt?! Ein unscharfer aber intuitiv klarer Begriff Ein zusammenhängendes Ganzes Mehr als die „Summe“ seiner Teile Eine (quasi) autonome Leistung des Wahrnehmungsapparates Gestalten kann man anhand von Gestaltregeln aus den Einzelkomponenten deduzieren.

Einleitung Gestaltregeln Prinzip der Nähe Objekte in der Nähe werden eher gruppiert Prinzip der Ähnlichkeit/Gleichheit Ähnliche Objekte werden eher gruppiert Prinzip des gemeinsamen Schicksals Objekte mit gleichartigen Dynamik werden eher gruppiert Prinzip der guten Fortsetzung Die einfachste Fortsetzung ist die Beste Prinzip der Geschlossenheit ?? Prinzip der guten Gestalt/Prägnanz Bevorzuge prägnante Gestalten (Kombination obiger Prinzipien)

2. GTTM Lerdahl&Jackendoff veröffentlichen 1983 einflussreiches Buch: A Generative Theory of Tonal Music (GTTM) Kombination von Musiktheorie, Linguistik, Kognitions/Gestaltpsychologie zu einem formalen Regelsystem der Musikanalyse Gegenstand: Gruppierung, Metrik, Zeitspannenreduktion, Prolongation Zwei Regeltypen: Wohlgeformheitsregeln (well-formedness) Vorzugsregeln (preference rules)

2. GTTM Wohlgeformtheitsregeln GWFR 1: Eine Gruppe ist eine zusammenhängende Folge von musikalischen Ereignissen. GWFR 2: Die ganze Melodie bildet eine Gruppe. GWFR 3: Eine Gruppe kann kleinere Gruppen enthalten. GWFR 4: Wenn eine Gruppe einen Teil einer anderen Gruppe enthält, so muss sie die Gruppe als Ganzes enthalten. GWFR 5: Untergruppen müssen eine Gruppe erschöpfen.

2. GTTM Wohlgeformtheitsregeln Anderes gesagt: Eine Melodie zerfällt in eine erschöpfende, nicht-überlappende Hierarchie von Gruppen. In einer Zusatzregeln lassen L&J Gruppenüberlapp von einem Ton zu (motiviert durch zahlreiche Beispiele aus der Musikliteratur) Die Wohlgeformtheitsregeln sind notwendig, aber nicht hinreichend Vorzugsregeln

2. GTTM Vorzugsregeln Sei n1n2n3n4 eine Folge von Noten. GPR 1: Vermeide sehr kleine Gruppen, insbeondere einelementige. Sei n1n2n3n4 eine Folge von Noten. GPR 2:(Zeitliche Nähe) Zwischen n2 und n3 kann eine Gruppengrenze liegen , falls: a)(Bindebogen/Pause) zwischen n2n3 das größte OOI oder b)(Einsatzpunkt) zwischen n2n3 das größte IOI liegt

2. GTTM Vorzugsregeln GPR 3: (Veränderung) Zwischen n2 und n3 kann eine Gruppengrenze liegen , falls: a)(Register) zwischen n2n3 das größte Intervall liegt, oder b)(Dynamik) zwischen n2n3 ein Lautstärkewechsel stattfindet, oder c)(Artikulation) ein Artikulationswechsel, oder d)(Dauern) ein Dauernwechsel

2. GTTM Vorzugsregeln GPR 4: (Intensivierung) Lege Großgruppengrenzen an den Stellen, wo die Effekte von GPR 2&3 am deutlichsten sind. GPR 5: (Symmetrie) Bevorzuge Gruppierungen mit Untergruppen möglichst gleicher Länge. GPR 6: (Parallelität) Wenn 2 oder mehr Segmente als parallel (sprich: ähnlich) angesehen werden können, formen sie vorzugsweise parallele Teile einer Gruppe.

2. GTTM Beispiel Anfangsthema von W.A. Mozarts Sinfonie Nr.40 (g-Moll, KV 550), Regeln und mögliche Gruppierung

2. GTTM Diskussion Nicht quantifiziert bzw. operationalisierbar, d.h. schwer testbar und nicht rechnertauglich. Sehr vage Parallelitätsregel. Per definition gebunden an westlicher tonale Musik.

3. Temperleys Modell Beschrieben in The Cognition of Basic Musical Structures (2001) Basiert auf vereinfachten/modifizierten GTTM-Regeln Modell ist operationalisiert und implementiert in der Software Grouper, Teil des frei erhältlichen Softwarepakets Melisma (s. Link auf Webseite) Modell ist recht erfolgreich.

3. Temperleys Modell Vermeidet Probleme nichteindeutiger oder polyphoner Gruppierung durch explizite Beschränkung auf einstimmige Volkslieder als Evaluationsmaterial Beschränkt sich auf nur eine Ebene der Segmentierung, die Phrasenebene. Sehr einfaches Modell mit nur 3 Vorzugsregeln (Phrase Structure Preference Rules)

3. Temperleys Modell PSR 1:(Lückenregel) Setze Phrasengrenzen bevorzugt an Stellen mit großem IOI oder großem OOI Bewertung (gap score): IOI+OOI (normalisiert durch mittleres IOI bis dahin)

3. Temperleys Modell PSR 2:(Längenregel) Bevorzuge Phrasen mit ungefähr 8 Noten. Bewertung: -|log2(N/8)| (Bestrafung)

3. Temperleys Modell PSR 3:(Metrische Parallelität) Bevorzuge aueinanderfolgende Phrasen, die auf derselben Taktzeit beginnen. Bewertung: Bestrafung bei nicht Parallelität auf Halbtakt- und Taktlevel (genaue Werte nicht bekannt...)

3. Temperleys Modell Alle drei Regeln werden gegeneinander gewichtet (Gewichte durch trial-and-error ermittelt, nicht dokumentiert) Die optimale Lösung wird aus den Gesamtwerten an jeder Stelle durch Dynamische Programmierung ermittelt.

3. Temperleys Modell Beispiel Lückenwerte (gap score)

4. Cambouropoulos‘ LBDM Beschrieben in „Towards a General Computational Theory of Musical Structure.“ (Diss., 1998) LBDM = Local Boundary Detection Model („Lokales Grenzerkennungs Modell“) Basiert im Prinzip auf Gestaltregeln. Jedem Zwischenraum zwischen zwei Noten wird eine Grenzstärke zugeordnet. Umfasst die meisten GTTM Regeln (GPR 2&3)

4. Cambouropoulos‘ LBDM LBDM beruht auf dem verallgemeinerten Prinzip von Gleichheit/Verschiedenheit, dass die Gestaltprinzipien Ähnlichkeit und Nähe (im Prinzip) ersetzen kann. LBDM hat 3 Regeln die Differenzen musikalischer Parameter nach Gleichheit/Verschiedenheit werten. Gruppengrenze an lokalen Maxima der Grenzstärken

4. Cambouropoulos‘ LBDM G-ICR: (general identity-change rule) Gruppengrenzen können nur zwischen verschiedenen Entitäten liegen. Bewertung: 2 Punkte (für intrinsischer nicht-abgleiteter Eigenschaften, z.B. Dauer)

4. Cambouropoulos‘ LBDM ICR: (identity-change rule) Jedes Intervall zwischen 3 benachbarten Objekten kann ein Gruppengrenze sein, falls die Intervalle verschieden sind. Bewertung: 1 Punkt für jedes Intervall.

4. Cambouropoulos‘ LBDM PR: (proximity rule) Bilden drei Objekte zwei Intervalle die verschieden sind, dann wähle das größere Intervall als Gruppengrenze. Bewertung: 1 Punkt für‘s größere Intervall.

4. Cambouropoulos‘ LBDM Beispiel Seien drei Töne zu den Zeitpunkten t1, t2, t3 mit Intervallen D1 = t2-t1 und D2 = t3-t2 gegeben. Dann kann gelten: D1 = D2 (0): P1 = P2 = 0 D1 > D2 (+): P1 =1(ICR)+1(PR)+2(G-ICR) = 4 P2 =1(ICR)+0(PR) = 1 D1 < D2 (-): P1 =1(ICR)+0(PR)+2(G-ICR)= 3 P2 =1(ICR)+1(PR) = 2

4. Cambouropoulos‘ LBDM Beispiel Grenzstärken aus 4 Dimensionen für Anfang g-Moll Sinfonie (WAM)

5. Was noch? Tenney&Polansky (1980), Erstes computationelles Modell Sven Ahlbäck (2004): Komplexes Regelsystem (vereinigt viele Ideen aus GTTM, Temperley, Cambouropoulos etc.) Rens Bod (~1999): Data-Oriented Parsing (DOP) Gedächtnisbasiertes Lernen von Phrasengrammatiken. Weyde/Dahlingshaus(~2001): Neuro-fuzzy System. (Lernt Gewichte für Fuzzy-Gruppierungsregeln mit Hilfe von neuronalen Netzen) Vergleichende Studie von Höthker/Spevak/Thom ergab leicht bessere Performance für Temperley über LBDM. Was gibt unser Experiment?

6. Zusammenfassung Segmentierung von Melodien ist wichtiger und integraler Bestandteil der Melodiewahrnehmung. Segmentierung nicht eindeutig. Automatische Segmentierung wichtig für viele Anwendungen. Fast alle Segmentierungsalgorithmen basieren in irgendeiner Form auf Quantifizierung von Gestaltregeln.

Symbole&Signale Hamburg WS 04/05, 14.1.2005 Segmentierungs Ende des Segmentierungssegments Klaus Frieler Symbole&Signale Hamburg WS 04/05, 14.1.2005