Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Sprachverstehen Anatomie. Harvard-MIT Division of Health Sciences and Technology HST.725: Music Perception and Cognition Prof. Peter Cariani.

Ähnliche Präsentationen


Präsentation zum Thema: "Sprachverstehen Anatomie. Harvard-MIT Division of Health Sciences and Technology HST.725: Music Perception and Cognition Prof. Peter Cariani."—  Präsentation transkript:

1 Sprachverstehen Anatomie

2 Harvard-MIT Division of Health Sciences and Technology HST.725: Music Perception and Cognition Prof. Peter Cariani

3

4 Sprachverstehen Dichotisches Hören: Höreindruck des rechten Ohres dominiert, d.h. VP berichten häufiger das, was sie rechts gehört haben (right ear advantage )

5

6 Zatorre, Belin & Penhune, 2002, TICS

7

8 Fig. 2. (a) 3-D rendering of the functional activation pattern in our spectral–temporal study. The brain is viewed from the right side, with the level of the horizontal section indicated in the inset. Green areas, located bilaterally within Heschl’s gyrus (H) correspond to regions showing significant covariation of CBF with increasing rate of temporal change, red areas (located in anterior superior temporal cortex, and in right superior temporal sulcus, STS) correspond to regions whose CBF increased as a function of changes in the spectral parameter. (b) Blood flow changes in the three cortical regions that showed increases to the spectral input parameter (open symbols, spectral parameter; filled symbols, temporal parameter). Symbols indicate average cerebral blood flow (CBF) ± one standard error of the mean; lines are drawn through the least-squares linear solution corresponding to these points. (c) Histograms showing percentage blood flow difference when all temporal and spectral conditions were compared with one another. The left graph shows greater activity in the left than the right Heschl’s gyrus (green areas in a) in response to the temporal stimuli as compared with the spectral stimuli; the right graph shows greater activity in the right than left anterior superior temporal cortex (red areas in a) to the spectral as compared with the temporal stimuli. Adapted from Ref. [59].

9

10 Eigenschaften des Gehörs Das akustische Signal besteht aus Schallwellen. Wellen haben die Eigenschaften Frequenz (Anzahl der Schwingungen/sec ) und Amplitude (Stärke der Schwingung) Was können menschliche Hörer unterscheiden? Frequenzunterschiede: 20 Hz (1 Hz = 1 Schwingung /sec) Amplitudenunterschiede: 0.5 dB (Dezibel; 1 dB = 20 log Px/P0) (Flüstern = 20dB, Kinopublikum 45dB, Kaufhaus 60dB) Theoretisch mögliche Unterscheidungen: 250 Amplituden (0-125 dB) 1000 Frequenzen (10 – 20000 Hz) 250000 Kombinationen Tatsächlich benutzen Sprachen aber nur höchstens 80 Phoneme.

11 Eigenschaften des Gehörs Was können menschliche Hörer identifizieren (Pollack, 1952, 1953, 1954)? 5 verschiedene Frequenzkategorien 5-7 verschiedene Amplitudenkategorien 8-9 Kombinationen aus Frequenz und Amplitude 6 verschiedene Dimensionen zusammen erlauben etwa 32 identifizierbare Kategorien. Wir können also nicht alle unterscheidbaren akustischen Signale identifizieren, sondern nur eine viel geringere Anzahl von Kategorien. > Trade-off zwischen Menge der Information und Sicherheit der Erkennung. Wie viel Information kann damit übertragen werden?

12 Information Information reduziert Unsicherheit. Bei wenigen Möglichkeiten ist die Unsicherheit klein, bei vielen gro ß. Einheit der Information: bit Anzahl gleichwahrscheinlicher Möglichkeiten = 2 x bit (Kopf oder Zahl beim Münzwurf: 2 Möglichkeiten; 2 = 2 1 ; also 1 bit Wenn alle Phoneme des Deutschen (ca 40) gleichwahrscheinlich wären: 40 Möglichkeiten; 40 = 2 x ; log 40 = log (2 x ) log 40 = x log 2 log 40/log2 = x x= 5.32 1 Phonem = 5.32 bit 1 Buchstabe (von ca 29) = 4.91 bit

13 Information Informationsgehalt eines bestimmten Ereignisses i, das mit der Wahrscheinlichkeit p i auftritt: H i = log 2 1/p i d.h. je wahrscheinlicher, desto weniger Information. Je ungleicher die Wahrscheinlichkeit der verschiedenen Möglichkeiten, desto weniger Information hat jede einzelne Möglichkeit im Durchschnitt. Informationsübertragung ist nie perfekt. Störungen nennt man Rauschen. Signal-Rausch-Verhältnis gibt an, wie deutlich das Signal (also etwa die Buchstaben oder Phoneme) im Verhältnis zum Rauschen wahrzunehmen ist. Je weniger Informationen man überträgt, desto weniger deutlich muss das Signal sein.

14 Kreuzworträtsel E ORN

15 Amplitudenbereiche des Sprachsignals Sprache ohne den mittleren Lautstärkebereich ist nicht zu verstehen. Sprache ohne ganz laute und ganz leise Anteile dagegen recht gut. Die lauten Anteile sind die Vokale. > Konsonanten informativer als Vokale.

16

17 Informationsübertragung Informationsübertragung ist nie perfekt. Störungen nennt man Rauschen. Signal-Rausch-Verhältnis gibt an, wie deutlich das Signal (also etwa die Buchstaben oder Phoneme) im Verhältnis zum Rauschen wahrzunehmen ist. Bei akustischer Übertragung: Lautstärke Signal / Lautstärke Rauschen Je weniger Informationen man überträgt, desto weniger deutlich muss das Signal sein.

18

19 Phonemerkennung

20

21

22

23

24

25

26

27

28

29

30

31

32


Herunterladen ppt "Sprachverstehen Anatomie. Harvard-MIT Division of Health Sciences and Technology HST.725: Music Perception and Cognition Prof. Peter Cariani."

Ähnliche Präsentationen


Google-Anzeigen