Document Details

ChivalrousPlutonium8456

Uploaded by ChivalrousPlutonium8456

Universidad Politécnica de Madrid

Francisco Javier Casajús Quirós

Tags

audiology auditory system sound physics hearing

Summary

This document is part of a master's course on audio and video signal systems, focusing on the auditory system. It outlines the physical and psychoacoustic components involved. It includes discussions on sound physics, hearing description and models, psychoacoustics, including critical bands and loudness, and binaural hearing.

Full Transcript

Señal de audio y vı́deo Sistema Auditivo Máster de formación permanente en ingenierı́a de producción y explotación de contenidos Francisco Javier Casajús Quirós Departamento de Señales, Sistemas y Radiocomunicaciones E.T.S. Ingenie...

Señal de audio y vı́deo Sistema Auditivo Máster de formación permanente en ingenierı́a de producción y explotación de contenidos Francisco Javier Casajús Quirós Departamento de Señales, Sistemas y Radiocomunicaciones E.T.S. Ingenieros de Telecomunicación Universidad Politécnica de Madrid Índice 1. Introducción Fı́sica del sonido 2. Audición Descripción y modelos empı́ricos Modelado fı́sico 3. Psicoacústica Introducción Bandas crı́ticas Sonoridad Enmascaramiento 4. Audición binaural 2 / 89 Introducción Propósito En este apartado se describe el funcionamiento del aparato auditivo humano hasta los lı́mites del conocimiento actual del mismo. Concluiremos que el oı́do humano actúa como un excelente analizador espectral con una sensibilidad y precisión considerables. En concreto estudiaremos: I Los parámetros del oı́do desde el punto de vista de la teorı́a de sistemas lineales. I Los conceptos de bandas crı́ticas y enmascaramiento. I La localización de fuentes sonoras. La conclusión final es que el proceso de audición puede modelarse mediante un banco de filtros muy precisamente definidos. Este aspecto es fundamental a la hora de utilizar con ventaja las propiedades del aparato auditivo en sistemas de grabación-reproducción, compresión o postprocesado de audio. 3 / 89 Introducción Fı́sica del sonido 1. Introducción Fı́sica del sonido 2. Audición Descripción y modelos empı́ricos Modelado fı́sico 3. Psicoacústica Introducción Bandas crı́ticas Sonoridad Enmascaramiento 4. Audición binaural 4 / 89 Introducción Fı́sica del sonido Presión Presión sonora instantánea, p(t) Es el cambio de presión respecto a la presión estática (sin sonido) en un instante dado. Se mide en pascales 1 Pa = 1 N/m2. Presión sonora eficaz, pef Es el valor eficaz o rms de la presión instantánea en un punto dado. Densidad del aire, ρ Para una temperatura de T = 22 ◦ C y una presión estática P0 = 105 Pa (1 atmósfera), ρ = 1,18 kg/m3 5 / 89 Introducción Fı́sica del sonido Velocidad p Velocidad del sonido c En el aire es c = 331,4 T /273. A 22 ◦ C, c = 344,8 m/s Velocidad instantánea de partı́culas u(t) Es la velocidad que, debido a una onda sonora, adquiere una porción infinitesimal del medio de propagación en un instante dado. Velocidad eficaz de partı́culas uef Es el valor eficaz o rms de la velocidad instantánea de partı́culas en un punto dado. Un cambio en la presión sonora se traduce en un movimiento de partı́culas que lleva dicho cambio de presión a otro punto. De esta forma la perturbación de la presión se propaga por el medio en forma de onda. 6 / 89 Introducción Fı́sica del sonido Impedancia Se define una relación entre presión y velocidad para sistemas acústicos de forma análoga a la que existe entre tensión y corriente para sistemas eléctricos. P (ω) Impedancia especı́fica Z Es Z(ω) = U (ω). Se mide en rayleighs 1 rayls = 1 N·s/m3. Para ondas cisoidales p̃(t) = Z ũ(t). Impedancia caracterı́stica Z0 Para una onda plana, progresiva y en espacio libre la impedancia especı́fica recibe el nombre de impedancia caracterı́stica y es: Z0 = ρc = 407 7 / 89 Introducción Fı́sica del sonido Intensidad Intensidad sonora I Es la energı́a por unidad de tiempo y área que atraviesa una superficie perpendicular a una dirección dada. Para una onda progresiva en espacio libre: p2ef I = pef · uef = W/m2 ρc Nivel de intensidad IL Es la intensidad en dB relativa a una intensidad de referencia. I IL = 10 log dB Iref Iref = 10−12 W/m2 8 / 89 Introducción Fı́sica del sonido Nivel de presión Nivel de presión sonora SP L Es la presión en dB relativa a una presión de referencia. pef SP L = 20 log dB pref pref = 20 µPa Como p2ef = Iρc, los niveles SP L e IL deberı́an coincidir para ondas progresivas en espacio libre, si las referencias respectivas fueran equivalentes. Esto sólo se cumple de forma aproximada, por lo que tı́picamente IL = SP L − 0, 1 → En lo que sigue tomaremos el nivel de presión como equivalente al nivel de intensidad. 9 / 89 Audición Descripción y modelos empı́ricos 1. Introducción Fı́sica del sonido 2. Audición Descripción y modelos empı́ricos Modelado fı́sico 3. Psicoacústica Introducción Bandas crı́ticas Sonoridad Enmascaramiento 4. Audición binaural 10 / 89 Audición Descripción y modelos empı́ricos Audición Desde el punto de vista del diseñador de equipos y sistemas audiovisuales, la audición humana se apoya en un órgano auditivo con las siguientes propiedades: I Ancho de banda: 20 kHz I Margen dinámico: 120 dB I Es un analizador espectral de Q constante, aproximadamente. 11 / 89 Audición Descripción y modelos empı́ricos Parámetros generales de la audición I Margen de frecuencias: de 20 a 20.000 Hz (tı́pico hasta 17.000 en adultos) I Margen de intensidades 120 dB. Es un factor de 1012. I Se emplea la escala SPL (sound pressure level) como medida de nivel absoluto, con una presión de referencia de 20 µPa I En media, un sonido con esa presión tiene un nivel de intensidad de 0 dB y se considera en el umbral de audibilidad. 12 / 89 Audición Descripción y modelos empı́ricos Intensidades caracterı́sticas Sonido Intensidad (dB SPL) Umbral de silencio 0 Tic-tac de reloj 20 Susurro 30 Conversación normal 50–60 Tráfico 70 Despertador 80 Cortacésped 95 Motosierra 110 Martillo neumático 120 Umbral de dolor 120 Motor a reacción 130 13 / 89 Audición Descripción y modelos empı́ricos El oı́do humano Lateral Canales semicirculares Posterior Estribo Superior Ventana oval Vestíbulo Tendón Ventana redonda timpánico Caracol o cóclea Tendón del Nervio facial Hueso estribo Nervio temporal Yunque vestibular Martillo Nervio coclear Membrana timpánica Concha Externo : Pabellón auricular, concha y conducto. Medio : Tı́mpano y huesecillos. Interno : Caracol y nervio coclear. Pabellón Conducto auditivo externo Trompa de Eustaquio Glándula parótida 14 / 89 Audición Descripción y modelos empı́ricos Funciones del aparato auditivo Externo I Captación del sonido I Directividad Medio I Transmisión al caracol I Adaptación de impedancias acústicas. Interno I Descomposición espectral. 15 / 89 Audición Descripción y modelos empı́ricos Captación: del exterior al tı́mpano 1 Respuesta conjunta de los oı́dos externo y medio Cabeza esférica 20 Torso cuello etc Concha 15 Borde del pabellón Ganancia (dB) Canal auditivo y tı́mpano 10 Total a 45◦ 5 0 −5 Banda (vocal) realzada −10 0,2 0,5 1 2 5 10 Frecuencia (kHz) 1 Shaw, The External Ear, Berlin, 1974 16 / 89 Audición Descripción y modelos empı́ricos I Al sumar las contribuciones de las distintas partes de aparato auditivo se obtiene un realce de la banda media de 1,5 a 8 kHz que es donde se produce la comunicación oral. I Intervienen también elementos externos al oı́do como el torso, el cuello e incluso la ropa. I Las aportaciones más significativas son las de la concha (resonancia a 6 kHz) y el conjunto canal-tı́mpano (2,5 kHz). I Debido a la forma de la cabeza y, especialmente el pabellón auricular, la respuesta depende de la dirección de llegada del sonido. 17 / 89 Audición Descripción y modelos empı́ricos El canal auditivo como resonador Resonancias acústicas en un tubo semicerrado: L Máxima velocidad n=2 n=1 n=3 Velocidad nula I Las frecuencias de resonancia son: c c (2n − 1)c fn = = = λn 4L/(2n − 1) 4L I Para L = 30 mm, f1 = 2850 Hz 18 / 89 Audición Descripción y modelos empı́ricos Directividad 2 Respuesta dependiente del ángulo de incidencia 25 0◦ 20 45◦ 90◦ 15 135◦ Ganancia (dB) 10 5 0 −5 0,2 0,3 0,5 0,7 1 1,4 2 3 4 5 7 10 Frecuencia (kHz) 2 Shaw, The External Ear, Berlin, 1974 19 / 89 Audición Descripción y modelos empı́ricos I Si la fuente pasa de estar situada frontalmente (0◦ ) a una posición posterior (135◦ ) la banda de 2 a 6 kHz sufre una atenuación considerable mientras que las frecuencias inferiores resultan realzadas. I La ganancia a 12 kHz aumenta conforme la fuente pasa de la dirección frontal a la lateral (90◦ ), para disminuir al pasar la fuente detrás del oyente. I Efectos de este tipo permiten que un solo oı́do pueda determinar la posición de una fuente sonora con cierta precisión. 20 / 89 Audición Descripción y modelos empı́ricos Transmisión: desde el tı́mpano al caracol 3 40 Ganancia tı́mpano-vestı́bulo (dB) 20 0 −20 101 102 103 104 Frecuencia (Hz) El énfasis en torno a 1000 Hz se debe a las resonancias mecánicas de los elementos de transmisión. 3 Nedzelnitsky, Sound pressures in the basal turn of the cat cochlea, JASA, 1980 21 / 89 Audición Descripción y modelos empı́ricos Resonancia mecánica Consideramos un elemento de masa m anclado con una unión elástica de constante k y sometido a una fuerza f (t) que, en nuestro caso, es de origen acústico. X f = ma m k f − kx = ma f f = ma + kx d2 x f =m + kx x dt2 22 / 89 Audición Descripción y modelos empı́ricos Resonancia mecánica y resonancia eléctrica Para simplificar el análisis, consideramos el siguiente circuito eléctrico cuya ecuación diferencial es formalmente igual a la del resonador mecánico para L = m y C = 1/k, identificando v con f y q con x. i d2 q Z C di 1 1 v=L + idt = L + q dt C dt2 C v L con pulsación de resonancia: ω0 = √1 LC Pulsación de resonancia del sistema mecánico: r k ω0 = m 23 / 89 Audición Descripción y modelos empı́ricos Necesidad de adaptación Transmisión de sonido entre dos fluidos Z1 Z2 Pi Pt = Pi − Pr Pr Coeficiente de reflexión de potencia R = Pr /Pi Coeficiente de transmisión de potencia T = Pt /Pi Impedancia acústica Z = ρc = p/v 4Z1 Z2 I T = (Z1 +Z2 )2 I Zaire = 410, Zagua = 1,57.106 =⇒ T = 10−3 → −30 dB 24 / 89 Audición Descripción y modelos empı́ricos Adaptación: tı́mpano-caracol o aire-agua I El tı́mpano se halla en contacto con el aire. I El caracol contiene un fluido salino llamado endolinfa, prácticamente igual al agua de mar. I Las fuerzas necesarias para producir en la endolinfa desplazamientos volumétricos iguales a los del aire son muy superiores en aquélla. I La adaptación consiste en una amplificación de la presión acústica a costa de una reducción proporcional de la velocidad volumétrica del fluido. 4 I Ası́ la presión la ventana oval es 30 veces mayor que en el tı́mpano, principalmente merced a los mecanismos que siguen. 4 De forma similar al comportamiento de tensiones y corrientes en un transformador eléctrico. 25 / 89 Audición Descripción y modelos empı́ricos Adaptación de impedancias en el oı́do medio 1/2 Palanca de huesecillos. Yu l2 n l1 qu F2 = F1 ≈ 1,5F1 e l2 F2 l1 v1 F2 = = Martillo F1 l2 v2 l1 El aumento de fuerza entraña una disminución proporcional de la velocidad del movimiento. F1 26 / 89 Audición Descripción y modelos empı́ricos Adaptación de impedancias en el oı́do medio 2/2 Transformación de presiones. F = p1 A1 = p2 A2 F p2 A1 p1 A1 p2 = p1 ≈ 20p1 A2 A2 Ası́ se incrementa la presión en el interior del caracol. Tı́mpano Estribo Como la potencia acústica P ∝ p2 pcaracol = 1,5 × 20 ptimpano = 30 ptimpano → 29 dB de potencia, que compensa la pérdida debida al cambio de medio. 27 / 89 Audición Descripción y modelos empı́ricos El caracol Membrana de Reissner Rampa vestibular Rampa media Fibras nerviosas Órgano de Corti Rampa timpánica Membrana basilar 28 / 89 Audición Descripción y modelos empı́ricos La membrana basilar 4000 3000 500 µm 800 600 5000 Ápice 2000 I El caracol contiene un conducto helicoidal dividido en toda su longitud por dos membranas que crean 1000 200 400 tres cámaras (o rampas) diferentes. I La membrana de Reissner es extremadamente fina (en torno a dos células), careciendo al parecer de 1500 funciones acústicas 7000 I En la membrana basilar, de anchura creciente y 40 µm grosor decreciente, se realiza la descomposición espectral del sonido. Base 20000 29 / 89 Audición Descripción y modelos empı́ricos Demostración HHMI 30 / 89 Audición Descripción y modelos empı́ricos La membrana basilar desenrollada Habitualmente se considera la membrana basilar desenrollada para simplificar su descripción. Se tratarı́a de una lámina de grosor decreciente y anchura creciente. Base del caracol Ventana oval Estribo Ventana redonda Membrana basilar ”desenrollada” Esta es la forma que adopta cuando aparece una excitación sinusoidal, vista en un instante determinado. 31 / 89 Audición Descripción y modelos empı́ricos Ondas progresivas von Békésy (premio Nobel 1961) observó la aparición de ondas progresivas en la membrana basilar en presencia de tonos puros. Envolvente t1 200 cps t2 t3 Desplazamiento t4 Base Distancia a lo largo del caracol Ápice Para un frecuencia dada la membrana oscila, pero su envolvente permanece constante y aparece un máximo de ésta en una posición que depende de la frecuencia del estı́mulo. 32 / 89 Audición Descripción y modelos empı́ricos Respuesta de la membrana basilar 5 1 50 100 200 300 Hz ←Frecuencia de excitación Amplitud 0,5 0 35 30 25 20 Distancia al estribo (mm) Distancia al estribo → 31 28 24 20 17 13 mm 1 Amplitud relativa 0,5 0 20 30 50 100 200 300 500 1,000 2,000 5,000 Frecuencia (Hz) 5 von Békésy, Experiments in Hearing, 1960 33 / 89 Audición Descripción y modelos empı́ricos Los resultados de von Békésy muestran que: I Un estı́mulo de una frecuencia dada (p.e. 300 Hz) activa toda la membrana, pero tiene una respuesta máxima en una posición especı́fica (p.e. a 26 mm del estribo) que depende de la frecuencia. I Una posición dada de la membrana basilar (p.e. a 17 mm del estribo) responde de forma máxima a cierta frecuencia (p.e. a 1500 Hz) y de forma progresivamente menor a frecuencias alejadas de esta última. I Por tanto, el conjunto de las posiciones de la membrana puede considerarse como un banco de filtros paso-banda. 34 / 89 Audición Modelado fı́sico 1. Introducción Fı́sica del sonido 2. Audición Descripción y modelos empı́ricos Modelado fı́sico 3. Psicoacústica Introducción Bandas crı́ticas Sonoridad Enmascaramiento 4. Audición binaural 35 / 89 Audición Modelado fı́sico Ondas progresivas en la membrana basilar I Una onda sinusoidal que llega al tı́mpano actúa sobre la endolinfa a través de la ventana oval. I El fluido se mueve adelante y atrás de acuerdo con los cambios de presión en el tı́mpano. I Este movimiento causa diferencias de presión entre las dos caras de la membrana, provocando desplazamientos. I El movimiento global de la membrana se parece al de una cuerda que se hace ondular desde un extremo. I La ventana redonda se mueve de forma opuesta a la ventana oval, para acomodarse a los movimientos de la endolinfa, que es incompresible. 36 / 89 Audición Modelado fı́sico Variables en la onda progresiva Ventana oval Membrana basilar P1 (x, t) Rampa vestibular J1 (x, t) Helicotrema P2 (x, t) Rampa timpánica J2 (x, t) Ventana redonda x=0 x=L I Presión relativa: p = P1 − P2 I Corriente relativa debida al gradiente de presión: j = J1 − J2 I Desplazamiento vertical de la membrana: h(x, t) 37 / 89 Audición Modelado fı́sico Ecuación de onda 1/3 I Es posible formular la siguiente ecuación para la membrana basilar: ∂2h ∂2p 2ρ = l ∂t2 ∂x2 donde ρ es la densidad de la endolinfa, y l la altura de la rampa. I Existe una relación entre la presión y el desplazamiento de la membrana a través de la rigidez K(x): p(x, t) = K(x)h(x, t) que se ha de medir experimentalmente. I Esto nos da la ecuación de onda en la membrana: ∂2 l ∂2 2 h(x, t) = K(x)h(x, t) ∂t 2ρ ∂x2 38 / 89 Audición Modelado fı́sico Ecuación de onda 2/3 I La ecuación de onda de una cuerda tensa es: ∂2 2 ∂ 2 y(x, t) = c y(x, t) ∂t2 ∂x2 siendo c la velocidad de propagación. I Comparando con la de la membrana: ∂2 l ∂2 h(x, t) = K(x)h(x, t) ∂t2 2ρ ∂x2 concluimos que, en una región pequeña en torno a x0 , para K(x) casi constante, p se cumplirı́a la ecuación de onda ordinaria con una velocidad de propagación proporcional a K(x0 ). 39 / 89 Audición Modelado fı́sico Ecuación de onda 3/3 I La rigidez ha sido estimada como K(x) = αe−βx I K(x), y por tanto la velocidad de propagación, disminuye al alejarse del estribo. I Por consiguiente la longitud de onda disminuye al alejarse del estribo. I Una onda sinusoidal produce una onda progresiva de longitud de onda decreciente en la membrana basilar. I Cuando λ es suficientemente pequeña, la membrana no responde y la onda desaparece. I Para valores adecuados de λ la respuesta de la membrana es máxima. I El punto de desaparición y máximo están tanto más lejos cuanto mayor es λ y cuanto menor es la frecuencia de la onda. 40 / 89 Audición Modelado fı́sico Resoluciones numéricas de la ecuación de onda 6 1 nm 4600 Hz 1300 Hz 370 Hz x=0 x=L 6 Duke y Jülicher, 2003 41 / 89 Psicoacústica Introducción 1. Introducción Fı́sica del sonido 2. Audición Descripción y modelos empı́ricos Modelado fı́sico 3. Psicoacústica Introducción Bandas crı́ticas Sonoridad Enmascaramiento 4. Audición binaural 42 / 89 Psicoacústica Introducción Actividad en el nervio auditivo. La medición de la actividad en el nervio auditivo, dependiendo de la frecuencia del estı́mulo, revela una selectividad muy superior a la predicha por los modelos fı́sicos. Presión sonora necesaria para lograr una respuesta (N/m2 ) Umbral (dB SPL) Haz de fibras no. 6 Haz de fibras no. 5 Frecuencia (Hz) Estas curvas se han realizado con gatos. No hay resultados comparables para los seres humanos. 43 / 89 Psicoacústica Bandas crı́ticas 1. Introducción Fı́sica del sonido 2. Audición Descripción y modelos empı́ricos Modelado fı́sico 3. Psicoacústica Introducción Bandas crı́ticas Sonoridad Enmascaramiento 4. Audición binaural 44 / 89 Psicoacústica Bandas crı́ticas La señal de dos tonos: en el tiempo x(t) t x(t) = cos(2πf1 t) + cos(2πf2 t) f1 + f2 f1 − f2 x(t) = 2 cos(2π t) cos(2π t) 2 2 f2 = f1 + ∆f 45 / 89 Psicoacústica Bandas crı́ticas La señal de dos tonos: en la membrana basilar 1046 Hz 523 Hz Separadas: tono musical Base Ápice 697 Hz 523 Hz Juntas: sonido áspero Base Ápice 588 Hz 523 Hz Indistinguibles: batido Base Ápice 46 / 89 Psicoacústica Bandas crı́ticas El tı́mpano vibra siguiendo la forma de x(t), sin distinguir el hecho de que se trata de la superposición de dos sinusoides. Sin embargo en la membrana basilar aparecen dos regiones de resonancia. I Si ∆f es lo suficientemente grande, las dos regiones se encuentran lo bastante separadas como para que percibamos dos tonos diferentes de igual intensidad. I Si por el contrario ∆f es menor que cierta cantidad el oı́do percibe un solo tono de frecuencia intermedia, cuya intensidad varı́a de forma periódica siguiendo la envolvente de x(t). I Para que estos efectos tengan lugar, las regiones de resonancia deben tener una anchura apreciable. Cuando la separación entre frecuencias supera dicha anchura (relacionada con el ancho de banda crı́tico), los dos tonos se perciben por separado. 47 / 89 Psicoacústica Bandas crı́ticas Frecuencia percibida con un estı́mulo de dos tonos f2 Frecuencia percibida Banda crt́ica Tono único f1 Frecuencia de batido Batido Rugoso ∆f ∆fD ∆fCB 48 / 89 Psicoacústica Bandas crı́ticas Fijamos f1 y empezando con f2 = f1 aumentamos progresivamente f2. I Inicialmente ∆f = 0 por lo que percibirı́amos un tono cuya intensidad depende de la fase relativa de las componentes. I Al aumentar ∆f comenzamos a percibir un tono de frecuencia f1 + ∆f /2 cuyo volumen fluctúa o bate con frecuencia creciente ∆f. I Cuando se supera el lı́mite de discriminación de frecuencia ∆fD ( 10 Hz) seguimos percibiendo un solo tono pero con una rugosidad que lo hace desagradable. I Este efecto aumenta hasta que ∆f sobrepasa el ancho de banda crı́tico ∆fCB. Entonces percibimos dos tonos de frecuencias f1 y f2 y amplitud constante. En la práctica el oı́do no distingue dos tonos separados, sino que los percibe como un tono musical complejo, sin fluctuación de amplitud. 49 / 89 Psicoacústica Bandas crı́ticas Ancho de banda crı́tico Realizando este mismo experimento para distintas frecuencias iniciales f1 podrı́amos determinar el ancho de banda crı́tico en función de la frecuencia central. 5,000 2,000 F. central Ancho de banda Ancho de banda crı́tico (Hz) 1,000 Ancho de banda de 1/3 de octava 100 90 500 200 90 500 110 200 1000 150 2000 280 100 5000 900 50 1/6 de octava 10000 2300 20 50 100 200 500 1,0002,000 5,00010,000 Frecuencia central (Hz) 50 / 89 Psicoacústica Bandas crı́ticas Aproximaciones útiles... 0,69... para el ancho de banda crı́tico7 : ∆fG = 25 + 75 1 + 1,4f 2 5000 2000 1000 1. Para frecuencias menores de ∆ fG (Hz) 700 500 Hz, ∆fG ≈ 100 Hz 500 2. Para frecuencias mayores de 0.2f → 500 Hz, ∆fG ≈ 0,2f 200 100 20 50 70 100 200 500 700 1k 2k 5k 7k 10k f (Hz) 7 f en kHz 51 / 89 Psicoacústica Bandas crı́ticas Construcción de las bandas crı́ticas (O el banco de filtros perceptual) I Partiendo de la frecuencia 0 definimos un conjunto de bandas disjuntas. I La frecuencia inferior (fl ) de cada una es la superior (fu ) de la anterior. I El ancho de banda (∆fG ) es el crı́tico. I Se numeran empezando desde cero. I Este ı́ndice (z) está relacionado con la posición en la membrana basilar y constituye una escala perceptual de frecuencia. I z se mide en Barks. El resultado es la tabla de bandas crı́ticas de Scharf, que se corresponde con un banco de filtros de base perceptual. 52 / 89 Psicoacústica Bandas crı́ticas Tabla de Scharf z fl , f u fc z ∆fG z fl , f u fc z ∆fG 0 0 12 1720 50 0.5 100 1850 12.5 280 1 100 13 2000 150 1.5 100 2150 13.5 320 2 200 14 2320 250 2.5 100 2500 14.5 380 3 300 15 2700 350 3.5 100 2900 15.5 450 4 400 16 3150 450 4.5 110 3400 16.5 550 5 510 17 3700 570 5.5 120 4000 17.5 700 6 630 18 4400 700 6.5 140 4800 18.5 900 7 770 19 5300 840 7.5 150 5800 19.5 1100 8 920 20 6400 1000 8.5 160 7000 20.5 1300 9 1080 21 7700 1170 9.5 190 8500 21.5 1800 10 1270 22 9500 1370 10.5 210 10500 22.5 2500 11 1480 23 12000 1600 11.5 240 13500 23.5 3500 12 1720 24 15500 53 / 89 Psicoacústica Bandas crı́ticas La escala perceptual de frecuencia  2 f Relación entre ı́ndice (en Barks) y frecuencia (en kHz): z = 13 arctg(0,76f ) + 3,5 arctg 7,5 24 20 16 z (Bark) 12 8 4 0 0 1 2 4 8 16 20 f (kHz) 54 / 89 Psicoacústica Bandas crı́ticas Ápice Membrana basilar Base 0 8 16 24 32 mm Posición 0 3 6 9 12 15 18 21 24 Bark Índice 0 125 250 500 1000 2000 4000 8000 16000 Hz Frecuencia La escala frecuencial medida en Barks es la escala natural del oı́do. Todas las ideas relativas al análisis frecuencial, sonoridad, altura tonal, enmascaramiento, etc. se describen de forma más simple utilizando dicha escala. 55 / 89 Psicoacústica Bandas crı́ticas Nivel sonoro y bandas crı́ticas Nivel de volumen LS (fonios) 80 75 I Tenemos una fuente de ruido paso-banda de frecuencia central fija y ancho de banda creciente. 70 I Al aumentar el ancho de banda se disminuye la amplitud 65 Banda crı́tica de forma que la potencia total permanece constante. 60 I El nivel sonoro percibido es constante hasta el momento en que el ancho de banda excede el crı́tico. 55 100 200 500 1,000 2,000 I A partir de ahı́ el nivel sonoro parece aumentar ya que Ancho de banda (Hz) comienza a excitarse una banda crı́tica adicional. Para 1000 Hz de frecuencia central 56 / 89 Psicoacústica Bandas crı́ticas Bandas crı́ticas y nivel sonoro. Demostración Esta demostración permite medir el ancho de banda crı́tico mediante un ruido de ancho de banda creciente cuya amplitud se disminuye con objeto de mantener constante la potencia. Cuando el ancho de banda excede el crı́tico, el nivel sonoro percibido parece aumentar, ya que entonces el estı́mulo abarca más de una banda crı́tica. 57 / 89 Psicoacústica Bandas crı́ticas Comenzamos escuchando un ruido de referencia paso-banda, centrado en 1000 Hz y con un ancho de banda del 15 % (925-1075 Hz), al que sigue un ruido idéntico que servirá para pruebas. El ancho de banda de este último se incrementa en 7 saltos del 15 %, manteniendo su potencia constante a base de disminuir la amplitud. Cuando el ancho de banda excede el crı́tico, el nivel sonoro comienza a aumentar. Contenido: 1. Señal de referencia (ruido paso-banda) seguida por la señal de prueba (el mismo ruido). 2. Ídem con señal de prueba de la misma potencia y ancho de banda 15 % mayor. 3. 6 aumentos sucesivos del ancho de banda en un 15 %. 58 / 89 Psicoacústica Sonoridad 1. Introducción Fı́sica del sonido 2. Audición Descripción y modelos empı́ricos Modelado fı́sico 3. Psicoacústica Introducción Bandas crı́ticas Sonoridad Enmascaramiento 4. Audición binaural 59 / 89 Psicoacústica Sonoridad Nivel. Curvas ISO-226 Cuantificando el nivel percibido de una señal... Nivel de presión sonora (dB SPL) fonios Umbral de audición Frecuencia (Hz) 60 / 89 Psicoacústica Sonoridad Las curvas indican cuál ha de ser el nivel objetivo de un tono de cierta frecuencia para producir la misma sensación de nivel sonoro que un tono de referencia de 1.000 Hz8. I Por ejemplo un tono de 80 Hz ha de tener 70 dB para producir la misma sensación de nivel que un tono de 1.000 Hz a 60dB. I Ambos tonos tienen LS = 60 fonios, que es la unidad de nivel percibido equivalente. I Para un tono de 30 Hz el nivel objetivo necesario sube a 90 dB I Para un tono de 3.000 Hz bastan 52 dB. Las curvas se obtuvieron para estı́mulos consistentes en un solo tono puro y pueden explicarse bastante bien por la función de transferencia global desde el pabellón auditivo hasta la ventana oval. Si subes el volumen, suena mejor. ¿? 8 Demostración con generador 61 / 89 Psicoacústica Sonoridad Ejemplo: Sonómetro IEC 61672-1:2003 Diagrama de bloques de un sonómetro según norma IEC 61672-1:2003 para la medición del nivel sonoro. p(t) √ LW τ (t) W (ω) (·)2 h(t) = τ1 e−t/τ u(t) · 20 log(·) Ponderación Promedio temporal −20 log p0 frecuencial exponencial Referencia I W (ω) pondera las frecuencias según su valor perceptual. I Se realiza un promediado de la energı́a instantánea con peso exponencial y constante de tiempo τ. I p0 es la presión acústica de referencia para la cual el nivel sonoro LW τ = 0. 62 / 89 Psicoacústica Sonoridad Ejemplo: Sonómetro IEC 61672-1:2003 (... ) Ponderación frecuencial tipo A 20 Se utiliza mucho la ponderación A. 10 Ponderación A sobre curvas de isonivel ISO226:2003 0 120 -10 Nivel relativo (dB) 110 100 -20 90 fon Nivel de presión sonora (dB SPL) 90 80 fon -30 80 70 fon 70 -40 60 fon 60 -50 50 fon 50 40 fon 40 -60 10 2 10 3 10 4 30 fon Frecuencia (Hz) 30 20 fon 20 10 10 fon I El nivel se da en dBA. 0 fon 0 I Da mayor peso a las frecuencias 10 2 10 3 10 4 medias. Frecuencia (Hz) I Para niveles de presión sonora de 20−55 fonios. 63 / 89 Psicoacústica Sonoridad Ejemplo: Sonómetro IEC 61672-1:2003 (... ) El desajuste entre la ponderación A y las curvas de isonivel se debe a que la ponderación se especificó con las curvas originales de Fletcher y Munsson de 1933. Ponderaciones frecuenciales inversas A B 120 C 110 100 fon Nivel de presión sonora (dB SPL) 100 Fletcher 1933 ! 90 A ISO226:2003 80 70 fon 70 60 50 40 fon 40 30 2 3 4 10 10 10 Frecuencia (Hz) 64 / 89 Psicoacústica Sonoridad Ejemplo: Sonómetro IEC 61672-1:2003 (fin) Ponderaciones frecuenciales Ponderaciones 20 10 0 A Para medidas de niveles medios de ruido -10 acústico. Nivel relativo (dB) C Para medidas de niveles altos de ruido -20 acústico. -30 K Medida de volumen en estudio. -40 R Nivel de ruido acústico y eléctrico. A [IEC 61672] -50 C [IEC 61672] K [ITU-R BS.1770] R [ITU-R 568] -60 10 2 10 3 10 4 Frecuencia (Hz) 65 / 89 Psicoacústica Sonoridad Las curvas ISO-226, son insuficientes para dar una medida de intensidad perceptual. I Si considerásemos dos tonos puros (midiendo su nivel sonoro como en el experimento precedente) observarı́amos que cuando la separación excede el ancho de banda crı́tico, el nivel sonoro parece aumentar. I Dos valores de nivel en fonios sólo tienen significado si son iguales. Ello indica que los tonos correspondientes producen la misma sensación de nivel. I Pero un tono de 60 fonios no suena el doble de fuerte que uno de 30 fonios. Por ello se introduce una nueva medida llamada sonoridad que resuelve estos problemas. Se apoya tanto en las curvas ISO-226 como en la teorı́a de bandas crı́ticas. 66 / 89 Psicoacústica Sonoridad La definición de sonoridad apunta a cuantificar la sensación sonora que producen tonos de distintos niveles y 1 kHz de frecuencia. Se observa que: I Para tonos de niveles superiores a 40 dB, duplicar la sonoridad requiere 10 dB más de intensidad. I Para tonos de niveles inferiores a 40 dB, duplicar la sonoridad requiere entre 2 y 5 dB más de intensidad. La sonoridad N se define con una curva empı́rica medida en sonios. 1 sonio es la sensación sonora de un tono de 1 kHz y 40 dB. 100 10 LS −40 N = 10 30 , LS > 40 Sonoridad N (son) 1   46 ln 10 LS + 46 30 N= , LS < 40 46 0.1 0.01 0 10 20 30 40 50 60 70 80 90 100 LS (fon) 67 / 89 Psicoacústica Sonoridad Sonoridad e intensidad I Siendo LS ≈ LI = 10 log 10−12 , para LS > 40 dB:  10 log I  −10 log 104 /30 √ 3 N = 10 10−12 = 108 I √ Quedando, para tonos de 1 kHz: N = 464 3 I Para dos o más tonos: 1. Para tonos que están dentro de la misma banda crı́tica, la sonoridad es la correspondiente a la suma de las intensidades: sX N = 464 3 Ii i 2. Si están en distintas bandas crı́ticas, la sonoridad es la suma de sonoridades: X N= Ni i 68 / 89 Psicoacústica Sonoridad Ejemplo: considere dos señales sonoras que contienen dos tonos: a.- Próximos. LS −40 ISO-226 N = 10 30 f IL = SP L LS N Hz dB fon son Tono 1 900 40 40 1 Tono 2 1000 Σ 40 40 1 I Ambas señales son de la misma Total 43 43 potencia: 43 dB(SPL) Equivalente 1000 43 1,26 ∆fG = 160 Hz Misma banda crı́tica I Pero la segunda tiene mayor sonoridad. b.- Distantes. ISO-226 N = 10 LS −40 30 I El nivel sonoro equivalente (al de un tono de 1 kHz) de b es 5 dB superior f IL = SP L LS N Hz dB fon son al de a. Tono 1 1000 40 40 1 Tono 2 3175 40 37 0,79 Σ Total 43 1,79 Equivalente 1000 48 ∆fG = 160 y 900 Hz Distinta banda crı́tica 69 / 89 Psicoacústica Enmascaramiento 1. Introducción Fı́sica del sonido 2. Audición Descripción y modelos empı́ricos Modelado fı́sico 3. Psicoacústica Introducción Bandas crı́ticas Sonoridad Enmascaramiento 4. Audición binaural 70 / 89 Psicoacústica Enmascaramiento Enmascaramiento de un tono por otro 71 / 89 Psicoacústica Enmascaramiento I Cuando dos sonidos diferentes ocupan la misma banda crı́tica, el oı́do no puede separarlos. I Si los dos sonidos tienen distinto nivel, el más intenso parece reducir el nivel sonoro del menos intenso. I En la figura vemos el aumento en el umbral de percepción de un tono en función de su frecuencia cuando se pretende oir en presencia de otro tono enmascarante de frecuencia 400 Hz y nivel 40, 60 y 80 dB. I Ası́ por ejemplo en presencia de un tono de 400 Hz y 60 dB es necesario incrementar 22 dB por encima del umbral de audición la potencia de un tono de 500 Hz para que resulte apenas audible. 72 / 89 Psicoacústica Enmascaramiento Bandas crı́ticas y enmascaramiento. Demostración Esta demostración ilustra el enmascaramiento de un tono de 2000 Hz por ruido paso banda y espectralmente plano. Primero se emplea ruido de banda ancha y después ruido con ancho de banda de 1000, 250 y 10 Hz. Para determinar qué nivel tiene el tono cuando es apenas perceptible en presencia de ruido, presentamos en todos los ejemplos el mencionado tono de 2000 Hz en 10 saltos decrecientes de 5 dB cada uno. 73 / 89 Psicoacústica Enmascaramiento Contenido: 1. Tono de 2000 Hz con 10 saltos decrecientes de 5 dB. Cuente cuántos oye. 2 repeticiones 2. Ídem con ruido de banda ancha 3. Con ruido de 1000 Hz de ancho de banda. 4. Con ruido de 250 Hz de ancho de banda. 5. Con ruido de 10 Hz de ancho de banda. 74 / 89 Psicoacústica Enmascaramiento Enmascaramiento de un tono por ruido de banda estrecha 75 / 89 Psicoacústica Enmascaramiento En las medidas realizadas el enmascaramiento disminuye de forma paradójica cuando la frecuencia del tono enmascarado se aproxima mucho a la del enmascarante. I Se debe al batido que se produce entre ambos tonos en estas condiciones. Dicho batido dificulta la tarea de los sujetos que realizan las pruebas y produce respuestas no muy consistentes. I Para remediar el efecto se sustituye el tono enmascarante por ruido de banda estrecha. Ası́ se eliminan los fenómenos de batido. I En las curvas resultantes, cuando el enmascarante es un ruido paso-banda centrado en 410 Hz y con 90 Hz de ancho de banda, para un nivel de ruido de 60 dB, el tono de 500 Hz deberı́a estar a 40 dB por encima del umbral de audición para ser audible. 76 / 89 Psicoacústica Enmascaramiento Medida del enmascaramiento 77 / 89 Audición binaural Percepción de la dirección de una fuente sonora I C D I Fuente I retardo 1 < retardo 2 2 1 1 2 atenuación 1 < atenuación 2 1 I Fuente C 2 retardo 1 = retardo 2 atenuación 1 = atenuación 2 I Fuente D retardo 1 > retardo 2 atenuación 1 > atenuación 2 Retardos y atenuaciones para diferentes posiciones de la fuente. 78 / 89 Audición binaural Diferencias de intensidad I Muy efectiva para frecuencias superiores a 5.000 Hz. I La diferencia de intensidad se debe, no tanto a las distintas distancias de los oı́dos a la fuente, como al hecho de que la cabeza se encuentra siempre entre la fuente y el oı́do más alejado de ésta. I La cabeza produce una sombra en dicho oı́do con atenuaciones considerables para frecuencias altas. I Para frecuencias bajas la longitud de onda es comparable al tamaño de la cabeza, el sonido sufre difracción y la atenuación es menor 79 / 89 Audición binaural Diferencias de retardo I Muy efectiva para frecuencias inferiores a 1.000 Hz. I Se basa en que el sonido de la fuente llega antes al oı́do más cercano a la misma. I Para sonidos de banda estrecha, cuasi periódicos, si el retardo diferencial es mayor que el periodo, hay incertidumbre a la hora de estimarlo, puesto que puede contener un número indeterminable de ciclos. I Si el retardo excede 1 msg la fuente se asigna totalmente al oı́do que recibe antes la señal (efecto de precedencia). 80 / 89 Audición binaural Localización en el plano medio I Los dos efectos no permitirı́an distinguir movimientos verticales de las fuentes o saber si el sonido proviene del frente o de un punto simétricamente situado tras el oyente. I Para tales distinciones se emplea la directividad del pabellón auditivo, cuya respuesta en frecuencia (o más exactamente la función de transferencia asociada a la cabeza) depende de la dirección de llegada del sonido, como ya se explicó. I El efecto global se traduce en una coloración dependiente de la dirección, pero que actúa sobre un espectro desconocido a priori I Probablemente en el proceso de localización juegan un papel importante los pequeños movimientos exploratorios de la cabeza. 81 / 89 Audición binaural FIN Bibliografı́a: I Beranek, L.L. y Mellow, T.J.,“Acoustics. Sound Fields and Transducers”, Academic Press 2012. I Zwicker, E. y Fastl, H., “Psychoacoustics”, Springer 1999. I Kinsler, L.E., Frey, A.R., Coppens, A.B. y Sanders, J.V., “Fundamentals of Acoustics”, John Wiley & Sons 2000. I Pickles, J.O., “An Introduction to the Physiology of Hearing”, Academic Press 1992. 82 / 89 Audición binaural Resumen: Fı́sica del sonido Presión p(t) Velocidad u(t) Impedancia p(t) = u(t) · Z Caracterı́stica Z0 = ρc Intensidad ∝ u2 , ∝ p2 Nivel de presión sonora en dB SPL referidos a 20 µPa 83 / 89 Audición binaural Resumen: Audición Oı́do externo Conducto Oı́do medio Oı́do interno I Captación I Resonancia I Resonancia mecánica I Analizador espectral I Directividad 1,5 − 8 kHz 1 kHz I con Banco de filtros I Tubo semicerrado I Adaptación de I por Bandas Crı́ticas impedancias 84 / 89 Audición binaural Psicoacústica Bandas crı́ticas Tablas de Scharf con ı́ndice de tonalidad z ≈ banco 1/3 de octava √ Sonoridad I Un tono: N = 464 3 I sonios, LS > 40 dB I Dentro de banda crı́tica: Σ intensidades I En diferentes bandas crı́ticas: Σ sonoridades Enmascaramiento Umbral enmascarado Audición binaural Plano horizontal I Diferencias de intensidad, f > 5 kHz I Diferencias de tiempo, f < 1 kHz I Efecto de precedencia para diferencias de tiempo > 1 ms Plano medio Directividad del pabellón auditivo. 85 / 89

Use Quizgecko on...
Browser
Browser