Podcast
Questions and Answers
¿Cuáles son los dos tipos principales de sonidos en el habla?
¿Cuáles son los dos tipos principales de sonidos en el habla?
Sonoros y Sordos
¿Cuál es el nombre de las resonancias en la producción de voz?
¿Cuál es el nombre de las resonancias en la producción de voz?
Formantes
¿Qué característica de la música se relaciona con el período de los picos de intensidad?
¿Qué característica de la música se relaciona con el período de los picos de intensidad?
Ritmo
¿Cuál es la abreviatura de la Transformada de Fourier Localizada?
¿Cuál es la abreviatura de la Transformada de Fourier Localizada?
Signup and view all the answers
¿Cómo se llama el banco de filtros que descompone una señal en subbandas?
¿Cómo se llama el banco de filtros que descompone una señal en subbandas?
Signup and view all the answers
¿Qué técnica de análisis de audio crea una imagen que muestra la distribución de la energía en función del tiempo y la frecuencia?
¿Qué técnica de análisis de audio crea una imagen que muestra la distribución de la energía en función del tiempo y la frecuencia?
Signup and view all the answers
¿Qué escala de frecuencia se basa en la percepción humana del tono?
¿Qué escala de frecuencia se basa en la percepción humana del tono?
Signup and view all the answers
¿Qué significa las siglas ERB?
¿Qué significa las siglas ERB?
Signup and view all the answers
¿Qué técnica de síntesis de audio implica un proceso de aprendizaje automático?
¿Qué técnica de síntesis de audio implica un proceso de aprendizaje automático?
Signup and view all the answers
¿Cuál es la técnica común para la síntesis de audio que se basa en obtener una señal con el espectro deseado?
¿Cuál es la técnica común para la síntesis de audio que se basa en obtener una señal con el espectro deseado?
Signup and view all the answers
¿Qué tipo de transformada se utiliza en la codificación de audio como MP3?
¿Qué tipo de transformada se utiliza en la codificación de audio como MP3?
Signup and view all the answers
¿Qué técnica se utiliza para eliminar aliasing en el dominio del tiempo?
¿Qué técnica se utiliza para eliminar aliasing en el dominio del tiempo?
Signup and view all the answers
¿Cuál de las siguientes opciones es una característica de la DCT-IV?
¿Cuál de las siguientes opciones es una característica de la DCT-IV?
Signup and view all the answers
La MDCT se puede utilizar para la síntesis de audio.
La MDCT se puede utilizar para la síntesis de audio.
Signup and view all the answers
Study Notes
Introducción al Máster de Ingeniería de Producción y Explotación de Contenidos
- El máster se centra en la ingeniería de producción y explotación de contenidos.
- El profesor es Francisco Javier Casajús Quirós.
- El departamento es el de Señales, Sistemas y Radiocomunicaciones de la ETS Ingenieros de Telecomunicación de la Universidad Politécnica de Madrid.
Señales de Audio
- Voz: La generación de sonidos vocales e insonoros (nasales) involucra la vibración de las cuerdas vocales. Los sonidos sordos implican turbulencias en el flujo aéreo. La cavidad bucal funciona como un resonador, y la cavidad nasal como una trampa de ondas.
- Música: El rango de niveles de audio musical está aproximadamente entre 70 dB y el umbral de dolor. El espectro de frecuencias oscila entre 50 Hz y 17 000 Hz.
Rasgos de la Música
- Altura: La frecuencia del armónico principal.
- Timbre: El envolvente espectral.
- Ritmo: El periodo de intensidad de los picos.
- Volumen: La energía localizada en el dominio temporal.
Técnicas basadas en la Transformada de Fourier
- La transformada de Fourier localizada (TFL): Se utiliza para analizar segmentos de señales en el dominio tiempo-frecuencia.
- Solapar y sumar: Método para reconstruír una señal a partir de una serie de análisis de segmentos solapados.
Herramienta espectro-temporales
- Espectrograma: Representación gráfica del contenido espectral de una señal en función del tiempo, usualmente utilizando una escala de color. Las imágenes del espectrograma permiten una interpretación visual en el contexto del tiempo y la frecuencia.
- Análisis de base perceptual: Analiza la forma en la que el oído humano percibe el tono y la frecuencia de sonido.
- Síntesis de audio: Incorpora el conocimiento de bases perceptuales al reconstruír audio.
Bancos de filtros de M bandas
- Diezmado-interpolación: Un proceso para reducir la señal de muestreo usando la interpolación de bandas.
- Filtros especulares en cuadratura (QMF): Filtros con respuestas especulares y simétricas en la banda negativa.
- Filtros en cuadratura en fase (PQF): Método para la síntesis de audio similar a QMF, pero con características de operación en fase.
Técnicas basadas en la Transformada Discreta en Coseno (DCT)
- Transformada Discreta del Coseno (DCT): Método para transformaciones de señales con bases a funciones cosenoidales. Los coeficientes espectrales de la DCT capturan mejor la energía en comparación con la DFT.
- Transformada Discreta del Coseno Modificada (MDCT): Una versión de la DCT que reduce la distorsión al solapar ventanas, apropiada para la codificación de audio con alta resolución.
- Cancelación de Alias en el Dominio del Tiempo (TDAC): Método para reducir la distorsión en el proceso de solape-suma de MDCT.
Otros temas
- Método de Griffin y Lim (1984): Un método iterativo para la síntesis de audio que busca aproximarse a una forma de onda objetivo dada su representación espectral.
- Autoencoders: Método de aprendizaje automático para la síntesis de audio que utiliza redes neuronales.
- GAN (Generative Adversarial Networks): Método de aprendizaje automático para la síntesis de audio que se basa en competición generativo-discriminativa.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Este quiz explora los conceptos fundamentales del máster en Ingeniería de Producción y Explotación de Contenidos. Se abordan temas sobre señales de audio, características de la música y la teoría detrás de la voz humana. Un recurso útil para aquellos interesados en ingeniería de sonido y producción musical.