Podcast
Questions and Answers
¿Cuáles son los componentes de las señales musicales?
¿Cuáles son los componentes de las señales musicales?
¿Qué representa la señal de audio digital?
¿Qué representa la señal de audio digital?
¿Qué genera la voz humana?
¿Qué genera la voz humana?
La voz humana se genera por la vibración de las cuerdas vocales y es modulada por el tracto vocal (boca, lengua, labios).
Las vocales y consonantes tienen:
Las vocales y consonantes tienen:
Signup and view all the answers
¿Cómo se obtiene la Frecuencia Fundamental?
¿Cómo se obtiene la Frecuencia Fundamental?
Signup and view all the answers
¿Qué son los armónicos?
¿Qué son los armónicos?
Signup and view all the answers
¿Qué son los formantes?
¿Qué son los formantes?
Signup and view all the answers
¿Qué es el espectrograma?
¿Qué es el espectrograma?
Signup and view all the answers
La escala mel representa las frecuencias de forma lineal.
La escala mel representa las frecuencias de forma lineal.
Signup and view all the answers
¿El espectrograma de banda ancha brinda buena resolución temporal?
¿El espectrograma de banda ancha brinda buena resolución temporal?
Signup and view all the answers
El espectrograma de banda estrecha ofrece buena resolución temporal.
El espectrograma de banda estrecha ofrece buena resolución temporal.
Signup and view all the answers
¿Cuál de las siguientes opciones describe mejor el espectrograma de banda ancha?
¿Cuál de las siguientes opciones describe mejor el espectrograma de banda ancha?
Signup and view all the answers
¿Qué es un filtro de paso alto?
¿Qué es un filtro de paso alto?
Signup and view all the answers
¿Qué es la frecuencia de Nyquist?
¿Qué es la frecuencia de Nyquist?
Signup and view all the answers
Study Notes
Sesión 1: Fundamentos de Tratamiento Digital de Audio
- El objetivo de la sesión es analizar señales de voz y música en el dominio temporal y frecuencial.
- Se busca identificar formantes en vocales y consonantes.
- Se presenta la Transformada de Fourier de Tiempo Corto (STFT).
- Se desarrollan ejemplos prácticos de análisis y síntesis de audio.
Configuración del Entorno
- Se conecta Google Drive con Google Colab.
- Se importan bibliotecas necesarias para el procesamiento de audio.
-
numpy
para matrices. -
matplotlib.pyplot
para gráficos. -
scipy.io.wavfile
para leer archivos WAV. -
scipy.signal
escipy.interpolate
para procesamiento de señal e interpolación. -
scipy.signal.find_peaks
para encontrar picos. -
IPython.display
para mostrar audio. -
librosa
para análisis y visualización.
-
Señales de Audio
- Las señales de audio son variaciones de presión del aire digitalizadas.
- Se representan como funciones discretas en el tiempo.
- Se utilizan técnicas matemáticas para su análisis y procesamiento.
Voz Humana
- La voz humana es una señal compleja, generada por la vibración de las cuerdas vocales y el tracto vocal.
- Sus características incluyen:
- Frecuencia Fundamental (F0): Frecuencia más baja, determina el tono.
- Armónicos: Múltiplos enteros de F0, contribuyen al timbre.
- Formantes: Resonancias en el tracto vocal, identifican las vocales y consonantes.
Música
- Las señales musicales tienen patrones de frecuencias específicos.
- Características:
- Frecuencia Fundamental: Nota escuchada.
- Armónicos y Sobretonos: Timbre característico.
- Envolventes Temporales: Evolucionan en el tiempo (ataque, decaimiento, sostenimiento, liberación).
Ejemplo de Archivos
- Se proporcionan ejemplos de archivos de audio (voz y música) para su análisis.
Análisis Temporal de Vocales Sueltas
- Se cargan ejemplos de archivos de vocales para análisis.
- Se utiliza la librería
librosa
para visualizar la forma de onda. - Se calcula la forma de onda para muestras de vocales.
- Se facilita la visualización de las vocales individuales
Análisis Temporal de Vocales Concatenadas
- Se analizan las formas de onda de vocales concatenadas.
Análisis Frecuencial de Vocales
- Se utiliza la Transformada Discreta de Fourier (DFT) para obtener el espectro.
- Se calcula el espectro logarítmico (escala dB).
- Se visualiza el espectro.
Análisis Frecuencial de Vocales (Espectrograma)
- Se genera el espectrograma para vocales, mostrando la evolución del espectro en el tiempo.
- Se explican diferentes tipos de espectrogramas.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
En esta sesión se exploran los conceptos básicos del tratamiento digital de audio, enfocándose en el análisis de señales de voz y música. Se estudia la Transformada de Fourier de Tiempo Corto y se realizan ejemplos prácticos para entender su aplicación. La configuración del entorno incluye la utilización de Google Colab y diversas bibliotecas de Python para facilitar el procesamiento de audio.