Podcast
Questions and Answers
¿El enmascaramiento de audio es un efecto que describe cómo un tono fuerte puede hacer que un tono débil sea más audible?
¿El enmascaramiento de audio es un efecto que describe cómo un tono fuerte puede hacer que un tono débil sea más audible?
False
En el código proporcionado, ¿cuál es la frecuencia base utilizada para generar la señal enmascarada?
En el código proporcionado, ¿cuál es la frecuencia base utilizada para generar la señal enmascarada?
440 Hz
¿Qué tipo de función se utiliza en el código para generar la señal enmascarada?
¿Qué tipo de función se utiliza en el código para generar la señal enmascarada?
La función seno
¿Qué tipo de archivo de audio se utiliza en el código para demostrar la compresión de audio?
¿Qué tipo de archivo de audio se utiliza en el código para demostrar la compresión de audio?
Signup and view all the answers
En la función demo_preeco, ¿cuál es el propósito de la variable peso_umbral?
En la función demo_preeco, ¿cuál es el propósito de la variable peso_umbral?
Signup and view all the answers
En el código, ¿qué técnica se utiliza para la compresión de audio?
En el código, ¿qué técnica se utiliza para la compresión de audio?
Signup and view all the answers
¿Qué biblioteca de Python se utiliza en el código para cargar y analizar archivos de audio?
¿Qué biblioteca de Python se utiliza en el código para cargar y analizar archivos de audio?
Signup and view all the answers
Study Notes
Instalación y Uso de pydub
- La librería
pydub
se instala con!pip install pydub
- Se descarga e instala
pydub-0.25.1-py2.py3-none-any.whl
- Se instala con éxito
pydub-0.25.1
Importación de Librerías
- Se importan librerías para procesamiento de audio y visualización
-
librosa
,librosa.display
,matplotlib.pyplot
,numpy
,pydub
,os
,IPython.display
,soundfile
,scipy.signal.windows
- Se importan para diversas tareas, incluyendo análisis de audio, visualización de espectrogramas y reproducción de audio
Generación de Tono con Enmascaramiento
- Función
generar_tonos_enmascaramiento
genera una señal con dos tonos - Se usa
np.sin
para crear las señales sinusoidales de los tonos - La función requiere la frecuencia, tasa de muestreo, duración y amplitud de los tonos como parámetros
Función de Demostración de Enmascaramiento
- La función
demo_enmascaramiento
define una función para demostrar el enmascaramiento - Se define una
frecuencia_base
y undesfase
en Hz para el primer tono - Crea una señal con una frecuencia ligeramente desplazada, creando así un enmascaramiento
- Muestra visualmente el audio generado y la señal de espectro, con la frecuencia de muestreo y tiempo
- Los parámetros configurados incluyen
frecuencia\_base
,desfase
,sr
,duracion
,amplitud\_mascarante
,amplitud\_enmascarada
Carga de un Archivo WAV
- Carga un archivo de audio WAV usando
librosa.load
con una tasa de muestreo específica - La muestra se guarda en
y
- Los datos guardados en
sr
se utilizan para la tasa de muestreo
Espectrograma del Archivo Original
- Se genera un espectrograma del archivo WAV cargado
- Se utiliza
librosa.amplitude_to_db
para convertir las amplitudes a decibelios - Los datos se muestran en una gráfica con un espectrograma completo del archivo de audio.
Compresión de Audio
- Se crea una instancia
AudioSegment
a partir del archivo de audio. - Se crea y guarda varias versiones comprimidas del audio, en formato MP3, utilizando diferentes tasas de bitrate (320 kbps, 128 kbps, 64 kbps y 32 kbps)
Tamaños de Archivos
- Los tamaños de los archivos se muestran en KB tras la compresión, original y comprimido.
Espectrogramas de los Archivos Comprimidos
- Se generan y muestran los espectrogramas de las versiones comprimidas del audio (320 kbps, 128 kbps, 64 kbps y 32 kbps)
- Se visualizan los espectrogramas para comparar las diferencias en calidad de audio por cada tasa, usando diferentes tonos de color para cada bit rate.
Simulación de Efecto Preeco
- La función
demo_preeco
simula el preeco en el audio - Se aplica una
ventana
a unpulso
corto - Implementa cómputo de DCT (Transformada Discreta del Coseno) y cuantización para simular el efecto de compresión
- Genera y muestra el espectro del audio original con el efecto de compresión
Función para cargar y reproducir un audio
Función cargar_audio
carga y reproduce un archivo de audio desde una ruta.
Función para cuantizar audio
Función cuantizar_audio
cuantiza un audio a un número específico de bits.
Normaliza, cuantiza el audio y lo desnormaliza.
Visualización de la señal original y cuantizada
Función mostrar_cuantizacion
visualiza la señal original y cuantizada con un número de bits especificado.
Espectrograma de Banda Estrecha
- Función
mostrar_espectrograma_banda_estrecha
muestra el espectrograma de banda estrecha para el audio cuantizado. - Muestra una representación visual del espectro a lo largo del tiempo.
Cuantización de Audio
- Se cuantiza el audio original a distintos números de bits.
- A partir de los datos anteriores, los nuevos audios cuantizados se reproducen, mostrando el espectrograma, con un zoom en los 20 primeros milisegundos.
Actividad para los participantes
- Se recomiendan pruebas experimentales, cambiando parámetros y observando el output.
- Los participantes son alentados a experimentar con diferentes valores de parámetros.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Este cuestionario cubre la instalación y uso de la librería pydub
, incluyendo la importación de librerías necesarias para el procesamiento de audio. También se exploran funciones para generar tonos y demostrar enmascaramiento en señales de audio. Prepárate para probar tus conocimientos sobre esta herramienta fundamental en análisis de audio.