Instalación y Uso de pydub
7 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

¿El enmascaramiento de audio es un efecto que describe cómo un tono fuerte puede hacer que un tono débil sea más audible?

False

En el código proporcionado, ¿cuál es la frecuencia base utilizada para generar la señal enmascarada?

440 Hz

¿Qué tipo de función se utiliza en el código para generar la señal enmascarada?

La función seno

¿Qué tipo de archivo de audio se utiliza en el código para demostrar la compresión de audio?

<p>Un archivo de audio WAV</p> Signup and view all the answers

En la función demo_preeco, ¿cuál es el propósito de la variable peso_umbral?

<p>Determinar el umbral para la cuantización del espectro de frecuencia.</p> Signup and view all the answers

En el código, ¿qué técnica se utiliza para la compresión de audio?

<p>La transformada de coseno discreta (DCT)</p> Signup and view all the answers

¿Qué biblioteca de Python se utiliza en el código para cargar y analizar archivos de audio?

<p>La biblioteca librosa</p> Signup and view all the answers

Study Notes

Instalación y Uso de pydub

  • La librería pydub se instala con !pip install pydub
  • Se descarga e instala pydub-0.25.1-py2.py3-none-any.whl
  • Se instala con éxito pydub-0.25.1

Importación de Librerías

  • Se importan librerías para procesamiento de audio y visualización
  • librosa, librosa.display, matplotlib.pyplot, numpy, pydub, os, IPython.display, soundfile, scipy.signal.windows
  • Se importan para diversas tareas, incluyendo análisis de audio, visualización de espectrogramas y reproducción de audio

Generación de Tono con Enmascaramiento

  • Función generar_tonos_enmascaramiento genera una señal con dos tonos
  • Se usa np.sin para crear las señales sinusoidales de los tonos
  • La función requiere la frecuencia, tasa de muestreo, duración y amplitud de los tonos como parámetros

Función de Demostración de Enmascaramiento

  • La función demo_enmascaramiento define una función para demostrar el enmascaramiento
  • Se define una frecuencia_base y un desfase en Hz para el primer tono
  • Crea una señal con una frecuencia ligeramente desplazada, creando así un enmascaramiento
  • Muestra visualmente el audio generado y la señal de espectro, con la frecuencia de muestreo y tiempo
  • Los parámetros configurados incluyen frecuencia\_base, desfase, sr, duracion, amplitud\_mascarante, amplitud\_enmascarada

Carga de un Archivo WAV

  • Carga un archivo de audio WAV usando librosa.load con una tasa de muestreo específica
  • La muestra se guarda en y
  • Los datos guardados en sr se utilizan para la tasa de muestreo

Espectrograma del Archivo Original

  • Se genera un espectrograma del archivo WAV cargado
  • Se utiliza librosa.amplitude_to_db para convertir las amplitudes a decibelios
  • Los datos se muestran en una gráfica con un espectrograma completo del archivo de audio.

Compresión de Audio

  • Se crea una instancia AudioSegment a partir del archivo de audio.
  • Se crea y guarda varias versiones comprimidas del audio, en formato MP3, utilizando diferentes tasas de bitrate (320 kbps, 128 kbps, 64 kbps y 32 kbps)

Tamaños de Archivos

  • Los tamaños de los archivos se muestran en KB tras la compresión, original y comprimido.

Espectrogramas de los Archivos Comprimidos

  • Se generan y muestran los espectrogramas de las versiones comprimidas del audio (320 kbps, 128 kbps, 64 kbps y 32 kbps)
  • Se visualizan los espectrogramas para comparar las diferencias en calidad de audio por cada tasa, usando diferentes tonos de color para cada bit rate.

Simulación de Efecto Preeco

  • La función demo_preeco simula el preeco en el audio
  • Se aplica una ventana a un pulso corto
  • Implementa cómputo de DCT (Transformada Discreta del Coseno) y cuantización para simular el efecto de compresión
  • Genera y muestra el espectro del audio original con el efecto de compresión

Función para cargar y reproducir un audio

Función cargar_audio carga y reproduce un archivo de audio desde una ruta.

Función para cuantizar audio

Función cuantizar_audio cuantiza un audio a un número específico de bits. Normaliza, cuantiza el audio y lo desnormaliza.

Visualización de la señal original y cuantizada

Función mostrar_cuantizacion visualiza la señal original y cuantizada con un número de bits especificado.

Espectrograma de Banda Estrecha

  • Función mostrar_espectrograma_banda_estrecha muestra el espectrograma de banda estrecha para el audio cuantizado.
  • Muestra una representación visual del espectro a lo largo del tiempo.

Cuantización de Audio

  • Se cuantiza el audio original a distintos números de bits.
  • A partir de los datos anteriores, los nuevos audios cuantizados se reproducen, mostrando el espectrograma, con un zoom en los 20 primeros milisegundos.

Actividad para los participantes

  • Se recomiendan pruebas experimentales, cambiando parámetros y observando el output.
  • Los participantes son alentados a experimentar con diferentes valores de parámetros.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Codificación - Colab PDF

Description

Este cuestionario cubre la instalación y uso de la librería pydub, incluyendo la importación de librerías necesarias para el procesamiento de audio. También se exploran funciones para generar tonos y demostrar enmascaramiento en señales de audio. Prepárate para probar tus conocimientos sobre esta herramienta fundamental en análisis de audio.

Use Quizgecko on...
Browser
Browser