Podcast
Questions and Answers
¿En qué espacio de color se transforma la imagen para separar la parte de color de la parte de luminancia?
¿En qué espacio de color se transforma la imagen para separar la parte de color de la parte de luminancia?
YCbCr
¿Qué técnica de compresión sin pérdida utiliza una tabla de códigos para representar secuencias de bytes?
¿Qué técnica de compresión sin pérdida utiliza una tabla de códigos para representar secuencias de bytes?
¿Qué representa el punto central de la imagen en la transformada de Fourier?
¿Qué representa el punto central de la imagen en la transformada de Fourier?
La onda (0,0), un plano plano sin ondulaciones.
La compresión con pérdida elimina permanentemente los datos que considere innecesarios de la imagen.
La compresión con pérdida elimina permanentemente los datos que considere innecesarios de la imagen.
Signup and view all the answers
¿Qué tipo de codificación de entropía se utiliza comúnmente para almacenar “símbolos” que son comunes en nuestros datos y usar más bits para “símbolos” menos comunes?
¿Qué tipo de codificación de entropía se utiliza comúnmente para almacenar “símbolos” que son comunes en nuestros datos y usar más bits para “símbolos” menos comunes?
Signup and view all the answers
¿En qué consiste la técnica de submuestreo de croma?
¿En qué consiste la técnica de submuestreo de croma?
Signup and view all the answers
¿Qué tipo de codificación de imágenes utiliza la transformada de ondícula en lugar de la transformada discreta de coseno?
¿Qué tipo de codificación de imágenes utiliza la transformada de ondícula en lugar de la transformada discreta de coseno?
Signup and view all the answers
La compresión fractal es un método de compresión con pérdida para imágenes digitales.
La compresión fractal es un método de compresión con pérdida para imágenes digitales.
Signup and view all the answers
¿Qué método de compresión de imágenes utiliza la cuantificación para reducir la cantidad de bits necesarios para almacenar un número?
¿Qué método de compresión de imágenes utiliza la cuantificación para reducir la cantidad de bits necesarios para almacenar un número?
Signup and view all the answers
¿Qué técnica de compresión de imágenes utiliza un gran conjunto de puntos (vectores) que se agrupan en grupos que tienen aproximadamente la misma cantidad de puntos más cercanos a ellos?
¿Qué técnica de compresión de imágenes utiliza un gran conjunto de puntos (vectores) que se agrupan en grupos que tienen aproximadamente la misma cantidad de puntos más cercanos a ellos?
Signup and view all the answers
La compresión sin pérdida reducirá la calidad de la imagen.
La compresión sin pérdida reducirá la calidad de la imagen.
Signup and view all the answers
¿Qué tipo de codificación de imágenes se utiliza en el formato PNG y en el programa de compresión ZIP?
¿Qué tipo de codificación de imágenes se utiliza en el formato PNG y en el programa de compresión ZIP?
Signup and view all the answers
¿Qué técnica de compresión de imágenes se utiliza para imágenes con áreas de color uniforme?
¿Qué técnica de compresión de imágenes se utiliza para imágenes con áreas de color uniforme?
Signup and view all the answers
¿Cuál es la función principal de la codificación de Huffman?
¿Cuál es la función principal de la codificación de Huffman?
Signup and view all the answers
¿Qué es la tasa de código?
¿Qué es la tasa de código?
Signup and view all the answers
¿Cuál es el objetivo de la codificación aritmética?
¿Cuál es el objetivo de la codificación aritmética?
Signup and view all the answers
¿Cómo se calcula la probabilidad de ocurrencia de un símbolo en la codificación aritmética?
¿Cómo se calcula la probabilidad de ocurrencia de un símbolo en la codificación aritmética?
Signup and view all the answers
¿Qué es la transformada de Fourier?
¿Qué es la transformada de Fourier?
Signup and view all the answers
La transformada discreta del coseno (DCT) es una señal periódica continua.
La transformada discreta del coseno (DCT) es una señal periódica continua.
Signup and view all the answers
¿Cuál es la diferencia entre la DT-FT y la DFT?
¿Cuál es la diferencia entre la DT-FT y la DFT?
Signup and view all the answers
¿Qué significa que la DFT asume una expansión periódica de la señal?
¿Qué significa que la DFT asume una expansión periódica de la señal?
Signup and view all the answers
¿Cuál es la principal diferencia entre la compresión con pérdida y la compresión sin pérdida?
¿Cuál es la principal diferencia entre la compresión con pérdida y la compresión sin pérdida?
Signup and view all the answers
El algoritmo LZW se utiliza en el formato de imagen GIF.
El algoritmo LZW se utiliza en el formato de imagen GIF.
Signup and view all the answers
El algoritmo LZW tiene pérdidas.
El algoritmo LZW tiene pérdidas.
Signup and view all the answers
¿Cuál es el objetivo principal de la codificación de Huffman?
¿Cuál es el objetivo principal de la codificación de Huffman?
Signup and view all the answers
En la teoría de la información, el teorema de codificación de fuente de Shannon expresa que la tasa de código no puede ser menor que la entropía de Shannon.
En la teoría de la información, el teorema de codificación de fuente de Shannon expresa que la tasa de código no puede ser menor que la entropía de Shannon.
Signup and view all the answers
¿Qué es un sistema LSI?
¿Qué es un sistema LSI?
Signup and view all the answers
¿Qué es la transformada discreta del coseno (DCT)?
¿Qué es la transformada discreta del coseno (DCT)?
Signup and view all the answers
La cuantificación vectorial es una técnica de compresión con pérdida.
La cuantificación vectorial es una técnica de compresión con pérdida.
Signup and view all the answers
La compresión con pérdida puede restaurar el original si es necesario.
La compresión con pérdida puede restaurar el original si es necesario.
Signup and view all the answers
¿Cuál es el formato de imagen con pérdida más común?
¿Cuál es el formato de imagen con pérdida más común?
Signup and view all the answers
La correlación de fase es un enfoque para estimar el desplazamiento relativo de traslación entre dos imágenes similares.
La correlación de fase es un enfoque para estimar el desplazamiento relativo de traslación entre dos imágenes similares.
Signup and view all the answers
¿Cuál es el método más común para hacer coincidir un macrobloque con otro bloque?
¿Cuál es el método más común para hacer coincidir un macrobloque con otro bloque?
Signup and view all the answers
El método de correlación de fase es resistente al ruido.
El método de correlación de fase es resistente al ruido.
Signup and view all the answers
La compensación de movimiento se utiliza en los formatos de compresión como MPEG.
La compensación de movimiento se utiliza en los formatos de compresión como MPEG.
Signup and view all the answers
¿Cuáles son los principales componentes de la detección y coincidencia de características?
¿Cuáles son los principales componentes de la detección y coincidencia de características?
Signup and view all the answers
¿Cuál de estos métodos se utiliza para la identificación de características en una imagen?
¿Cuál de estos métodos se utiliza para la identificación de características en una imagen?
Signup and view all the answers
Los descriptores de características locales son muy robustos a cambios en la imagen.
Los descriptores de características locales son muy robustos a cambios en la imagen.
Signup and view all the answers
La codificación de vídeo predictivo se basa en la predicción del error.
La codificación de vídeo predictivo se basa en la predicción del error.
Signup and view all the answers
¿Qué es un GOP?
¿Qué es un GOP?
Signup and view all the answers
¿Qué significa la “estimación de movimiento”?
¿Qué significa la “estimación de movimiento”?
Signup and view all the answers
¿Qué es el método de coincidencia de bloques?
¿Qué es el método de coincidencia de bloques?
Signup and view all the answers
El método de coincidencia de bloques se utiliza en los estándares de codificación de video.
El método de coincidencia de bloques se utiliza en los estándares de codificación de video.
Signup and view all the answers
El flujo óptico se basa en el análisis de las variaciones de intensidad de los niveles de gris entre imágenes consecutivas de la secuencia.
El flujo óptico se basa en el análisis de las variaciones de intensidad de los niveles de gris entre imágenes consecutivas de la secuencia.
Signup and view all the answers
El método de flujo óptico es inmune al ruido.
El método de flujo óptico es inmune al ruido.
Signup and view all the answers
La técnica de block matching se utiliza para la estimación y compensación de movimiento en la codificación de video.
La técnica de block matching se utiliza para la estimación y compensación de movimiento en la codificación de video.
Signup and view all the answers
Study Notes
Procesado de señales audiovisuales: Compresión de imagen y vídeo
- El tema trata sobre el procesado de señales audiovisuales, centrándose en la compresión de imagen y vídeo.
- El presentador es Alberto Belmonte Hernández.
- El material está financiado por la Unión Europea y NextGenerationEU, el Gobierno de España y el Ministerio de Cultura y Deporte.
Temario
- El temario incluye: - Tratamiento de la imagen como señal. - Compresión de imágenes. - Estimación de movimiento. - Compresión de vídeo (ITU, DCI y HDR). - Práctica 2: Análisis de compresión de imagen y vídeo.
1.1 Tratamiento de la imagen como señal
- Se presenta una breve introducción sobre las señales unidimensionales (1D) en el contexto de las imágenes digitales.
- Una imagen digital se define como una representación numérica bidimensional de la realidad.
- Las imágenes digitales se construyen muestreando y cuantificando la imagen continua original, obteniendo una imagen discreta.
- El proceso de muestreo implica la toma de valores discretos, y la cuantificación reduce el rango de esos valores a un conjunto discreto (por ejemplo, valores de intensidad o índices de color.).
- Los píxeles suelen incluir información de tres componentes de color (rojo, verde, azul, etc.)
Breve repaso de señales unidimensionales (1D)
- Las imágenes, si bien se representan como señales bidimensionales, utilizan conceptos de señales unidimensionales para su descripción.
- Las señales continuas se representan como una función f(x,y) donde x e y son coordenadas espaciales.
- Las señales discretas se representan como f[m,n] donde m y n son coordenadas discretas. - El muestreo y la cuantificación transforman una señal continua en una discreta.
Sistemas Lineales e Invariantes en el Tiempo (LTI)
- Se describen los sistemas LTI, una categoría de sistemas que cumplen dos propiedades importantes: linealidad e invariancia en el tiempo.
- La linealidad significa que la salida es proporcional a la entrada.
- La invariancia en el tiempo significa que si la entrada se retrasa en el tiempo, la salida también se retrasa.
- Los sistemas LITI son importantes en el procesado de señales e imágenes, y su respuesta de impulso puede ser usada para calcular la respuesta a cualquier entrada.
Representación de señales en términos de componentes de frecuencia
- La transformada de Fourier (TF) transforma una señal del dominio del tiempo al dominio de la frecuencia, y permite analizar las características de la señal en términos de frecuencias.
- La Transformada de Fourier de Tiempo Discreto (DTFT) transforma una señal discreta del dominio del tiempo al dominio de la frecuencia.
- La Transformada de Fourier Discreta (DFT) es una versión discreta de la DTFT que se utiliza con una señal de longitud finita.
Imágenes como señales bidimensionales (2D)
- Las imágenes se representan como señales bidimensionales (2D), que dependen de dos componentes espaciales, ancho y alto.
- La imagen continua ideal se define como una función f(x, y) donde x, y están en R
- Las imágenes digitales, en cambio, son versiones discretas de esta señal continua. Se utilizan sistemas de coordenadas (m,n) donde m y n están en Z.
- Las imágenes digitales consisten en una cuadrícula de píxeles, cada uno representado por un valor discreto.
- El rango de valores que un píxel puede tomar (representación de la intensidad) puede ser un valor de intensidad (gris, en escala de grises). También se puede entender como índice en un mapa de colores.
- Si el color está representado por tres componentes (RGB), entonces un píxel almacenaría índices para los tres componentes.
Compresión con pérdidas o sin pérdidas
- Se describe la compresión de imágenes con pérdida y sin pérdida. La compresión con pérdida reduce el tamaño del archivo y pierde algunos datos de la imagen. La compresión sin pérdida mantiene la calidad de la imagen original y reduce un poco el tamaño del archivo.
Compresión sin pérdidas
- Se describen algunos algoritmos sin pérdida para la compresión de imágenes y archivos.
- Algunos de los algoritmos más comunes son Huffman, codificación aritmética y codificación de longitud de ejecución (RLE).
- Estos algoritmos tienen como objetivo la compresión de datos redundantes.
Compresión sin pérdidas: Codificación Huffman
- Se describe la codificación de Huffman como un algoritmo que asigna códigos de longitud variable (más cortos para símbolos que aparecen con más frecuencia) que permiten la compresión sin pérdidas de los datos.
Compresión sin pérdidas: Codificación Aritmética
- Se describe la codificación aritmética como un algoritmo que asigna un único número a todo el mensaje o cadena que se desea codificar.
- El valor de este número indica la probabilidad de ocurrencia de cada símbolo, o secuencia de símbolos, basada en la tasa de apariencia de cada en el conjunto de datos de entrada.
Compresión sin pérdidas - LZW
- Se describen las características de LZW, un método de compresión sin pérdidas que se basa en la creación de un diccionario de cadenas repetidas de una secuencia de símbolos.
- LZW utiliza códigos para representar las secuencias repetidas en lugar de los símbolos individuales mejorando significativamente la compresión.
Compresión con pérdidas
- Se describe la compresión con pérdidas como un proceso irreversible que sacrifica cierta calidad de imagen a cambio de una alta compresión.
- Algunos ejemplos de esto son la compresión JPEG y la cuantificación escalar y vectorial.
Compresión con pérdidas – Cuantización escalar y vectorial
- Se describen las técnicas de cuantización escalar y vectorial, que implican la reducción del número de bits para representar la información de una imagen.
- La cuantización implica la reducción de la cantidad de bits necesarios para representar una cantidad o valor; y puede utilizarse como técnica de compresión con pérdidas.
- La cuantización escalar implica cuantizar cada píxel de forma independiente, y la cuantización vectorial implica agrupar varios píxeles para formar un vector.
- La cuantización puede utilizarse para reducir el espacio que ocupa una imagen digital.
- La pérdida de información ocurre en la cuantización vectorial.
Compresión con pérdidas – Submuestreo
- El ojo humano es más sensible a la luminancia que al color en las imágenes.
- Para reducir la compresión de datos visuales sin perder la calidad, se utiliza submuestreo.
- El espacio de color YCbCr separa mejor la luminancia (Y) de la crominancia (Cb, Cr).
- En el submuestreo, cada cuatro muestras de Cb o Cr se reemplazan por una sola.
- Se ahorra espacio en la memoria, o bien cuando transmitimos la imagen, sin pérdida significativa de calidad.
Compresión con pérdidas – PCM y DPCM
- Se describe la modulación por código de pulsos (PCM) y su variante, modulación por código de pulsos diferencial (DPCM), como métodos de compresión de datos con pérdida para señales de imagen.
- PCM muestrea y cuantifica la señal de entrada para representar los valores, y DPCM solo captura las diferencias con la imagen anterior.
- Ambas técnicas benefician un ahorro en la cantidad de espacios guardados; sin embargo, provocan una pérdida en la calidad de la imagen.
- En la codificación PCM, se realiza la cuantificación de los valores obtenidos en el muestreo, y en la codificación DPCM, se realiza una predicción de los valores y se guarda solo la diferencia. La diferencia tiene un rango más bajo que los valores originales, lo que significa espacio de almacenamiento menor que la imagen original en PCM.
Compresión con pérdidas – Fractal Encoding
- Se describe el codificador fractal como un método de compresión que busca encontrar patrones repetitivos en una imagen y convertirlos en patrones que se pueden usar para codificar la imagen.
- Los patrones se pueden representar mediante ecuaciones matemáticas llamadas “códigos fractales”
- Los códigos fractales se utilizan para reconstruir la imagen, perdiendo información.
Compresión con pérdidas – JPEG
- Se explica la codificación JPEG como un método de compresión con pérdida que utiliza la transformada discreta del coseno (DCT).
- Se divide la imagen en bloques (generalmente 8×8 píxeles), se aplica la DCT para representar cada bloque, se cuantifican los coeficientes DCT, y se codifican los coeficientes cuantificados mediante un algoritmo sin pérdidas, como la codificación de longitud de ejecución (RLE). - El submuestreo reduce tamaño de imagen, que es fundamental a la hora de aplicar compresión de datos, lo que permite una reducción significativa. - La codificación de entropía se usa para codificar y comprimir los datos de manera efectiva.
Estimación de Movimiento
- Se describe la importancia de la estimación del movimiento en las técnicas de compresión de vídeo. Esto ayuda a reducir la redundancia temporal entre los fotogramas consecutivos.
- La estimación del movimiento se usa para predecir el movimiento de objetos en la imagen para codificar información adicional y reducir la información que necesita ser almacenada.
Estimación de movimiento - Correlación de fase
- La correlación de fase se describe como un método que determina el desplazamiento relativo entre dos imágenes u otras dos representaciones de datos, utilizando una representación en el dominio de la frecuencia.
- Se enfoca en el uso de la transformada de Fourier (para crear una representación en el dominio de la frecuencia), y luego en la comparación entre las señales (en el dominio de la frecuencia) -Se utiliza la correlación cruzada normalizada de las representaciones, para determinar el desplazamiento relativo entre imágenes similares.
Estimación de movimiento – Block Matching
- Se describe la coincidencia de bloques como un método para estimar el movimiento entre dos imágenes sucesivas de una secuencia de vídeo.
- La técnica divide el cuadro en bloques, y compara cada bloque con bloques similares en cuadros anteriores. - El desplazamiento es estimado y los datos de movimiento son codificados.
- Se realiza el procesamiento de patrones que se mueven para reducir la redundancia de estas imágenes.
Estimación de Movimiento - Flujo Óptico
- Se describe el flujo óptico como un método para estimar el movimiento entre dos imágenes sucesivas de una secuencia de vídeo observando el movimiento de los puntos de las imágenes. - Esto implica calcular el cambio de intensidad en un espacio 2D, o en otras palabras, calcular la velocidad en una dirección específica (vector) de todos o algunos puntos específicos de una imagen específica en relación con otra imagen. - La hipótesis se basa en que la variación de intensidad entre un par de píxeles debe ser proporcional al vector de desplazamiento.
Estimación de movimiento - Feature Matching
- Se describe la coincidencia de características como un método para determinar el movimiento entre dos imágenes sucesivas de una secuencia de video mediante el uso de descriptores de características locales, con una representación gráfica, para determinar visualmente la correspondencia. -Se describe el proceso de detección y matching de características.
Compresión de vídeo
- Se describe la compresión de vídeo como una forma de reducir el tamaño de los archivos de vídeo.
- Esto se logra mediante la reducción de la redundancia espacial y temporal entre frames en la secuencia de vídeo.
- Se puede almacenar y representar la información de una imagen mediante una codificación de datos bidimensional.
- Se utiliza la información de movimiento entre los marcos consecutivos para predecir y codificar mejor los cuadros futuros.
- Se utilizan diferentes algoritmos y técnicas de representación de imágenes.
- Se describen los contenedores y la codificación, como MPEG-1 y MPEG-2, como ejemplos de métodos de codificación de vídeo para compresión de datos.
- Se describen los contenedores, como MPEG-1 y MPEG-2, y aspectos de los estándares como H.264/AVC, HEVC y los estándares de compresión recientes.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Explora el fascinante mundo del procesado de señales audiovisuales centrado en la compresión de imagen y vídeo. Este cuestionario abarca desde el tratamiento de la imagen como señal hasta las técnicas de compresión de vídeo, proporcionando una base sólida en estos temas cruciales. Ideal para aquellos interesados en la tecnología de la imagen y el vídeo.