Tema 4_Senal_video PDF
Document Details

Uploaded by ChivalrousPlutonium8456
Universidad Politécnica de Madrid
José Manuel Menéndez
Tags
Summary
This document describes and characterizes video signals, covering analog and digital aspects. It details the components of video signals, including luminance and chrominance. The document also touches on the historical development and use of video technology and standardization, such as the UIT-R recommendations.
Full Transcript
Descripción y caracterización de señal de vídeo Máster de formación permanente en ingeniería de producción y explotación de contenidos José Manuel Menéndez Catedrático de la ETSIT-UPM Departamento de Señales, Sistemas y Radiocomunicaciones...
Descripción y caracterización de señal de vídeo Máster de formación permanente en ingeniería de producción y explotación de contenidos José Manuel Menéndez Catedrático de la ETSIT-UPM Departamento de Señales, Sistemas y Radiocomunicaciones E.T.S. Ingenieros de Telecomunicación Universidad Politécnica de Madrid Contenido 1. Introducción La recomendación UIT-R BT.709 2. Origen de la señal de vídeo La recomendación UIT-R BT.2020 3. Caracterización de la señal de vídeo 5. Alto rango dinámico - HDR Tipo de barrido SDR vs HDR La velocidad de refresco OETF y EOTF para SDR La relación de aspecto La recomendación UIT-R BT.2100 La resolución Curvas OOTF HLG y PQ La característica cromática Curvas OETF HLG y PQ 4. La señal de vídeo digital Curvas EOTF HLG y PQ Justificación Metadatos en la señal HDR La recomendación UIT-R BT.601 6. Conclusiones para la señal UHD 2 / 122 Introducción Contenido 1. Introducción La recomendación UIT-R BT.709 2. Origen de la señal de vídeo La recomendación UIT-R BT.2020 3. Caracterización de la señal de vídeo 5. Alto rango dinámico - HDR Tipo de barrido SDR vs HDR La velocidad de refresco OETF y EOTF para SDR La relación de aspecto La recomendación UIT-R BT.2100 La resolución Curvas OOTF HLG y PQ La característica cromática Curvas OETF HLG y PQ 4. La señal de vídeo digital Curvas EOTF HLG y PQ Justificación Metadatos en la señal HDR La recomendación UIT-R BT.601 6. Conclusiones para la señal UHD 3 / 122 Introducción Introducción ▶ El vídeo es el elemento principal del multimedia, y el contenido que domina el tráfico en Internet (entre el 80 % y el 90 % del tráfico total en IP en el mundo) ▶ La disponibilidad de cámaras de vídeo de alta calidad en cualquier smartphone está disparando su captación y transmisión en cualquier ámbito: ▶ Televisión ▶ Cine ▶ Vídeo-vigilancia ▶ Vídeos personales ▶... ▶ Y está presente en todos los eslabones de la cadena de producción: ▶ Adquisición ▶ Almacenamiento ▶ Edición ▶ Compresión ▶ Presentación ▶... 4 / 122 Introducción Introducción ▶ Durante muchos años se ha producido una convivencia de dos mundos: ▶ Vídeo analógico ▶ Vídeo digital ▶ La digitalización ha permitido la convergencia de diferentes formatos analógicos previos en uno único digital ▶ No obstante, la coexistencia anterior ha provocado que el vídeo digital haya heredado características del vídeo analógico ▶ Por ello, resulta difícil entender las características del vídeo digital sin tener un mínimo conocimiento de lo que es el vídeo analógico ▶ Actualmente, toda la cadena de producción de vídeo es digital, existiendo un único punto de la misma donde se produce la conversión A/D: en la cámara de captación ▶ En el capítulo dedicado a las cámaras de captación se verá que se produce una cuantificación de una señal discreta espacial y temporalmente 5 / 122 Origen de la señal de vídeo Contenido 1. Introducción La recomendación UIT-R BT.709 2. Origen de la señal de vídeo La recomendación UIT-R BT.2020 3. Caracterización de la señal de vídeo 5. Alto rango dinámico - HDR Tipo de barrido SDR vs HDR La velocidad de refresco OETF y EOTF para SDR La relación de aspecto La recomendación UIT-R BT.2100 La resolución Curvas OOTF HLG y PQ La característica cromática Curvas OETF HLG y PQ 4. La señal de vídeo digital Curvas EOTF HLG y PQ Justificación Metadatos en la señal HDR La recomendación UIT-R BT.601 6. Conclusiones para la señal UHD 6 / 122 Origen de la señal de vídeo Vídeo analógico ▶ Por señal de vídeo analógico se entiende una señal eléctrica unidimensional, que se obtiene muestreando patrones de intensidad luminosa (secuencias de imágenes) en sus tres posibles dimensiones: las dos espaciales (filas y columnas) más la dimensión temporal ▶ Este proceso de muestreo, que transforma señales tridimensionales en unidimensionales se suele conocer con el nombre de barrido, ya que en el proceso de captación, la información sobre la intensidad luminosa se adquiere barriendo la imagen por líneas horizontales 7 / 122 Origen de la señal de vídeo Vídeo analógico monocromo Eléctricamente, la señal x (t) de cada línea tiene el siguiente aspecto (en PAL1 ), donde la información de la señal de vídeo (entre los niveles de negro y blanco) está delimitada en cada línea por impulsos de sincronismo (de forma rectangular): Por tanto, una señal de vídeo no es más que una sucesión temporal de imágenes, cada una de las cuales es, a su vez, descompuesta en líneas horizontales, separadas entre sí por impulsos de sincronismo 1 PAL - Phase Alternating Line: sistema de vídeo analógico utilizado en la mayor parte de Asia y Europa occidental, incluyendo a España 8 / 122 Origen de la señal de vídeo Vídeo analógico monocromo ▶ La señal de vídeo x (t) se utilizaba para modular, en AM– (AM negativo). Los niveles de luminosidad más altos (que se corresponden con los puntos blancos en la imagen) presentan los niveles de tensión más bajos, y los niveles más oscuros (los puntos negros) los más altos, haciendo coincidir los impulsos de sincronismo (que marcan el comienzo de cada línea) con los máximos de energía de la señal ▶ Sin embargo, la señal de vídeo original, sin invertir, presentaba los niveles más altos correspondientes a los puntos blancos, y los más oscuros en los niveles más bajos 9 / 122 Origen de la señal de vídeo Vídeo analógico monocromo Nivel de blancos Nivel de negros ▶ La figura muestra una concatenación de tres líneas de señal de luminancia sin invertir, correspondiente a una carta de ajuste que tiene 8 barras verticales, con el blanco a la izquierda, oscureciéndose progresivamente hacia la derecha hasta alcanzar el nivel de negro Impulsos de sincronismo horizontal ▶ La señal es muy ruidosa, ya que se ha adquirido a partir de la señal leída por un magnetoscopio VHS en el laboratorio ▶ Se observan los impulsos de sincronismo horizontal con niveles de tensión por debajo de los niveles correspondientes al negro 10 / 122 Origen de la señal de vídeo Vídeo analógico en color ▶ La señal de vídeo analógico comenzó ofreciendo exclusivamente una señal de niveles de gris, sin color (monocroma), denominada luminancia ▶ Posteriormente se incorporó el color, con sistema tri-cromático (siguiendo el modelo de percepción humana) ▶ Para favorecer la compatibilidad entre vídeo monocromo (o de niveles de gris) y señal con color se emitían tres señales: ▶ Señal de luminancia (la de niveles de gris original) ▶ Dos señales de diferencia de color (llamadas U y V en PAL) que se sumaban a la anterior para aportar la información de color en aquellos receptores con capacidad para ello 11 / 122 Origen de la señal de vídeo Vídeo analógico en color ▶ Las señales analógicas U y V en PAL eran, realmente, dos vectores de diferencia de color R − Y y B − Y , normalizados para mantener el rango dinámico mediante las expresiones: U = 0, 493 · (B − Y ) V = ±0, 877 · (R − Y ) ▶ El signo ± hace referencia al procedimiento de alternancia de signo entre líneas consecutivas utilizado por el sistema PAL (Phase Alternating Line) para corregir errores en la demodulación ▶ Con estas dos señales se generaba una única señal de crominancia C (t), modulada en cuadratura QAM, con la siguiente expresión: p V C (t) = V cos wpc t + U sen wpc t = (V 2 + U 2 ) sen(wpc t + arctan ) U donde wpc = 2πfpc , con fpc la frecuencia de la portadora de color (4,43 MHz en PAL) ▶ Se observa que la señal de crominancia es un fasor, con las siguientes características: p Amplitud = Saturación de color (mezcla con blanco) = (V 2 + U 2 ) Fase = Tinte (longitud de onda predominante) = arctan V U 12 / 122 Origen de la señal de vídeo Vídeo analógico en color ▶ La señal de crominancia iba sumada a la de luminancia, pero modulada en QAM ▶ Superponiendo ambas señales, se obtiene la señal de vídeo compuesto, tal como muestra la figura ▶ Se observa, también, la denominada salva de color, un conjunto de 9 ciclos de la frecuencia de la portadora de color (en la señal PAL, 4,43 MHz) para facilitar el sincronismo del módulo de extracción de dicha información, situados en el pórtico posterior del impulso de sincronismo horizontal 13 / 122 Origen de la señal de vídeo Digitalización del vídeo ▶ Para digitalizar la señal de vídeo, se muestreaban cada una de las líneas horizontales a la frecuencia adecuada, de tal modo que quedaran estructuras regulares con forma de matriz, a intervalos de tiempo regular entre cada cuadro de imagen: ▶ El muestreo se efectuaba sobre cada señal (Y , U, V ) por separado ▶ Actualmente, los sensores que incluyen las cámaras de captación ya incorporan esta estructura matricial en los fotodiodos, generando 3 señales independientes en cada punto 14 / 122 Origen de la señal de vídeo Digitalización del vídeo ▶ La señal de vídeo digital ha seguido el mismo modelo de trabajo con luminancia Y + 2 señales de diferencia de color, llamadas en digital CR y CB ▶ Las cámaras de captación ofrecen, para cada punto de la imagen, denominado píxel, tres datos, de dos posibles modos: o bien su información en colores primarios R, G, B, o bien información de Y , CR y CB (obtenida a partir de las señales RGB) 15 / 122 Origen de la señal de vídeo La señal de vídeo digital Por lo tanto, la señal de vídeo digital en color se compone, realmente, de tres señales de vídeo diferentes, y su representación admite dos formatos diferentes: 1 Los tres colores primarios R, G, B, utilizados habitualmente en aplicaciones de edición de gráficos de alta calidad (realidad virtual, gráficos sintéticos, etc.) 2 Información de luminancia y diferencias de color Y , CR y CB , usada habitualmente en TV 16 / 122 Origen de la señal de vídeo La señal de vídeo digital ▶ Tanto en la representación de primarios de color (R, G, B) como en el formato de luminancia y diferencias de color (Y , CR , CB ), la señal se compone de un flujo de bits que describen, muestra a muestra, las señales anteriores. ▶ El cómo se secuencian los valores (en bits) lo determina el interfaz digital físico que se use, y se verá en el capítulo correspondiente ▶ El paso de RGB a YCR CB es inmediato mediante ecuaciones lineales. Por ejemplo según la recomendación UIT-R BT.601 para generar señal de definición estándar SD (Standard Definition), la luminancia se obtiene como: Y = 0,299R + 0, 587G + 0, 114B 17 / 122 Caracterización de la señal de vídeo Contenido 1. Introducción La recomendación UIT-R BT.709 2. Origen de la señal de vídeo La recomendación UIT-R BT.2020 3. Caracterización de la señal de vídeo 5. Alto rango dinámico - HDR Tipo de barrido SDR vs HDR La velocidad de refresco OETF y EOTF para SDR La relación de aspecto La recomendación UIT-R BT.2100 La resolución Curvas OOTF HLG y PQ La característica cromática Curvas OETF HLG y PQ 4. La señal de vídeo digital Curvas EOTF HLG y PQ Justificación Metadatos en la señal HDR La recomendación UIT-R BT.601 6. Conclusiones para la señal UHD 18 / 122 Caracterización de la señal de vídeo Caracterización de la señal de vídeo ▶ Para caracterizar una señal de vídeo es necesario tener en cuenta una serie de parámetros, entre los que se encuentran: ▶ El tipo de barrido (entrelazado o progresivo) ▶ La velocidad de refresco ▶ La relación de aspecto ▶ La resolución ▶ La característica cromática ▶ Los parámetros anteriores son característicos tanto de la señal de vídeo analógico como digital ▶ De hecho, la señal digital ha heredado dichas propiedades de la señal analógica ▶ Hay algunos parámetros que NO son comunes, como el ancho de banda (analógico) que queda reemplazado por la velocidad binaria (digital) ▶ El barrido entrelazado ya no existe en las señales UHD (Ultra High Definition), permaneciendo en algunos formatos de HD (High Definition) por herencia histórica 19 / 122 Caracterización de la señal de vídeo Tipo de barrido Entrelazado/Progresivo Los métodos más habituales de barrido de las líneas son dos: a) Progresivo: Un barrido progresivo capta cada una de las imágenes cada ∆t segundos, por líneas consecutivas (figura a). El valor de ∆t puede ser variable, aunque se empiezan a considerar monitores de alta resolución temporal a partir de ∆t = 1/72 segundos A E Las líneas se pintan con cierta inclinación C B (exagerada en la figura) dado que el barrido original de la señal analógica presentaba cierta inclinación. Esto ya no sucede con la actual señal digital D F a) b) b) Entrelazado: Este es el formato utilizado por la industria televisiva tradicional (figura b). Su uso queda justificado por dos motivos: la necesidad de evitar que el ojo sea capaz de captar el parpadeo originado por el refresco continuo del tubo de rayos catódicos, y las restricciones en cuanto a disponibilidad de ancho de banda en el espectro para la señal 20 / 122 Caracterización de la señal de vídeo Tipo de barrido Entrelazado ▶ El formato entrelazado divide cada una de las imágenes completas, denominadas cuadros, en dos campos diferentes, adquiridos en instantes de tiempo distintos ▶ El primer campo (adquirido en el instante t) contiene la información de las líneas impares - campo impar ▶ El segundo (adquirido en el instante t + 1) contiene las líneas pares - campo par ▶ La información se presenta después en el monitor tal como se ha barrido inicialmente, es decir, primero un campo, y a continuación el segundo campo, entrelazado línea a línea con el primero (de ahí su nombre) ▶ Al camino recorrido por el haz sobre la pantalla en los antiguos TRCs para moverse desde el punto B al C1 se le denomina retraza horizontal, en tanto que a los trayectos D–E y F–A se les denomina retrazas verticales ▶ Nota importante: ¡¡cada campo está adquirido en un instante de tiempo diferente!! 1 En la figura de la transparencia anterior 21 / 122 Caracterización de la señal de vídeo Tipo de barrido Entrelazado/Progresivo Imagen entrelazada: Imagen progresiva: 22 / 122 Caracterización de la señal de vídeo Tipo de barrido Entrelazado/Progresivo Cuadro de imagen entrelazada (con objetos moviéndose a alta velocidad) y uno de sus campos: En el cuadro completo se observa cierta borrosidad en la imagen (sólo en los objetos que se mueven), debido a la diferencia de tiempo de adquisición de líneas pares e impares 23 / 122 Caracterización de la señal de vídeo La velocidad de refresco La velocidad de refresco ▶ Es el número de imágenes (o cuadros) por segundo visualizadas, en Hz ▶ Debe ser suficientemente alto como para evitar que no se perciba movimiento continuo (atendiendo a la persistencia del sistema visual humano) ▶ Los sistemas tradicionales de vídeo analógico compuesto manejaban cifras de 25 (PAL) y 30 cuadros/segundo (NTSC2 ), es decir, 50 y 60 campos/segundo, respectivamente, con formato entrelazado ▶ Estas cifras suelen coincidir con las frecuencias de la red eléctrica del país en cuestión, aspecto importante que evitaba la aparición de interferencias de baja frecuencia en la señal de vídeo analógico, muy molestas para el observador ▶ Posteriormente, en la década de los 50, en E.E.U.U y Canadá introdujeron en el sistema NTSC la información de color, con una portadora de color situada entre la información de luminancia y la de sonido. Para minimizar interferencias con dicha incorporación, manteniendo el ancho de banda, decidieron reducir una milésima la frecuencia de refresco de cuadro ligeramente, a valores de 30/1, 001 = 29, 97 Hz. Actulmente, estos valores complejos de gestionar carecen de sentido 2 National Television System Committee: Sistema de TV de EEUU y Canadá, entre otros 24 / 122 Caracterización de la señal de vídeo La velocidad de refresco La velocidad de refresco ▶ Las cifras de frecuencia de refresco mencionadas ofrecían sensación de movimiento continuo en los vídeos mostrados en los TRCs convencionales, de tamaños inferiores a las 40" normalmente ▶ Estas cifras eran diferentes de las manejadas históricamente en la industria del cine, y por ello se utilizaban mecanismos complejos para adaptar dichas velocidades de refresco (ver apéndice 1) ▶ Los valores de refresco anteriores se han visto incrementados últimamente en los monitores utilizados en aplicaciones tanto domésticas como informáticas (es fácil encontrar valores de 70, 80, 100, 150 e incluso 240 Hz) 25 / 122 Caracterización de la señal de vídeo La velocidad de refresco La velocidad de refresco ▶ Se ha comprobado que una frecuencia alta de refresco produce menos fatiga visual ▶ No se debe confundir la velocidad de refresco del monitor con la de la propia señal (emitida o almacenada). Pueden diferir, y es el monitor el que se encarga de adaptarla (típicamente para incrementarla, mediante interpolaciones y filtrados no lineales) ▶ En aplicaciones que hacen uso de grandes pantallas (salas comerciales), donde se manejan señales de UHD, se ha comprobado que se necesitan mayores velocidades de refresco temporal para tener una sensación de movimiento natural en los objetos que se desplazan rápidamente en la escena 26 / 122 Caracterización de la señal de vídeo La velocidad de refresco La velocidad de refresco y la CFR ▶ Algunos estudios [Mackin et al., SMPTE 2017]3 analizan la visibilidad de la percepción de la pérdida de movimiento natural en la pantalla, pérdida que, según ellos mismos denominan, originan artefactos visuales por movimiento ▶ En función de dicha percepción, definen un umbral de frecuencia de refresco de cuadro crítica (Critical Frame Rate - CFR) que depende: ▶ Del tamaño de la pantalla ▶ De la distancia de visionado ▶ De la velocidad de desplazamiento de los objetos en la pantalla ▶ Las conclusiones a las que llegan es que cuanto más grande sea la pantalla y más cerca se visualice, mayor debe ser la frecuancia de refresco de cuadro 3 [Mackin et al., SMPTE 2017] A. Mackin, C. Noland and D. R. Bull, High frame rates and the visibility of motion artifacts. SMPTE Motion Imaging Journal, págs. 41-49, July 2017. 27 / 122 the stimulus subtended on the retina is dependent on these parameters). Practical Considerations Caracterización de la señal de vídeoFigure 6 demonstrates that the CFR is relatively sta- It is not meaningful to compare our experimental La velocidad de refresco ble with respect to stimulus sizes above 3.3 arc min, so results to the CFR model outlined in Eq. 1, as we can- variations in the angular size due to changes in view- not assume that attenuation in the spectrum due to the ing distance should not be significant when assuming a stimulus having a finite width is negligible (Eq. 2), as La velocidad de refresco y la CFR large stimulus size (≥ 20 arc min). demonstrated in Figs. 7 and 9. Watson’s model15 pre- Figure 11 shows the relationship between viewing dicts an increase in CFR for increased luminance distance and frame rate for a variety of screen sizes, at a levels, due to the window of visibility increasing in pan speed of 1.3 screen widths/sec, based on our exper- size.15,34 However, the model does not take the size Gráfica del estudio de [Mackin et al., SMPTE 2017], con objetos moviéndose a una velocidad de 1,3 la imental data. Frame rates exponentially decay with of the stimulus into account; it assumes that the anchura de la pantalla/segundo: 1000 1000 Screen Size Screen Size 80" 80" 800 60" 800 60" Critical Frame Rate (Hz) Critical Frame Rate (Hz) 40" 40" 20" 20" 600 600 400 400 200 200 0 0 1 2 3 4 5 1 2 3 4 5 Viewing Distance (m) Viewing Distance (m) FIGURE 11. Example CFR (left) and acceptable frame rate (right) as a function of viewing distance for a variety of screen sizes, when pan speed is 1.3 screen widths/sec. The dashed portion of the curves represent where the speed is outside the range tested in the experiment and, therefore, these points have been extrapolated. 48 SMPTE Motion Imaging Journal | July 2017 Authorized licensed use limited to: Univ Politecnica de Madrid. Downloaded on August 03,2018 at 10:43:21 UTC from IEEE Xplore. Restrictions apply. 28 / 122 Caracterización de la señal de vídeo La relación de aspecto La relación de aspecto ▶ Representa el cociente entre la anchura y la altura de las imágenes: Anchura Nº columnas R= = Altura Nº filas ▶ La señal de televisión con resolución estándar (Standard Definition Television – SDTV) tiene una relación de aspecto clásica de 4:3 (1,33:1) ▶ En televisión de alta definición (High Definition Television – HDTV) se manejan valores de 16:9 (1,77:1) ▶ Sin embargo, el cine ha venido utilizando varias relaciones de aspecto desde mediados del siglo pasado, en el rango de 1,85:1 a 2,35:1 (CinemaScope) 29 / 122 Caracterización de la señal de vídeo La relación de aspecto Diferentes formatos ▶ La indicación del formato y el tipo de barrido (y, en ocasiones, el modo de transporte de la señal) se suele indicar con las letras PsF – Progressive segmented Frame, siempre referidas a un cuadro de imagen, no a un campo: P: Número de líneas activas por cuadro de imagen s: Indica el tipo de barrido: i para entrelazado (interlaced), y p para progresivo F: Indica la velocidad de refresco, en cuadros por segundo ▶ Algunos ejemplos: 1080p50, 1080i25, 1080p25, 720p50, 576i25,... ▶ 1080i25: 1080 líneas por cuadro de imagen, en formato entrelazado (540 líneas por campo), a 25 cuadros por segundo (50 campos por segundo) ▶ 720p50: 720 líneas por cuadro de imagen, en formato progresivo (1280 × 720 píxeles por cuadro), a 50 cuadros por segundo 30 / 122 Caracterización de la señal de vídeo La relación de aspecto Diferentes formatos ▶ Los tamaños de cuadro más comúnmente manejados se verán a continuación, en la sección dedicada a la resolución en vídeo ▶ En ocasiones se utiliza la indicación PsF para señalizar el formato de transporte de la señal en alguno de los interfaces digitales, especialmente cuando se transmite señal progresiva como si fuera entrelazada (es decir, descompuesta artificialmente en dos campos: uno de líneas impares, y otro de líneas pares) 31 / 122 Caracterización de la señal de vídeo La relación de aspecto Cambios de relación de aspecto ▶ A la hora de visualizar grabaciones en formato de cine, en monitores de vídeo con resoluciones 4/3 o 16/9, es necesario siempre decidir: 1. si se muestra la señal completa a base de encajar la imagen, con su relación de aspecto original, en la pantalla de visualización de 4/3 o 16/9, empequeñeciendo con ello la imagen y desaprovechando parte de la superficie del monitor, 2. o bien utilizar la pantalla completa a base de mostrar exclusivamente parte de la imagen (por ejemplo, solo el centro), perdiendo parte de la información de la señal original ▶ En el primer caso (el más habitual para no perder información visual), para encajar la imagen en el nuevo monitor, existen incluso recomendaciones del SMPTE, como la RP-199 (disponible en Moodle en la práctica 2), que suministra las instrucciones precisas para aprovechar al máximo la pantalla de resolución 16:9 cuando se presentan vídeos con otros formatos 32 / 122 Caracterización de la señal de vídeo La relación de aspecto Cambios de relación de aspecto 33 / 122 The 16:9 aspect ratio employed by digital television standards affords a possibility of avoiding the use of pan and scan techniques when adapting works produced in aspect ratios other than 16:9. The ability to use Caracterización de la señal de vídeo letterbox and sidebar techniques allows for portrayal of the work in the form originally intended by the artists La relación de aspecto who created the original work. 1.2 Scope Recomendación SMPTE RP-199 This practice describes a method of mapping images originating in aspect ratios different from 16:9 into a 16:9 scanning structure in a manner that retains the original aspect ratio of the work. 2 Definitions For the purposes of this practice, the following definitions of terms apply: 2.1 letterbox: An image mapped into the total 16:9 display area such that the full width is utilized, but the full height is not (see figure 1). 2.2 sidebar: An image mapped into the total 16:9 display area such that the full height of the display area is utilized, but the full width is not (see figure 2). Figure 1 – Letterbox Figure 2 – Sidebar image mapping Copyright © 2004 by THE SOCIETY OF Approved MOTION PICTURE AND TELEVISION ENGINEERS 34 / 122 Caracterización de la señal de vídeo La relación de aspecto Recomendación SMPTE RP-199 3 Mapping images into the scanning structure 3.1 Works shall be mapped into the 16:9 aspect ratio scanning structure as shown in algorithm 1. 3.2 Works shall be mapped into the 16:9 aspect ratio so that the center of the original image corresponds with the center of the 16:9 image. Algorithm 1 Calculation of the pixel mapping: Let: A = the aspect ratio of the film (ratio of width to height, expressed as a decimal) Ph = number of horizontal pixels in scanned film image Pv = number of vertical pixels in scanned film image TVh = number of horizontal pixels in television display system TVv = number of vertical pixels in television display system If: A < 16/9 (1.78) Then: Ph = TVv * A Pv = TVv If: A > 16/9 (1.78) Then: Ph = TVh Pv = TVh / A 35 / 122 If: A < 16/9 (1.78) Caracterización de la señal de vídeo La relación de aspecto Then: Ph = TVv * A Pv = TVv RecomendaciónIf: SMPTE A > 16/9 RP-199 (1.78) Then: Ph = TVh Pv = TVh / A Example: Transfer a 1.85:1 image using SMPTE 274M (1920 × 1080) Given: A = 1.85 (greater than 1.78) TVh = 1920 (number of horizontal pixels in television display system) TVv = 1080 (number of vertical pixels in television display system) Therefore: 1.85 > 1.78 (true) so Ph = TVh = 1920 horizontal pixels in target image and Pv = TVh / A = 1038 vertical pixels in target image NOTES 1 This leaves the determination of the original aspect ratio to the user of the film. Fractional results should be rounded up to the next highest pixel value. 2 Examples of common film formats are given in table 1. 36 / 122 Caracterización de la señal de vídeo La relación de aspecto Recomendación SMPTE RP-199. Ejemplo de aplicación Ejemplo: Se dispone de dos señales de vídeo, de 720 × 576 y 1280 × 720 píxeles de resolución respectivamente. Calcular la resolución con que se observarían en pantalla si se mostraran con un monitor FULL HD de 1920 × 1080 píxeles, siguiendo la recomendación SMPTE RP-199. Solución: TVh = 1920, TVv = 1080 Para el primer caso: 720 A1 = = 1, 25 < 16/9 =⇒ Ph = 1080 × A1 = 1350, Pv = 1080 576 Por lo tanto, la resolución observada sería de 1350 × 1080 (Modo Sidebar o Pillarbox ) Para el segundo caso: 1280 = 1, 78 = 16/9 =⇒ Ph = 1920, Pv = 1080 A2 = 720 Por lo tanto, la resolución observada sería de 1920 × 1080. Cuando coincide la relación de aspecto la señal se escala hasta ocupar toda la pantalla 37 / 122 Caracterización de la señal de vídeo La relación de aspecto Relación de aspecto de píxel - PAR ▶ Se define el Display Aspect Ratio - DAR como el cociente entre el número de columnas y el de filas que se pueden mostrar en la pantalla ▶ Se define el Image Aspect Ratio - IAR como el cociente entre el número de columnas y el de filas que tiene la imagen ▶ Se define el Pixel Aspect Ratio - PAR como el cociente: DAR PAR = IAR ▶ Es necesario tener en cuenta posibles deformaciones geométricas en las conversiones de relación de aspecto, ya que en SDTV el PAR es rectangular, en tanto que en HDTV y UHDTV es cuadrado: 38 / 122 Caracterización de la señal de vídeo La relación de aspecto Relación de aspecto de píxel - PAR Se pueden producir deformaciones al presentar imágenes que asumen monitores de imagen con píxeles cuadrados si estos no lo son, y viceversa: 39 / 122 Caracterización de la señal de vídeo La resolución La resolución ▶ Existen grandes diferencias entre el concepto de resolución en vídeo analógico y en vídeo digital. El apéndice 3 describe qué se entiende por resolución y factor de resolución en vídeo analógico, y está asociado al grado de detalle con el que se reproducen los objetos en las imágenes, siendo, por tanto, un parámetro subjetivo ▶ En vídeo digital, sin embargo, se conoce por resolución (o también definición) al número de filas y columnas de píxeles que tiene cada cuadro de imagen. Es, por tanto, un parámetro objetivo ▶ El término anglosajón más comúnmente utilizado es definition, y vinculado a él se manejan tres términos muy difundidos, que tienen un significado muy concreto: Standard Definition – SD: vídeos obtenidos según la recomendación UIT-R BT.601 High Definition – HD: vídeos obtenidos según las recomendaciones UIT-R BT.709 y UIT-R BT.2100 Ultra High Definition – UHD: vídeos obtenidos según las recomendaciones UIT-R BT.2020 y UIT-R BT.2100 40 / 122 Caracterización de la señal de vídeo La resolución Diferentes formatos ▶ Los tamaños de cuadro de imagen más utilizados son los mostrados en la imagen, y responden a los parámetros predefinidos en las recomendaciones anteriormente comentadas de la UIT-R ▶ El prefijo DCI proviene de Digital Cinema Initiatives, un consorcio de empresas y entidades vinculadas a la industria cinematográfica, que han propuesto otras resoluciones para cine en 2K y 4K, diferentes a las utilizadas por la TV para HD y UHD, generando relaciones de aspecto ligeramente mayores a 16/9 41 / 122 Caracterización de la señal de vídeo La característica cromática La característica cromática ▶ Como ya se ha comentado, las señales manejadas pueden incluir información de color o sólo de la luminancia (niveles de gris) ▶ La mayoría de los formatos de vídeo utilizados manejan señales en color, con primarios R, G, B o diferencias de color Y , CR , CB ▶ La colorimetría demuestra que se puede representar prácticamente cualquier color mediante una adecuada mezcla aditiva de tres colores primarios, tales como el rojo (R), verde (G) y el azul (B), siguiendo el modelo del sistema visual humano ▶ Dado que los dispositivos de presentación de imágenes (monitores) no permiten las mezclas aditivas con coeficientes negativos en los primarios, los colores que se pueden presentar están reducidos a un conjunto limitado, en función de los colores primarios con los que se trabaje 42 / 122 Caracterización de la señal de vídeo La característica cromática La característica cromática ▶ La Colorimetría (vista en otra asignatura) permite operar con la señal de color, y determinar los colores que se pueden representar en función de los primarios seleccionados ▶ Para ello, tras múltiples transformaciones matemáticas, se pueden representar los colores existentes mediante el Diagrama de Cromaticidad CIE4 4 Commission Internationale de lÉclairage 43 / 122 Caracterización de la señal de vídeo La característica cromática La característica cromática ▶ El Diagrama de Cromaticidad CIE permite identificar cada color mediante sus coordenadas (x , y ) en el sistema de ejes bidimensional ▶ Además, permite también determinar los colores que se pueden obtener mediante mezclas aditivas de tres primarios: los colores posibles son los incluidos en el triángulo delimitado por lados que unen los puntos correspondientes a los tres primarios ▶ Ejemplo de primarios definidos por la recomendación UIT-R BT.709 para señal HDTV, y posibles colores a representar 44 / 122 Caracterización de la señal de vídeo La característica cromática Diagrama de Cromaticidad CIE en 3D ▶ Realmente, el Diagrama de Cromaticidad CIE es un volumen 3D, en el que los niveles de luminosidad más altos (blancos) están en la parte superior, y los más bajos (negros) en la inferior ▶ Habitualmente, en TV se suele representar una proyección vertical 2D del volumen (animación completa en https://commons.wikimedia.org/wiki/File: Visible_gamut_within_CIExyY_color_space_D65_whitepoint_mesh.webm) 45 / 122 Caracterización de la señal de vídeo La característica cromática Primarios de color en TV ▶ Al definir tres primarios de color en TV se están definiendo las paredes verticales que limitan los colores representables en el sólido 3D de color ▶ Animación completa en https://upload.wikimedia.org/wikipedia/commons/c/c2/SRGB_ gamut_within_CIExyY_color_space_mesh.webm 46 / 122 La señal de vídeo digital Contenido 1. Introducción La recomendación UIT-R BT.709 2. Origen de la señal de vídeo La recomendación UIT-R BT.2020 3. Caracterización de la señal de vídeo 5. Alto rango dinámico - HDR Tipo de barrido SDR vs HDR La velocidad de refresco OETF y EOTF para SDR La relación de aspecto La recomendación UIT-R BT.2100 La resolución Curvas OOTF HLG y PQ La característica cromática Curvas OETF HLG y PQ 4. La señal de vídeo digital Curvas EOTF HLG y PQ Justificación Metadatos en la señal HDR La recomendación UIT-R BT.601 6. Conclusiones para la señal UHD 47 / 122 La señal de vídeo digital Justificación Digitalización de la señal de vídeo La evolución hacia el mundo digital en la señal de vídeo ha sido una clara tendencia, debido fundamentalmente a los tres siguientes factores: ▶ La calidad de reproducción de un sistema basado en vídeo digital es independiente de la calidad del sistema de transmisión (si éste ha sido adecuadamente diseñado), y depende exclusivamente del procesado de la señal en el emisor o receptor ▶ Ésto permite que la señal de vídeo digital atraviese todos los elementos de transmisión y difusión que sean necesarios sin que con ello se deteriore de manera progresiva la calidad de la señal generada, tal como ocurre en el dominio analógico ▶ Las posibilidades de manipulación y procesamiento de la señal de vídeo en formato digital son muy superiores. La constante evolución del sector informático hace posible que cada día sean mayores las posibilidades de procesado de la señal en producción, a un coste cada vez más bajo 48 / 122 La señal de vídeo digital Justificación Criterios de digitalización de la señal de vídeo analógico ▶ Las primeras cámaras de vídeo siempre generaban señal analógica. Su transformación en señal digital requería de un proceso de conversión A/D, con un muestreo a la frecuencia adecuada ▶ Si el motivo de la digitalización de la señal de vídeo fuera sólo la transmisión física de la señal, bastaría con realizar la conversión A/D atendiendo exclusivamente al criterio de Nyquist ▶ Sin embargo, si también se considera la posibilidad de procesar la señal en producción para crear determinados efectos (fundidos, cortinillas, insertos, eliminado de ruidos, etc), resulta interesante utilizar un procedimiento de muestreo que genere imágenes cuyos píxeles presenten una configuración regular, con forma matricial ▶ Esto implica que el número de muestras que se obtengan por cada fila de la imagen debe ser entero, independientemente de su resolución o frecuencia de cuadro original ▶ Estos aspectos de muestreo y cuantificación de la señal analógica se tuvieron en cuenta en la recomendación UIT-R BT.601 para SDTV, y en las primeras versiones de la recomendación UIT-R BT.709 para HDTV 49 / 122 La señal de vídeo digital Justificación ¿Digitalización de vídeo actualmente? ▶ Los sensores de las cámaras de vídeo actuales generan ya una señal con estructura matricial, con lo cual, no se requiere la definición de una frecuencia de muestreo ▶ Por ello, las últimas versiones de la recomendación UIT-R BT.709 para HDTV ya no incluyen niguna mención a posibles frecuencias de muestreo. Tampoco lo hacen las recomendaciones UIT-R BT.2020 y UIT-R BT.2100 para UHDTV ▶ No obstante, la señal que generan los sensores está discretizada espacial (en filas y columnas) y temporalmente, pero no cuantificada en el valor de luminosidad y/o color de cada píxel ▶ Por tanto, se sigue necesitando un conversor A/D a la salida del sensor, dentro de la cámara de captación 50 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Criterios para realizar la digitalización La recomendación UIT-R BT.601 – SDTV ▶ Aunque los sistemas de vídeo compuesto analógico diferían en cuanto a nº de líneas totales y velocidad de refresco (NTSC a 525 líneas y 59,94 Hz, mientras que PAL/SECAM operaban con 625 líneas y 50 Hz habitualmente), siempre se buscan frecuencias de muestreo que ofrezcan estructuras regulares matriciales para todas las señales ▶ Con ello, se simplifica el problema a los fabricantes, que sólo tienen que desarrollar un sistema de digitalización común a todos los estándares, y que además permite una conversión sencilla entre formatos ▶ La determinación de las características de este sistema de digitalización para vídeo analógico en componentes con definición estándar (SDTV) fue el objetivo de la recomendación UIT-R BT.601, que combinó aspectos de la recomendación 625/50 de la EBU (documentos técnicos 3246 y 3247) con el informe 525/59,94 de la SMPTE RP 125 51 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Criterios para realizar la digitalización ▶ La recomendación UIT-R BT.601 no propone una frecuencia de muestreo, sino toda una familia de frecuencias basadas en la frecuencia clave de 13,5 MHz, aplicada siempre a vídeo en componentes, bien RGB, o bien Y , CR , CB ▶ Muestreando a fm =13,5 MHz se obtienen 864 muestras por período de línea a 625/50, y 858 muestras en 525/59,94 ▶ Si se desean velocidades binarias inferiores por limitaciones en el canal disponible, la frecuencia puede sustituirse por 3fm /4 =10,125 MHz, fm /2 =6,75 MHz o bien fm /4 =3,375 MHz ▶ En la nomenclatura habitual se suele designar por un 1 a la frecuencia más baja (3,375 MHz), por un 2 a 6,75 MHz, por un 3 a 10,125 MHz y por un 4 a 13,5 MHz ▶ De esta manera, cuando se desea trabajar con máxima calidad en componentes se suele utilizar el formato RGB con 4:4:4, indicando con ello que las tres componentes primarias se muestrean a 13,5 MHz 52 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Criterios para realizar la digitalización ▶ Para servicios de emisión de TV se suele trabajar en formato digital con componentes en luminancia y diferencias de color Y , CR , CB , siendo: CR = kR (R − Y ) CB = kB (B − Y ) con kR y kB constantes, se suele muestrear a 4:2:2, indicando con ello que la luminancia va muestreada a 13,5 MHz, y las señales de diferencia de color a 6,75 MHz ▶ Si la velocidad de transferencia de datos es crítica (como ocurre en aplicaciones de periodismo - ENG (Electronic News Gathering) se puede llegar a usar 4:1:1 o, incluso, 3:1:1 ▶ Con los factores 3 y 1 surge un problema en el formato de 525/59,94, ya que no proporciona un número entero de muestras por línea, lo cual dificulta el procesamiento en producción 53 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Criterios para realizar la digitalización ▶ Algunos sistemas de compresión de vídeo hacen uso de un tipo particular de muestreo, denominado 4:2:0 ▶ Con ello, no se quiere indicar que una de las componentes no se muestrea en absoluto ▶ La denominación 4:2:0 es un caso particular, con la que se indica que la luminancia Y se muestrea a 13,5 MHz, mientras que las señales diferencia de color CR y CB se muestrean a 6,75 MHz en una línea si, y otra no, es decir, que una línea va muestreada a 4:2:2 y la siguiente a 4:0:0 (considerando sólo la luminancia) 54 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Criterios para realizar la digitalización Los indicativos de las frecuencias (códigos 4, 3, 2 o 1) también se pueden ver como en nº de cuartos respecto a la frecuencia central de muestreo (fm = 13, 5 MHz) que se utilizan: Indicativo Frecuencia Número de muestras de fr. MHz PAL NTSC 4 13,5 864 858 fm 4 3 10,125 648 643,5 fm 4 2 6,75 432 429 fm 4 1 3,375 216 214,5 fm 4 Número de muestras proporcionado por cada una de las frecuencias de muestreo para componentes, derivadas de 13,5 MHz (recomendación UIT-R BT.601) 55 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Esquemas de muestreo 4:2:2 y 4:1:1 en vídeo en componentes Muestreo 4:2:2 y 4:1:1: 56 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Esquemas de muestreo para difusión de TV: 4:2:0 ▶ Para aplicaciones de difusión de señal de TV se utiliza otro esquema de muestreo: 4:2:0 ▶ Este esquema NO indica que una de las bandas de colores no se esté muestreando ▶ Realmente 4:2:0 es un código que indica que el muestreo se realiza alternando los esquemas 4:2:2 en una línea, y 4:0:0 (sin crominancias) en la siguiente Diferentes opciones para muestreo 4:2:0: 57 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 La recomendación UIT-R BT.601 ▶ La recomendación UIT-R BT.601 especifica los métodos de codificación digital de señales de vídeo en componentes ▶ Sugiere la utilización de la misma frecuencia de muestreo (13,5 MHz) para los formatos de relación de aspecto 4/3 y 16/9, aunque también especifica una frecuencia de muestreo alternativa de 18 MHz para el formato de 16/9 ▶ Proporciona valores específicos para dos familias diferentes: 1. Basada en componentes primarios de color RGB, muestreados a 4:4:4 2. Basada en diferencias de color YCR CB , muestreados a 4:2:2 ▶ Para las dos familias anteriores, y con los formatos posibles de relación de aspecto, especifica siempre la utilización de codificación MIC con cuantificación uniforme, con 8 bits por cada muestra tanto para los primarios de color como para la luminancia o las diferencias de color ▶ Opcionalmente, permite la utilización de 10 bits para representar cada muestra 58 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 La recomendación UIT-R BT.601 ▶ La recomendación UIT-R BT.601 parte de la señal analógica original para crear la señal digital ▶ Los valores de los parámetros temporales a considerar en el proceso de digitalización son los siguientes para una de las líneas de luminancia: 59 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Obtención de EY′ , ER′ , EG′ , EB′ ▶ Se parte de las señales de luminancia y diferencia de color: vs EY′ = 0, 299ER′ + 0, 587EG′ + 0, 114EB′ γ = 0.45 (ER′ − EY′ ) = ER′ − 0, 299ER′ − 0, 587EG′ − 0, 114EB′ = 0, 701ER′ − 0, 587EG′ − 0, 114EB′ γ = 2.2 (EB′ − EY′ ) = EB′ − 0, 299ER′ − 0, 587EG′ − 0, 114EB′ = −0, 299ER′ − 0, 587EG′ + 0, 886EB′ ve siendo EX′ la versión precorregida en gamma, según la recomendación UIT-T H.272, que hereda la respuesta exponencial e 1/0,45 = e 2,2 que tenían los CRTs, y propone una pre-corrección inversa e 0,45 a la efectuada por los CRTs para obtener una respuesta lineal final ▶ Por tanto, EX′ = EX e 0,45 , siendo EX cualquiera de las señales EY , ER , EG , EB de la cámara 60 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Valores normalizados de EY′ , ER′ , EG′ , EB′ ▶ Estos valores están normalizados a la unidad, como muestra la tabla siguiente: Condición ER′ EG′ EB′ EY′ ER′ − EY′ EB′ − EY′ Blanco 1,0 1,0 1,0 1,0 0 0 Negro 0 0 0 0 0 0 Rojo 1,0 0 0 0,299 0,701 -0,299 Verde 0 1,0 0 0,587 -0,587 -0,587 Azul 0 0 1,0 0,114 -0,114 0,886 Amarillo 1,0 1,0 0 0,886 0,114 -0,886 Cian 0 1,0 1,0 0,701 -0,701 0,299 Magenta 1,0 0 1,0 0,413 0,587 0,587 61 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Valores normalizados de EY′ , ER′ , EG′ , EB′ ▶ Aunque los valores de EY′ están ya comprendidos en la gama de 0 a 1,0, los de (ER′ − EY′ ) se sitúan en la gama de -0,701 a +0,701, y los de (EB′ − EY′ ) en la gama de -0,886 a +0,886 ▶ Para re-normalizar respecto a la unidad la gama de las señales de diferencia de color (es decir, de -0,5 a +0,5), se pueden calcular los coeficientes siguientes: 0, 5 kR = = 0, 713 0, 701 0, 5 kB = = 0, 564 0, 886 EC′ R = kR (ER′ − EY′ ) = 0, 713(ER′ − EY′ ) = 0, 500ER′ − 0, 419EG′ − 0, 081EB′ EC′ B = kB (EB′ − EY′ ) = 0, 564(EB′ − EY′ ) = −0, 169ER′ − 0, 331EG′ + 0, 500EB′ 62 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Construcción de Y , CR , CB ▶ La norma propone codificación binaria de 8 bits con cuantificación uniforme, es decir, 256 niveles de cuantificación equidistantes (de 0000 0000 a 1111 1111, o bien de 00 a FF en hexadecimal), es decir, de 0 a 255 ▶ En el caso del sistema 4:2:2, descrito en esta recomendación, los niveles 0 y 255 se reservan para datos de sincronización, en tanto que los niveles 1 a 254 se utilizan para vídeo ▶ La señal de luminancia sólo ocupa 220 niveles. Para proporcionar márgenes de trabajo y que el negro se encuentre en el nivel 16, el valor decimal de la señal de luminancia antes de la cuantificación es: Y = 219(EY′ ) + 16 63 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Construcción de Y , CR , CB ▶ Las señales de diferencias de color ocupan 225 niveles, y como el valor 0 es el nivel 128, los valores decimales de las señales de diferencia de color antes de la cuantificación son: CR = 224[EC′ R ] + 128 = 224[0, 713(ER′ − EY′ )] + 128 CB = 224[EC′ B ] + 128 = 224[0, 564(EB′ − EY′ )] + 128 ▶ Simplificando: CR = 160(ER′ − EY′ ) + 128 CB = 126(EB′ − EY′ ) + 128 64 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 La recomendación UIT-R BT.601. Formato de R = 4/3 ▶ Parámetros de codificación según la recomendación UIT-R BT.601 para las familias RGB 4:4:4 e YCR CB 4:2:2, con relación de aspecto 4/3 y haciendo uso de 8 bits por muestra: Sistema 625/50 Sistema 525/59,94 Parámetro Total Visible Total Visible Entrelazado 2:1 2:1 Campos/segundo 50 59,94 Líneas/cuadro 625 576 525 484 Columnas/cuadro R, G, B o Y 864 720 858 720 CR o CB 432 360 429 360 Régimen binario [Mbs] R, G, B o Y 108 82,944 107,999 83,552 CR o CB 54 41,422 53,999 41,776 ▶ Los píxeles obtenidos NO son cuadrados ⇔ El PAR no vale 1 65 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 La recomendación UIT-R BT.601. Formato de R = 16/9 ▶ Parámetros de codificación según la recomendación UIT-R BT.601 para las familias RGB 4:4:4 e YCR CB 4:2:2, con relación de aspecto 16/9 y haciendo uso de 8 bits por muestra: Sistema 625/50 Sistema 525/59,94 Parámetro Total Visible Total Visible Entrelazado 2:1 2:1 Campos/segundo 50 59,94 Líneas/cuadro 625 576 525 484 Columnas/cuadro R, G, B o Y 1152 960 1144 960 CR o CB 576 480 572 480 Régimen binario [Mbs] R, G, B o Y 144 110,592 143,999 111,402 CR o CB 72 55,296 71,999 55,701 ▶ Los píxeles obtenidos NO son cuadrados ⇔ El PAR no vale 1 66 / 122 La señal de vídeo digital La recomendación UIT-R BT.601 Velocidades binarias sin compresión ▶ Como se puede apreciar, la velocidad binaria total que se obtiene para el formato de 4/3 (el más común) es de 324 Mbs para RGB, y de 216 Mbs para YCR CB ▶ Si sólo se considera la zona visible y no se envía información referente a los sincronismos, la velocidad se reduce a 248,832 Mbs para RGB y 165,888 Mbs para YCR CB ▶ Queda patente, pues, que resultaría muy interesante disponer de mecanismos para reducir este importante volumen de información y poder transmitir vídeo digital por canales más restrictivos ▶ Esta necesidad ha quedado reflejada en la elaboración de una serie de estándares de compresión de vídeo, entre los cuales destacan UIT-T J.81, UIT-T H.261, UIT-T H.263, ISO MPEG-1, ISO MPEG-2, ITU-T Rec. H.264/ISO/IEC 14496-10 MPEG-4 (parte 10) AVC, MPEG-H Part 2 (ISO/IEC 23008-2)/ITU-T H.265 High Efficiency Video Coding (HEVC), etc. 67 / 122 La señal de vídeo digital La recomendación UIT-R BT.709 La recomendación UIT-R BT.709 La recomendación UIT-R BT.709 – HDTV ▶ La recomendación UIT-R BT.709 define los parámetros y valores del formato de imagen para la señal de televisión de alta definición (HDTV) ▶ Inicialmente, se desarrollaron dos normas de exploración de HDTV: la 1125/60/2:1 y la 1250/50/2:1, que digitalizaban señal analógica de alta definición en componentes, con impulsos de sincronismo trinivel: ▶ Finalmente, para televisión digital, las imágenes por ordenador y otras aplicaciones se diseñó un formato de imagen común de HDTV de 1920 columnas y 1080 líneas que proporciona un muestreo de píxeles cuadrados y cierto número de frecuencias de imagen entrelazada y progresiva (Parte 2 de dicha Recomendación) 68 / 122 La señal de vídeo digital La recomendación UIT-R BT.709 La recomendación UIT-R BT.709 ▶ De nuevo, propone valores específicos para dos familias diferentes (basándose en las frecuencias de muestreo de las señales anteriores trinivel): 1. Componentes primarios de color RGB, muestreados a 4:4:4 2. Diferencias de color YCR CB , muestreados a 4:2:2 ▶ El concepto de frecuencia de muestreo pierde su sentido original, pero los códigos de muestreo se mantienen para indicar el número de muestras de cada señal que se consideran ▶ Para las dos familias anteriores, especifica siempre la utilización de codificación MIC con cuantificación uniforme, con 8 o 10 bits por cada muestra tanto para los primarios de color como para la luminancia o las diferencias de color ▶ Sólo maneja relación de aspecto R = 16/9, con píxeles cuadrados 69 / 122 La señal de vídeo digital La recomendación UIT-R BT.709 La recomendación UIT-R BT.709 ▶ La norma arranca definiendo el formato de imagen común (Common Image Format – CIF) con resolución de 1920 × 1080, de manera que tenga valores de parámetros de imagen común independientes de la frecuencia de refresco ▶ Se especifican las siguientes frecuencias de refresco de imagen: 60 Hz, 50 Hz, 30 Hz, 25 Hz, 24 Hz ▶ Dado que en el momento de definición de esta norma el uso de CRTs era masivo, se admite captura tanto progresiva (P) como entrelazada (I) ▶ Las imágenes progresivas pueden transportarse con transporte progresivo (P) o transporte de cuadro progresivo segmentado (Progressive segmented Frame – PsF), entendiendo por tal un cuadro progresivo que se transmite dividido en dos bloques: un con las líneas impares de la imagen, y otro con las líneas pares (como si fuera entrelazado) ▶ Las imágenes entrelazadas se transportan con transporte entrelazado (I), similar la formato PsF anterior 70 / 122 Rec. UIT-R BT.709-5 19 La señal de vídeo digital La recomendación UIT-R BT.709 Características de la imagen 2 Características de imagen Valores del sistema Punto Parámetro 60/P 30/P 30/PsF 60/I 50/P 25/P 25/PsF 50/I 24/P 24/PsF 2.1 Formato de imagen 16:9 2.2 Muestras por línea activa 1 920 2.3 Retícula de muestreo Ortogonal 2.4 Líneas activas por imagen 1080 2.5 Formato del píxel 1:1 (píxels cuadrados) 71 / 122 La señal de vídeo digital La recomendación UIT-R BT.709 Formato de las señales 9DORUHVGHVLVWHPD 3XQWR 3DUiPHWUR 3 3 3V) , 3 3 3V) , 3 3V) 3UHFRUUHFFLyQQROLQHDOFRQFHSWXDO J Se aplica precorrección gamma (se asume CRTs) GHODVVHxDOHVSULPDULDV 9pDVHHO 'HWHUPLQDFLyQGHODVHxDOGH EYc ERc EG c EBc OXPLQDQFLD EYc 'HWHUPLQDFLyQGHODVHxDOGH EBc EYc GLIHUHQFLDGHFRORU c ECB Se define una función de transferencia FRGLILFDFLyQDQDOyJLFD c EG ER c EB c opto-electrónica (OETF): ERc EYc c ECR c EG ER c EB c &XDQWLILFDFLyQGHODVVHxDOHVGH OXPLQDQFLDRVA\GHGLIHUHQFLD DRc > @ ,17 ERc n GHFRORU c DG > @ c n ,17 EG 26 Rec. UIT-R BT.709-5 DBc ,17 > E c @ B n (1) «n» designa el número de longitud en bit de la señal cuantificada. DYc > ,17 EYc n @ (2) El operador INT devuelve el valor 0 para partes fraccionarias en el intervalo de 0 a 0,4999… y +1 para las partes fraccionarias en el intervalo de 0,5 a 0,9999…, es decir, redondea al alza las fracciones superiores a 0,5. c DCB ,17 > E c CB n @ c DCR ,17 > E c CR n @ 'HULYDFLyQGHODVVHxDOHVGH OXPLQDQFLD\GHGLIHUHQFLDGHFRORU DYc > ,17 DRc DG c DBc @ DWUDYpVGHODFXDQWLILFDFLyQGHODV ª§ º · VHxDOHVRVA c DCB ,17«¨¨ DRc Dc Dc ¸ n » ¬© G B ¸¹ ¼ ª§ · º c DCR ,17 «¨¨ DRc Dc Dc ¸ n » ¬© G B ¸¹ ¼ 72 / 122 La señal de vídeo digital La recomendación UIT-R BT.709 28 Rec. UIT-R BT.709-5 Representación digital 5 deRepresentación las señales digital Valores del sistema Punto Parámetro 60/P 30/P 30/PsF 60/I 50/P 25/P 25/PsF 50/I 24/P 24/PsF 5.1 Señal codificada R, G, B o Y, CB, CR 5.2 Retícula de muestreo Ortogonal, repetitiva en cada línea y cada imagen – R, G, B, Y 5.3 Señales de retícula de muestreo Ortogonales, repetitivas en cada línea y en cada imagen, coubicadas mutuamente y – CB, CR con muestras Y alternadas(1) 5.4 Número de muestras activas por línea – R, G, B, Y 1 920 – CB, CR 960 5.5 Formato de codificación Lineal, 8 ó 10 bits/componente 5.6 Niveles de cuantificación Codificación de 8 bits Codificación de 10 bits – Nivel de negro R, G, B, Y 16 64 – Acromático CB, CR 128 512 – Valor de cresta nominal – R, G, B, Y 235 940 – CB, CR 16 y 240 64 y 960 5.7 Asignación de nivel de Codificación de 8 bits Codificación de 10 bits cuantificación – Datos vídeo 1 a 254 4 a 1 019 – Referencia de temporización 0 y 255 0-3 y 1 020-1 023 5.8 Características de filtro(2) – R, G, B, Y Véase la Fig. 14A – CB, CR Véase la Fig. 14B 73 / 122 La señal de vídeo digital La recomendación UIT-R BT.709 Posibilidades de representación del color ▶ La norma especifica también el Iluminante a usar como blanco patrón (D65), y las coordenadas de RGB en el diagrama de cromaticidad CIE 1931 de los primarios de color: 74 / 122 La señal de vídeo digital La recomendación UIT-R BT.709 Posibilidades de representación del color ▶ Con esta especificación, las posibilidades de representación de colores son las siguientes (prácticamente iguales a las de la señal de SDTV PAL según el estándar SMPTE C): 75 / 122 La señal de vídeo digital La recomendación UIT-R BT.2020 La recomendación UIT-R BT.2020 La recomendación UIT-R BT.2020 – UHDTV ▶ Esta norma proporciona las especificaciones para la producción y el intercambio internacional de programas de televisión en ultra alta definición (UHDTV) ▶ Propone valores para señal de 4K (3840 × 2160) y 8K (7680 × 4320) ▶ Sólo maneja relación de aspecto R = 16/9, con píxeles cuadrados ▶ Sólo acepta manejar formato progresivo de barrido, con muestreo 4:4:4, 4:2:2 y 4:2:0, y usando 10 o 12 bits por muestra (lo que se conoce como High Bit Depth – HBD) ▶ Admite las siguientes frecuencias de refresco: 120, 60, 60/1,001, 50, 30, 30/1,001, 25, 24, 24/1,001. Frecuencias de 50 cuadros/seg o superiores se conocen como High Frame Rate – HFR ▶ La norma sugiere que los sistemas de UHDTV de 4K y 8K servirán, principalmente, para la entrega de programas de televisión en los hogares, donde ofrecerán a los espectadores una mayor sensación de presencia (o de inmersión en la escena) y de realidad gracias a pantallas de unos 1,5 metros (unas 60") de diagonal, o incluso mayores, y a pantallas muy grandes en teatros, salas, estadios o parques temáticos 76 / 122 (1) la información de la imagen puede indicarse linealmente con los valores tricromáticos RGB en la La señal de vídeo digital gama 0-1. La recomendación UIT-R (2) BT.2020 Los valores colorimétricos de la información de la imagen pueden determinarse a partir de los RGB primarios de referencia y el blanco de referencia. Formatos de señal para la recomendación UIT-R BT.2020 Se sigue definiendo una función de transferencia opto-electrónica CUADRO 4 (OETF) que hereda la pre-corrección gamma, y que para 10 bits/píxel es idéntica a BT.709: Formato de la señal Parámetro Valores R'G'B' 2 Formato de la señal Luminancia constante Luminancia no constante Y'CC'BCC'RC 3 Y'C'BC'R 4 4,5 E , 0 E E 0,45 E ( 1), E 1 Función de transferencia donde E es la tensión normalizada por el nivel blanco de referencia y no lineal proporcional a la intensidad luminosa implícita que se detectará con un canal de cámara color de referencia R, G, B; E' es la señal no lineal resultante. α = 1,099 y β = 0,018 para un sistema de 10 bits α = 1,0993 y β = 0,0181 para un sistema de 12 bits 77 / 122 La señal de vídeo digital La recomendación UIT-R BT.2020 Formatos de señal para la recomendación UIT-R BT.2020 Esta función de transferencia OETF: 4,5 · E , si 0 ≤ E < 0,018 ′ E (E ) = α · E 0,45 − (α − 1), si 0,018 ≤ E ≤ 1 tiene el siguiente aspecto para 10 bits/píxel (donde α = 1,099): A pesar de que las pantallas planas tienen ya respuestas lineales (no exponenciales como los CRTs), se sigue realizando una expansión de los bajos niveles de luminosidad para facilitar la visualización de sombras y zonas oscuras en la imagen NOTA: la parte lineal inicial minimiza la amplificación del ruido en zonas muy oscuras 78 / 122 La señal de vídeo digital La recomendación UIT-R BT.2020 ′ C′ Representación YC′ CBC ′ ′ ′ RC vs Y CB CR ▶ Según la recomendación UIY-R BT.2246, si se calcula el valor de Y ′ tras la corrección gamma de las señales RGB se genera el problema denominado como Luminancia Constante. ▶ Se debe a que el valor de Y ′ es diferente cuando se calcula con valores corregidos en gamma previamente R ′ G ′ B ′ que cuando se calcula con valores originales RGB, y posteriormente se aplica la corrección gamma ▶ En el primer caso, cuando se calcula con valores precorregidos en gamma R ′ G ′ B ′ se denomina Luma, y la norma UIT-R BT.2020 lo representa como YC′ ▶ En el segundo caso, cuando se calcula con valores RGB originales se denomina Luminancia, y la norma UIT-R BT.2020 lo representa como Y ′ 79 / 122 La señal de vídeo digital La recomendación UIT-R BT.2020 ′ C′ Representación YC′ CBC ′ ′ ′ RC vs Y CB CR ▶ Parece ser que la Luminancia se aproxima más a la sensibilidad humana al brillo percibido que la Luma ▶ El ratio entre la Luma y la Luminancia se denomina Índice de luminancia constante γ Y′ rR 1/γ + gG 1/γ + bB 1/γ k = C′ = Y (rR + gG + bG) ▶ k alcanza el 100 % con señales acromáticas, decreciendo a medida que el color se satura ▶ El problema surge cuando la luminancia reproducida se ve afectada por la reducción en ancho de banda (muestreo 4.2:2 Y 4:2:0) de las señales CB′ y CR′. Este problema se manifiesta como un descenso del nivel de luminancia en zonas muy saturadas o con componentes de alta frecuencia (bordes en la imagen) ▶ El problema anterior provoca pérdida de detalle en la luminancia y/o disminución de la luminosidad media en la zona (oscurecimiento) comparado con lo que el observador vería en la escena real 80 / 122 La señal de vídeo digital La recomendación UIT-R BT.2020 Colorimetría propuesta por la recomendación UIT-R BT.2020 Rec. UIT-R BT.2020 3 La norma especifica también el Iluminante a usar como blanco patrón (D65), y las coordenadas de RGB en el diagrama de cromaticidad CIE 1931 de losCUADRO 3 de color: primarios Colorimetría del sistema Parámetro Valores Características de transferencia optoelectrónica antes de la Supuesto lineal(1) precorrección no lineal Coordenadas de cromaticidad x y (CIE, 1931) Colores primarios y blanco de Rojo primario (R) 0,708 0,292 referencia(2) Verde primario (G) 0,170 0,797 Azul primario (B) 0,131 0,046 Blanco de referencia (D65) 0,3127 0,3290 (1) la información de la imagen puede indicarse linealmente con los valores tricromáticos RGB en la gama 0-1. (2) Los valores colorimétricos de la información de la imagen pueden determinarse a partir de los RGB primarios de referencia y el blanco de referencia. 81 / 122 La señal de vídeo digital La recomendación UIT-R BT.2020 Comparativa en colorimetría Comparativa en respuesta colorimétrica entre los sistemas UIT-R BT.709 y UIT-R BT.2020, y diferencia entre los índices de luminancia constante: Los primarios UIT-R BT.709 cubren en torno al 35,9 % del diagrama de color, en tanto que los primarios UIT-R BT.2020 alcanzan el 75,8 %, lo que supone un incremento del 111,1 %. Por ello, cuando se usa colorimetría UIT-R BT.2020 se habla de Gama de Color Ampliado (o Wider Colour Gamut - WCG) 82 / 122 La señal de vídeo digital La recomendación UIT-R BT.2020 4 Rec. UIT-R BT.2020 ′ C′ Obtención de los parámetros YC′ CBC ′ ′ ′ RC e Y CB CR CUADRO 4