Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2020-21   2022-23



Máster Universitario en Ingeniería Informática


TRABAJOS FIN DE MÁSTER
curso: 2021-22

Transcodificador de Vídeo HEVC/VVC usando Machine Learning


Descripcion y Objetivos

HEVC ha sido desarrollado por el JCT-VC para reemplazar a su predecesor, el estándar H.264/AVC. El objetivo principal de HEVC es mejorar significativamente los prestaciones de Rate-Distortion (RD) comparado con H.264/AVC para hacer posible nuevas aplicaciones, como las resoluciones mayores que las de Alta Defición (HD) (como 4K, 3840x2160 píxeles, y 8K, 7680x4320 píxeles). Este seguramente sea el evento más significativo de la compresión de vídeo digital en una década. Con el esfuerzo colaborativo de muchos expertos, HEVC puede proveer aproximadamente el doble de compresión que los estándares hasta ahora usados manteniendo la misma calidad, a costa sin embargo de costes computacionales extremadamente superiores.

Por otro lado, diversos estudios han confirmado que la distribución de video se ha convertido en el principal tráfico de datos a nivel mundial, llegando al 80% del tráfico total de internet en 2020, en especial sobre redes celulares e inalámbricas, y su volumen continuará creciendo hasta el 85% en 2022, motivado fundamentalmente por el auge en el número de servicios y de usuarios, pero también por el incremento de la resolución espacial y temporal que han experimentado los formatos de video por encima de la alta definición. En 2022 se espera que el número de dispositivos conectados a la red capaces de consumir contenidos audiovisuales triplicará la población mundial (una media de 3.5 dispositivos per capita).

Es por ello que, en Julio de 2020, los organismos internacionales encargados de regular la estandarización de los códecs de video ITU-T VCEG (Video Coding Expert Group) e ISO/IEC MPEG (Moving Picture Expert Group), crearon el Joint Video Exploration Team (JVET) para definir conjuntamente un nuevo estándar de compresión llamado Versatile Video Coding (VVC), que mejora sustancialmente las prestaciones actuales de HEVC (en torno a un 50%). El ámbito de aplicación de esta nueva especificación pretende incluir una amplia variedad de fuentes y aplicaciones de vídeo, entre las que se encuentran, además de las ya abarcadas por HEVC, los contenidos de vídeo en 360º, realidad virtual, contenidos en HDR (High Dynamic Range), etc. 

La idea de este TFM es el diseño e implementación de un trancodificador de vídeo HEVC/VVC para convertir contenidos audiovisuales desde el formato HEVC hacia el formato VVC de una manera eficiente usando para ellos técnicas de Machine Learning.

 


Metodología y Competencias

Para la realización de este TFM se ha seguido la siguiente metodología:

- Fase 1: Estudio del funcionamiento y las características de los estándares a tratar. Esta fase consiste en la lectura de trabajos e investigaciones que explican y detallan los estándares VVC y HEVC, así como sus diferencias y comparativas con otros estándares.

- Fase 2: Estudio del código. Se procederá a estudiar el código de los codificadores de HEVC y VVC y localizar las etapas mas importantes en las que se puede implementar el trasncodificador.

- Fase 3: Diseño e implementación del algoritmo propuesto basado en técnicas de Machine Learning.

- Fase 4: Ejecución de las pruebas y escritura de la memoria. Ejecutar todas las pruebas necesarias para obtener las prestaciones. Debido a que estas pruebas necesitaban bastante tiempo para ejecutarse, se comenzará paralelamente la escritura de la memoria.

- Fase 5: Recogida de datos y finalización de la memoria. Una vez finalizadas todas las pruebas, se recogerán  datos y se procesarán para su inclusión de éstas en la memoria. Con los datos preparados, se realizará un análisis de los mismos para obtener las conclusiones para finalizar la memoria.

Este TFM permite completar las siguientes competencias:

[CE4]    Capacidad para modelar, diseñar, definir la arquitectura, implantar, gestionar, operar, administrar y mantener aplicaciones, redes, sistemas, servicios y contenidos informáticos.

[CE10]    Capacidad para comprender y poder aplicar conocimientos avanzados de computación de altas prestaciones y métodos numéricos o computacionales a problemas de ingeniería.

[CE15]    Capacidad para la creación y explotación de entornos virtuales, y para la creación, gestión y distribución de contenidos multimedia.

[CE16]  Realización, presentación y defensa, una vez obtenidos todos los créditos del plan de estudios, de un ejercicio original realizado individualmente ante un tribunal universitario, consistente en un proyecto integral de Ingeniería en Informática de naturaleza profesional en el que se sinteticen las competencias adquiridas en las enseñanzas.

 


Medios a utilizar

Todo el equipamiento está disponible en el grupo de investigación RAAP del I3A. En concreto se usará un PC de trabajo con el código de los codificadores y el software Weka y PCs de especificaciones superiores para la codificación de vídeo HEVC y VVC.

 

 


Bibliografía

[1] ITU-T Recommendation H.265 and ISO/IEC 23008-2 (Version 2). High Efficiency Video Coding, Oct 2014.

[2]  ITU-T and ISO/IEC JTC 1, Versatile Video Coding, Rec. ITU-T H.266 and ISO/IEC 23090-3 (VVC), July 2020.

[3]  G. J. Sullivan, J.-R. Ohm, W.-J. Han, and T. Wiegand. Overview of the High Efficiency Video Coding (HEVC) Standard, EEE Transactions on Circuits and Systems for Video Technology Piscataway, NJ, USA, volume 22. Dec. 2012.

[4]  B. Bross et al., "Overview of the Versatile Video Coding (VVC) Standard and its Applications". IEEE Transactions on Circuits and Systems for Video Technology, doi: 10.1109/TCSVT.2021.3101953. 2021.

[6]  VTM software repository, vesion VTM-7.0. Available online: https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM.2021.

 


Tutores


CUENCA CASTILLO, PEDRO ÁNGEL
GARCIA LUCAS, DAVID
 

Alumno




 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2021-22
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete
Tfno: 967 59 92 00 - Fax: 967 59 92 24

informatica.ab@uclm.es
aviso legal
generar código QR de la página