Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2019-20   2021-22



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2020-21

Reconocimiento de lugares de interés mundial a través de imágenes.


Tecnologías Específicas

Computación
 


Descripcion y Objetivos

El trabajo fin de grado se centrara en el problema de clasificación de imágenes. Hoy en día el uso de modelos de redes profundas, redes neuronales con capas especificas para tratar y filtrar imágenes han obtenido un éxito sin precedentes en el etiquetado y clasificación automática de imágenes.

En nuestro caso se va a enfocar en la propuesta de resolución de un reto abierto de Kaggle, en la competición “Google Landmark Recognition 2020”. Se trata de un problema extremadamente complejo por su número de imágenes, el tipo de imágenes tratada y del objetivo a reconocer en las mismas, lo que lo hace un verdadero reto, no en vano ofrecen un premio de 25.000 dólares para el ganador del reto.

Nuestro objetivo principal no es obviamente ganar el reto, sino utilizar el problema para ampliar el estudio de los modelos de redes convolucionales para su uso en este problema, así como sus rendimientos.

El reto ofrece una base de datos de imágenes mundiales y el objetivo es reconocer “Landmark” famosos y no tan famosos en el mundo, para así poder ofrecer servicios asociados, como por ejemplo al turismo, para poder ayudar a los usuarios a reconocer y organizar sus propias colecciones de fotografías.

El problema se puede tratar como un problema de clasificación, lo que lo hace un reto es que aunque haya un gran número de imágenes en total, alrededor de 100G, el número de etiquetas  es muy elevado (81K) y por tanto, el número de imágenes por etiqueta es bajo, lo que hace difícil que los modelos profundos puedan entrenarse de manera adecuada.

 

 


Metodología y Competencias

METODOLOGÍA:

  1. Revisar el contexto del problema y la literatura disponible.
  2. Realizar un análisis exploratorio de los datos existentes.
  3. Diseñar/implementar modelos basados en propuestas existentes de etiquetado de imágenes.
  4. Documentar todo el proceso anterior para que sea repetible.
  5. Estimar la bondad de los modelos finales (seleccionados) sobre el conjunto de datos de test reservado a tal efecto.

COMPETENCIAS:

Se trabajarán principalmente (en distinto grado) las siguientes competencias específicas de la tecnología de computación:

  • Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
  • Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
  • Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes entornos inteligentes.
  • Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar, implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
 


Medios a utilizar

Todos los medios que se utilizan para la realización de este trabajo fin de grado están disponibles en la ESII y estarán a disposición de alumno que realice este trabajo.

Ordenadores, compiladores, APIs específicas para el desarrollo de las propuestas, etc.

 


Bibliografía

Libros y manuales de aprendizaje automático, procesamiento del lenguaje natural y ciencia/minería de datos.

Libros y manuales de lenguajes de programación y librerías específicas (machine learning, deep learning, visión artificial, etc.).

Todo disponible en la ESIIAB y/o en internet.

https://www.kaggle.com/c/landmark-recognition-2020/data

 


Tutores


PUERTA CALLEJON, JOSE MIGUEL
GAMEZ MARTIN, JOSE ANTONIO
 

Alumno


SVETLOZAROV DYULGEROV, NIKOLA

 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2020-21
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete

informatica.ab@uclm.es
aviso legal
generar código QR de la página