Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2016-17   2018-19



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2017-18

Diseño de un sistema de reconocimiento y comprensión del habla para la interacción humano-robot


Tecnologías Específicas

Computación
Tecnologías de la Información
 


Descripcion y Objetivos

El objetivo de este TFG es el estudio de distintos reconocedores automáticos del habla disponibles y sistemas de comprensión, así como su instalación, puesta en marcha, y prueba en un robot social.

Para ello se utilizarán las librerías y APIs proporcionadas por dichos sistemas y tendrán que adaptarse para su uso dentro de una arquitectura cognitiva para la robótica social ya existente. Principalmente se estudiarán y utilizarán sistemas basados en Deep Learning que son lo que establecen el estado del arte actual.

Como resultado del proyecto se desarrollará un componente  capaz de reconocer el habla de distintos usuarios y poder evaluar la calidad de la señal capturada y la transcripción realizada, así como su comprensión para el desarrollo de futuros sistemas de diálogo entre humanos y robots.

 


Metodología y Competencias

Metología:

Para la realización de este trabajo se sugiere una metodología de desarrollo agil como por ejemplo SCRUM. Se estudiará utilizar otra metodología distinta en función del alumno que realize este trabajo, sus preferencias, así como la intensificación que esté cursando.

Plan de trabajo:

Para la realización de este trabajo se deben llevar a cabo las siguientes tareas:

  • Estudio del estado del arte y de las distintas técnicas para abordar el problema
  • Estudio de la tecnología hardware y software que permita implementar el componente
  • Diseño software del componente
  • Validación y pruebas

Competencias:

  • [CM4] Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
  • [CM5] Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes entornos inteligentes.
  • [CM6] Capacidad para desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona computadora.
  • [IS3] Capacidad de dar solución a problemas de integración en función de las estrategias, estándares y tecnologías disponibles.
  • [IS4] Capacidad de identificar y analizar problemas y diseñar, desarrollar, implementar, verificar y documentar soluciones software sobre la base de un conocimiento adecuado de las teorías, modelos y técnicas actuales.
 


Medios a utilizar

  • Plataformas robóticas y de adquisición de datos disponibles en el laboratorio SIMD del I3A
  • Sistemas de reconocimiento y de comprensión del habla ya implementados.
 


Bibliografía

Reconocedores del habla:

  • Sofware Kaldi: http://kaldi.sourceforge.net/about.html
  • Software LTK: https://www.translectures.eu/web/tlk/
  • Software Julius: http://julius.osdn.jp/en_index.php
  • Software DeepSpeech: https://github.com/mozilla/DeepSpeech

Sistemas de comprensión semántica:

  • Senna: http://ml.nec-labs.com/senna/
  • OpenCCG: http://openccg.sourceforge.net/
 


Tutores


GARCÍA VAREA, ISMAEL
ROMERO GONZALEZ, CRISTINA
 

Alumno


GÓMEZ CLEMENTE, VÍCTOR

 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2017-18
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete
Tfno: 967 59 92 00 - Fax: 967 59 92 24

informatica.ab@uclm.es
aviso legal
generar código QR de la página