Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2019-20   2021-22



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2020-21

Caracterización del tráfico de comunicaciones de aplicaciones HPC y de Centros de Datos para su uso en herramientas de simulación


Tecnologías Específicas

Ingeniería de Computadores
 


Descripcion y Objetivos

Los centros de datos y de supercomputación están en un momento de gran auge, debido a múltiples razones: el incremento del número y tipología de los servicios ofrecidos por Internet, las necesidades de cómputo de nuevas aplicaciones de procesamiento de datos, el constante aumento del número de usuarios en la Red, etc. En estas instalaciones, la infraestructura de computación está compuesta esencialmente de sistemas con un elevado número de elementos de proceso y almacenamiento de datos. Todos ellos están unidos mediante una o varias redes de interconexión. Dichas redes constituyen una componente clave puesto que deben soportar, de la forma más eficiente posible, toda la transferencia de información que se produzca entre todos los elementos de cómputo y almacenamiento, evitando convertirse en un cuello de botella de todo el sistema, y ser la causante de la degradación de prestaciones del sistema en su conjunto.

Es por ello fundamental diseñar redes de interconexión eficientes para estos sistemas, para lo cual es norma general, dadas sus características, realizar los estudios de comportamiento previos a la fabricación mediante simulación. Los simuladores de redes de interconexión, además de modelar los componentes principales de una red de interconexión (nodos de proceso, conmutadores, tarjetas de red, etc.) necesitan manejar una carga de tráfico que represente a las comunicaciones reales que deberá soportar. Hay diversas formas de obtener ese tráfico por la red, siendo la más cercana a la realidad el uso de la comunicación que se genera en un sistema real cuando se ejecutan aplicaciones.

Este TFG se centra en ese tipo de tráfico de red, para lo cual se va a manejar un conjunto representativo de las aplicaciones que actualmente se usan en centros de datos y de supercomputación. El objetivo es caracterizar las comunicaciones que dichas aplicaciones generan cuando están en ejecución en un sistema real. El resultado debe permitir usar, en un simulador de redes de interconexión ya existente, tráfico de comunicaciones que sea similar al que se puede encontrar en una red de un sistema real. Al lograr este objetivo se consigue otro muy importante que es poder estudiar el comportamiento de los diseños de la red de interconexión en entornos realistas.

 

 


Metodología y Competencias

Para alcanzar los objetivos del TFG, se seguirá la metodología habitual en este tipo de trabajos, a partir de la cual surgen las siguientes actividades (se indica el tiempo estimado de realización en meses, asumiendo una dedicación de 8 meses, 37,5 horas/mes y 300 horas de dedicación total al TFG):


1) Lectura de documentación sobre redes de interconexión, aplicaciones y patrones de tráfico. Se reforzarán los conocimientos que el alumno ya tiene sobre estos aspectos consultando diversos documentos proporcionados por los tutores (0,5 meses).

2) Selección y revisión de un conjunto de aplicaciones usadas en entornos de centros de datos y supercomputación. A partir de la documentación revisada, se elegirá un conjunto reducido de aplicaciones, se descargarán de los correspondientes sitios web, y se realizará un estudio de las mismas, el cual será básico en cuanto a sus objetivos, pero más exhaustivo en lo que respecta a la forma de usarlas (1 mes).

3) Preparación y puesta en marcha de las aplicaciones para recoger el tráfico que generan. En primer lugar, se realizarán las actuaciones necesarias para que las aplicaciones puedan ser ejecutadas en el clúster disponible. Y a continuación se introducirán las modificaciones necesarias en las aplicaciones para poder recoger todas las comunicaciones que se generan a nivel de proceso durante la ejecución de las mismas (1 mes).

4) Obtención del tráfico para diversas configuraciones. Las aplicaciones serán ejecutadas en el clúster considerando varias configuraciones posibles, tanto relativas a los parámetros que definen a la propia aplicación (número de procesos, tamaño del problema, etc.) como a los que caracterizan al clúster (número de nodos, topología, etc.) (1 mes).

5) Caracterización del tráfico generado por las aplicaciones. El tráfico obtenido será analizado detalladamente realizando diversos estudios que permitan su caracterización. Así, se obtendrán datos sobre localidad espacial y temporal de las comunicaciones, patrones existentes entre procesos, nivel de carga a lo largo del tiempo, etc. A partir de esos datos, si fuera factible, se podría valorar la posibilidad de modelar el tráfico (2 meses).

6) Pruebas de funcionamiento en un simulador de redes de interconexión. El conjunto de cargas obtenidas será usado en un simulador de red para comprobar su correcto funcionamiento, y para realizar un estudio simple de rendimiento para algunas configuraciones de red (1,5 meses).

7) Al margen de las anteriores, otra tarea será la elaboración de la memoria del TFG incluyendo todos los aspectos relevantes del trabajo realizado. Se irá elaborando durante el desarrollo del trabajo (1 mes desde la finalización de todo el trabajo).

Las competencias específicas de la Tecnología Ingeniería de Computadores que se trabajarán en este TFG, y que por tanto serán reforzadas son las siguientes:

- Capacidad de analizar y evaluar arquitecturas de computadores, incluyendo plataformas paralelas y distribuidas, así como desarrollar y optimizar software para las mismas.

- Capacidad para analizar, evaluar, seleccionar y configurar plataformas hardware para el desarrollo y ejecución de aplicaciones y servicios informáticos.

 

Además, se trabajarán otras competencias, como:

- Capacidad de análisis, síntesis y evaluación.

- Aprendizaje autónomo.

 


Medios a utilizar

Los medios a utilizar para el desarrollo del TFG son los siguientes:

- Clúster CELLIA del RAAP: este clúster está formado por 50 nodos de cómputo, procesadores Intel Xeon E5, 32 GB de RAM, GPUs y una red de interconexión Ethernet.

- Librería TraceLIB (http://www.i3a.info/VEFtraces/).

- Simuladores de redes de interconexión, disponibles para el grupo RAAP.

- Ordenador tipo PC.

 

 


Bibliografía

La bibliografía básica para el desarrollo del TFG es la siguiente:


- Manuales de desarrollador de la librería TraceLIB.

- Manuales de C++

- Diversos libros y artículos sobre redes de interconexión en general.

- Documentación de las aplicaciones a analizar.


Toda la bibliografía está disponible.

 


Tutores


QUILES FLOR, FRANCISCO JOSE
SÁNCHEZ GARCÍA, JOSÉ LUIS
 

Alumno


RUBIO AGUILERA, JAVIER

 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2020-21
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete
Tfno: 967 59 92 00 - Fax: 967 59 92 24

informatica.ab@uclm.es
aviso legal
generar código QR de la página