Ejecuci´ on de trabajos MPI sobre Condor y SGE

4. Arquitectura base del entorno de trabajo TDP-Shell 56

4.7. Archivos TDP-Shell script

5.1.1. Ejecuci´ on de trabajos MPI sobre Condor y SGE

Condor y SGE ofrecen unos entornos especiales para trabajos distribuidos. Por su parte, Condor ofrece eluniverso paralelo [46] y SGE elentorno paralelo o pe [47]. Dentro de estos entornos distribuidos se pueden configurar de diversos tipos, entre ellos el mpi (MPICH, LAM para Condor y SGE as´ı como OpenMPI para SGE). Para que los entornos de trabajos paralelos de Condor y SGE puedan ejecutar correctamente los trabajos MPI, es necesario que primero puedan poner en marcha el entorno de ejecuci´on que utilizan

5.1. aplicaciones MPI sobre gestores de colas y herramientas de monitorización 139 las diferentes implementaciones de la librera MPI que soportan. Por ejemplo, antes de ejecutar la aplicación MPI, LAM necesita que estén en ejecución sus demonios lamd y en el caso de MPICH1, los demonios sshd que necesita la herramienta de conexión remota ssh. Por lo tanto, para la correcta puesta en marcha de estos entorno de ejecución de MPI, los dos gestores de colas necesitan obtener cierta información de ellos (variables de entorno, fichero de máquinas, situación de los servidores sshd, lamd u orted, etc).

Para ello tanto Condor como SGE ofrecen unos scripts especiales configurables, para que sus administradores (o usuarios) puedan introducir esta información. Condor ofrece un script para MPICH1 (mp1script) y otro para LAM lamscript. Por su parte, SGE ofrece, para cada tipo de su entorno paralelo, dos clases de scripts especiales, unos para su inicialización (acciones a realizar antes de la ejecución del script del trabajo distribuido), los cuales suelen denominarse con el prefijo start y otros para su finalización (acciones a realizar después de la ejecución del script del trabajo distribuido), los cuales suelen denominarse con el prefijo stop. Dentro del entorno distribuido MPI de SGE se ofrecen los scripts de inicio y finalización para MPICH, LAM y OpenMPI.

Estos scripts especiales que utilizan Condor y SGE, afectan a la manera en que se declaran sus ficheros de descripci´on de trabajos para aplicaciones distribuidas MPI.

Debido a este motivo, es necesario el estudio de las modificaciones que sufren estos ficheros para que el componentetdp consolelos pueda procesar correctamente y obtener el fichero de descripción de trabajos global. En el caso de Condor, los ficheros de descripción de trabajos para aplicaciones distribuidas MPI se declaran a través de los siguientes comandos:

universe = parallel : Se indica a Condor que el trabajos es del tipo distribuido.

executable = [ mp1script | lamscript] : Como ejecutable se declara el script especifico de la implementaci´on de la librer´ıa MPI : mp1script para MPICH y lamscript para LAM. Este script se encarga del lanzamiento de la aplicaci´on MPI definida en el trabajo (utiliza el comando mprun).

arguments =<Ejecutable de la aplicaci´on MPI>[args]*: Como argumentos al script especifico se le pasan el ejecutable de los procesos de aplicaci´on MPI y sus posibles argumentos.

machine count = n : Este comando indica el n´umero de procesos (n) que

140 5. Arquitectura de TDP-Shell para entornos distribuidos MPI generar´a la aplicaci´on MPI (valor del argumento -np de mpirun).

Para el caso del gestor de colas SGE, la utilización de shell-scrips como ficheros de descripción de trabajos MPI, permite la existencia de una gran variedad de posibilidades a la hora de declarar estos trabajos. Pero existe una forma básica (punto de partida de muchos scripts) de realizar esta declaración, la cual se muestra en los siguientes puntos:

1. Declaraci´on de las directiva especial de SGE para entornos distribuidos MPI, la cual es:

-pe mpi n1-n2 : Directiva de SGE a través del cual se le informa de que el trabajo utiliza el entorno paralelo (pe) y que es del tipo MPI, además también indica que estará formado por entre n1 y n2 procesos(n1 y n1 pertenecen a los números Naturales). Al interpretar esta directiva, SGE ejecuta sus scripts especiales del entorno paralelo MPI. El de inicialización antes de ejecutar el cuerpo principal de shell-script de descripción del trabajo MPI y el de finalización al terminar la ejecución de este shell-script.

2. Declaraciones e informaci´on ´util situada en el cuerpo principal del script:

Fichero $TMPDIR/machines: Fichero, devuelto por el script especial de inicialización del para el entorno MPI de SGE, el cual informa de las máquinas escogidas para la ejecución de los procesos de la aplicación MPI definida en el trabajo. Este número de máquinas dependerá de los números n1 y n2 pasados en el comando de SGE -pe. Tanto el nombre del directorio temporal $TMPDIR, como en nombre del fichero, denominado por defecto machines, son configurables a través del el script especial de inicialización del para entornos MPI de SGE.

El Comando mpirun (o mpiexec) es utilizado para poner en marcha la ejecución de la aplicación MPI (como si se tratará de un cluster no controlado por un gestor de colas). En caso necesario, se puede utilizar el fichero

$TMPDIR/machines para informar de las máquinas donde se va a ejecutar los procesos de la aplicación MPI. Por ejemplo, para la versión MPICH1 se utiliza el argumento especial de mpirun -machinefile $TMPDIR/machines, para informarle de la dirección y nombre del fichero que contiene la descripción de estas de máquinas.

5.1. aplicaciones MPI sobre gestores de colas y herramientas de monitorización 141 Una vez estudiado como definir aplicaciones distribuidas MPI a través de los archivos de descripción de trabajos de Condor y SGE, el ultimo punto de estudio es como estos gestores de colas, ponen en ejecución los procesos de las aplicaciones MPI definidas en sus respectivos trabajos. Este estudio es importante porque definirá la manera en que Condor y SGE van a ejecutar los componentes tdp agent cuando gestionan este tipo de aplicaciones distribuidas bajo el entornoTDP-Shell. Como se verá a continuación, el procedimiento que siguen ambos gestores de colas son muy similar y se ha resumido en los siguientes pasos:

1. Localizar las m´aquinas que tengan los suficientes recursos para ejecutar los procesos de la aplicaci´on MPI definida en el trabajo del usuario (figura 5.1, punto segundo ).

Una vez localizadas, los scripts especiales del entorno distribuidos MPI de Condor y SGE informan a los entornos de ejecución de la distribución de MPI que utilizan (MPICH, LAM u OpenMPI) de estas máquinas seleccionadas, normalmente a través de un fichero, denominado de máquinas, con el formato que se ha explicado al principio de este apartado. En Condor el encargado de localizar las máquinas con suficientes recursos es un planificador especial ,denominado dedicado [48], instalado en una máquina del conjunto que controla dicho gestor. En SGE, el proceso de selección de las máquinas se realiza dentro del script de inicialización del entorno distribuido mpi, el cual procesa el fichero especial de SGE, denominado sge hostfile, que contiene la lista de todas las máquinas de su cluster que pueden ejecutar procesos de las aplicaciones MPI. Este fichero, creado normalmente por el administrador del sistema, se le puede pasar como argumento a los scripts de inicialización o estar definido en una variable de entorno especial de SGE (la forma de hacerlo la definirá el script de inicialización).

2. Ejecutar en las máquinas seleccionadas en el punto anterior, los demonios (o componentes remotos) de las herramientas de conexión remota (sshd para el caso de ssh y MPICH1) o los demonios (lamd para LAM y orted para OpenMPI) propios de la implementación de MPI utilizada (figura 5.2, punto 1). En el caso de LAM, para ejecutar sus demonios remotos, los scripts especiales del entorno distribuido MPI de los gestores de colas utilizan el programa lamboot, pasándole como argumento el fichero de máquinas generado en el paso 1. Hay que destacar que Condor, después de la selección de las máquinas del paso 1, ejecuta en una máquina el proceso cuyo

142 5. Arquitectura de TDP-Shell para entornos distribuidos MPI

Figura 5.1: Selecci´on de las m´aquinas con los suficientes recursos

código ejecutable se ha declarado en el comando execute del fichero de descripción de trabajos enviado por el usuario. En este caso, el código de este proceso será el script especial del entorno paralelo (mp1script o lamscript), consiguiendo de esta manera que su ejecución realice las acciones explicadas en este paso para el entorno de ejecución de la librer´ıa MPI escogida.

3. Una vez están activos estos demonios ya se puede ejecutar la aplicación MPI del trabajo definido por el usuario. La manera de proceder respecto a esta ejecución es diferente en cada gestor de colas. Condor utiliza su script especial del el entorno MPI para ejecutarla. Este script llama al programa mpirun, cuyo argumento del código ejecutable de los procesos de la aplicación MPI es obtenido gracias a que también se le pasa como argumento de este script especial de Condor (como se ha explicado en la declaración de los archivos de descripción de trabajos MPI de este punto 5.1.1). SGE por su lado, utiliza su metodolog´ıa de ejecución standard, ejecutando en una máquina de las seleccionadas, el script que define el trabajo paralelo MPI que usuario le ha enviado y el cual contiene, entre otros comandos, el programa mpirun y el ejecutable de dicha aplicación MPI (figura 5.2, punto 2 ).

5.1. aplicaciones MPI sobre gestores de colas y herramientas de monitorizaci´on 143

Figura 5.2: Ejecuci´on de los procesos MPI bajo el control del gestor de colas

Una vez entre en ejecución el programa mpirun, este se encargará de la correcta puesta en marcha de los procesos de la aplicación MPI, como si hubiera sido ejecutado directamente por el usuario y no a través del gestor de colas . En la figura 5.2, se pueden observar las diferencias que existen entre LAM, OpenMPI con MPICH respecto a la metodolog´ıa seguida en ejecución los diferentes procesos MPI, sobre todo con el proceso padre. En la implementación de MPICH este proceso es ejecutado por mpirun para que posteriormente se encargue de la ejecución de los procesos hijos (figura 5.2, punto 3a y 3 ), por el contrario en el caso de LAM y OpemMPI son sus respectivos demonios lamd y orted, los encargados de la ejecución de todos los procesos MPI (figura 5.2, puntos 3b y 3 ).

5.1.2. Monitorizaci´ on de aplicaciones MPI sobre Paradyn, Gdb

Dans le document TDP-Shell: Entorno para acoplar gestores de colas y herramientas (Page 150-155)