SlideShare una empresa de Scribd logo
El Algoritmo de Floyd

      Capítulo 6
Grafos con Pesos
• Un grafo dirigido en la cual hay asociado
  con cada arista un número positivo (el
  “peso”) se llama un grafo dirigido con
  pesos.
• El largo de una trayectoria de un vértice u
  a otro vértice v es la suma de los pesos
  de las aristas que componen la
  trayectoria.
El Problema de Todos Pares
       Distancias mas Cortas
• Dado un grafo dirigido con pesos, ¿cuales
  son las trayectorias de largos mínimos (es
  decir “distancias mas cortas”) entre todos
  los pares de vértices?
La Matríz de Adyacencias

• Representar un grafo dirigido con pesos G con n
  vértices por una matríz MG como sigue:
• Si 1,2, … ,n son los vértices, entonces
  el elemento en la fila #i y la columna #j es
  0 si i=j, es ∞ (un número mas grande que
  cualquier peso) si no hay arista de I a j, y es
   el peso de la arista de i a j si tal arista existe.
  Lamemos MG la matríz de adyacencias.
Ejemplo
                    4                 A   B   C   D   E
        A
                                  A   0   6   3   ∞   ∞
                        B
3           6                     B   4   0   ∞   1   ∞
                        1   3     C   ∞   ∞   0   5   1
        C 5
1                                 D   ∞   3   ∞   0   ∞
                        D
                                  E   ∞   ∞   ∞   2   0
    E           2

                                  Matríz de Adyacencias
El Algoritmo de Floyd
for k ← 0 to n-1
  for i ← 0 to n-1
      for j ← 0 to n-1
      a[i,j] ← min (a[i,j], a[i,k] + a[k,j])
      endfor
  endfor
endfor
La Solución al Ejemplo Anterior
                     4                A   B   C    D    E
         A
                                 A    0   6   3    6    8
                         B
 3           6                   B    4   0   7    1    8
                         1   3   C 10     6   0    3    1
         C 5
 1                               D    7   3   10   0   11
                         D
                                  E   9   5   12   2    0
     E           2

                                 Matríz de Distancias
La Idea del Algoritmo
                           La trayectoria mas corta de i a k
                                que pasa por 0, 1, …, k-1
                    i

                                               k
                           Computed
                           in previous
La trayectoria mas corta   iterations
de i a j que pasa por
    0, 1, …, k-1                         La trayectoria mas corta
                                         de k a j que pasa por
                                j            0, 1, …, k-1
El Diseño del Algoritmo Paralelo
• Particionar
• Patronos de Comunicaciones
• Aglomeración y Asignación
Particionar
• En el seudo código la misma asignación
  se ejecuta n3 veces.
• No hay paralelismo funcional.
• Usemos descomposición de dominio:
  particionar la matriz A en sus n2
  elementos.
Comunicaciones
• Para todo valor de k, a[k,m] se necesita
  por toda tarea asociada con elementos en
  la columna m y a[m,k] se necesita por
  toda tarea asociada con elements de la
  fila m.
• Durante de la iteración k, todo element en
  la fila k se emit a las tareas de la misma
  columna y todo elemento de la columna a
  se emite a la tarea en la misma fila
Comunicaciones

                                   Poner al dia
Primitive tasks                    a[3,4]
                                   Cuando k=1


Iteración k:
                                   Iteración k:
Toda tarea
                                   Toda tarea
en la fila k
                                   en la columna
emite su valor
                                    k emite su valor
a los procesos
                                   a los procesos
en la misma
                                   en la misma
columna
                                   fila
Aglomeración y Asignación
• El número de taréas es estático
• Las comunicaciones entre las tareas son
  regulares
• El tiempo de computación por tarea es
  constante
• Un buena estrategia en este caso es
  – Aglomerar tareas pare minimizar las
    comunicaciones
  – Crear una tarea por proceso MPI
Dos Descomposiciones

Rowwise block striped   Columnwise block striped
Comparación de
          Descomposiciones
• Columnwise block striped
  – Se eliminan las emisiones dentro de las
    columnas
• Rowwise block striped
  – Se eliminan las emisiones dentro de las
    columnas
  – Escribir la salida es mas simple
• Escoja rowwise
La Entrada de la Matríz de
             Adyacencias
• La matríz se guarda en el orden “row major” en
  un archivo”.
• Si hay p procesos, entonces para cada i=0,1,
  …,p-2, el proceso p-1 lee la fila in/p hasta la
  fila (i+1)n/p -1 y las envia al proceso i.
  Después, lee las últimas filas para le mismo.
• La razón por la cual p-1 hace este trabajo es
  que no hay ningun proceso que va a ser
  responsible por mas filas que el p-1 (Ejercicio
  6.1)
Comunicación Punto-Punto
• Envolve dos procesos
• Un proceso envia un mensaje
• El otro proceso receive el mensaje
Enviar
int MPI_Send (
     void     *mensage,
     int     cantidad,
     MPI_Datatype tipo,
     int     dest,
     int     etiqueta,
     MPI_Comm      comunicador
    )
Recibir
int MPI_Recv (
    void      *mensage,
    int      cantidad,
    MPI_Datatype tipo,
    int      fuente,
    int      etiqueta,
    MPI_Comm       comunicador,
    MPI_Status *estatus//un apuntador a un //record
   de tipo MPI_Status
)
• “fuente” puede ser MPI_ANY_SOURCE
El Argumento estatus de MPI_Recv
• Antes de usar MPI_Recv, hay que
  declarar un record de tipo MPI_Status
• Este record contiene tres campos:
  - MPI_source: el rango del proceso que
    envió el mensaje
  - MPI_tag: la etiqueta del mensaje
  - MPI_ERROR: la condición de error
El Código para Eniviar/Recibir
if (ID == j) {
   …
   Receive from i
   …
}
…
if (ID == i) {
   …
   Send to j
   …
}
MPI_Send
• La función bloquea hasta que el buffer
  este libre
• Tipicamente el mensaje se envia a un
  buffer de mensaje que permite la
  devolución de control al proceso que
  llamó
MPI_Recv
• La función bloquea hasta que el mensaje
  se haya recibido o hasta que un error se
  haya detectado
• Cuando occure un error, el record dado
  como el último argumentocontiene
  información acerca del proceso que envió
  el mensaje, el valor de la etiqueta, y la
  condición de error.
Punto Muerto (“Deadlock”)
• Ocurre cuando un proceso espera una
  condición que nunca occura.
• Ejemplos en los cuales punto muerto
  ocurre:
  – Dos procesos reciben antes de enviar.
  – La etiqueta de enviar no es la misma como la
    etiqueta de recibir.
  – Un proceso envia un mensaje a una
    destinación incorrecta.
Ejemplo
Float a,b,c;
Int id;
MPI_Status estatus;
…
If(id==0){
MPI_Recv(&b,1,MPI_FLOAT,1,0,MPI_COMM_WORLD,&estatus);
MPI_Send (&a,1,MPI_FLOAT,1,0,MPI_COMM_WORLD);
C=(a+b)/2.0;
} else if (id==1){
MPI_Recv(&a,1,MPI_FLOAT,0,0,MPI_COMM_WORLD,&estatus);
MPI_Send (&b,1,MPI_FLOAT,0,0,MPI_COMM_WORLD);
C=(a+b)/2.0
}
//El proceso #0 se queda esperando un mensaje del proceso #1 mientras que
     el proceso #1 se queda esperando un mensaje del proceso #0.
Otro Ejemplo
Float a,b,c;
Int id;
MPI_Status estatus;
…
If(id==0) {
MPI_Send (&a,1,MPI_FLOAT,1,1,MPI_COMM_WORLD);
MPI_Recv(&b,1,MPI_FLOAT,1,1,MPI_COMM_WORLD,&estatus);
C=(a+b)/2.0;
}else if (id==1){
MPI_Send (&b,1,MPI_FLOAT,0,0,MPI_COMM_WORLD);
MPI_Recv(&a,1,MPI_FLOAT,0,0,MPI_COMM_WORLD,&estatus);
MPI_Send (&b,1,MPI_FLOAT,0,0,MPI_COMM_WORLD);
C=(a+b)/2.0
}
/*El proceso #0 envia un mensaje con etiqueta 1 al proceso #1 y el proceso #1
     envia un mensaje con etiqueta 0 al proceso #0. Pero el proceso #0 esta
     esperando un mensaje con etiqueta 1 y el proceso #1 está esperando un
     mensaje con etiqueta 0.*/
Una Versión Paralela en MPI del
      Algoritmo de Floyd
• La entrada consiste de un archivo que
  contiene una matríz n X n de enteros.
• Esta matriz se puede leer haciendo uso
  de una función read_row_striped_matrix
read_row_striped_matrix

• Esta función pone las filas de la matríz de
  entrada en los p procesadores de acuerdo con
  el Método 2, es decir que el procesador i, i=0,1,
  …,p-1, irecibirá las filas i n/p hasta la (i + 1)
  n/p -1
• Dado el nombre del archivo de entrada, el tipo
  de dato de los elementos de la matriz, y un
  comunicador, (1) devuelve un apuntador a un
  arreglo de apuntadores y (2) un apuntador a la
  localización que contiene la matrix, y (3) las
  dimensiones de la matriz
Funciones Disponibles
• read_row_striped_matrix además de otras
  funciones útiles se encuentran en el
  archivo MyMPI.h
• Este archivo además del código de fuente
  de los otros programas del texto se
  encuentran en la página de Michael J.
  Quinn:
http://ac-staff.seattleu.edu/quinnm/web./education/ParallelProgramming
Declaraciones y Inicializaciones
#include <stdio.h>
#include <mpi.h>
#include "MyMPI.h"
typedef               int dtype;
#define               MPI_TYPE MPI_INT
int main (int argc, char *argv[])
{ dtype **a;                                 /* Doubly-subscripted array */
  dtype *storage;                 /* Local portion of array elements */
  int                 i, j, k;
  int                 id;                                        /* Process rank */
  int                 m;                                         /* Rows in matrix */
  int                 n;                                         /* Columns in matrix */
  int                 p;                                         /* Number of processes */
  double time, max_time;
  void compute_shortest_paths (int, int, int**, int);
  MPI_Init (&argc, &argv);
  MPI_Comm_rank (MPI_COMM_WORLD, &id);
  MPI_Comm_size (MPI_COMM_WORLD, &p);
main
• /*Leer archivo que contiene la matríz de
  distancias*/
• /*Imprimir la matríz de distancias*/
• /*Llamar la función
  compute_shortest_paths*/
• /*Computar tiempo total*/
• /*Imprimir la nueva matríz de distancias
main
read_row_striped_matrix (argv[1], (void *) &a,
   (void *) &storage, MPI_TYPE, &m, &n, MPI_COMM_WORLD);

 if (m != n) //terminate(id,”Matrix must be squaren”)
        print_row_striped_matrix ((void **) a, MPI_TYPE, m, n, MPI_COMM_WORLD);
MPI_Barrier (MPI_COMM_WORLD);
 time = -MPI_Wtime();
 compute_shortest_paths (id, p, (dtype **) a, n);
  time += MPI_Wtime();
 MPI_Reduce (&time, &max_time, 1, MPI_DOUBLE, MPI_MAX, 0,
    MPI_COMM_WORLD);
 if (!id)
              printf ("Floyd, matrix size %4d, %3d processes: %10.6f secondsn",
                           n, p, max_time);

    print_row_striped_matrix ((void **) a, MPI_TYPE, m, n,
      MPI_COMM_WORLD);

    MPI_Finalize();
}
compute_shortest_paths
•   void compute_shortest_paths (int id, int p, dtype **a, int n)
•   {
•      int                  i, j, k;
•      int                  offset;                     /* Local index of broadcast row */
•      int                  root;                       /* Process controlling row to be bcast */
•      int                  *tmp;                       /* Holds the broadcast row */
•     tmp = (dtype *) malloc (n * sizeof(dtype));
•      for (k = 0; k < n; k++)
•      { root = BLOCK_OWNER(k, p, n);
•        if (root == id)
•        { offset = k - BLOCK_LOW(id, p, n);
•           for (j = 0; j < n; j++)
•             tmp[j] = a[offset][j];
•        }
•        MPI_Bcast (tmp, n, MPI_TYPE, root, MPI_COMM_WORLD);
•        for (i = 0; i < BLOCK_SIZE(id, p, n); i++)
•           for (j = 0; j < n; j++)
•             a[i][j] = MIN(a[i][j], a[i][k] + tmp[j]);
•      }
•      free (tmp);
•   }
Un Program para Generar una
   Matríz de Distancias Aleatorias
• genMat4floyd escrito por Andrea di Blas
• Hay 4 entradas en la linea de comando:
  n (el número de vértices)
  r (la “densidad”, es decir el porciento de
    números no cero en la matríz de
    distancias)
  salida (el nombre del archivo de salida)
  seed (la “semilla” del generador de números
  aleatorios.
Un Programa para Crear un
           Archivo con una Matríz de
•   *
                Distancias Dada
#include <stdio.h>
#include <stdlib.h>
/******************************************************************************/
int        main(int argc, char *argv[])
{ int                          i, j;
    int                        n;
    FILE              *fp;
    int                        *Astorage;
    int                        **A;
    int               x;
    if(argc != 3)
    {      printf("nDebe ser: generar <n> <archivo> ");
           printf("ndonde la matriz de distancias es nxn");
           printf("n");
           exit(1);
    }
Programa generar(cont)
  n=atoi(argv[1]);
//Abrir archivo para escribir
    if((fp = fopen(argv[2], "w")) == NULL)
    {       printf("n*** no se puede escribir en archivo %s ***n", argv[2]);
            exit(1);
    }

    /* escribir las dimensiones n y n en el archivo */
    fwrite(&n, sizeof(int), 1, fp);
    fwrite(&n, sizeof(int), 1, fp);
// Asignar memoria para almacenar el arreglo
    if((Astorage = (int *)malloc(n * n * sizeof(int))) == NULL)
    {      printf( "n*** no hay memoria ***n");
           exit(2);
    }
//Asignar memoria para los apuntadores a las filas
    if((A = (int **)malloc(n * sizeof(int *))) == NULL)
    {      printf("n*** no hay memoria ***n");
           exit(2);
    }
Program generar (cont)
    /* inicializar arreglo de apuntadores */
    for(i = 0; i < n; ++i)
            A[i] = &Astorage[i * n];
/* Entrar la matriz de distancias desde el teclado*/
    /* set all values */
    for(i = 0; i < n; ++i)
            for(j = 0; j < n; ++j)
            {
             printf("A[%d][%d]=",i,j);
             scanf("%d",&A[i][j]);
            }

        /* escribir el arreglo en el archivo */
        fwrite(Astorage, sizeof(int), n * n, fp);

        fclose(fp);
        return(0);
    }
•       }
Función para Leer Matríz de
                   Distancias
/** Process p-1 opens a file and inputs a two-dimensional
  matrix, reading and distributing blocks of rows to the
  other processes.*/

void read_row_striped_matrix (
  char     *s,      /* IN - File name */
  void   ***subs, /* OUT - 2D submatrix indices */
  void    **storage, /* OUT - Submatrix stored here */
  MPI_Datatype dtype, /* IN - Matrix element type */
  int    *m,       /* OUT - Matrix rows */
  int    *n,      /* OUT - Matrix cols */
  MPI_Comm comm) /* IN - Communicator */
{
  int     datum_size; /* Size of matrix element */
  int     i;
  int     id;         /* Process rank */
  FILE     *infileptr; /* Input file pointer */
  int     local_rows; /* Rows on this proc */
  void    **lptr;        /* Pointer into 'subs' */
  int     p;          /* Number of processes */
  void     *rptr;        /* Pointer into 'storage' */
  MPI_Status status;          /* Result of receive */
  int     x;         /* Result of read */
read_row_striped_matrix (cont)
MPI_Comm_size (comm, &p);
 MPI_Comm_rank (comm, &id);
 datum_size = get_size (dtype);

 /* Process p-1 opens file, reads size of matrix,
    and broadcasts matrix dimensions to other procs */

 if (id == (p-1)) {
    infileptr = fopen (s, "r");
    if (infileptr == NULL) *m = 0;
    else {
       fread (m, sizeof(int), 1, infileptr);
       fread (n, sizeof(int), 1, infileptr);
    }
 }
 MPI_Bcast (m, 1, MPI_INT, p-1, comm);

 if (!(*m)) MPI_Abort (MPI_COMM_WORLD, OPEN_FILE_ERROR);

 MPI_Bcast (n, 1, MPI_INT, p-1, comm);
read_row_striped_matrix (cont)
local_rows = BLOCK_SIZE(id,p,*m);

 /* Dynamically allocate matrix. Allow double subscripting
    through 'a'. */

 *storage = (void *) my_malloc (id,
    local_rows * *n * datum_size);
 *subs = (void **) my_malloc (id, local_rows * PTR_SIZE);

 lptr = (void *) &(*subs[0]);
 rptr = (void *) *storage;
 for (i = 0; i < local_rows; i++) {
   *(lptr++)= (void *) rptr;
   rptr += *n * datum_size;
 }
read_row_striped_matrix (cont)
/* Process p-1 reads blocks of rows from file and
    sends each block to the correct destination process.
    The last block it keeps. */

    if (id == (p-1)) {
       for (i = 0; i < p-1; i++) {
         x = fread (*storage, datum_size,
           BLOCK_SIZE(i,p,*m) * *n, infileptr);
         MPI_Send (*storage, BLOCK_SIZE(i,p,*m) * *n, dtype,
           i, DATA_MSG, comm);
       }
       x = fread (*storage, datum_size, local_rows * *n,
         infileptr);
       fclose (infileptr);
    } else
       MPI_Recv (*storage, local_rows * *n, dtype, p-1,
         DATA_MSG, comm, &status);
}
Como Usar el Programa Paralelo
           de Floyd
• Crear un archivo que contiene la matríz de
  distancias utilizando o generar.c (para un
  grafo especifico) o genMat4floyd.c (para un
  grafo a la azar)
• Si el archivo de objeto está en generar o
  genMat4floyd, respectivamente, entonces se
  ejecutan por
• ./generar n archivo
• o
  ./genMat4floyd n r archivo semilla
Compilar y Ejecutar
• Compilar MyMPI.c y floyd.c
  separadamente para crear archivos o
  mpicc –c MyMPI.c
  mpicc –c floyd.c
• Link:
       mpicc MyMPI.o floyd.o -o floyd
• Ejecutar:
      ./floyd archivo

Más contenido relacionado

PDF
Paralela5
PDF
Examen de Turbo C
PDF
Paralela6
DOC
Encriptacion
PDF
Paralela3
PDF
Paralela8
PPTX
DOCX
Conferencia n°7
Paralela5
Examen de Turbo C
Paralela6
Encriptacion
Paralela3
Paralela8
Conferencia n°7

La actualidad más candente (20)

PPSX
Capítulo 3: Encripción
PDF
Tema 1.1
PDF
Paralela2
PDF
Paralela7
PPTX
Capítulo 7 sincronización de procesos 09 01-2012
PPT
Recursividad
PDF
Paralela4
PDF
Estructura de datos avanzada
PDF
Fundamentos de Analisi y Diseño de Algoritmos FADA
PDF
Computación ii 324-1-estructuras dinamicas-con enlaces
PPTX
Funciones recursivas
PDF
Recursividad
PPT
Clase nº1 fisica 2010
PPT
Analisis Clase2
PPT
composicion de algoritmos
PDF
Solucion taller 1 de control 2
DOCX
Algoritmos divide y vencerás
PDF
Divide y Vencerás
PPT
Resumen Complejidad Computacional y de Algoritmos
Capítulo 3: Encripción
Tema 1.1
Paralela2
Paralela7
Capítulo 7 sincronización de procesos 09 01-2012
Recursividad
Paralela4
Estructura de datos avanzada
Fundamentos de Analisi y Diseño de Algoritmos FADA
Computación ii 324-1-estructuras dinamicas-con enlaces
Funciones recursivas
Recursividad
Clase nº1 fisica 2010
Analisis Clase2
composicion de algoritmos
Solucion taller 1 de control 2
Algoritmos divide y vencerás
Divide y Vencerás
Resumen Complejidad Computacional y de Algoritmos
Publicidad

Destacado (12)

PPTX
Algoritmo de dijkstra
PPTX
PPTX
Sistemas distribuidos (Diseño de redes I)
PPTX
Algoritmo de dijkstra final
PPTX
Floyd-Warshall
PPTX
Algoritmo de dijkstra
PPTX
Algoritmo De Dijkstra
PPT
EIGRP - Enhanced Interior Gateway Routing Protocol v1.0
PPT
Capitulo 9 eigrp
PDF
Conceptos y protocolos de enrutamiento: 9. EIGRP
PPTX
Algoritmo de Dijkstra
Algoritmo de dijkstra
Sistemas distribuidos (Diseño de redes I)
Algoritmo de dijkstra final
Floyd-Warshall
Algoritmo de dijkstra
Algoritmo De Dijkstra
EIGRP - Enhanced Interior Gateway Routing Protocol v1.0
Capitulo 9 eigrp
Conceptos y protocolos de enrutamiento: 9. EIGRP
Algoritmo de Dijkstra
Publicidad

Similar a Floyd (20)

PPT
Matriz Vector
PDF
PPT
UTPL-LÓGICA DE LA PROGRAMACIÓN-I BIMESTRE-(abril agosto 2012)
PDF
Usando Twisted para hacer aplicaciones de escritorio no bloqueantes
PPT
Mpinning Gy Alg9(Conteo)
PDF
Introducción al análisis de algoritmos
PDF
LÓGICA DE LA PROGRAMACIÓN (I Bimestre Abril Agosto 2011)
PPTX
05 - Analisis de Algoritmos.pptx
PPT
Common Scrambling Algorithm al descubierto
PPT
Logica de la programacion i bimestre
PDF
S01.s2 - Complejidad Algorítmica UTP 2025
PDF
07 cuantificacion escalar (1)
PDF
Sistemas Difusos
PPTX
ClaseCoordinada_Clase1 Estructura de Datos
DOCX
A1 u1-16230227
PPTX
Clase 02 Python UP Clase 02 Python UP Clase 02 Python UP
PDF
Estructura de datos avanzada
PDF
Mas_de_400_ejercicios_de_programacion_en (2).pdf
PDF
Mas_de_400_ejercicios_de_programacion_en (1).pdf
Matriz Vector
UTPL-LÓGICA DE LA PROGRAMACIÓN-I BIMESTRE-(abril agosto 2012)
Usando Twisted para hacer aplicaciones de escritorio no bloqueantes
Mpinning Gy Alg9(Conteo)
Introducción al análisis de algoritmos
LÓGICA DE LA PROGRAMACIÓN (I Bimestre Abril Agosto 2011)
05 - Analisis de Algoritmos.pptx
Common Scrambling Algorithm al descubierto
Logica de la programacion i bimestre
S01.s2 - Complejidad Algorítmica UTP 2025
07 cuantificacion escalar (1)
Sistemas Difusos
ClaseCoordinada_Clase1 Estructura de Datos
A1 u1-16230227
Clase 02 Python UP Clase 02 Python UP Clase 02 Python UP
Estructura de datos avanzada
Mas_de_400_ejercicios_de_programacion_en (2).pdf
Mas_de_400_ejercicios_de_programacion_en (1).pdf

Floyd

  • 1. El Algoritmo de Floyd Capítulo 6
  • 2. Grafos con Pesos • Un grafo dirigido en la cual hay asociado con cada arista un número positivo (el “peso”) se llama un grafo dirigido con pesos. • El largo de una trayectoria de un vértice u a otro vértice v es la suma de los pesos de las aristas que componen la trayectoria.
  • 3. El Problema de Todos Pares Distancias mas Cortas • Dado un grafo dirigido con pesos, ¿cuales son las trayectorias de largos mínimos (es decir “distancias mas cortas”) entre todos los pares de vértices?
  • 4. La Matríz de Adyacencias • Representar un grafo dirigido con pesos G con n vértices por una matríz MG como sigue: • Si 1,2, … ,n son los vértices, entonces el elemento en la fila #i y la columna #j es 0 si i=j, es ∞ (un número mas grande que cualquier peso) si no hay arista de I a j, y es el peso de la arista de i a j si tal arista existe. Lamemos MG la matríz de adyacencias.
  • 5. Ejemplo 4 A B C D E A A 0 6 3 ∞ ∞ B 3 6 B 4 0 ∞ 1 ∞ 1 3 C ∞ ∞ 0 5 1 C 5 1 D ∞ 3 ∞ 0 ∞ D E ∞ ∞ ∞ 2 0 E 2 Matríz de Adyacencias
  • 6. El Algoritmo de Floyd for k ← 0 to n-1 for i ← 0 to n-1 for j ← 0 to n-1 a[i,j] ← min (a[i,j], a[i,k] + a[k,j]) endfor endfor endfor
  • 7. La Solución al Ejemplo Anterior 4 A B C D E A A 0 6 3 6 8 B 3 6 B 4 0 7 1 8 1 3 C 10 6 0 3 1 C 5 1 D 7 3 10 0 11 D E 9 5 12 2 0 E 2 Matríz de Distancias
  • 8. La Idea del Algoritmo La trayectoria mas corta de i a k que pasa por 0, 1, …, k-1 i k Computed in previous La trayectoria mas corta iterations de i a j que pasa por 0, 1, …, k-1 La trayectoria mas corta de k a j que pasa por j 0, 1, …, k-1
  • 9. El Diseño del Algoritmo Paralelo • Particionar • Patronos de Comunicaciones • Aglomeración y Asignación
  • 10. Particionar • En el seudo código la misma asignación se ejecuta n3 veces. • No hay paralelismo funcional. • Usemos descomposición de dominio: particionar la matriz A en sus n2 elementos.
  • 11. Comunicaciones • Para todo valor de k, a[k,m] se necesita por toda tarea asociada con elementos en la columna m y a[m,k] se necesita por toda tarea asociada con elements de la fila m. • Durante de la iteración k, todo element en la fila k se emit a las tareas de la misma columna y todo elemento de la columna a se emite a la tarea en la misma fila
  • 12. Comunicaciones Poner al dia Primitive tasks a[3,4] Cuando k=1 Iteración k: Iteración k: Toda tarea Toda tarea en la fila k en la columna emite su valor k emite su valor a los procesos a los procesos en la misma en la misma columna fila
  • 13. Aglomeración y Asignación • El número de taréas es estático • Las comunicaciones entre las tareas son regulares • El tiempo de computación por tarea es constante • Un buena estrategia en este caso es – Aglomerar tareas pare minimizar las comunicaciones – Crear una tarea por proceso MPI
  • 14. Dos Descomposiciones Rowwise block striped Columnwise block striped
  • 15. Comparación de Descomposiciones • Columnwise block striped – Se eliminan las emisiones dentro de las columnas • Rowwise block striped – Se eliminan las emisiones dentro de las columnas – Escribir la salida es mas simple • Escoja rowwise
  • 16. La Entrada de la Matríz de Adyacencias • La matríz se guarda en el orden “row major” en un archivo”. • Si hay p procesos, entonces para cada i=0,1, …,p-2, el proceso p-1 lee la fila in/p hasta la fila (i+1)n/p -1 y las envia al proceso i. Después, lee las últimas filas para le mismo. • La razón por la cual p-1 hace este trabajo es que no hay ningun proceso que va a ser responsible por mas filas que el p-1 (Ejercicio 6.1)
  • 17. Comunicación Punto-Punto • Envolve dos procesos • Un proceso envia un mensaje • El otro proceso receive el mensaje
  • 18. Enviar int MPI_Send ( void *mensage, int cantidad, MPI_Datatype tipo, int dest, int etiqueta, MPI_Comm comunicador )
  • 19. Recibir int MPI_Recv ( void *mensage, int cantidad, MPI_Datatype tipo, int fuente, int etiqueta, MPI_Comm comunicador, MPI_Status *estatus//un apuntador a un //record de tipo MPI_Status ) • “fuente” puede ser MPI_ANY_SOURCE
  • 20. El Argumento estatus de MPI_Recv • Antes de usar MPI_Recv, hay que declarar un record de tipo MPI_Status • Este record contiene tres campos: - MPI_source: el rango del proceso que envió el mensaje - MPI_tag: la etiqueta del mensaje - MPI_ERROR: la condición de error
  • 21. El Código para Eniviar/Recibir if (ID == j) { … Receive from i … } … if (ID == i) { … Send to j … }
  • 22. MPI_Send • La función bloquea hasta que el buffer este libre • Tipicamente el mensaje se envia a un buffer de mensaje que permite la devolución de control al proceso que llamó
  • 23. MPI_Recv • La función bloquea hasta que el mensaje se haya recibido o hasta que un error se haya detectado • Cuando occure un error, el record dado como el último argumentocontiene información acerca del proceso que envió el mensaje, el valor de la etiqueta, y la condición de error.
  • 24. Punto Muerto (“Deadlock”) • Ocurre cuando un proceso espera una condición que nunca occura. • Ejemplos en los cuales punto muerto ocurre: – Dos procesos reciben antes de enviar. – La etiqueta de enviar no es la misma como la etiqueta de recibir. – Un proceso envia un mensaje a una destinación incorrecta.
  • 25. Ejemplo Float a,b,c; Int id; MPI_Status estatus; … If(id==0){ MPI_Recv(&b,1,MPI_FLOAT,1,0,MPI_COMM_WORLD,&estatus); MPI_Send (&a,1,MPI_FLOAT,1,0,MPI_COMM_WORLD); C=(a+b)/2.0; } else if (id==1){ MPI_Recv(&a,1,MPI_FLOAT,0,0,MPI_COMM_WORLD,&estatus); MPI_Send (&b,1,MPI_FLOAT,0,0,MPI_COMM_WORLD); C=(a+b)/2.0 } //El proceso #0 se queda esperando un mensaje del proceso #1 mientras que el proceso #1 se queda esperando un mensaje del proceso #0.
  • 26. Otro Ejemplo Float a,b,c; Int id; MPI_Status estatus; … If(id==0) { MPI_Send (&a,1,MPI_FLOAT,1,1,MPI_COMM_WORLD); MPI_Recv(&b,1,MPI_FLOAT,1,1,MPI_COMM_WORLD,&estatus); C=(a+b)/2.0; }else if (id==1){ MPI_Send (&b,1,MPI_FLOAT,0,0,MPI_COMM_WORLD); MPI_Recv(&a,1,MPI_FLOAT,0,0,MPI_COMM_WORLD,&estatus); MPI_Send (&b,1,MPI_FLOAT,0,0,MPI_COMM_WORLD); C=(a+b)/2.0 } /*El proceso #0 envia un mensaje con etiqueta 1 al proceso #1 y el proceso #1 envia un mensaje con etiqueta 0 al proceso #0. Pero el proceso #0 esta esperando un mensaje con etiqueta 1 y el proceso #1 está esperando un mensaje con etiqueta 0.*/
  • 27. Una Versión Paralela en MPI del Algoritmo de Floyd • La entrada consiste de un archivo que contiene una matríz n X n de enteros. • Esta matriz se puede leer haciendo uso de una función read_row_striped_matrix
  • 28. read_row_striped_matrix • Esta función pone las filas de la matríz de entrada en los p procesadores de acuerdo con el Método 2, es decir que el procesador i, i=0,1, …,p-1, irecibirá las filas i n/p hasta la (i + 1) n/p -1 • Dado el nombre del archivo de entrada, el tipo de dato de los elementos de la matriz, y un comunicador, (1) devuelve un apuntador a un arreglo de apuntadores y (2) un apuntador a la localización que contiene la matrix, y (3) las dimensiones de la matriz
  • 29. Funciones Disponibles • read_row_striped_matrix además de otras funciones útiles se encuentran en el archivo MyMPI.h • Este archivo además del código de fuente de los otros programas del texto se encuentran en la página de Michael J. Quinn: http://ac-staff.seattleu.edu/quinnm/web./education/ParallelProgramming
  • 30. Declaraciones y Inicializaciones #include <stdio.h> #include <mpi.h> #include "MyMPI.h" typedef int dtype; #define MPI_TYPE MPI_INT int main (int argc, char *argv[]) { dtype **a; /* Doubly-subscripted array */ dtype *storage; /* Local portion of array elements */ int i, j, k; int id; /* Process rank */ int m; /* Rows in matrix */ int n; /* Columns in matrix */ int p; /* Number of processes */ double time, max_time; void compute_shortest_paths (int, int, int**, int); MPI_Init (&argc, &argv); MPI_Comm_rank (MPI_COMM_WORLD, &id); MPI_Comm_size (MPI_COMM_WORLD, &p);
  • 31. main • /*Leer archivo que contiene la matríz de distancias*/ • /*Imprimir la matríz de distancias*/ • /*Llamar la función compute_shortest_paths*/ • /*Computar tiempo total*/ • /*Imprimir la nueva matríz de distancias
  • 32. main read_row_striped_matrix (argv[1], (void *) &a, (void *) &storage, MPI_TYPE, &m, &n, MPI_COMM_WORLD); if (m != n) //terminate(id,”Matrix must be squaren”) print_row_striped_matrix ((void **) a, MPI_TYPE, m, n, MPI_COMM_WORLD); MPI_Barrier (MPI_COMM_WORLD); time = -MPI_Wtime(); compute_shortest_paths (id, p, (dtype **) a, n); time += MPI_Wtime(); MPI_Reduce (&time, &max_time, 1, MPI_DOUBLE, MPI_MAX, 0, MPI_COMM_WORLD); if (!id) printf ("Floyd, matrix size %4d, %3d processes: %10.6f secondsn", n, p, max_time); print_row_striped_matrix ((void **) a, MPI_TYPE, m, n, MPI_COMM_WORLD); MPI_Finalize(); }
  • 33. compute_shortest_paths • void compute_shortest_paths (int id, int p, dtype **a, int n) • { • int i, j, k; • int offset; /* Local index of broadcast row */ • int root; /* Process controlling row to be bcast */ • int *tmp; /* Holds the broadcast row */ • tmp = (dtype *) malloc (n * sizeof(dtype)); • for (k = 0; k < n; k++) • { root = BLOCK_OWNER(k, p, n); • if (root == id) • { offset = k - BLOCK_LOW(id, p, n); • for (j = 0; j < n; j++) • tmp[j] = a[offset][j]; • } • MPI_Bcast (tmp, n, MPI_TYPE, root, MPI_COMM_WORLD); • for (i = 0; i < BLOCK_SIZE(id, p, n); i++) • for (j = 0; j < n; j++) • a[i][j] = MIN(a[i][j], a[i][k] + tmp[j]); • } • free (tmp); • }
  • 34. Un Program para Generar una Matríz de Distancias Aleatorias • genMat4floyd escrito por Andrea di Blas • Hay 4 entradas en la linea de comando: n (el número de vértices) r (la “densidad”, es decir el porciento de números no cero en la matríz de distancias) salida (el nombre del archivo de salida) seed (la “semilla” del generador de números aleatorios.
  • 35. Un Programa para Crear un Archivo con una Matríz de • * Distancias Dada #include <stdio.h> #include <stdlib.h> /******************************************************************************/ int main(int argc, char *argv[]) { int i, j; int n; FILE *fp; int *Astorage; int **A; int x; if(argc != 3) { printf("nDebe ser: generar <n> <archivo> "); printf("ndonde la matriz de distancias es nxn"); printf("n"); exit(1); }
  • 36. Programa generar(cont) n=atoi(argv[1]); //Abrir archivo para escribir if((fp = fopen(argv[2], "w")) == NULL) { printf("n*** no se puede escribir en archivo %s ***n", argv[2]); exit(1); } /* escribir las dimensiones n y n en el archivo */ fwrite(&n, sizeof(int), 1, fp); fwrite(&n, sizeof(int), 1, fp); // Asignar memoria para almacenar el arreglo if((Astorage = (int *)malloc(n * n * sizeof(int))) == NULL) { printf( "n*** no hay memoria ***n"); exit(2); } //Asignar memoria para los apuntadores a las filas if((A = (int **)malloc(n * sizeof(int *))) == NULL) { printf("n*** no hay memoria ***n"); exit(2); }
  • 37. Program generar (cont) /* inicializar arreglo de apuntadores */ for(i = 0; i < n; ++i) A[i] = &Astorage[i * n]; /* Entrar la matriz de distancias desde el teclado*/ /* set all values */ for(i = 0; i < n; ++i) for(j = 0; j < n; ++j) { printf("A[%d][%d]=",i,j); scanf("%d",&A[i][j]); } /* escribir el arreglo en el archivo */ fwrite(Astorage, sizeof(int), n * n, fp); fclose(fp); return(0); } • }
  • 38. Función para Leer Matríz de Distancias /** Process p-1 opens a file and inputs a two-dimensional matrix, reading and distributing blocks of rows to the other processes.*/ void read_row_striped_matrix ( char *s, /* IN - File name */ void ***subs, /* OUT - 2D submatrix indices */ void **storage, /* OUT - Submatrix stored here */ MPI_Datatype dtype, /* IN - Matrix element type */ int *m, /* OUT - Matrix rows */ int *n, /* OUT - Matrix cols */ MPI_Comm comm) /* IN - Communicator */ { int datum_size; /* Size of matrix element */ int i; int id; /* Process rank */ FILE *infileptr; /* Input file pointer */ int local_rows; /* Rows on this proc */ void **lptr; /* Pointer into 'subs' */ int p; /* Number of processes */ void *rptr; /* Pointer into 'storage' */ MPI_Status status; /* Result of receive */ int x; /* Result of read */
  • 39. read_row_striped_matrix (cont) MPI_Comm_size (comm, &p); MPI_Comm_rank (comm, &id); datum_size = get_size (dtype); /* Process p-1 opens file, reads size of matrix, and broadcasts matrix dimensions to other procs */ if (id == (p-1)) { infileptr = fopen (s, "r"); if (infileptr == NULL) *m = 0; else { fread (m, sizeof(int), 1, infileptr); fread (n, sizeof(int), 1, infileptr); } } MPI_Bcast (m, 1, MPI_INT, p-1, comm); if (!(*m)) MPI_Abort (MPI_COMM_WORLD, OPEN_FILE_ERROR); MPI_Bcast (n, 1, MPI_INT, p-1, comm);
  • 40. read_row_striped_matrix (cont) local_rows = BLOCK_SIZE(id,p,*m); /* Dynamically allocate matrix. Allow double subscripting through 'a'. */ *storage = (void *) my_malloc (id, local_rows * *n * datum_size); *subs = (void **) my_malloc (id, local_rows * PTR_SIZE); lptr = (void *) &(*subs[0]); rptr = (void *) *storage; for (i = 0; i < local_rows; i++) { *(lptr++)= (void *) rptr; rptr += *n * datum_size; }
  • 41. read_row_striped_matrix (cont) /* Process p-1 reads blocks of rows from file and sends each block to the correct destination process. The last block it keeps. */ if (id == (p-1)) { for (i = 0; i < p-1; i++) { x = fread (*storage, datum_size, BLOCK_SIZE(i,p,*m) * *n, infileptr); MPI_Send (*storage, BLOCK_SIZE(i,p,*m) * *n, dtype, i, DATA_MSG, comm); } x = fread (*storage, datum_size, local_rows * *n, infileptr); fclose (infileptr); } else MPI_Recv (*storage, local_rows * *n, dtype, p-1, DATA_MSG, comm, &status); }
  • 42. Como Usar el Programa Paralelo de Floyd • Crear un archivo que contiene la matríz de distancias utilizando o generar.c (para un grafo especifico) o genMat4floyd.c (para un grafo a la azar) • Si el archivo de objeto está en generar o genMat4floyd, respectivamente, entonces se ejecutan por • ./generar n archivo • o ./genMat4floyd n r archivo semilla
  • 43. Compilar y Ejecutar • Compilar MyMPI.c y floyd.c separadamente para crear archivos o mpicc –c MyMPI.c mpicc –c floyd.c • Link: mpicc MyMPI.o floyd.o -o floyd • Ejecutar: ./floyd archivo