Академический Документы
Профессиональный Документы
Культура Документы
Curso 10/11
1 INTRODUCCIN
2 CONECTIVIDAD
3 MQUINAS MIMD 4 MQUINAS SIMD 5 SUPERESCALARES
2
4
arqAva
Temario
Conectividad-2
2 CONECTIVIDAD 1 Introduccin
Interconnection Networks. An engineering Jos Duato y - 2003 [Captulos 1 y 2] Principles and Practices of Interconnection ... William James Dally y - 2004 [Cap: 1,2,3,22]
2 Conceptos 1 Clasificacin de las redes 2 Caracterizacin por Grafos 3 Perfiles de comunicacin 3 Redes de medio de transmisin compartido (Buses) 4 Redes directas (estticas ) 1 Encaminamiento 2 Array lineal, anillo, ..., hipercubo 5 Redes indirectas (dinmicas) 1 Crossbar, redes multietapa ()
arqAva
Introduccin
Conectividad-3
P4
P5
arqAva
Introduccin
Conectividad-4
Comunicacin Hw <===> Comunicacin Sw Memoria Comn (Load/Store) Comunicar Pi y Memoria P1 P2 Pi RED M1 Mj Mk Pn Paso Mensajes (Send/Receive) Comunicar Pi con Pj P1 P2 Pi Pn
RED
arqAva
Introduccin
http://www.euroben.nl/reports/overview09.pdf
Conectividad-5
Coste * 50
Gigabit Ethernet 0,1 10..40
arqAva
Introduccin
Conectividad-6
LAN WAN
arqAva
Introduccin
Conectividad-7
Sistema
27 nodos
36 placas
6 ncleos
arqAva
Introduccin
Conectividad-8
27/Mayo/2009: Quiebra
arqAva
Introduccin
Conectividad-9
LAN/WAN Internet Millones de nodos # Nodos dinmico Enlaces largos Red irregular Latencia alta
arqAva
Conectividad-10
PERFILES DE COMUNICACIN
arqAva
Conectividad-11
Ethernet
M1
Token Ring
Mj
Mk
arqAva
Conectividad-12
Redes directas: Conexiones fijas entre los elementos (Pi, Pj) invariables durante la ejecucin
P1 P2 Acoplamiento dbil Amplio uso en multicomputadores
P4
P3
Los propios Nodos encaminan Los caminos del origen al destino pueden ser distintos
arqAva
Conectividad-13
Redes indirectas: Conexiones varan entre los elementos (Pi, Mj) variables durante la ejecucin
P1 P2 Pi
RED M1 Mj Mk Red Telefnica Acoplamiento fuerte Amplio uso en multiprocesadores Encamina la propia red
Pn
arqAva
Conectividad-14
Parcialmente conectadas:
conexas !
arqAva
Conectividad-15
A1
Grado de la red: El del nodo con mayor grado (4) Deseable regularidad Compromiso en el Grado
Menor conectividad => Ms latencia Menor coste Ms conectividad => Menor latencia Mayor coste
arqAva
Conectividad-16
Dimetro de la red: Camino ms distante de entre los mnimos que unen a dos nodos cualesquiera.
Mtrica => Nmero de saltos => 2
1, 2, 3, ......?
arqAva
Perfiles de Comunicacin
Conectividad-17
Mquinas CRCW
arqAva P1
$
Conectividad-18
Pi
$
Pn
$
M1
Mj
Mk
Cachs !
98% Hit
Pn
Algunos problemas !
colisiones
Fallo costoso
P2 P1
Soluciones ?
arqAva Redes Medio Compartido (Bus II) Conectividad-19 Bus pipelining Write Read
Pedir bus Arbitrar Dar bus Usar bus
1 2 3 4 5 AR ARB AG RQ ACK 1 2 3 4 AR ARB AG RQ 5 6 P RPLY
P RPL
arqAva Redes Medio Compartido (Bus III) Conectividad-20 Split transaction: Pipelining + Dividir la transaccin en dos
1
read resp write ack write ack read resp read resp read resp 1 1 2 2 3 3 4 4 5 5 6 6
10
11
12 13
14
15
16
17
AR ARB AG RQ AR ARB AG RPL AR ARB AG RQ Mejora ? AR ARB AG ACK AR ARB AG RQ AR ARB AG ACK AR ARB AG RQ AR ARB AG RPL AR ARB Stall Stall Stall Stall AG RQ AR ARB AG RPL AR ARB Stall Stall Stall Stall AG RQ AR ARB AG RPL 3 4 5 6 7 8 9 RpA RqB 10 RpB 11 12 13 14
1 2 RqA
RqC
RpC
RpA
RqC
RpC
arqAva Redes Medio Compartido (Bus IV) Conectividad-21 Modo rfaga (Burst): Transacciones largas (lnea de cach)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 Arb Arb Arb Arb Cmd Dir Dato Cmd Dir Dato Cmd Dir Dato Cmd Dir Dato
Normal
Arb Cmd Dir Dato Dato Dato Dato
Inconveniente ?
Rfaga
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 GrA GrB ReA Cmd Dir Dato Dato Dato Dato Eti Dato Dato Dato Dato Cmd Dir Dato
Mensaje ms prioritario
Mensaje continuado
Buses mltiples
Concluyendo Cachs (L1, L2 y L3) Pipelining Split Transaction Modo rfaga Buses Jerrquicos Buses Mltiples Muy costoso + 32P
arqAva Generalidades
Redes directas
Conectividad-23
Encaminamiento Menor dimetro aumentando el grado Array lineal Anillo simple y de grado n Conectividad total Compromiso grado vs dimetro y muchos nodos rbol, Fat Tree y Estrella Mallas y Toroides Hipercubo con y sin ciclo Tabla de parmetros
arqAva
Conectividad-24
A otros nodos
MultiC ms integrado
P M P M
IC
IC
Switch Pn
Transputer Buffers Arbitraje Encamina.
L2
IC
Nodos => PCs o similares Ejemplos: Alpha 21364, SiCortex, Intel Core i7, AMD Istanbul
arqAva
Conectividad-25
arqAva
Conectividad-26
arqAva
Conectividad-27
500MHz
www.sicortex.com
arqAva
Conectividad-28
arqAva
Conectividad-29
19,2..25,6 GBseg
www.intel.com/technology/quickpath/introduction.pdf
arqAva
Conectividad-30
arqAva
..51,2 GBseg
arqAva
Encaminamiento (Modos)
Conectividad-32
Mecanismo Hw/Sw para que la informacin llegue del origen al destino. Hay que distinguir entre: Algoritmo: Eleccin del camino y gestin de conflictos Tcnica: Modo de propagar la informacin
Conmutacin de paquetes
3 4
Conmutacin de circuitos
Redes directas
Redes indirectas
Encaminamiento (Algoritmo)
0,0 fila col 0..7 0..7 1,0 2,0 3,0 4,0 5,0 6,0 7,0 0,1 0,2 0,3 0,4
Conectividad-33
0,5 0,6 0,7
D
A C
Algo: MovCol+MovFila
En origen: C[3,4] => D[1,6]
E datos L .,NN,E,E 5,1
arqAva
Encaminamiento (wormhole)
Conectividad-34
Destino
210
210
Destino
0 1 2
0 1 2
0 1
arqAva
Encaminamiento (ejemplo)
Conectividad-35
+ 7 veces mejor
Wormhole
Distancia
arqAva
Encaminamiento (Interbloqueo) C D A
D B D
Conectividad-36
B
D
Interbloqueo !
C D
A B A
C A
arqAva
B A
arqAva
Conectividad-38
6 4
3 5
6 4
3 5
Conectividad-39
Salto 3 1 1 2 3 2
Salto 4 1 2 2 1 1 2
2 2 3
2
1
d = 3, d = 1,71
d = 3, d = 1,71
d = 2, d = 1,57
arqAva N = 16 n = 3
Salto 2
Conectividad-40
Salto 3
Salto 4
d = 6, d = 3,2
d = 4, d = 2,27
arqAva N = 16 n = 4
Salto 3
Conectividad-41
Salto 4
Salto 5
d = 4, d = 2,13
d = 4, d = 2,13
arqAva N = 32 n = 5
Conectividad-42
Escalable ?
d = 4, d = ???
arqAva
Conectividad-43
arqAva
Conectividad-44
70 60 50 40 30 20 10 0 0 20 40 # Nodos 60
Moverse por aqu con menor grado
Dimetro
arqAva
Conectividad-45
ESTRELLA
arqAva
Conectividad-46
MALLA 3D
O(2,2,1)
D(3,3,2)
Colisin!
Interbloqueos ?
Cuello de botella?
arqAva
Conectividad-47
18
18
arqAva
Conectividad-48
K=2
arqAva
Conectividad-49
Dimetro = log2 N
Grado = log2 N
Fcil encaminar
Dim4
arqAva
Conectividad-50
1.
Numerar nodos en binario. Nodos adyacentes difieren en un bit (el asociado a la direccin que les une) Enviar mensaje por el enlace asociado a la menor direccin donde no coinciden bit del nodo actual y bit del nodo destino
2.
1000
0100 0101
Realizar ORX ?
Nodo actual
0111
0110 1010
0010 1010
1010 1010
arqAva
Conectividad-51
K=3
2 3
2
2 Dimetro ? 2
4
4
3
3 4 4
3
5 5
4
6
arqAva
Conectividad-52
arqAva
Conectividad-53
5832 ncleos
arqAva
Topologa
Array lineal Anillo Anillo de grado n rbol binario rbol binario equilibrado Estrella Malla Toroide Hipercubo Hipercubo con ciclos
N de nodos
N N N 2K-1 2K-1 N nK nK 2K K*2K
Grado
2 2 n=log2N 3 2K N-1 2*K 2*K K 3
Dimetro
N-1 N/2 n-1 2*(K-1) 2*(K-1) 2 K*(n-1) K* n/2 K 2*K - 1 + K/2
arqAva
Perspectiva histrica
Introduccin-55
2010?
Multiprocessor systems-on-chips (MPSoCs) Niagara Hoy 4..8 ncleos .. 64 en 2010 .. Se llegar a 1.000?
arqAva
P1 P2
P3
Pn
M1
M2
M3
Mm
colisin
difusin
arqAva
Conectividad-57
crossbar 8*8
directo
cruce
difusin
colisin
arqAva
Conectividad-58
000
001
010
001 010
001
010
Encaminamiento?
Sea de 001 a 010
Latencia y O( ) ?
arqAva
Conectividad-59
000
001 010 011
000
001 010 011
100
101 110 111
100
101 110 111
Permite difusin !
arqAva
Barato y limitado 2..32 Ms caro. Bueno para N moderado Mayor ancho de banda y fcil encaminar Compromiso entre Bus y Crossbar
arqAva
intercluster
arqAva
Redes en Top500
Conectividad-62
48,4%
6,0%
41,4%
FIN