Академический Документы
Профессиональный Документы
Культура Документы
2, APRIL 2005
P3
Las mismas consideraciones pueden aplicarse al resto de
d
variables asociadas a los surrogates, como son p , p y p.
Dado que se debe satisfacer la condicin de estabilidad del
sistema (p > p) tomaremos un factor k (k>1) tal que p = kp.
Razonando de manera anloga con el servidor origen,
obtendremos expresiones similares en las variables p, s, s y
Fig. 1. Topologa simplificada de una red de distribucin de contenido.
s. La expresin general permite obtener el tiempo de
En una primera aproximacin podemos asumir que todos respuesta tanto para un cluster de clientes como para el
los clusters de clientes (en lo sucesivo clientes) se encuentran sistema global, que ser el que se considerar en este artculo,
uniformemente distribuidos alrededor de una circunferencia que corresponde a la media de los M clusters:
con un tiempo de ida y vuelta (RTT, roundtrip-time) 0
respecto del servidor origen, correspondiente al centro. Los M
1
surrogates entre los clientes y el servidor origen se encuentran R Ri (5)
M i 1
a una distancia p y d respectivamente, en trminos de RTT.
Un cliente generar peticiones, que sern servidas bien por el Por tanto, la expresin general queda como:
servidor origen o por los surrogates. El mecanismo mediante
el cual un cliente conoce el servidor ms apropiado no se R Rs R0 (6)
considerar en este artculo; en su lugar se asumir que las
peticiones sern encaminadas a los surrogates con una con las siguientes expresiones para R s y R 0 :
probabilidad p. Por el contrario, los clientes contactarn con el
servidor origen con una probabilidad (1-p). 1 M P 1
p i
j i, j
La medida comnmente empleada en la evaluacin del Rs N W p
M (8)
M i 1 j 1 j j
rendimiento en la mayora de los anlisis de redes de CDNs es P p Ol
el tiempo medio de respuesta experimentado por los usuarios.
l 1
Para comenzar con una frmula inicial podemos considerar la
siguiente expresin: 1 M P
j 1
R0 1 p i NW 0i (9)
M M
R = p Rsrrgt 1 p Rorigin
i 1 j 1
P s 1 p l Ol
(1) l 1
donde Rsrrgt es el tiempo medio de respuesta asociado a donde M es el nmero de clusters de clientes, P es el nmero
contactar con un surrogate (y ser servido por ste) y Rorigin es de surrogates, pij es la probabilidad de que el i-simo cliente
el tiempo medio de respuesta en contactar el servidor origen
contacte con el j-simo surrogate, N representa el nmero de
(y ser servidor por ste). El tiempo de respuesta puede ser
paquetes necesarios para una transaccin cliente servidor, pi,j
representado [1] linealmente como:
es el tiempo de ida y vuelta medio para el i-simo cliente y el
R = N S j-simo surrogate, lj representa la tasa media de llegada que el
(2) l-simo cluster enva al j-esimo surrogate, oi es el RTT medio
donde N corresponde a un factor de escala que incorpora el
entre el i-simo cluster y el servidor origen, y (1-p)l
efecto de la prdida de paquetes en la red, las retransmisiones
representa la tasa media de llegada que el l-simo cluster enva
y, en general, la cantidad de informacin intercambiada
al servidor origen.
necesaria para satisfacer la solicitud de un cliente; representa
el factor de latencia de la red y S es el tiempo de proceso, que
se modelar como un sistema M/M/1. De esta forma tenemos IV. SIMULANDO EL MODELO
que el tiempo medio de respuesta se puede expresar de la
Como puede apreciarse, la expresin para el tiempo de
siguiente forma:
respuesta global corresponde a una funcin n-dimensional. El
proceso de simulacin debe considerar las siguientes variables
222 IEEE LATIN AMERICA TRANSACTIONS, VOL. 3, NO. 2, APRIL 2005
cada cliente contactar surrogates. Fig. 2. Tiempos de respuesta (M =32, P =4, N=3, =2, k=1.1,
x Un factor de capacidad (k) representando el incremento hit_ratio=0..1,0mn =0mx = 4 seg, dmn =dmx =1.5 seg, mn=mx = 200 )
necesario con respecto a la tasa media de llegada, de tal
forma que se satisfaga la condicin de estabilidad. 14
soportar todo el trfico, es decir, cuando p=0. Para el caso de este caso, sino el incremento relativo del tiempo medio de
los surrogates, la situacin ms desfavorable se alcanza respuesta en todo el intervalo (todo el da). Para este
cuando escenario, la sobrecarga en los servidores ha determinado
3.5
4
T.resp. global
T.resp. surrogate
3
3.5 T. resp. origen
T.resp. global
T. resp. RTT
T.resp. surrogate
T.resp. proceso
2.5 T.resp. origen 3
T.resp. RTT
at T.resp. proceso at
s s 2.5
e 2 e
u
p u
p
s s
er er
e e 2
d 1.5 d
o
p o
p
m m 1.5
ei ei
T 1 T
1
0.5
0.5
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 5 10 15 20
Probabilidad de acierto Tiempo
Fig 4. Tiempos de respuesta (M =96, P =32 , N=3, =2, k=1.1, hit_ratio=0..1, Fig. 5. Tiempos de respuesta (M =100, P =50 , N=5, =0.7, kmx=1.4,
0mn =0.3 seg, 0mx = 0.5 seg, dmn =0.3 seg dmx =0.4 seg, mn=50, mx = hit_ratio=0.5, 0mn =0.3 seg, 0mx = 0.5 seg, dmn =0.3 seg dmx =0.4 seg,
100) mn=50, mx = 100)
son estos los que absorben todo el trfico, esto es, cuando principalmente el tiempo medio global mientras que el ancho
p=1. Dado que se asignan diferentes pesos en la de banda en los enlaces apenas ha variado en la simulacin.
comunicacin, as como distintas tasas de generacin de Un efecto flash crowd puede ser local a una cierta zona, o
trfico a cada uno de los clientes, cada surrogate percibir una puede ser global a toda la CDN. El primero de los casos puede
tasa de trfico de llegada diferente, lo que supondr un valor ser tratado con xito por el proveedor de la CDN sin ms que
de capacidad distinto para cada uno de ellos. redirigir clientes a otros surrogates que proporcionan un
La Fig. 4 muestra un nuevo escenario de una posible CDN tiempo de respuesta menor al evitar rutas congestionadas o
donde la capacidad de los servidores se ha fijado en base a las sobrecarga en los servidores. Un efecto flash crowd global
consideraciones previamente citadas. afecta a todo el sistema y resulta difcil hacer algo ya que la
Puede observarse cmo el tiempo de proceso es bastante congestin y la sobrecarga se encuentran distribuidos por todo
reducido, por lo que el tiempo de respuesta global est el sistema y los mecanismos de balanceo son poco exitosos.
principalmente afectado por el tiempo de ida y vuelta (RTT).
Esto es debido a que los servidores se encuentran
V. CONCLUSIONES Y FUTURO TRABAJO
sobredimensionados como consecuencia de un diseo en el
caso peor. Sin embargo, en el caso de una CDN sobre Internet Las redes de distribucin de contenido tratan con un
la cantidad de solicitudes es impredecible. Esto resulta notorio proceso de comunicacin donde la latencia de red y la
en el denominado efecto flash crowd, que corresponde a un capacidad de los servidores son parmetros decisivos en el
aumento brusco e inmenso del nmero de usuarios intentando tiempo de respuesta percibido por el usuario, as como la
acceder simultneamente a un servidor web. Este efecto puede capacidad de redireccionamiento del sistema para asociar cada
ser simulado de una forma simplificada mediante un valor cliente que solicita una peticin con un surrogate cercano. La
reducido del factor de capacidad k. Adems, la variable comunidad cientfica ha realizado varios estudios tanto desde
independiente para simular un efecto flash crowd debe ser un punto de vista emprico como analtico. Este trabajo de
el tiempo, y no la probabilidad de acierto. La Fig. 5 muestra investigacin se ha centrado en el ltimo caso, partiendo de un
trabajo previo donde se presentaba un modelo simplificado de
una posible simulacin donde el factor de capacidad efectivo k
una CDN, el cual se ha ampliado de una forma ms realista.
es una variable aleatoria, aunque siempre garantizando el
En este trabajo se ha llegado a las siguientes conclusiones:
cumplimiento del factor de estabilidad en un sistema M/M/1.
x Resulta deseable descargar todo el contenido a los
Sus mrgenes de variacin se encuentran entre un valor
surrogates desde el punto de vista del tiempo de ida y
bastante reducido (kmn=1.001) y un valor mximo dado (kmx).
vuelta (RTT). Adems, el tiempo de ida y vuelta sigue
Adems el efecto flash crowd afecta tambin a la velocidad
(bajo condiciones razonables) un comportamiento lineal
efectiva de transferencia en la red, ya que aumenta la
dependiendo de la probabilidad de acierto.
congestin. Este efecto se simular mediante una variacin del
x Si los servidores se encuentran dimensionados con un
parmetro N que representaba el nmero necesario de
valor de capacidad que solamente es dependiente de la
retransmisiones para satisfacer una peticin de un cliente. La
tasa de trfico de llegada, la probabilidad de acierto no
Fig. 5 muestra un posible efecto flash crowd a las 03:00h. El afecta al tiempo de proceso. Bajo esta suposicin uno
valor absoluto del tiempo de respuesta no es importante en puede discriminar en el anlisis cuando el contenido es
224 IEEE LATIN AMERICA TRANSACTIONS, VOL. 3, NO. 2, APRIL 2005
servido nicamente por el servidor origen (no hay CDN), [9] C. Cameron, S. Low and D. Wei, "High-Density model for server
allocation and placement", ACM SIGMETRICS02, Marina del Rey, CA
por los surrogates (100% de acierto) o una situacin (USA), June 2002.
intermedia entre ambos. [10] D. Agrawal, J. Giles and D. Verma, "On the performance of Content
x Los casos reales implican una capacidad de los servidores Distribution Networks", International Symposium on Performance
Evaluation of Computer and Telecommunication Systems, Orlando
limitada, normalmente determinada en la fase de diseo
(USA), July 2001.
en base a la poblacin de clientes esperada. Esto supone [11] M. Masa and E. Parravicini, "Impact of Request Routing Algorithms on
un valor mayor en el tiempo de respuesta cuando la the Delivery Performance of Content Delivery Networks", 22nd IEEE
probabilidad de acierto aumenta, por lo que la descarga International Performance Computing and Communications Conference,
Phoenix (USA), April 2003.
total de contenido no es deseable desde este punto de [12] S. Calo, D. Verma, D. Agrawal, and J. Giles, "On the Effectiveness of
vista. Por tanto, se ha de llegar a una solucin de Content Distribution Networks, International Symposium on
compromiso entre tiempo de ida y vuelta y tiempo de Performance Evaluation of Computer and Telecommunication Systems",
San Diego (USA), July 2002.
proceso.
x El efecto flash crowd puede ser causado por congestin
en la red, sobrecarga en los servidores o por ambos VII. BIOGRAFAS
factores. Estos escenarios pueden simularse mediante
valores elevados del factor de retransmisin N y de los Benjamn Molina recibi su titulacin en ingeniera de
tiempos de ida y vuelta , y modificando adecuadamente telecomunicacin por parte de la Universidad Politcnica
el factor de capacidad k y las tasas de trfico . Dado que de Valencia en 2001. Realiz su premiado proyecto fin de
carrera en el campo de las tecnologas de voz en Tissat,
las variables afectan de forma separada a cada surrogate, donde posteriormente trabaj durante un ao
servidor origen y cliente, el efecto flash crowd se puede desarrollando interfaces web para PDAs y servicios de
reproducir tanto a nivel local, afectando a unos pocos integracin de telefona y computador sobre la plataforma
Java. Posteriormente pas a ser miembro del grupo de Sistemas y
nodos de la red, como a nivel global, sobre toda la CDN. Aplicaciones de Tiempo Real Distribuido en el Departamento de
Comunicaciones, en la universidad donde haba estudiado. Benjamn Molina
Como posible futuro estudio a este trabajo, resulta
est actualmente envuelto en proyectos relacionados con entornos de
interesante el hecho de introducir diferentes polticas de simulacin de redes que cubren la distribucin de contenido y aspectos de
asignacin de pesos en las probabilidades de contacto de los escalabilidad que puedan afectar a redes reales. Su inters principal est
surrogates, as como una distribucin no uniforme de clientes centrado en la distribucin multimedia a travs de Internet y las diferentes
tecnologas asociadas.
y surrogates con el fin de obtener tanto clientes densos como
dispersos dentro del mimo escenario o CDN. Adems,
tambin conviene introducir modelos complementarios de
Carlos E. Palau recibi su titulacin y su tesis doctoral,
mecanismos de redireccin de clientes y ubicacin de ambas en ingeniera de telecomunicacin, en la
servidores. Una vez analizadas todas estas incorporaciones, se Universidad Politcnica de Valencia, en 1993 y 1997,
pretende abordar el comportamiento de la CDN en base a las respectivamente. Es profesor asociado en la Escuela
Tcnica Superior de Ingenieros de Telecomunicacin de
posibles aplicaciones que soporte. la Universidad Politcnica de Valencia y trabaja en el
grupo de Sistemas y Aplicaciones de Tiempo Real
VI. REFERENCIAS Distribuido del Departamento de Comunicaciones.
Actualmente se encuentra envuelto en proyectos de
investigacin y desarrollo de aplicaciones multimedia y tecnologas de tiempo
[1] P.S.M. Sayal and P. Vingralek, "Selection algorithms for replicated web real, medicina, educacin y comunicaciones. El Dr. Palau es miembro de IEEE
servers", ACM SIGMETRICS Internet Server Performance Workshop, e IAESTED.
Madison (USA), June 1998.
[2] D. Verma, Content Distribution Networks, an engineering approach,
New York, John Wiley, 2002.
[3] D. Liben-Nowell, H. Balakrishnan and D. Karger, "Analysis of the Manuel Esteve obtuvo su titulacin en Ingeniera
evolution of peer-to-peer systems", ACM Conference on Principles of Informtica en 1989 y su ttulo de Doctor en ingeniera de
Distributed Computing, Monterrey (USA), July 2002. Telecomunicacin en 1994, ambos por la Universidad
[4] Akamai, http://www.akamai.com. Politcnica de Valencia. Es catedrtico en la Escuela
[5] K.L. Johnson, J.F. Carr, M.S. Day and M.F. Kaashoek, "The measured Tcnica Superior de Ingenieros de Telecomunicacin de
performance of content distribution networks", 5th International la Universidad Politcnica de Valencia (UPV), y dirige el
Workshop on Web Caching and Content Distribution, Lisbon (Portugal), grupo de Sistemas y Aplicaciones de Tiempo Real
June 2000. Distribuido del Departamento de Comunicaciones.
[6] Z. Mao, C. Cranor, F. Douglis and M. Rabinovich, "A precise and Actualmente trabaja en proyectos de investigacin y desarrollo de tecnologas
efficient evaluation of the proximity of web clients and their local DNS multimedia y tiempo real para aplicaciones industriales, mdicas, educativas y
servers", USENIX02, Monterrey CA (USA), June 2002. de comunicaciones. Es responsable de la Universidad Virtual de la UPV y ha
[7] J. Kangasharju, K.W. Ross, and J.W. Roberts, "Performance Evaluation codirigido EUROMEDIA 01.
of Redirection Schemes in Content Distribution Networks", 5th
International Workshop on Web Caching and Content Distribution,
Lisbon (Portugal), June 2000.
[8] R. P. Doyle, J. S. Chase, S. Gadde and A. M. Vahdat, "The trickle-down
effect: web caching and server request distribution", Computer
Communications, vol. 25, 2002, pp. 345-356.