Вы находитесь на странице: 1из 3

Semntica de fallos

Los
sistemas
distribuidos
constan
de
una
multitud
de
componentes hardware y software que pueden fallar. En muchos sistemas, estos
fallos pueden llegar a producir inconsistencias y, por lo tanto, la no disponibilidad
del servicio que estaban ofreciendo.

Una primera clasificacin de acuerdo a la gravedad de fallos


Fallo de tipo crash: En este modo, el fallo de un proceso consiste en una parada
prematura, es decir, un proceso acta en el sistema correctamente y, en un
momento dado, deja de estar operativo. Derivaciones de este modo de fallo son:
o Fallo silencioso. Cuando un proceso falla, deja de interactuar con el
resto del sistema.
o Fallo parada. Cuando un proceso falla, avisa de ello a todos los
procesos del sistema y luego se para.

Fallo de omisin. Este modo contiene al fallo de tipo crash y, adems, en


l se contemplan omisiones en los mensajes que se envan o reciben. Es
equivalente a decir que, adems de fallar un proceso, el servicio de
comunicacin puede perder mensajes.

Fallo de temporizacin. En los sistemas de tiempo real no slo es


importante que los resultados obtenidos sean correctos, sino que adems
deben haberse conseguido dentro de unos requisitos temporales. Un fallo
de temporizacin, adems de contener el modo de fallo de omisin,
aparece cuando un proceso se ejecuta ms rpida o lentamente de lo
definido en su especificacin. Si se asocia al servicio de comunicacin, es
equivalente a decir que la red transporta los mensajes ms rpidos o ms
lentamente de lo que dice su especificacin.

Fallo arbitrario. Tambin conocido como fallo bizantino o malicioso, es


un modo de fallo que define un comportamiento no determinista de los
procesos. En este modo se engloban todos los modos de fallo anteriores.
Los elementos del sistema pueden no respetar su especificacin en
cualquier momento.

La segunda clasificacin de fallos de acuerdo a su rendimiento

Fallo transitorio: se produce de manera aislada y desaparecen al cabo de


un tiempo. La forma en que aparecen y la duracin es aleatoria.

Fallo intermitente: se produce aleatoriamente de vez en cuando, se deben a


cierta combinacin especfica del sistema.

Fallo permanente: permanece hasta ser reparado.

Se utiliza una tercera clasificacin acorde a la naturaleza del fallo.

Fallos accidentales: se producen de manera accidental.

Fallos intencionales: son provocados de forma maliciosa.

Para construir un sistema tolerante a fallos, habitualmente se consideran dos


alternativas.
La primera consiste en ejecutar sistemas software sobre hardware especializado
tolerante a fallos (CPU y memoria principal replicadas, discos espejo, varios buses
y rutas de datos, entre otros.) pero; debido a razones econmicas
fundamentalmente no es tan viable. La segunda aproximacin consiste en
usar hardware estndar para soportar tolerancia a fallos, replicando
ese hardware y manteniendo esa replicacin a nivel software. De esta forma se
consigue un sistema distribuido tolerante a fallos.

http://www.iuma.ulpgc.es/users/lhdez/inves/pfcs/memoriaivan/node2.html#SECTION00250000000000000000
cours_tolerance pp 16,22,23,24 del pdf.

Pdf thes-samir-jafar, pp. 27,28.

Вам также может понравиться