Академический Документы
Профессиональный Документы
Культура Документы
Facultad de Ciencias
Escuela de Computacin
Lecturas en Ciencias de la Computacin
ISSN 1316-6239
ND 2015-01
Lecturas en Ciencias de la Computaci
on
ISSN 1316-6239
Este documento pretende servir como una gua para el estudio de algoritmos y estructuras de datos b
asicas para la composici
on
de soluciones computacionales basadas en algoritmos sobre lenguajes imperativos. La estructura del documento corresponde
en gran parte con el programa de estudios que ofrece la Licenciatura en Computaci
on de la Universidad Central de Venezuela
en su Plan de Estudio 2004, especficamente a la asignatura Algoritmos y Estructuras de Datos correspondiente al 2do perodo
semestral de una carrera de 10 perodos. As, se busca introducir al estudiante en las destrezas en el a
rea de la algortmica
y la programaci
on para la construcci
on de programas de manera sistem
atica y haciendo un uso eficiente de los recursos
computacionales. Entonces se busca explicar conceptos te
oricos involucrando a su vez el desarrollo de ejercicios pr
acticos.
El documento se divide en seis grandes partes: Tipos de Datos, Recursi
on, Backtracking, Complejidad, Estructuras Din
amicas,
y Arboles.
Para cada parte se trata de mostrar las siguientes secciones:
Definiciones: Se muestran conceptos b
asicos dentro de un marco te
orico asociado al tema a estudiar.
Clasificaciones/Implementaciones: Por cada secci
on se clasifica el t
opico de estudio y/o se muestran las diversas implementaciones algortmicas de las estructuras de datos o tecnicas.
Ejercicios: Ciertos algoritmos/ejemplos se muestran para ser explicados en detalle.
Algoritmos: Un conjunto de algoritmos/ejemplos cl
asicos son mostrados explicando en que consiste el problema.
Ideas Finales: Un conjunto de ideas principales para el cierre de cada secci
on.
Problemas: Se listan ejercicios simples para ser realizados por los estudiantes o en clases pr
acticas.
El orden de las secciones no es estricto, pero en muchas de ellas se requiere informaci
on previa. Por ejemplo, para el tema
de Arboles
se requiere del conocimiento base explicada en la secci
on Recursi
on por ser una estructura de datos recursiva por
definici
on. Igualmente, es el facilitador/docente quien decide el orden al momento de difundir conocimiento.
Este documento no contiene todos los aspectos relacionados con cada secci
on, ya que trata de ser una gua para un perodo de
clases de aproximadamente 4 horas semanales durante un perodo de 14 semanas (56 horas). As, de antemano se recomienda
complementar su utilizaci
on con otros textos o material bibliogr
afico de los t
opicos explicados.
Todo el documento emplea la notaci
on Alpha1 la cual consiste en una notaci
on algortmica b
asica basada en pseudoc
odigo
para la escritura de algoritmos y estructuras de datos. La idea es ser consistente al momento de la docencia y no incurrir en
errores como mezclar notaciones de diversos lenguajes de programaci
on. Adem
as, la notaci
on permite una r
apida conversi
on
a cualquier lenguaje de programaci
on moderno.
Este documento puede contener errores. Por ello, se recomienda buscar la u
ltima versi
on en el repositorio git de direcci
on
https://github.com/esmitt/notas-docencia-ayed.git. La ayuda siempre es bienvenida por ello puede enviar un pull request en
Github para colaborar.
1 La
especificaci
on completa de la notaci
on Alpha est
a disponible en http://goo.gl/SOHo8h
Tabla de Contenidos
I
Tipos de Datos
1 Definiciones
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
6
7
8
8
8
9
9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
10
10
11
12
12
13
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
13
14
14
15
5 Ideas Finales
16
6 Problemas
16
II
18
Recursividad
1 Definiciones
18
2 Algoritmo Recursivo
18
3 Ejecuci
on
19
4 Clasificaci
on
19
20
6 Ejercicios
20
6.1 Imprimir una secuencia de n
umeros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.1.1 Potenciaci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.1.2 Convertir un decimal a binario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
7 Algoritmos
7.1 Collatz . . . . . . .
7.2 B
usqueda Binaria .
7.3 Hanoi . . . . . . .
7.4 Palndrome . . . .
7.5 Invertir un n
umero
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
23
23
23
23
24
24
8 Ideas Finales
24
9 Problemas
25
III
26
Backtracking
1 Definiciones
26
2 T
ecnica de Backtracking
26
3 Clasificaci
on
28
4 Ejercicios
28
4.1 Suma Parcial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.2 n-Reinas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.3 Sudoku . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5 Algoritmos
31
5.1 Laberinto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.2 Problema de la Mochila . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
6 Ideas Finales
32
7 Problemas
32
IV
34
Complejidad en Tiempo
1 Definiciones
34
2 Operaciones Elementales
34
2.1 Tasas de crecimiento m
as comunes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3 Notaciones Asint
oticas
36
4 An
alisis de Complejidad
37
4.1 Regla de la Suma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2 Regla del Producto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5 Complejidad de Algoritmos Iterativos
38
6 Ejercicios
39
6.1 B
usqueda Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
6.2 B
usqueda Binaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
6.3 Bubble Sort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
7 Algoritmos
42
45
10 Problemas
46
48
1 Tipo List
1.1 Simplemente Enlazada
1.1.1 Especificaci
on .
1.1.2 Ejemplos . . .
1.1.3 Implementaci
on
1.2 Doblemente Enlazada
1.2.1 Especificaci
on .
1.2.2 Ejemplos . . .
1.2.3 Implementaci
on
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
48
48
48
49
50
54
54
55
55
2 Lista Multienlazada
56
2.1 Tipo Sparse Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.1.1 Implementaci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.1.2 Ventajas y Desventajas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3 Tipo Stack
3.1 Especificaci
on . . . . . . .
3.2 Implementaci
on . . . . . .
3.3 Algoritmos . . . . . . . .
3.3.1 Parentesis . . . . .
3.3.2 Notaci
on PostFija
3.3.3 Invertir Pila . . . .
3.4 Recursi
on . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
59
59
60
61
61
62
62
63
4 Tipo Queue
64
4.1 Especificaci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2 Implementaci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5 Otras estructuras
5.1 Tipo Double-ended Queue
5.2 Tipo Priority Queue . . .
5.3 Tipo Associative Array . .
5.4 Tipo Set . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
66
66
66
66
67
6 Ideas Finales
67
7 Problemas
67
Arboles
68
VI
1 Definiciones
68
2 General Tree
70
2.1 Especificaci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
2.2 Implementaci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.3 Recorridos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3 Binary Tree - BT
3.1 Definiciones . . . . . . . . . . . . .
3.2 Recorridos . . . . . . . . . . . . . .
3.3 Implementaci
on . . . . . . . . . . .
3.4 Algoritmos . . . . . . . . . . . . .
3.4.1 Contar el n
umero de nodos
3.4.2 Buscar el elemento mnimo
3.4.3 Calcular la profundidad . .
3.4.4 Arboles
binarios iguales . .
3.4.5 Suma de los nodos . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
71
72
72
73
75
75
75
76
76
76
92
9 Problemas
93
Parte I
Tipos de Datos
En la construcci
on de algoritmos eficientes, no solo basta la utilizaci
on de la l
ogica correcta para la resoluci
on del problema
sino tambien las estructuras de datos involucradas en dicho algoritmo. Las estructuras de datos est
an compuestas por un
conjunto de variables que almacenar
an los valores necesarios para un algoritmo. Estos valores toman informaci
on de acuerdo
a un conjunto finito definido por un lenguaje de programaci
on que los identifica. Asociado a estos valores se encuentra una
serie de operaciones particulares. A este conjunto de valores y operaciones particulares se le conoce como tipo de dato de un
lenguaje de programaci
on.
A continuaci
on estudiaremos en que consisten los tipos de datos, una peque
na clasificaci
on, que operaciones est
an asociadas
a estos y c
omo est
an representadas en el computador.
Definiciones
Un tipo de dato es un conjunto de valores y un conjunto de operaciones aplicadas a dichos valores en un lenguaje de programaci
on. Dependiendo del lenguaje de programaci
on, un tipo de dato puede ser una estructura de datos, un tipo definido por
el programador, un tipo abstracto, una clase, entre otros. Es posible clasificar los tipos de datos en tipos simples o elementales
y en tipos compuestos o estructurados. En la Fig. 1 se muestra la clasificaci
on empleada de tipos de datos para la notaci
on
empleada.
Figura 1: Clasificaci
on de los tipos de datos seg
un su naturaleza.
El tipo simple est
a formado por aquellos que no pueden dividirse en componentes, es decir, forman en s un tipo de dato
indivisible o tipo base. Por el contrario, el tipo compuesto est
a formado por componentes tal que puede descomponerse o
dividirse en tipos simples. Entre los tipos simples est
an el tipo Char, Pointer, Integer, Real, Boolean y Enum. En el tipo
compuesto se encuentra el tipo String y Array, los cuales pertenecen a una subclasificaci
on de acuerdo al tipo de elementos
simples que lo conforman (tipo homogeneo); y los tipo Register y File que pueden contener elementos de diversos tipos
(heterogeneo).
Es importante destacar que la clasificaci
on se enfoca en los tipos de datos est
aticos o creados de forma directa en la mayora de
los lenguajes de programaci
on. Se excluyen tipos compuestos homogeneos din
amicos como listas, a
rboles, grafos, entre otros.
B
asicamente en un lenguaje de programaci
on, es posible expresar los valores de un tipo de dato de 3 formas:
1. Constantes: denotan un valor en particular dentro del conjunto posible para un tipo de dato.
2. Identificadores, nombres o variables: representan un valor cualquiera del conjunto posible para un tipo de dato asociado
a una combinaci
on de caracteres (dependiente del lenguaje).
3. Expresiones: denotan valores como resultado de operaciones entre constantes/identificadores/otras expresiones.
Cada tipo de dato determina una clase de valores que puede asumir un identificador o expresi
on las cuales pertenecen a un
solo tipo. Por su parte, los operadores act
uan sobre operandos de alg
un tipo y arrojan como resultado otro tipo (que puede ser
del mismo tipo o no). Al mismo tiempo, la utilizaci
on de los tipos de datos proporciona un ocultamiento de la representaci
on
interna en el computador de dichos tipos, ofreciendo una abstracci
on que es beneficiosa para la portabilidad y sem
antica de
los programas.
Del mismo modo, la verificaci
on de los tipos durante el programa es una tarea importante a realizar. Esta verificaci
on consiste
en detectar que cada operaci
on reciba el n
umero adecuado de argumentos y que estos sean del tipo adecuado. Esto puede ser
realizado de forma din
amica o de forma est
atica, es decir, en momento de ejecuci
on o compilaci
on/traducci
on respectivamente2 .
2 Comentar
A continuaci
on estudiaremos los tipos de datos indicando su organizaci
on l
ogica de definici
on, as como las operaciones y
atributos que posee. Tambien se estudiar
a la representaci
on que manejan internamente en el computador, la cantidad de
memoria que ocupan (CM(tipo)), y el conjunto de valores que puede tomar denominado como cardinalidad (CARD(tipo)).
En este estudio, no se tomar
a en cuenta el controlador o descriptor que algunos lenguajes de programaci
on asocia a cierto
tipos de datos para realizar chequeos de desbordamiento que son ejecutados en tiempo de ejecuci
on. Este descriptor puede
incluir identificador u
nicos que asocian a un identificador as como lmites o identificadores de subtipos.
Los valores de los tipos simples se codifican en la memoria del dispositivo como una secuencia de 0s y 1s. Estos est
an presente
en la mayora de lenguajes de programaci
on y consideraremos los m
as esenciales. Por lo general, los tipos de dato simple
ocupan lo que se denomina una palabra en memoria, debido a que en el peor de los casos los datos est
an alineados a frontera de
palabra. Una palabra se define como una cantidad de bytes que es dependiente del hardware y est
a directamente relacionada
con el direccionamiento. Por ejemplo, en la tabla 2 se muestra el espacio en bytes ocupado para una palabra de memoria en
diversas arquitecturas.
Arquitectura
Tama
no de la Palabra
16 bits
32 bits
64 bits
128 bits
2 bytes
4 bytes
8 bytes
16 bytes
2.1
Tipo Integer
// r e p r e s e n t a c i o
n d e l n
u mero | 6|
// i n v e r t i r t o d o s l o s b i t s
// s u m a r l e e l v a l o r de 1 , e n t o n c e s 1 1 1 1 1 0 1 0 = 6
Nombre Usual
byte
16
short
32
int
64
long / int64
Rango
Con signo: de -8 a 7
Sin signo: de 0 a 15
Con signo: de -128 a 127
Sin signo: de 0 a 255
Con signo: de -2147483648 a 2147483647
Sin signo: de 0 a 4294967295
Con signo: de -9223372036854775808 a 9.223372036854775807
Cardinalidad
23 1 valores
28 1 valores
232 1 valores
264 1 valores
Tabla 2: Rangos y cardinalidad para algunos valores comunes del tipo Integer empleando n bits.
2.2
Tipo Real
Representaci
on: Un n
umero del tipo real es representado con el metodo de punto flotante el cual es una aproximaci
on de dicho
n
umero en el computador. Para ello se requiere de un n
umero fijo llamado parte significativa, y un exponente. Este proceso
siempre asumiendo que la base es 2 (base binaria), en ocasiones puede variar a base 10 o 16. Entonces, un n
umero puede ser
representado como:
parte signif icativa baseexponente
Por ejemplo:
95.164 = 95164 102
donde 95164 es la parte significativa, la base es 10, y -2 es el exponente.
Desde hace dos decadas, se emplea en la mayora de los sistemas computacionales el est
andar IEEE 754 para la representaci
on
de un n
umero en punto flotante (precisi
on simple o precisi
on doble). En dicho est
andar, se consideran algunos aspectos para
su representaci
on y almacenamiento:
Existe un bit de signo, donde 0 representa un n
umero positivo y 1 un n
umero negativo
El exponente es base 2
Existe un campo de exponente donde se almacena el valor del exponente sum
andole el valor de 127 (precisi
on simple)
o 1023 (precisi
on doble).
Se asume que el primer bit de la parte significativa (denominada mantisa) es siempre 1.f
Es importante destacar que el n
umero de bits n empleado depende de la arquitectura del sistema. Brevemente, se muestra el
proceso de convertir un n
umero a real a su representaci
on en IEEE 754.
22, 625(base10) = 10110, 101(base2)
(1 24 ) + (0 23 ) + (1 22 ) + (1 21 ) + (0 20 ) + (1 21 ) + (0 22 ) + (1 23 )
Primero, el proceso consiste es desplazar hacia la izquierda la coma decimal tal que el n
umero se represente de la forma
1.b1 b2 b3 b4 . . . bk 2k , donde b1 b2 b3 b4 . . . bk representa a la mantisa y k al exponente. De esta forma queda:
1, 0110101 24
Por su parte k = 4, el exponente, pero se almacena sum
andole el valor de 127 (precisi
on simple), quedando 131 y su
representaci
on en binario es 10000011. Finalmente, la representaci
on en IEEE 754 de valores de precisi
on simple es 1 bit
para el signo, 8 bits para el exponente y 23 bits para la mantisa. Finalmente, el n
umero 22,625 en binario es:
0 10000011 01101010000000000000000
2.3
Tipo Char
2.4
Tipo Boolean
Conjunto de Valores: El tipo Boolean tiene dos posible valores (generalmente llamados true y false) que representan los valores
de verdad especificados en la a
lgebra de Boole.
Conjunto de Operaciones: Este tipo de dato est
a asociado principalmente a sentencias condicionales que cambian el control
del flujo de ejecuci
on de un programa. Las operaciones algebraicas tales como and, or, == y not son parte del conjunto posible
de operaciones que soporta.
on. Sin embargo, es usual que la unidad mnima de
Representaci
on: Para ello solo bastara un bit para su representaci
almacenamiento para un tipo de dato sea 1 palabra, por lo que se utiliza 1 palabra para representarlo. Si una palabra se
define como 8 bits, entonces se requiere de un byte para su almacenamiento donde el valor de 0 representa a false y 1 a true.
Muchas veces, el valor de true se asocia con cualquier valor distinto de 0 (depende del lenguaje de programaci
on).
La cantidad de memoria que ocupa este tipo es 1 palabra CM(Boolean) = 1 palabra.
Cardinalidad: Dado que solo toma dos valores posible, su cardinalidad es 2.
2.5
Tipo Enum
Conjunto de Valores: El tipo Enum (tambien llamado enumerado) es un tipo que consiste en un conjunto de valores llamados
elementos, miembros o enumerados del un tipo de dato. Un tipo enumerado est
a compuesto por valores constantes del lenguaje.
Por ejemplo, el tipo Enum llamado suit, contiene dentro de su conjunto a los valores CLUB, DIAMOND, HEART y SPADE.
El orden de los valores constantes es importante en la definici
on de un tipo Enum. Generalmente y por convenci
on, se suelen
colocar los elementos con letras may
usculas.
Conjunto de Operaciones: Los operadores aritmeticos y relacionales son posibles para cada uno de sus elementos, pero siempre
tomando en cuenta que el resultado de la operaci
on se encuentre en el rango definido por el enumerado.
Representaci
on: A cada constante del tipo Enum se le asocia un valor entero comenzando desde el 1, y de manera consecutiva
para los otros elementos. Por ejemplo, la siguiente definici
on es correcta:
Type Enum e D i r = [ N O R T H , E A S T , S O U T H , W E S T ]
eDir direction = 2
select
d i r e c t i o n == N O R T H :
P r i n t ( Ha ci a e l N o r t e )
break
d i r e c t i o n == E A S T :
P r i n t ( Ha ci a e l E s t e )
break
d i r e c t i o n == S O U T H :
P r i n t ( Ha ci a e l Sur )
break
d i r e c t i o n == W E S T :
P r i n t ( Ha ci a e l O e s t e )
break
end
La salida ser
a Hacia el Este, y dado que es posible asignarle valores del tipo Integer directamente a un tipo Enum, entonces
se representa como un valor entero que representa la cantidad de elementos que posee el enumerado. Para el caso del ejemplo,
se almacena el valor de 4.
La cantidad de memoria que ocupa este tipo es 1 palabra CM(Enum) = 1 palabra.
Cardinalidad: La cardinalidad se deriva del n
umero de elementos o miembros del tipo Enum.
2.6
Tipo Pointer
Un tipo Pointer se refiere a valores que hacen referencia otro valor almacenado en una posici
on de memoria. Entonces, este
tipo de dato referencia a una direcci
on de memoria. En la secci
on 4 se hace un estudio detallado de este tipo de dato. Sin
embargo, en este punto podemos denotar que la cantidad de memoria que ocupa es tambien 1 palabra CM(Pointer) = 1
palabra.
2.7
Ejemplo de declaraciones
Notaci
on Alpha
Integer iValue = 3
Real rValue = 3.14159
Char cValue = x
Boolean bValue = rValue <iValue
Enum eValue = [N, S, E, W]
Integer * pValue
C/C++
int iValue = 3;
float rValue = 3.14159;
char cValue = x;
bool bValue = rValue <iValue
enum eValue {N, S, E, W};
int * pValue;
Java
int iValue = 3;
float rValue = 3.14159;
char cValue = x;
boolean bValue = rValue <iValue
public enum eValue {N, S, E, W};
N/A
Size
Size
Size
Size
Size
of
of
of
of
of
c h a r : << s i z e o f ( c h a r ) << e n d l ;
i n t : << s i z e o f ( i n t ) << e n d l ;
s h o r t i n t : << s i z e o f ( s h o r t i n t ) << e n d l ;
l o n g i n t : << s i z e o f ( l o n g i n t ) << e n d l ;
f l o a t : << s i z e o f ( f l o a t ) << e n d l ;
Cuando se desea contener una cantidad de tipos de datos considerable o se requiere una estructura m
as compleja para resolver
un problema, se emplean otros tipos de datos: los tipos compuestos.
Como se menciono anteriormente, un tipo compuesto representa a un conjunto de tipos simples que forman al tipo compuesto.
Generalmente, un tipo compuesto forma parte de diversos lenguajes de programaci
on como tipo de dato donde cada uno de sus
componentes son accedidos. Principalmente se estudiar
a el tipo Array, String, Register y File. N
otese que tipos homogeneos
y de naturaleza din
amica como lo son el tipo List, Queue, Stack, Tree se consideran tipos compuestos.
3.1
3.1.1
Tipo Array
Unidimensional
Conjunto de Valores: Valores que pueden ser simples o compuestos de la forma (eli , eli+1 , ..., els1 , els ), donde ei es del tipo
base del arreglo, li representa el lmite inferior y ls el lmite superior. As, el n
umero de valores es ls lis + 1, y sobre cada
valor se aplican las mismas operaciones del tipo base del arreglo.
Operaci
on Constructora: Es posible definir un arreglo y asignar valores de diversas formas. La primera consiste en crear el
arreglo y luego asignar sus valores uno a uno:
Array a V a l u e s o f I n t e g e r
aValues [ 1 ] = 1
aValues [ 2 ] = 1
aValues [ 3 ] = 2
aValues [ 4 ] = 3
aValues [ 5 ] = 5
[1..5]
En dicha definici
on se observa que el n
umero de elementos es ls li + 1 = 5 1 = 4 y que luego de asigna uno a uno sus
valores. Por otro lado, se pueden definir los valores del arreglo unidimensional por extensi
on en el momento de su construcci
on
de la siguiente forma:
Array a V a l u e s o f I n t e g e r
[ ] = { 1 , 1 , 2 , 3 , 5}
No se indica el tama
no del arreglo debido a que la operaci
on constructora permite asignarle directamente los valores y
determinar su dimensi
on.
ormula de acceso consiste en localizar al elemento de la posici
on i del arreglo A empleando una
F
ormula de Acceso: La f
direcci
on de memoria base dirBase:
A(i) = dirBase + (i li) CM (T Base)
Con la f
ormula de acceso es posible localizar un elemento del arreglo unidimensional con solo la direcci
on de memoria inicial
asumiendo que cada elemento se encuentra contiguo en memoria. De esta forma, solo empleando desplazamientos es posible
tener acceso a un elemento. En la Fig. 2 se muestra un ejemplo para el elemento i del arreglo A[i] tal como se mostr
o en la
f
ormula anterior.
i
Figura 2: La f
ormula de acceso permite ubicar el elemento i de un arreglo unidimensional A dada su direcci
on de memoria
base (i.e. la direcci
on de A[5]) en los lmites li ls.
Cardinalidad: La cardinalidad del tipo Array para el caso unidimensional es
ls
Y
i=li
10
Cantidad de Memoria: La cantidad de memoria que ocupa (complejidad en espacio) de un tipo Array unidimensional se define
como:
CM (Array1D ) = CM (T ipoBase) (ls li + 1)
En algunos lenguajes de programaci
on se suele a
nadir en el espacio del tipo Array una cabecera o header, tambien llamado
descriptor, que almacena los valores de los lmites del arreglo que es de utilidad para el compilador. En los lenguajes modernos,
este valor no es empleado porque se definen correctamente lo lmites o se calculan en tiempo de ejecuci
on por el compilador.
3.1.2
Bidimensional
of Integer
= 1
= 1
= 2
= 3
= 5
= 8
[1..2][1..3]
[ ] [ ] = { { 1 , 1 , 2 } , { 3 , 5 , 8}}
F
ormula de Acceso: La f
ormula de acceso consiste en localizar al elemento de la posici
on (i, j) de la matriz M empleando una
direcci
on de memoria base dirBase:
M (i, j) = dirBase + [(i li1 ) (ls2 li2 + 1) + (j li2 )] CM (T ipoBase)
La Fig. 3 muestra un ejemplo para ubicar la posici
on (i, j) dada la direcci
on de memoria de inicio de la estructura de datos
(i.e. posici
on M [1][1]). La f
ormula busca ubicarse i li1 filas desde la posici
on inicial, la cantidad del n
umero de filas es
ls2 li2 + 1. Por u
ltimo (debajo de las 3 filas color amarillo), se hace un desplazamiento j li2 m
as all
a del inicio tal como
se hace en un arreglo unidimensional.
li1 li1+1li1+2
li2
li1+1
li2+2
(i,j)
ls2-2
ls2-1
ls2
Figura 3: La f
ormula de acceso permite ubicar el elemento (i, j) de una matriz M dada su direcci
on de memoria base en los
lmites li1 , ls1 a li2 , ls2 .
Cardinalidad: La cardinalidad para el caso bidimensional es
ls1
ls2
Y
Y
i=li1 i=li2
Cantidad de Memoria: La cantidad de memoria que ocupa (complejidad en espacio) de un tipo Array bidimensional se define
como:
11
3.2
Tipo String
Conjunto de Valores: El tipo String se puede definir como un arreglo unidimensional de elementos de tipo Char. Por lo que
cada valor es un tipo Char, y su longitud viene definido por el m
aximo a almacenar en dicho tipo. Este valor m
aximo se define
previamente el algoritmo.
Operaci
on Constructora: Para definir un tipo String se define una variable de dicho tipo y se le asignan valores literales o
de otro identificador del mismo tipo. Es importante destacar que es posible construir un String empleando la operaci
on de
substring como [li..ls] donde li indica un ndice positivo dentro del rango del string y ls un ndice positivo dentro del rango
tal que ls li.
Cardinalidad: La cardinalidad de este tipo se calcula como el tipo Array con base el tipo Char, es decir Card(Char)m , donde
m = ls li + 1 indicando el n
umero m
aximo de elementos del tipo String.
Cantidad de Memoria: La cantidad de memoria que ocupa es simplemente m palabras de memoria.
3.3
Tipo Register
a formado por valores simples o compuestos (e1 , e2 , ..., em1 , em ), en donde ei es del
Conjunto de Valores: Un tipo Register est
tipo Ti .
Operaci
on Constructora: El tipo Register se define como:
Register rData
String sName
I n t e g e r iId
Char c S e x
end
En el c
odigo anterior se declara una variable rData que puede ser empleada en nuestros algoritmos. Por otro lado, es posible
crear un tipo de dato definido por el programador con la instrucci
on Type como sigue:
Type R e g i s t e r r t D a t a
String sName
I n t e g e r iId
Char c S e x
end
rtData oUser1 , oUser2
De esta forma, existe un tipo de dato compuesto heterogeneo rtData y existen dos variables de este tipo llamadas oUser1 y
oUser2.
Operaci
on Selectora: La operaci
on selectora de un tipo Register es a traves del operador punto (.) que permite seleccionar un
elemento (simple o compuesto) del registro. Por ejemplo oUser1.sName = Bart permite asignarle valores del tipo String al
campo sName de la variable oUser1. Es importante notar que tambien es posible asignar valores al tipo Register sin emplear
la operaci
on selectora pero debe ser realizado para todos sus valores (o usar el valor defecto/neutro de cada tipo de dato):
rtData oUser1 , oUser2
o U s e r 1 = { Bart , 7 4 2 , 'M' }
oUser2 = { Lisa , 741 , ' F ' }
F
ormula de Acceso: La f
ormula de acceso para un campo < identif icador > . < campo > del tipo Register, dado su direcci
on
base, se define como:
dirBase +
m
X
CM (Ci )
i=1
donde m es el n
umero de campos del identificador, y CM (Ci ) representa la cantidad de memoria que ocupa el campo i.
Cardinalidad: La cardinalidad de este tipo es:
Card(Register) =
m
Y
i=1
12
Card(Ci )
Cantidad de Memoria: La cantidad de memoria que ocupa es la suma de todos los campos que la conforman,
3.4
Pm
i=1
CM (Ck )
Tipo File
4.1
Conjunto de valores
Los valores asociados al tipo referencia son direcciones de memoria. Si se pueden direccionar 4 GB3 , entonces las direcciones
van desde la posici
on de memoria 0 hasta 232 1 (haciendo abstracci
on de los mecanismos de direccionamiento). Esto va a
depender del tama
no de la direcci
on en una arquitectura dada. La direcci
on 0 por lo general est
a reservada, y se utiliza para
inicializar los apuntadores, o indicar que no est
an apuntando a ning
un valor. La constante N U LL o N IL es empleada para
darle mayor legibilidad a los algoritmos, y no se debe acceder a esta direcci
on que generalmente es la direcci
on 0.
4.2
Conjunto de operaciones
Las operaciones m
as comunes son la asignaci
on y las relacionales. Por lo general s
olo interesa comparaciones de igualdad y
diferente; raramente se requiere comparar (> o <) una direcci
on con otra. Algunos lenguajes soportan aritmetica de punteros
donde es posible incrementar o decrementar una direcci
on. En el caso de la asignaci
on, es importante que ambas direcciones
apunten a elementos de un mismo tipo, pues de lo contrario se podran acceder e interpretar datos de manera err
onea. Dos
apuntadores son iguales si almacenan la misma direcci
on de memoria.
Otro operador es la derreferenciaci
on. Este operador retorna el dato referenciado por el apuntador, y se coloca antes del
identificador que se desea derreferenciar. Se emplear
a el smbolo para derreferenciar y se acostumbra colocarlo entre
parentesis junto con el identificador para mayor legibilidad. A continuaci
on se muestra un ejemplo como continuaci
on del
segmento de c
odigo anterior:
p P o i n t = new P o i n t ; // l a i n s t r u c c i
o n new
p P o i n t . x = 0 // s e a c c e d e l a c o o r d e n a d a
P o i n t p t N e w // s e d e f i n e una v a r i a b l e de
p t N e w = p P o i n t // e l punto apuntado p o r
s e e x p l i c a m
as adelante
x d e l punto pPoint , tambi
e n s e puede e m p l e a r como ( p P o i n t ) . x
t i p o r e g i s t r o Point
p P o i n t e s a s i g n a d o a ptNew
La operaci
on contraria a la derreferenciaci
on es la referenciaci
on (tambien llamada indirecci
on). Este operador retorna la
direcci
on de una variable u objeto. Se debe emplear mediante la palabra ref .
Point ptMyPoint ;
Point pPointer ;
pPointer = r e f ptMyPoint ;
// p P o i n t e r toma l a d i r e c c i
o n en donde e s t a
almacenado
ptMyPoint
pPointer . x = 4
// s e a s i g n a 4 a l campo x de p P o i n t e r . E q u i v a l e a ptMyPoint . x = 4 ;
( r e f ptMyPoint ) . y = 3
// s o l o a manera de e j e m p l o . E q u i v a l e a ptMyPoint . y = 3 ;
(( r e f pPointer ) ) . y = 1
// s o l o a manera de e j e m p l o . E q u i v a l e a ptMyPoint . y = 1 ;
El operador tiene prioridad sobre el operador punto . utilizado para acceder miembros de registros y objetos, y este sobre el
operador ref . Entre otros operadores sobre apuntadores se encuentra el new y delete.
3 En
13
4.2.1
Operador new
Este operador reserva el espacio en memoria suficiente para el tipo de dato especificado como par
ametro y retorna la direcci
on
de memoria que hace referencia a dicho espacio. Si no se logr
o reservar el espacio entonces retorna N IL. Es buena pr
actica de
programaci
on, verificar que se reserv
o la cantidad de memoria solicitada. En los compiladores actuales, si no hay memoria, se
genera una excepci
on. En estos casos, hay que manejar las excepciones, y no el valor de retorno. Unos ejemplos de su sintaxis
se muestra a continuaci
on:
Char p C h a r = new Char
U s e r o U s e r = new U s e r ( Homer )
R ea l p D o u b l e R e a l = new R e a l
Entonces, el operador new reserva el espacio en memoria para el tipo de dato que se est
a creando. Veamos un ejemplo m
as
extenso:
Ejemplos:
I nt e g er pInt
Point pp
p I n t = new I n t e g e r
// s e asume que s i e m p r e s e podr
a r e s e r v a r memoria
p p = new P o i n t
pp . x = 4 ; pp . y = 6 ;
p I n t = 100
Operador delete
14
En caso que User contenga a su vez atributos de tipo apuntador que hayan solicitado memoria din
amica, estos deben ser
liberados en el destructor de la clase User. El operador delete genera un error si la direcci
on no contiene un dato creado
din
amicamente con new, si el dato apuntado ya fue liberado previamente, o si la direcci
on es NIL.
Los datos que fueron creados con el operador new deben ser destruidos con el operador delete. De lo contrario, ese espacio
queda ocupando espacio en memoria hasta que el programa termine su ejecuci
on. Lenguajes como Java y C# destruyen los
objetos autom
aticamente cuando dejan de ser referenciados, es decir, cuando los apuntadores a esas a
reas han desaparecido
del ambiente de referenciaci
on. En el caso de C++, se debe invocar explcitamente al operador delete para liberar la memoria
(con excepci
on de los smart pointer).
4.2.3
Memoria din
amica
Un apuntador es un n
umero que representa una direcci
on, y al igual que el tipo Integer ocupa una palabra de memoria.
Su cardinalidad es la cantidad de memoria asignable. Actualmente, la cantidad de memoria asignable no es u
nicamente la
cantidad de memoria debido a muchos sistemas soportan el concepto de memoria virtual.
Entre las ventajas en la creaci
on de memoria de forma din
amica est
a la de reservar espacio para n componentes de un mismo
tipo de dato. De esta forma, es posible construir un conjunto de datos de un mismo tipo como un arreglo. El siguiente c
odigo
permite crear un arreglo de forma est
atica y din
amica o en tiempo de ejecuci
on.
Array a A r r a y o f R e a l [ 1 . . 6 7 ]
aArray [ 5 ] = 6
R ea l p r A r r a y = new R e a l [ 1 . . 6 7 ]
( prArray + 5) = 6.5
// e s e q u i v a l e n t e a u t i l i z a r p r A r r a y [ 5 ] = 6 . 5
Se puede observar que para el caso del apuntador prArray, dado que es una direcci
on de memoria, se puede aplicar la operaci
on
de suma a la direcci
on base de dicho arreglo en 5 posiciones. El resultado es equivalente a aplicar prArray[5], la cual representa
una forma m
as simple de utilizarla.
Dada que la posici
on del apuntador se encuenta en la primera posici
on de los datos (que estan continuos en memoria) es
posible asignarle un valor a la primera posici
on de la siguiente forma:
prArray = 2.8
Sin embargo, luego de dicho entero se encuentran 66 datos del tipo Integer m
as, que pueden ser accedidos derreferenciando
una posici
on de memoria o de forma convencional con el operador selector [ ].
Dada la diferencia entre aArray y prArray, una definida en tiempo de compilaci
on y la otra en ejecuci
on respectivamente, se
debe tomar en cuenta que el espacio solicitado din
amicamente por prArray debe ser liberado. No basta el operador delete en
su forma convencional puesto que liberara s
olo el primer elemento. Hace falta indicar que el apuntador referencie a una serie
de elementos. De esta manera, se debe emplear la siguiente instrucci
on:
delete
[]
prArray
Este operador libera todos los elementos que esten alojados desde la posici
on apuntada por prArray. Si el contenido del arreglo
son objetos, entonces se invocar
a a los destructores correspondientes. Igualmente, cuando se desea crear un arreglo de objetos
din
amicamente, s
olo puede invocarse al constructor por defecto de los objetos.
Dicho esquema puede aplicarse a arreglos bidimensionales. Un ejemplo para la construcci
on de una matriz din
amica de m n
posiciones donde primero se debe construir un arreglo de m posiciones que contenga a apuntadores del tipo base del arreglo.
Luego, cada posici
on almacenar
a una fila completa del arreglo bidimensional. En este punto, n indica el n
umero de columnas
en cada fila del arreglo. En la Fig. 5 se muestra un ejemplo para un arreglo del tipo Integer con m = 4 y n = 6.
Escribiendo el c
odigo, la construcci
on de la matriz de 4 6 del tipo Integer empleando memoria din
amica con el apuntador
pMatrix queda como:
Const I n t e g e r m = 4
Const I n t e g e r n = 6
I n t e g e r p M a t r i x
I n t e g e r iK
p M a t r i x = new I n t e g e r [ m ]
f o r i K = 1 t o m do
p M a t r i x [ i k ] = new I n t e g e r
end
[n]
Como se observa, se aloja memoria para una alojar apuntadores a las filas para luego, crear dichas filas de forma din
amica del
tama
no de las columnas. Ahora, el proceso para liberar dicha memoria consiste en liberar el espacio de cada fila completa y
15
Ideas Finales
El uso de tipos de datos incrementa la legibilidad y sem
antica de un programa
B
asicamente, se puede clasificar los tipos de datos por la naturaleza de los valores que almacena (simple o compuesto)
o por la forma como son creados (est
atico o din
amico)
La cantidad de memoria de un tipo, llamado complejidad en memoria o espacio que ocupa, corresponde al n
umero de
bytes o palabras en memoria que se requiere para su almacenamiento
Cualquier funci
on recursiva puede ser sustituida por una equivalente iterativa
Problemas
Dise
ne una estructura de datos que permita almacenar eficientemente matrices en forma de la letra Z, es decir, matrices
con elementos significativos en la diagonal de izquierda a derecha desde arriba a abajo, y en la primera y u
ltima fila (con
elementos no significativos en el resto). Calcule su costo de memoria, explique por que es eficiente en comparaci
on con
la representaci
on tpica, su cardinalidad, la f
ormula de acceso para un elemento (i,j) y por u
ltimo elabora un algoritmo
que permita sumar y multiplicar dichas matrices.
Asumiendo que todas las variables est
an contiguas en memoria en el orden que son declaradas, calcule la f
ormula de
acceso a Total[i].A[j], Total[i].x, y Total[i].y dada la direcci
on base de Secret y la siguiente definici
on:
Type R e g i s t e r S e c r e t
Char c
Integer x
R ea l y
Array A o f I n t e g e r [ 1 . . 1 0 ]
end
Array T o t a l o f S e c r e t [ 2 . . 1 ]
Empleando la definici
on del tipo Secret (del problema anterior) y con esta definici
on:
Type Array C I C P C o f S e c r e t [ 1 . . 2 ]
Type R e g i s t e r S o l
Array B o f C I C P C [ 2 . . 3 ]
Boolean bUnBit
end
Array M o o n o f S o l [ 1 . . 1 0 ]
16
17
Parte II
Recursividad
En Ciencias de la Computaci
on, la programaci
on imperativa es un paradigma de programaci
on que describe a un programa
en terminos del estado de dicho programa y las instrucciones que cambian este estado. Entre dicho conjunto de instrucciones
se encuentran los procedimientos/funciones (i.e. unidades invocables), los cuales definen una secuencia de operaciones que
realizan una tarea especfica y que pueden ser invocados desde cualquier secci
on de un programa.
En una unidad invocable U1 el conjunto de instrucciones que se ejecutan siguen un secuenciamiento: inst1 , inst2 , ..., instk .
Ahora, si alguna de las instrucciones corresponde a una llamada a otra unidad invocable U2 entonces se crea un nuevo ambiente
de programa y se ejecutan las instrucciones de esta.
Que sucede si una instrucci
on dentro de U1 invoca a la unidad U1 ?
Para entender mejor este aspecto, vamos a estudiar la Recursi
on.
Definiciones
La recursi
on es un proceso de definir una propiedad, una operaci
on o una funci
on en terminos de s misma. As, es posible
definir un conjunto infinito de objetos/operaciones con una declaraci
on finita. En terminos de Algoritmia, un algoritmo
recursivo contiene en sus instrucciones una invocaci
on a s mismo. El n
umero de invocaciones recursivas debe garantizar la
finalizaci
on de un bloque de instrucciones.
Un ejemplo de conjunto definido de forma recursiva son los n
umeros naturales, donde:
1. 0 es un n
umero natural que pertenece a N
2. n pertenece a N , entonces n + 1 pertenece a N
La recursi
on tambien se puede observar en la naturaleza como la forma de un copo de nieve, o la hoja de helecho. Igualmente,
cuando se coloca un espejo frente a otro sucede que el reflejo de un espejo se observa en el otro que contiene el reflejo del
primero y as de forma sucesiva hasta que se hace imperceptible dicho reflejo.
Existe una tecnica de programaci
on conocida como divide y conquista (divide and conquer) que consiste en dividir un problema
en dos o m
as sub-problemas del mismo tipo (o muy similar) y del mismo tipo, hasta que su soluci
on sea simple. La recursi
on
es una herramienta vital en la tecnica de divide and conquer, donde una invocaci
on recursiva resuelve un problema de menor
tama
no, de forma sucesiva, hasta llegar a un problema que su soluci
on sea directa o muy simple. Posteriormente, cada soluci
on
obtenida se debe combinar para obtener la soluci
on final al problema original.
Por ejemplo, la funci
on Factorial de un n
umero n se puede expresar como:
n! =
si n = 0
si n 1
1
n (n 1)!
Si la operaci
on n! se define como una funci
on llamada Fact con par
ametro n, se puede definir la funci
on factorial como:
Fact (0) = 1
F a c t ( n ) = n F a c t ( n 1) // n > 1
A continuaci
on, estudiaremos que elementos componen a un algoritmo recursivo para su construcci
on.
Algoritmo Recursivo
18
2. Caso(s) recursivo(s): Se refiere a los casos que se resuelven mediante invocaciones a s mismo, y por lo general reduce
el problema de dimensi
on para que se aproxime cada vez m
as a un caso base y pueda ser resuelto de forma simple.
El caso recursivo contiene una operaci
on vital que se refiere a la combinaci
on de las soluciones parciales encontradas.
Generalmente, esta operaci
on constituye una funci
on de mezcla, operaci
on aritmetica, etc.
3. Par
ametros: En toda unidad invocable recursiva se requiere al menos un par
ametro que debe ser modificado en cada
invocaci
on recursiva (reduciendo el tama
no del problema). Los par
ametros de la unidad invocable recursiva ser
an
utilizados (generalmente por valor) en cada instancia para resolver el problema.
Para identificar los elementos mencionados, estudiemos la funci
on Fact que calcula el factorial de un n
umero.
1
2
3
4
5
6
7
f u n c t i o n Fact ( I n t e g e r iN ) : I n t e g e r
i f i N <= 0 t h e n
return 1
else
r e t u r n iN Fact ( iN 1)
end
end
Ejecuci
on
Clasificaci
on
19
Empleando la versi
on recursiva, el c
odigo de Fibonacci se muestra m
as simple y en menos lneas de c
odigo:
f u n c t i o n FibR ( I n t e g e r iN ) : I n t e g e r
i f i N <= 2 t h e n
return 1
else
r e t u r n FibR ( iN 1) + FibR ( iN 2)
end
end
5
4
3
2
3
2
Figura 6: Representaci
on gr
afica de las invocaciones generadas con F ib(5).
Ambas funciones realizan el c
omputo del valor de Fibonacci para un n
umero entero N . Sin embargo, la versi
on recursiva crea
muchos ambientes recursivos durante la invocaci
on de las funciones. Si se coloca de forma gr
afica las invocaciones generadas
con F ib(5) de arriba hacia abajo, con enlaces que indiquen nuevos ambientes de programas, el resultado sera similar a como
se observa en la Fig. 6.
Se puede observar que existen invocaciones duplicadas (e.g. F ib(2) se debe calcular 3 veces) que hacen ineficiente dicha
implementaci
on con respecto a una versi
on iterativa. Entonces, es importante evaluar el costo de construir algoritmos eficientes
vs. legibilidad y simplicidad del c
odigo generado.
Es importante destacar que cualquier funci
on recursiva se puede transformar en una funci
on iterativa. Una forma de realizar
esto es simulando la recursi
on con un Stack (ver la secci
on 3.4, parte V para mayor detalle).
Ejercicios
De forma natural, los algoritmos recursivos intentan solucionar un problema aplicando el concepto de divide y conquista. A
continuaci
on, una serie de ejercicios asociados al tema.
20
6.1
N
otese que cuando el par
ametro sea iN = 0, se crear
a un nuevo ambiente recursivo donde el nuevo par
ametro es iN = 1.
En dicho ambiente, la condici
on ser
a f alse y no se ejecutar
a instrucci
on alguna, volviendo a la siguiente instrucci
on del punto
de invocaci
on cuando iN = 0. La siguiente instrucci
on es P rint(iN ) y as la secuencia se mostrar
a desde 0 a 9.
6.1.1
Potenciaci
on
La operaci
on de potencia consiste en elevar el n
umero x a y (i.e. xy ). Llamando a la funci
on potencia P ow que recibe dos
par
ametros que corresponden a la base y el exponente, se tiene que:
Pow (2, 4) = 16
Pow (3, 4) = 81
Pensando en una versi
on iterativa de P ow, podemos escribirla como:
f u n c t i o n Pow ( I n t e g e r iBase , iExp ) :
i f i E x p == 0 t h e n
return 1
end
Integer iResult = iBase
f o r I n t e g e r i I = 2 t o i E x p do
iResult = iResult iBase
end
return iResult
end
Integer
Para la versi
on recursiva se debe definir, los par
ametros, el caso base y el caso recursivo. Queda claro que los par
ametros solo
son la base y el exponente:
f u n c t i o n Pow ( I n t e g e r iBase , iExp ) :
Integer
Luego, se debe definir el caso base donde se conoce que x0 = 1 y x1 = x. Entonces se puede escribir como:
21
Integer
Ahora para explorar el caso recursivo podemos analizar un poco la secuencia de operaciones que se emplean en el c
alculo de
la potencia: Pow(2,0) = 1
Pow(2,1) = 2
Pow(2,2) = 2 * Pow(2,1) = 2 * 2 = 4
Pow(2,3) = 2 * Pow(2,2) = 2 * 4 = 8
Pow(2,4) = 2 * Pow(2,3) 2 * 8 = 16
...
Pow(base, exp) = base * power(base, exp-1)
De esta forma, resulta sencillo traducir la f
ormula al c
odigo para obtener la funci
on Pow:
f u n c t i o n Pow ( I n t e g e r iBase , iExp ) : I n t e g e r
i f i E x p == 0 t h e n
return 1
e l s e i f i E x p == 1 t h e n
return iBase
else
r e t u r n i B a s e P o w ( i B a s e , i E x p 1)
end
end
6.1.2
Es importante destacar que es posible modificar el procedimiento tal que permita la conversi
on de base 10 a base k de forma
muy simple.
22
Algoritmos
7.1
Collatz
La conjetura de Collatz propuesta en 1937 (tambien conocido como el problema de 3n + 1) define que dado un n
umero natural
n si es par, se divide entre 2 para obtener n2 , si es impar se multiplica por 3 y se suma 1, 3 n + 1. Este proceso se repite
indefinidamente (siempre llegar
a a 1).
void C o l l a t z ( I n t e g e r iN )
P r i n t ( iN )
i f iN > 1 then
i f i N mod 2 == 0 t h e n
C o l l a t z ( iN div 2)
else
C o l l a t z (3 iN + 1)
end
end
end
7.2
B
usqueda Binaria
La b
usqueda binaria busca un valor en una secuencia de elementos ordenados. La b
usqueda binaria reduce un problema de
on.
tama
no n a tama
no n2 en cada iteraci
f u n c t i o n B i n a r y S e a r c h R ( r e f Array a V a l u e s o f I n t e g e r [ ] , I n t e g e r i N u m b e r , i F i r s t , i L a s t ) :
i f iFirst > iLast then
r e t u r n 1
end
Integer iMiddle = ( iFirst + iLast ) div 2
i f a V a l u e s [ i M i d d l e ] == i N u m b e r t h e n
return iMiddle
end
i f aValues [ iMiddle ] < iNumber then
BinarySearchR ( r e f aValues , iNumber , iMiddle + 1 , iLast )
end
return BinarySearchR ( r e f aValues , iNumber , iFirst , iMiddle 1)
end
7.3
Integer
Hanoi
Las Torres de Hanoi es un juego inventado en 1883 que consiste en ocho discos de radio creciente que se apilan insert
andose
en una de las tres estacas de un tablero (ver Fig. 8). El objetivo del juego es crear la pila en otra de las estacas siguiendo tres
reglas:
1. Solo se puede mover un disco a la vez
2. No puede haber un disco de mayor tama
no sobre uno de menor tama
no
3. Solo se puede mover un disco que este en el tope de una estaca
v o i d H a n o i ( I n t e g e r iN , i S o u r c e , i T a r g e t , i T e m p )
i f ( i N <= 1 ) t h e n
MoveDisk ( iSource , iTarget )
// j u s t p r i n t move from i S o u r c e t o i T a r g e t
else
Hanoi ( iN 1 , iSource , iTemp , i T a r g e t )
MoveDisk ( iSource , iTarget )
Hanoi ( iN 1 , iTemp , iTarget , i S o u r c e )
end
end
23
una cualquiera de las otras dos agujas, ese da la torre, el templo y el mundo entero desaparecer
an. Para ello se requiere 264
1 movimientos, y asumiendo que se emplea un segundo por cada movimiento, se necesitan 585 billones de a
nos (127 veces
la edad actual del sol).
7.4
Palndrome
7.5
Invertir un n
umero
Esta funci
on invierte el valor de un n
umero entero y lo retorna. Emplea dos par
ametros donde el primero corresponde al
n
umero a invertir y el segundo se emplea durante la recursi
on para mantener el c
alculo parcial del n
umero invertido.
f u n c t i o n I n t e g e r R e v e r s e ( I n t e g e r iN , i S )
i f i N == 0 t h e n
r e t u r n iS
else
r e t u r n R e v e r s e ( n d i v 1 0 , s 10 + n mod 1 0 )
end
P r i n t ( R e v e r s e ( 5 8 3 1 , 0 ) ) // l a s a l i d a e s 1385
Ideas Finales
La recursi
on ofrece un mecanismo de solucionar problemas aplicando el principio de divide y conquista
Siempre se edbe garantizar la culminaci
on del algoritmo (no olvidar la convergencia al caso base)
La recursi
on puede crear sub-problemas no tan peque
nos, as como un n
umero de invocaciones excesivas pudiendo
ocasionar un desborde de pila
24
Cualquier funci
on recursiva puede ser sustituida por una equivalente iterativa
Problemas
1. Construya un algoritmo recursivo que permita hacer la divisi
on de dos n
umeros empleando restas sucesivas
2. Si existen 2 funciones recursivas que resuelven el problema A, bajo cu
ales criterios se selecciona la mejor soluci
on?
3. Un n
umero cumple con la propiedad de Goldbach si se puede escribirse como la suma de dos n
umeros primos. Defina
una funci
on que determine si un n
umero natural cumple con esta propiedad
4. Que hace la siguiente funci
on?
f u n c t i o n M c C a r t h y ( I n t e g e r iN )
i f ( i N > 1 0 0 ) t h e n r e t u r n i N 10 end
e l s e r e t u r n M c C a r t h y ( M c C a r t h y ( i N + 1 1 ) ) end
end
// t r y u s i n g a = 3 and b = 4
[ ] = {1 ,2 ,3 ,4 ,5 ,6}
se desea conocer si existe una suma sucesiva para 9. En este caso existe ya que 4+5=9, si se desea la suma de 7, esta
es 3+4=7, para la suma de 10, 1+2+3+4=10. Ahora, para la suma de 8 es imposible puesto que el 2 y el 6 no son
sucesivos
25
Parte III
Backtracking
En general, el dise
no de un algoritmo que resuelva un problema se puede considerar una tarea difcil. Una forma de facilitar
esta tarea es recurrir a tecnicas conocidas de dise
no de algoritmos basados en esquemas muy generales que pueden adaptarse
a un problema particular al detallar las partes generales del esquema. Muchos problemas pueden resolverse buscando una
soluci
on f
acil y directa pero, a en otras oportunidades no resulta tan sencilla o simplemente es ineficiente. Un esquema de
estos se denomina backtracking el cual permite buscar todas las soluciones posibles de un problema incluyendo la o
ptima;
pero no siempre resulta eficiente en tiempo y espacio.
Estudiaremos los aspectos de este esquema para el dise
no de algoritmos.
Definiciones
T
ecnica de Backtracking
26
Letra Fija
swap(Z,E)
swap(Z,Z)
swap(E,E)
swap(E,N)
N Z
swap(Z,Z)
swap(Z,N)
swap(Z,N) swap(E,E)
swap(E,Z)
27
13
Permute ( strText , 1 , 3)
La ejecuci
on del algoritmo se muestra de forma gr
afica en la Fig. 9. La idea detr
as de la permutaci
on es tener una posici
on fija
de inicio de las iteraciones (lnea 5) la cual debe ser empleada en cada invocaci
on recursiva (lnea 1). De este modo, desde esa
posici
on en adelante se aplica el intercambio de la palabra inicial iIndex con el ndice de la iteraci
on (lnea 6). Luego, se invoca
recursivamente la funci
on pero ahora con un nuevo punto de partida (lnea 7) y se ejecuta la misma idea. Posteriormente, el
intercambio de letras (lnea 6) no debe afectar el estado de ejecuci
on de un estado, regresando el cambio realizado (lnea 8).
La soluci
on se obtiene cuando el lmite inferior alcanza al superior (lnea 2), indicando que recorri
o todas las posiciones de la
palabra.
Clasificaci
on
Una soluci
on de backtracking en cada iteraci
on se encontrar
a en un cierto nivel k, con una soluci
on parcial C = (x1 , x2 , ..., xk )
(con k n). Entonces:
Si puede a
nadirse un elemento xk + 1 a la soluci
on parcial se avanza al nivel k + 1
Si no se prueban otros valores v
alidos para xk
Si no existe ning
un valor que sea v
alido por probar, se retrocede al nivel anterior k 1.
As, se continua con este proceso hasta que la soluci
on parcial sea una soluci
on del problema o hasta que no queden m
as
posibilidades por probar (en el caso de que no se encuentre ninguna soluci
on o se busquen todas las soluciones del problema).
De esta forma, es posible clasificar un algoritmo de backtracking de acuerdo al tama
no del subconjunto C soluci
on:
Una soluci
on: Cuando el algoritmo encuentre una soluci
on, su ejecuci
on finaliza. Generalmente, en este enfoque el
algoritmo se queda con la la primera soluci
on que consigue.
Soluci
on o
ptima: Cuando el algoritmo explora todos los subconjuntos de soluciones posibles y se queda con la o
ptima
para el problema a resolver.
Todas las soluciones: El algoritmo colecta todos los subconjuntos encontrados en la exploraci
on y forman parte de la
soluci
on (fuerza bruta).
Existen diversos algoritmos cl
asicos que se resuelven con algoritmos de backtracking: rompecabezas, laberintos, permutaciones,
problemas de las 8-reinas, crucigramas, Sudoku, problema de la mochila, problema del agente viajero, entre otros.
En backtracking, la generaci
on de los estados soluci
on o no en la exploraci
on se generan en profundidad, es decir, seleccionando
una opci
on y explorando todas las posibilidades a partir de ese punto. Por otro lado, existen enfoques donde para un estado
se generan todos los posibles nuevos estados y antes de explorarlos, se verifican si conducen a una soluci
on (branch & bound).
Ejercicios
La forma b
asica de resolver un problema aplicando backtracking es analizando los casos que son soluci
on al problema y de
que forma se obtiene dicha soluci
on. A continuaci
on estudiaremos algunos casos.
4.1
Suma Parcial
Dado un conjunto de valores enteros se quiere encontrar todos los subconjuntos que entre sus elementos sumen un valor k.
Por ejemplo, considerando el conjunto 1, 2, 3 la idea es encontrar todos los subconjuntos que entre sus elementos sumen k = 4.
Para este ejemplo, se toma en cuenta el orden de los elementos, es decir, el subconjunto 1, 3 ser
a distinto de 3, 1.
Entonces dividiendo el problema en elementos a considerar se tiene:
Alternativa : Valores 1, 2 y 3
Subtarea : Suma acumulativa
Soluci
on : Suma igual a 4
Para hacer un poco de abstracci
on, se asumen las funciones asociadas a un conjunto para agregar un valor y eliminar un
elemento en este, y la de imprimir sus valores de forma ordenada. El procedimiento que realiza es c
alculo se puede escribir
como:
1
2
3
4
5
6
7
v o i d F i n d S u m ( Array A o f I n t e g e r [ ] , I n t e g e r iN , i P a r t i a l , i T o t a l )
i f i P a r t i a l == i T o t a l t h e n
printSet ()
else
f o r I n t e g e r i I n d e x = 1 t o i N do
i f i P a r t i a l + A [ i I n d e x ] <= i T o t a l t h e n
addSet ( A [ iIndex ] )
28
8
9
10
11
12
13
14
15
16
17
F i n d S u m ( A , iN , i P a r t i a l + A [ i I n d e x ] , i T o t a l )
removeSet ()
end
end
end
end
Integer A of Integer [ ] = {1 ,2 ,3}
Integer iTotal = 4
FindSum ( A , 3 , 0 , iTotal )
La idea b
asica del algoritmo es buscar las sumas parciales de los elementos del arreglo obtenidas de sumar un elemento actual
con la suma acumulada (lnea 9). Si dicha suma parcial es inferior o igual al total buscado entonces se agrega al conjunto
soluci
on (lnea 10). Ahora, con una nueva suma parcial se invoca de forma recursiva a la funci
on (lnea 11) y de conseguir
soluci
on (lnea 5) se imprime el conjunto. En caso contrario, la invocaci
on hecha retorna al estado anterior y regresa/retorna
el valor a
nadido al conjunto de sumas parciales (lnea 12).
Para la invocaci
on inicial del algoritmo (lnea 19), se requiere el arreglo inicial A, el tama
no de este, la suma parcial para el
estado inicial (i.e. iP artial = 0) y el valor destino que se quiere alcanzar.
4.2
n-Reinas
El problema de las n-reinas consiste en colocar n reinas en un tablero de ajedrez sin que se amenacen unas con otras. En
Ciencias de la Computaci
on, el problema con n = 8 es un problema combinatorio cl
asico donde no puede haber dos reinas en
una misma fila, columna o diagonal. As, podemos definir los siguientes aspectos del problema para dise
nar la soluci
on:
Representaci
on : n-tuplas x1 , x2 , x3 , ..., xk donde xi es la fila donde est
a la reina de la columna i
Restricciones implcitas : Las componentes 1, 2, ..., n
Restricciones explcitas : No puede haber 2 reinas en una misma fila/columna/diagonal
Soluci
on : Empezar en la columna m
as abajo a la izquierda.
Si todas las reinas est
an colocadas entonces return true
Para cada posibilidad en las filas de una columna
Si la reina puede ser colocada
Escoger esta soluci
on y llamar recursivamente con las otras reinas
Si la recursi
on suceded entonces true
Si la recursi
on succed entonces probar en otra fila
Si todas las columnas han sido probadas, entonces return falso
El algoritmo se puede escribir como:
f u n c t i o n S o l v e ( Array a B o a r d o f I n t e g e r [ ] [ ] ,
i f iCol > iN then
return true
end
f o r I n t e g e r i R o w T o T r y = 1 t o i N do
PlaceQueen ( aBoard , iRowToTry , iCol )
i f S o l v e ( a B o a r d , iN , i C o l + 1 ) t h e n
return true
end
RemoveQueen ( aBoard , iRowToTry , iCol )
end
end
I n t e g e r iN , i C o l ) : B o o l e a n
Los procedimientos P lace y Remove se emplean para ubicar y quitar una reina de una posici
on respectivamente. Por otro
lado, la funci
on Solve verifica que en el tablero esten colocadas las iN reinas sin que se ataquen unas a otras.
Es interesante notar que con 8 reinas, el tama
no del espacio de soluciones es 88 , es decir, 224 16M . Sin embargo, dado que
las soluciones posibles son todas las permutaciones del conjunto 1, 2, 3, 4, 5, 6, 7, 8, el espacio de soluciones se reduce a de 88
tuplas a 8! = 40.320. Para explorar un caso m
as simple, en la Fig. 10 se observan los estados generados en la ejecuci
on cuando
n = 4 reinas en el tablero.
4.3
Sudoku
29
f u n c t i o n S o l v e S u d o k u ( Array a G r i d o f I n t e g e r [ ] [ ] , I n t e g e r i N ) : B o o l e a n
I n t e g e r iRow , iCol
// I f t h e r e i s no u n a s s i g n e d l o c a t i o n , we a r e done
i f no t F i n d U n a s s i g n e d L o c a t i o n ( a G r i d , r e f i R o w , r e f i C o l ) t h e n
r e t u r n t r u e // s u c c e s s !
end
f o r I n t e g e r i N u m = 1 t o 9 do
// c o n s i d e r d i g i t s 1 t o 9
i f isSafe ( aGrid , iRow , iCol , iNum ) then
aGrid [ iRow ] [ iCol ] = iNum
// make t e n t a t i v e a s s i g n m e n t
i f S o l v e S u d o k u ( aGrid , iN ) then
return true
end
a G r i d [ i R o w ] [ i C o l ] = U N A S S I G N E D // f a i l u r e , unmake & t r y a g a i n
end
end
return f a l s e
end
I n t e g e r iN = 9
Array a G r i d o f I n t e g e r [ 1 . . i N ] [ 1 . . i N ]
F i l l W i t h N u m b e r s A n d U n a s s i g n e d ( r e f aGrid , iN )
i f S o l v e S u d o k u ( aGrid , iN ) then
P r i n t G r i d ( aGrid , iN )
else
P r i n t ( No s o l u t i o n f o r you )
end
30
soluci
on del backtracking se determina cuando no se pueda encontrar casillas libres para colocar un nuevo n
umero (lnea 4).
En caso de existir una casilla libre se itera sobre el rango [1..9], y de ser posible ubicar un n
umero se coloca en la dicha casilla
disponible (lnea 9) y se repite el proceso de forma recursiva. Cuando la opci
on de colocar el n
umero no sea adecuada, se
desmarca dicha casilla asign
andole el valor U N ASSIGN ED y sea libre para otro estado del algoritmo (lnea 13).
Algoritmos
Muchos problemas pueden ser resueltos empleando el esquema de backtracking, entre ellos el problema del agente viajero
(travelling salesman problem), c
apsula convexa (convex hull), resoluci
on de tableros y laberintos, coloraci
on de grafos y
regiones, entre muchos otros.
5.1
Laberinto
El concepto de laberinto b
asico es dada una posici
on inicial encontrar la salida en otra posici
on. Para simplificar un poco,
dada una matriz de tama
no Sizex Sizey que representa al laberinto, se desea encontrar el conjunto de movimientos a realizar
para encontrar la salida en la posici
on Sizex y Sizey , empezando desde la posici
on (1, 1). Se asume que el laberinto puede
tener posiciones libres (por donde se puede pasar) o bloqueadas (paredes).
c l a s s Back
private :
Const I n t e g e r F R E E = 0
Const I n t e g e r V I S I T E D = 1
Const I n t e g e r W A L L = 2
Array m _ a M o v e X o f I n t e g e r [ ] = { 1 , +1 , 0 , 0}
Array m _ a M o v e Y o f I n t e g e r [ ] = { 0 , 0 , 1, +1}
Array m _ a T a b l e o f I n t e g e r [ ] [ ]
I nt e g er m_iSizeX , m_iSizeY
Set m_sSolution
v o i d s e t R a n d o m W a l l s ( I n t e g e r i S i z e X , i S i z e Y ) // add some w a l l s
f u n c t i o n i s V a l i d ( I n t e g e r iPosX , iPosY ) : Boolean
r e t u r n i P o s X >= 1 and i P o s X <= i S i z e X and i P o s Y >= 1 and i P o s Y <= i S i z e Y and m _ a T a b l e [ i P o s X ] [ i P o s Y ] == F R E E
end
public :
Constructor Back ( I n t e g e r iSizeX , iSizeY )
m_iSizeX = iSizeX
m_iSizeY = iSizeY
m _ a T a b l e = new I n t e g e r [ 1 . . m _ i S i z e X ] [ 1 . . m _ i S i z e Y ]
m _ s S o l u t i o n = {}
f o r I n t e g e r i Y t o m _ i S i z e Y do
f o r I n t e g e r i X t o m _ i S i z e X do
m _ a T a b l e [ iX ] [ iY ] = FREE
end
end
setRandomWalls ( iSizeX , iSizeY )
end
void Labyrinth ( I n t e g e r iStepX , iStepY )
Boolean b S o l u t i o n = f a l s e
i f i S t e p X == i S i z e X and i S t e p Y == i S i z e Y t h e n
bSolution = true
PrintSet ()
end
m_aTable [ iStepX ] [ iStepY ] = VISITED
Integer iDirection = 1
w h i l e no t b S o l u t i o n and i D i r e c t i o n <= 4 do
i f isValid ( iStepX + m _ a M o v e X [ i D i r e c t i o n ] , iStepY + m _ a M o v e Y [ i D i r e c t i o n ] ) then
addSet ( iStepX + m_aMoveX [ iDirection ] , iStepY + m_aMoveY [ iDirection ] )
Labyrinth ( iStepX + m_aMoveX [ iDirection ] , iStepY + m_aMoveY [ iDirection ] )
removeSet ( iStepX + m_aMoveX [ iDirection ] , iStepY + m_aMoveY [ iDirection ] )
end
iDirection = iDirection + 1
end
end
end
5.2
Problema de la Mochila
El problema de la mochila o Knapsack consiste en llenar una mochila con una serie de objetos asociados a una serie de pesos
con un valor asociado. Es decir, se dispone de iN tipos de objetos y que no hay un n
umero limitado de cada tipo de objeto (si
fuera limitado no cambia mucho el problema). Cada tipo i de objeto tiene un peso aW eight[i] positivo y un valor aV alue[i]
positivo asociados.
31
La mochila tiene una capacidad de peso igual a iCapacity. Se trata de llenar la mochila de tal manera que se maximice el
valor de los objetos incluidos pero respetando al mismo tiempo la restricci
on de capacidad.
Array a W e i g h t o f I n t e g e r [ ] = { 2 , 3 , 4 , 5}
Array a V a l u e o f I n t e g e r [ ] = { 3 , 5 , 6 , 10}
I n t e g e r iN = 4
void Knapsack ( I n t e g e r iStart , iCapacity , iSolution , r e f iOptimal )
f o r I n t e g e r i K = i S t a r t t o i N do
i f a W e i g h t [ i K ] <= i C a p a c i t y t h e n
K n a p s a c k ( iK , i C a p a c i t y a W e i g h t [ k ] , i S o l u t i o n + a V a l u e [ i K ] , i O p t i m a l )
i f i S o l u t i o n + aValue [ k ] > i O p t i m a l then
iOptimal = iSolution + aValue [ k ]
end
end
end
end
Integer iCapacity = 8 , iOptimal = 0
Knapsack (1 , iCapacity , 0 , r e f iOptimal )
Print ( iOptimal )
Ideas Finales
El backtracking es un metodo sistem
atico que realiza una b
usqueda exhaustiva de las soluciones, pero esta b
usqueda no
es ca
otica, sino organizada
Esta permite obtener una o todas las soluciones factibles o bien la soluci
on o
ptima entre todas las factibles
La tecnica del backtracking se puede implementar como una versi
on iterativa empleando estructuras de datos para
almacenar los estados candidatos a soluci
on
El costo de aplicar una soluci
on de backtracking es proporcional al n
umero de estados que se generan en las invocaciones
recursivas
Problemas
32
33
Parte IV
Complejidad en Tiempo
Se conoce ya que un algoritmo es una secuencia finita de instrucciones, cada una de las cuales tiene un significado preciso y
puede ejecutarse con una cantidad finita de esfuerzo en un tiempo finito. As, un programa es un algoritmo expresado en un
lenguaje de programaci
on especfico. Entonces, pueden existir diversos programas para resolver un mismo problema.
Tener un mecanismo que permita seleccionar que programa es mejor que otro sera ideal para lograr los resultados adecuados.
Entre dichos mecanismos est
an los criterios de evaluaci
on de un programa como la eficiencia, portabilidad, legibilidad, eficacia,
robustez, entre otros. En esta secci
on, nos enfocaremos en solo el criterio relacionado con la eficiencia del programa para el
an
alisis de la complejidad de un programa (uso de recursos del computador).
Definiciones
El an
alisis de algoritmos provee estimaciones te
oricas para los recursos que necesita cualquier algoritmo y se basan en criterios
como: eficiencia, portabilidad, eficacia y robustez. El an
alisis de complejidad est
a relacionado con la eficiencia del programa.
La eficiencia mide el uso de los recursos del computador por un algoritmo tal como el tiempo de c
alculo para ejecutar las
operaciones (complejidad en tiempo) y el espacio de memoria para contener y manipular el programa m
as los datos (complejidad
en espacio). As, el objetivo del an
alisis de complejidad es cuantificar las medidas fsicas en tiempo de ejecuci
on y espacio de
memoria para comparar distintos algoritmos que resuelven un mismo problema.
El tiempo de ejecuci
on depende de diversos factores como:
Los datos de entrada del programa
La calidad del c
odigo objeto generado por el compilador
La naturaleza y rapidez de las instrucciones de m
aquina utilizadas
La complejidad en tiempo del algoritmo base del programa
Hay dos estudios posibles sobre el tiempo de ejecuci
on:
1. Un estudio que proporciona una medida te
orica (a priori), que consiste en obtener una funci
on que acote (por arriba o
por abajo) el tiempo de ejecuci
on del algoritmo para unos valores de entrada dados
2. Un estudio que ofrece una medida real (a posteriori), consistente en medir el tiempo de ejecuci
on del algoritmo para
unos valores de entrada dados y en un ordenador especfico.
Ambas medidas son importantes: la primera ofrece estimaciones del comportamiento de los algoritmos de forma independiente
del computador en donde ser
an implementados y sin necesidad de ejecutarlos, y la segunda representa las medidas reales del
comportamiento del algoritmo.
Dado que la unidad de tiempo a la que debe hacer referencia estos estudios no puede ser expresada en segundos o en otra
unidad de tiempo concreta, pues no existe un computador est
andar/ideal al que pueda hacer referencia todas las medidas, se
denota por T (n) el tiempo de ejecuci
on de un algoritmo para una entrada de tama
no n.
En un an
alisis te
orico de algoritmos, es com
un calcular su complejidad en un sentido asint
otico, es decir, para un tama
no
de entrada n suficientemente grande, T (n). Te
oricamente T (n) debe indicar el n
umero de instrucciones ejecutadas por un
ordenador ideal. La notaci
on O grande (Big O) es una notaci
on para expresar esto. Por ello, estudiar la complejidad del
peor caso, mejor caso, y caso promedio resulta importante en las Ciencias de la Computaci
on:
1. Peor caso: Consiste Resulta tomar el m
aximo tiempo en que se ejecuta el algoritmo, entre todas las instancias posibles
2. Mejor caso: Viene dado por el menor tiempo en que se ejecuta el algoritmo
3. Caso promedio: Es la esperanza matem
atica del tiempo de ejecuci
on del algoritmo para entradas de tama
no n
Operaciones Elementales
34
Const I n t e g e r N = . . . // n
u mero m
a ximo de e l e m e n t o s de un a r r e g l o
Array a V a l u e s o f I n t e g e r [ 1 . . N ]
f i l l O r d e r e d ( r e f a V a l u e s , N ) // a s i g n a v a l o r e s de forma a s c e n d e n t e ,
i .e.
1 ,2 ,3 ,5 ,6 ,9 ,12 ,
...
El algoritmo:
1
2
3
4
5
6
7
8
9
10
11
v o i d S e a r c h ( r e f Array A o f I n t e g e r [ ] ,
I n t e g e r iJ = 1
w h i l e ( A [ i J ] < i C and i J < n ) do
j = j + 1
end
i f A [ i J ] == i C t h e n
r e t u r n iJ
else
return 0
end
end
I n t e g e r n , i C ) // s e i n t e n t a b u s c a r iC en e l
arreglo
N
otese que el algoritmo no es la mejor forma para encontrar un elemento en un arreglo ordenado, pero permite ilustrar el
n
umero de operaciones elementales que forman la funci
on T (n). Entonces, primero se calcula las operaciones elementales de
cada instrucci
on de la funci
on Search:
Lnea 1: No se considera como operaci
on elemental. Igual aplica para las lneas 5, 8, 10 y 11.
Lnea 2: Se ejecuta 1 operaci
on elemental de asignaci
on.
Lnea 3: Se ejecuta la condici
on del while que consta de 2 comparaciones, un acceso al arreglo y un and, para un total de 4
operaciones elementales.
Lnea 4: Se ejecutan 2 operaciones elementales, una asignaci
on y un incremento.
Lnea 6: Se ejecuta un acceso al arreglo y una comparaci
on, para un total de 2 operaciones elementales.
Lnea 7: Se ejecuta 1 operaci
on elemental por el return, cuando la condici
on es true.
Lnea 9: Se ejecuta 1 operaci
on elemental por el return, cuando la condici
on es falsa.
En el mejor caso, se ejecuta la lnea 2 (1 operaci
on) y solo la primera parte de la condici
on de la lnea 3 (2 operaciones), es
decir, la expresi
on A[iJ] < iC es falsa y se deja de evaluar la condici
on completa. Para ello, se asume que el operador and es
del tipo cortocircuito4 . Luego, se ejecuta la lnea 6 (2 operaciones) y la lnea 7 o 9 (1 operaci
on cada una). Como resultado
se tiene que la funci
on T (n) es T (n) = 1 + 2 + 2 + 1 = 6.
En el peor caso, se ejecuta la lnea 2 y la lnea 3 se ejecuta n 1 veces hasta que se cumpla la segunda parte de la condici
on.
Despues se ejecuta la condici
on de la lnea 6 y termina la ejecuci
on con la lnea 9. Cada iteraci
on del while est
a compuesta
por las lneas 3 y 4 y una ejecuci
on adicional de la lnea 3 que es la salida del ciclo. De esta forma, se tiene a la funci
on T (n)
como:
n1
X
T (n) = 1 + ((
(4 + 2)) + 4) + 2 + 1 = 6n + 2
k=1
k=0
n1
2
T (n) = 1 + ((
(4 + 2)) + 2) + 2 + 1 = 3n + 3
k=1
4 La
expresi
on l
ogica deja de ser evaluada en el momento que se conoce su valor aunque no hayan sido evaluados todos sus t
erminos.
35
Por defecto se toma el tiempo del peor caso como medida de complejidad T (n) del algoritmo. Por ejemplo, una b
usqueda
binaria se dice que se ejecuta en un n
umero de pasos proporcional al logaritmo de la longitud de la estructura de datos de
la b
usqueda, o en O(log(n)), dicho coloquialmente como tiempo logartmico. Es importante destacar que estos an
alisis se
realizan en una m
aquina hipotetica/ideal.
En la secci
on 4 se presenta una gua para el c
alculo del n
umero de operaciones elementales, funci
on T (n) para sentencias de
un algoritmo.
2.1
Tasas de crecimiento m
as comunes
A continuaci
on se describen las funciones m
as empleadas cuando se calcula la complejidad de algoritmos (ubicadas de forma
creciente):
1 < logn < n < n logn < n2 < nk < ... < 2n < en < kn < ... < nn < n! < ...
donde k es una constante y k > 2.
A continuaci
on, con el prop
osito del c
alculo del tiempo T (n) de ejecuci
on de un algoritmo la idea es clasificar dichas funciones
de forma tal que se puedan comparar. Para ello, se definen clases de equivalencia basadas en notaciones asint
oticas para el
c
alculo en notaci
on O.
Notaciones Asint
oticas
36
An
alisis de Complejidad
Para analizar la complejidad T (n) de un algoritmo y determinar que es de complejidad O(f (n)) se estudian una serie de reglas
que permitir
an aplicar las propiedades explicadas en la definici
on #1 y #2.
4.1
Regla de la Suma
I1 ;
I2 ;
...
Ik ;
se escribe como T1 (n) + T2 (n) = O(M ax{f (n), g(n)}). Donde la funci
on M ax se asocia a clasificar una funci
on de acuerdo a
su tasa de crecimiento (ver la secci
on 2.1).
4.2
37
A continuaci
on se presentan una serie de reglas aplicadas al c
alculo de instrucciones en un algoritmo.
Regla 1: La funci
on T(n) de una instrucci
on de asignaci
on simple es una constante c, as su complejidad en tiempo es O(1).
Se asumir
a que las operaciones aritmeticas simples empleando la sintaxis del lenguaje por s solas no implican tiempo
(en algunas ocasiones se pueden tomar en cuenta en el c
alculo).
Regla 2: La funci
on T (n) de una operaci
on de entrada/salida es una constante c, as su complejidad en tiempo es O(1). Esta
misma regla aplica para operaci
on de lectura/escritura de memoria.
Regla 3: Una secuencia de k instrucciones cualesquiera I1 , I2 , . . . , Ik con Ti (n) = O(fi (n)), la complejidad total viene dada
por:
k
X
i=1
i f <c o n d i c i
o n> t h e n
<i n s t r u c c i o n e s 1>
else
<i n s t r u c c i o n e s 2>
end
// {T1 ( n ) = O( f ( n ) ) }
// {T2 ( n ) = O( g ( n ) ) }
// {T3 ( n ) = O( h ( n ) ) }
Su funci
on T (n) se calcula como T (n) = T1 (n)+M ax{T2 (n), T3 (n)} de esta forma su complejidad es O(M ax{f (n), M ax{g(n),
h(n)}}) = O(M ax{f (n), g(n), h(n)}).
Regla 5: La funci
on T (n) de una sentencia select donde:
1
2
3
4
5
6
select
<c o n d i c i o n 1 >: <i n s t r u c c i o n e s 1>
<c o n d i c i o n 2 >: <i n s t r u c c i o n e s 2>
...
<c o n d i c i o n k >: <i n s t r u c c i o n e s k>
end
//T1 ( n ) = O( f 1 ( n ) )
//T2 ( n ) = O( f 2 ( n ) )
//Tk ( n ) = O( f k ( n ) )
Se puede escribir como T (n) = M ax{T1 (n), T2 (n), . . . , Tk (n)} considerando que Ti (n) incluye el c
alculo de la evaluaci
on
de la condici
on.
Regla 6: Dada la estructura de un ciclo while:
1
2
3
w h i l e <c o n d i c i
o n> do // {T1 ( n ) = O( f ( n ) ) }
<i n s t r u c c i o n e s >
// {T2 ( n ) = O( g ( n ) ) }
end
La funci
on T (n) para un ciclo while se puede escribir como:
T (n) = T1 (n) +
n1
X
k=1
Es importante tomar en cuenta que tanto T1 (n) como T2 (n) pueden variar en cada iteraci
on, y por tanto se debe de
tomar en cuenta para su c
alculo.
Las otras sentencias iterativas (for, do-while, foreach) se pueden representar como un ciclo while. Por ejemplo, el
do-while sera:
T (n) =
n
X
k=1
// de forma o r i g i n a l
f o r I n t e g e r i I = <i n i c i o > t o <f i n a l > do
<i n s t r u c c i o n e s >
end
// r e e s c r i t o como
I n t e g e r i I = <i n i c i o > // {T1 ( n ) = O( f ( n ) ) }
38
7
8
9
10
// {T2 ( n ) = O( g ( n ) ) }
// {T3 ( n ) = O( h ( n ) ) }
// {T4 ( n ) = O( i ( n ) ) }
La funci
on T (n), de forma detallada, es:
<f inal><inicio>
k=1
Por su parte, el ciclo foreach se comporta igual que el ciclo for con la diferencia que las variables < inicio > y < f inal >
corresponden al rango v
alido de una colecci
on (i.e. arreglo).
Regla 7: El tiempo de ejecuci
on de una unidad invocable con par
ametros U (P1 , P2 , . . . , Pk ) es el tiempo de la invocaci
on
de U (1) m
as el tiempo de evaluaci
on de sus par
ametros junto con el tiempo de ejecuci
on del cuerpo de U . As,
T (n) = 1 + T (P1 ) + T (P2 ) + + T (Pk ) + T (U ). No se toma en cuenta la copia de los valores de los par
ametros a la
pila de ejecuci
on. Para funciones recursivas se generan ecuaciones de recurrencia.
Ejercicios
A continuaci
on se presenta un serie de ejercicios pr
acticos acompa
nados de una breve explicaci
on del c
alculo de la complejidad
de estos.
6.1
B
usqueda Lineal
El algoritmo de b
usqueda lineal consiste en encontrar un valor dentro de un arreglo de valores de dicho tipo. La idea es
recorrer desde un extremo del arreglo al otro.
1
2
3
4
5
6
7
8
9
10
11
12
13
Const I n t e g e r N = . . .
Const I n t e g e r N O T _ F O U N D = . . .
Array a A r r o f I n t e g e r [ 1 . . N ]
f u n c t i o n L i n e a r S e a r c h ( Array a A o f I n t e g e r [ ] , I n t e g e r iN , i X ) // iX e s e l e l e m e n t o a b u s c a r
f o r I n t e g e r i K = 1 t o i N do
i f a A [ i K ] == i X t h e n
r e t u r n iK
end
return NOT_FOUND
end
// i n i c i a l i z a c i o
n de aArr con v a l o r e s
// a s i g n a c i o
n d e l v a l o r a b u s c a r en e l a r r e g l o y a l m a c e n a r l o en iX
L i n e a r S e a r c h ( aArr , N , iX )
39
Obteniendo el c
alculo del ciclo for, asumiendo que iN = n:
T (CicloF or)
1+1+
n1
X
(1 + T (Lineas6 7) + 1))
k=1
2+
n1
X
1 + (2 + 1) + 1
k=1
=
=
=
2 + 5(n 1)
2 + 5n 5
5n 3
6.2
B
usqueda Binaria
El algoritmo de b
usqueda binaria consiste en encontrar un valor dentro de un arreglo ordenado de valores de dicho tipo. La
idea es buscar la posici
on central del espacio de b
usqueda e ir comparando su valor dado que los valores est
an ordenados, si
es mayor se busca en la mitad superior, si es menor en la mitad inferior.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Const I n t e g e r N = . . .
Const I n t e g e r N O T _ F O U N D = . . .
Array a A r r o f I n t e g e r [ 1 . . N ]
f u n c t i o n B i n a r y S e a r c h ( Array a A o f I n t e g e r [ ] , I n t e g e r iN , i X ) // iX e s e l e l e m e n t o a b u s c a r
I n t e g e r iI = 1
w h i l e i I <= i N do
I n t e g e r iHalf = ( i + iN ) div 2
i f i X == a A [ i H a l f ] t h e n
return iHalf
e l s e i f iX > aA [ iHalf ] then
iI = iHalf
else
iN = iHalf
end
return NOT_FOUND
end
// i n i c i a l i z a c i o
n de aArr con v a l o r e s
// a s i g n a c i o
n d e l v a l o r a b u s c a r en e l a r r e g l o y a l m a c e n a r l o en iX
P r i n t ( B i n a r y S e a r c h ( aArr , N , iX ) )
40
k
0
1
2
3
4
...
log2 n
iI
n
2
n
2
n
2
n
2
...
n
+
+
+
n
2
n
2
n
2
+
+
n
8
n
8
n
16
iN
n
n
n
n
n
...
n
Volviendo al c
alculo de T (while) queda entonces:
log2 n
T (while) = 1 +
k=1
T (while)
1+
1+1+2
k=1
log2 n
1+
k=1
2 + 5log2 n
Si se emplea constantes para definir cada valor se tiene que T (while) = c1 + c2 log2 n y para T (n) = T (n) = T (while) + c3 :
T (n) = c1 + c2 log2 n + c3 O(c2 log2 n) = O(log2 n)
6.3
Bubble Sort
El algoritmo de Bubble Sort es un algoritmo de ordenamiento que consiste en revisar cada elemento de un arreglo con el
siguiente, intercambi
andolos de posici
on si est
an en el orden equivocado. Este proceso se realiza varias veces hasta que no se
necesiten m
as intercambios (ya estara ordenado).
Muchas veces, resulta m
as sencillo estudiar la complejidad de un algoritmo examinando su estructura y luego, de forma
conveniente, obtener los T (n) de cada fragmento de c
odigo. Este ejemplo permite explorar este estilo:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Const I n t e g e r N = . . .
Array a A r r o f I n t e g e r [ 1 . . N ]
v o i d B u b b l e S o r t ( r e f Array a A o f I n t e g e r
I n t e g e r iI , i J
f o r i I = 1 t o i N 1 do
f o r i J = i I + 1 t o i N 1 do
i f a A [ iJ 1] > a A [ i J ] t h e n
I n t e g e r i A u x = a A [ iJ 1]
a A [ iJ 1] = a A [ i J ]
aA [ iJ ] = iAux
end
end
end
end
// i n i c i a l i z a c i o
n de aArr con v a l o r e s
B u b b l e S o r t ( r e f aArr , N )
[] ,
I n t e g e r iN )
Se puede observar que el algoritmo consta de dos ciclos for anidados (lnea 5 y 6), y dentro del m
as interno est
a un condicional
(lnea 7). Entonces, para el segundo ciclo for es necesario calcular el condicional que lo contiene, y para el primer ciclo for se
requiere calcular el segundo ciclo for. Por ello, empezaremos por calcular el condicional.
El condicional de la lnea 7 es T (if ) = c1 +T (Linea810), donde c1 = 3 representa a las dos operaciones de acceso a memoria y
la comparaci
on. De hecho, estudiando el comportamiento de las lneas 8, 9 y 10 se puede decir que T (Linea810) = 2+3+2 = 7,
pero asumiendo la misma premisa que la constante c1 entonces T (Linea8 10) = c2 , por lo que T (if ) = c1 + c2 c.
41
n
X
c3 + c4 +
c4 + c + c5
j=i+1
n
X
c6 +
c7
j=i+1
c6 + (n i)c7
c8 + c9 +
n1
X
c9 + c6 + (n i)c7 + c10
i=0
c11 + (c9 + c6 + c1 0)
n1
X
(n i)c7
i=0
c11 + c12
n1
X
(n i)c7
i=0
n1
X
c11 + c12 c7
ni
i=0
"n1
X
c11 + c12 c7
i=0
c11 + c13
n1
X
#
i
i=0
n(n 1)
n(n 1)
2
n(n 1)
n(n 1)
2
c14
c14 n2 n
Algoritmos
El algoritmo anterior tiene una complejidad de O(n5 ). Considere que el valor lmite del segundo ciclo es iI 2 el cual pertenece
al primer ciclo que va desde el valor 0 hasta n (variable iN ).
f o r I n t e g e r i I = 0 t o iN 1 do
I n t e g e r iJ = 0
42
w h i l e i I < i N do
iJ = iJ + 1
iI = iI + 1
end
i f iJ < iN then
f o r I n t e g e r i K 1 = 0 t o i N do
f o r I n t e g e r i K 2 = 0 t o i N do
iI = iK1 iK2
end
end
end
end
En este fragmento de c
odigo el punto interesante radica sobre la variable iI y el ciclo for de la lnea 1. Dicho ciclo solo se
ejecutar
a 1 sola vez. En este caso, el ciclo de la lnea 8 es quien determinar
a la complejidad total del fragmento de c
odigo
O(n2 ).
En el c
alculo de la complejidad de algoritmo iterativos, su tiempo de ejecuci
on viene dado por el n
umero de operaciones
elementales que se ejecutan. Sin embargo, para los algoritmos recursivos existe con una dificultad extra pues la funci
on que
establece su tiempo de ejecuci
on viene dada por una ecuaci
on en recurrencia, es decir, T (n) = F (n) en donde en la expresi
on
F (n) aparece la propia funci
on T .
Resolver tal tipo de ecuaciones consiste en encontrar una expresi
on no recursiva de T . Por lo general, encontrar dicha funci
on
no es tarea sencilla. Veamos un ejemplo de una funci
on recursiva de nombre LessInArray que calcular el menor valor en un
arreglo del tipo Integer de forma recursiva.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
const Integer N = . . .
const Integer MAX_INTEGER = . . .
f u n c t i o n L e s s I n A r r a y ( Array a A r r a y o f I n t e g e r [ ] ,
i f i N <= 0 t h e n
return MAX_INTEGER
else
I n t e g e r iValue = L e s s I n A r r a y ( iN 1)
i f aArray [ iN ] < iValue then
r e t u r n aArray [ iN ]
else
return iValue
end
end
I n t e g e r iN )
Array a A r r a y o f I n t e g e r [ 1 . . N ]
f i l l A r r a y ( r e f a A r r a y ) // f i l l e d w i t h p o s i t i v e numbers
Print ( LessInArray ( aArray , N ) )
c1
T (n 1) + c2
si n 0
si n 1
(1)
Cuando n 0 (lnea 4) entonces el valor corresponde a una constante c1 y, en caso de que n 1 se corresponde a la invocaci
on
recursiva por una ecuaci
on de recurrencia de T (n). En este punto, queda estudiar como es el comportamiento de T (n) cuando
n 0 dado que el espacio de b
usqueda se reduce. Para ello tenemos que:
43
T (n)
=
=
=
=
=
T (n 1) + c2
[T (n 2) + c2 ] + c2 = T (n 2) + 2c2
[T (n 3) + c2 ] + 2c2 = T (n 3) + 3c2
...
T (n k) + kc2
=
=
O(n)
T (0) + nc2
c1 + nc2 O(n)
La funci
on T (n) arroja que el tiempo de ejecuci
on es c1 + nc2 , por lo tanto, su complejidad es O(n).
8.1
Clase de Recurrencia
cnk
aT (n/b) + cnk
si 1 n < b
si n b
(2)
donde a es el n
umero de subproblemas, n/b el tama
no de cada uno de los subproblemas.
Particularmente, si n es potencia de b se cumple que:
(
T (n) =
O(nk )
O(nk logn)
O(nlogb a )
si a < bk
si a = bk
si a > bk
(3)
cnk
aT (n b) + cnk
si 1 n b
si n > b
(4)
donde a es el n
umero de invocaciones recursivas que se realizan y n b el tama
no de cada una.
Particularmente, si n es divisible entre b se cumple que:
T (n) =
5 En
O(nk )
O(nk+1 )
kdivb
O(na
)
si a < 1
si a = 1
si a > 1
44
(5)
8.2
Ejercicios
c1
T (n/2) + c2
si n 1
si n > 1
(6)
Es importante destacar que en algunos casos, como el algoritmo presentado, es posible separar la condici
on base y la condici
on
recursiva y as determinar de forma sencilla la forma de T (n). Una vez expresada la funci
on T (n) queda estudiar su comportamiento y expresarla en funci
on del n
umero de veces que se ejecuta, el n
umero de k veces. Realizando este procedimiento
por sustituci
on queda:
T (n)
=
=
=
=
=
=
T (n/2) + c2
[T (n/4) + c2 ] + c2 = T (n/4) + 2c2
[T (n/8) + c2 ] + 2c2 = T (n/8) + 3c2
[T (n/16) + c2 ] + 3c2 = T (n/16) + 4c2
...
T (n/2k ) + kc2
Teniendo la representaci
on general de T (n), queda determinar en que punto dichas iteraciones alcanzan n = 1 (cuando
n/2k = 1). As se obtiene:
2k = n k = log2 (n)
Sustituyendo en la ecuaci
on original se puede determinar el tiempo T (n) del algoritmo.
T (n)
=
=
Ideas Finales
La complejidad de un algoritmo depende del tama
no del problema que se presenta al momento de ser ejecutado
La complejidad hace referencia a cu
anto tiempo se tomar
a en ejecutarse un algoritmo (comportamiento pr
actico y
te
orico)
45
Se estudian tres comportamientos de los algoritmos: peor caso, caso promedio y mejor caso. Para ello se requiere el
c
alculo de la cantidad de instrucciones que contiene el algoritmo, T (n) y de acuerdo a su comportamiento asint
otico
obtener el orden O
El c
alculo de la complejidad de algoritmos recursivos no es una tarea trivial. Por ello, se suele utilizar funciones de
recurrencia conocidas con el fin de ajustar el comportamiento de un algoritmo a una de dichas funciones.
10
Problemas
3. Dado un arreglo desordenado de valores del tipo Real, se desea implementar una operaci
on selectora, que dado un
par
ametro k, retorna el valor correspondiente a la posici
on k del arreglo si este estuviera ordenado (sin ordenarlo).
Defina un algoritmo que sea eficiente que dado cierto k y cualquier arreglo, el tiempo de b
usqueda sea el mismo. Calcule
formalmente la complejidad en tiempo del programa.
4. Calcule la complejidad del siguiente algoritmo:
5. Dada la siguiente unidad invocable:
void Beta ( )
Integer
N, X, Y, Z, M
X =0; Y =0; Z =0;
Read ( N )
M = 2 N
f o r I n t e g e r I = 1 t o M do
X = X + 1
Y = Y + (3 I )
Z = (2 I ) + 6 + Z ;
end
Print ( X ) ; Print ( Y ) ; Print ( Z ) ;
end
],
I n t e g e r prim ,
46
I n t e g e r ult ) :
Integer
end
m i t a d =( p r i m+u l t ) d i v 2
t e r c = ( ultp r i m ) d i v 3
r e t u r n a [ m i t a d ] + W e i r d o ( a , p r i m , p r i m+t e r c ) + W e i r d o ( a , ultt e r c , u l t )
end
47
Parte V
Tipo List
El tipo de dato List representa a una lista de elementos la cual permite representar una serie de actividades, tareas, objetos,
etc. Una lista del mercado, una lista de cosas por hacer, una lista de libros por leer, entre muchos otros ejemplos de la vida
diaria.
Una lista es una colecci
on finita de elementos del mismo tipo, ordenados de acuerdo a su posici
on en la lista. Podemos utilizar
la siguiente notaci
on para denotar una lista L de n elementos: si la lista es vaca se denota como L = (), y si contiene elementos
entonces como L = (e1 , e2 , ..., ek ). Generalmente las listas tienen las siguientes caractersticas:
Todos los elementos son de un mismo tipo de dato
Las listas pueden crecer o decrecer en tiempo de ejecuci
on
Se pueden subdividir en sublistas
Su acceso es de forma secuencial (un elemento seguido de otro)
Un tipo List es una estructura flexible que puede crecer y acortarse seg
un se requiera. Mediante una posici
on dentro de la lista
es posible moverse y efectuar operaciones b
asicas como insertar, eliminar, modificar un elemento, o concatenarse con otras
listas. Una clasificaci
on b
asica de listas puede ser de acuerdo al n
umero de enlaces o conexiones con los otros elementos de la
lista. As, se pueden clasificar en listas simplemente enlazadas (acceso en un solo sentido) o doblemente enlazadas (acceso en
ambos sentidos). A continuaci
on se describe cada una de ellas.
1.1
Simplemente Enlazada
Especificaci
on
En una especificaci
on de una estructura de datos se pueden diferenciar dos roles principales: usuario y programador. En el
rol de usuario, se emplea la estructura de datos sin conocer c
omo est
a implementado sino empleando los metodos dispuestos
en la especificaci
on de la estructura. Ahora, el rol de programador incluye el uso de la estructura seg
un su especificaci
on y la
forma como ser
a implementado (i.e. uso de variables, desarrollo de las unidades invocables).
Para la especificaci
on de la lista, se define como atributo un tipo de dato que represente una posici
on dentro de una lista. Esta
posici
on en su implementaci
on puede ser un tipo Integer, Pointer, entre otros. As, el tipo List se especifica en la siguiente
clase.
c l a s s L i s t <T>
public :
Type <... > t P o s i t i o n
// d e f i n i c i o
n de una p l a n t i l l a o t e m p l a t e de l i s t a s , T i n d i c a
el
t i p o de d a t o
// t i p o de d a t o p o s i c i o
n para d e s p l a z a r s e ( s i n m o s t r a r l a i m p l e m e n t a c i o
n )
48
Constructor List ( )
Destructor List ( )
// c o n s t r u y e l a l i s t a vac a ( ) .
// d e s t r u c t o r de l a c l a s e . L i b e r a l a
l i s t a de memoria
f u n c t i o n I s E m p t y ( ) : Boolean
// r e t o r n a True s i l a l i s t a e s vac a , y f a l s e en c a s o c o n t r a r i o
function First () : tPosition
// r e t o r n a l a p o s i c i o
n d e l 1 e r e l e m e n t o de l a l i s t a , o L a s t ( ) s i l a l i s t a e s vac a
function Last ( ) : tPosition
// r e t o r n a l a p o s i c i o
n f i n a l de l i s t a ( p o s i c i o
n despu
e s del u
ltimo )
v o i d N e x t ( r e f t P o s i t i o n p V a l u e ) // Pre : pValue != L a s t ( ) . Mueve l a p o s i c i
on h a c i a l a p o s i c i
o n s i g u i e n t e de l a l i s t a
f u n c t i o n G e t ( t P o s i t i o n p V a l u e ) : r e f T // Retorna l a r e f e r e n c i a a l a i n f o r m a c i o
n c o n t e n i d a en pValue
v o i d I n s e r t ( r e f T x , t P o s i t i o n p V a l u e ) // I n s e r t a x a n t e s de l a p o s i c i
o n pValue
void Delete ( tPosition pValue )
// Pre : pValue != L a s t ( ) . E l i m i n a e l e l e m e n t o de pValue . La p o s i c i o
n pValue queda
// r e f e r e n c i a n d o a un e l e m e n t o i n e x i s t e n t e
function Size ( ) : I n te g e r
// r e t o r n a e l n
u mero de e l e m e n t o s en l a l i s t a
end
N
otese que la funci
on Last retorna la posici
on final o posici
on disponible al final de la lista, lo cual difiere a ser el u
ltimo
elemento de la lista. Del mismo modo, es importante destacar que existe pase de par
ametros por referencia y retorno de la
referencia del tipo de dato T que es empleado de forma generica como plantilla en la clase.
1.1.2
Ejemplos
A continuaci
on una serie de ejemplos donde se utiliza las unidades invocables presentes en el tipo List sin conocer su implementaci
on.
- Dada una lista, imprimir sus elementos
v o i d P r i n t L i s t ( r e f L i s t <T> L )
tPosition tIndex = L . First ()
w h i l e t I n d e x != L . L a s t ( ) do
Print ( L . Get ( tIndex ) )
L . Next ( r e f tIndex )
end
end
// tambi
e n s e puede e m p l e a r L . Get ( t I n d e x ) = i S i x S i x S i x
Siendo muy similar al algoritmo anterior, dado el primer elemento de la lista se itera sobre cada elemento y se emplea la
funci
on Insert dada la posici
on y la constante a a
nadir.
- Dada una lista de valores enteros, eliminar todos los elementos que tengan valor mayor a 15:
v o i d D e l e t e 1 5 ( r e f L i s t <I n t e g e r > L )
tPosition tIndex = L . First ()
w h i l e t I n d e x != L . L a s t ( ) do
i f L . G e t ( t I n d e x ) > 15 t h e n
tPosition tTemp = tIndex
L . Next ( r e f tTemp )
L . Delete ( tIndex )
tIndex = tTemp
else
L . Next ( r e f tIndex )
end
end
end
Esta funci
on busca todas las posiciones que cumplen con la condici
on > 15 y para cada una salta una posici
on m
as all
a
de la actual con el fin de eliminar todos aquellos elementos que cumple dicha condici
on. Existen algunas consideraciones que
se deben tomar en cuenta al momento de su ejecuci
on, pero que dependen de la implementaci
on tal como liberaci
on de la
memoria si es din
amica, enlace de los elementos de forma correcta, entre otros.
49
-Concatenar dos listas del tipo User llamadas A y B, y dejar el resultado en la lista A
v o i d C o n c a t ( r e f L i s t<U s e r> A , B )
tPosition tIndex = B . First ()
w h i l e t I n d e x != B . L a s t ( ) do
A . Insert ( B . Get ( tIndex ) , A . Last ( ) )
B . Next ( r e f tIndex )
end
end
Al igual que operar sobre un par de arreglos, dada la lista A y a partir de su posici
on final se anexar
a cada uno de los elementos
que pertenecen a B hasta que no queden elementos en B. Nuevamente, aspectos como no eliminar los elementos de B o el
tama
no m
aximo de elementos de A, son concernientes al programador.
1.1.3
Implementaci
on
La forma b
asica de implementar una lista simplemente enlazada es empleando un arreglo unidimensional din
amico, donde
a medida que se agreguen o eliminen elementos, el tama
no de la lista se modifica. Una operaci
on de acceso, inserci
on,
eliminaci
on y b
usqueda tendr
a complejidad O(n), pero con una implementaci
on simple. Otra forma de implementar el tipo
List con arreglos, es empleando un arreglo de registros, donde cada posici
on contiene el valor a almacenar (informaci
on) y el
ndice al pr
oximo elemento dentro de la lista. Al mismo tiempo, es posible tener sublistas para definir las pr
oximas posiciones
libres u ocupadas del arreglo. A diferencia de la implementaci
on anterior, esta es est
atica y se debe definir un tama
no m
aximo
de elementos.
En diversos lenguajes de programaci
on existen implementaciones din
amicas de listas como es el caso en C++ empleando la
librera STL (i.e. vector), en Java de forma nativa (i.e. Vector), en Python se emplea como un tipo de dato secuencia, entre
otros. A continuaci
on, estudiaremos diversas implementaciones .
Implementaci
on con arreglos Para la implementaci
on con arreglos se asume que existe un tama
no m
aximo o que se modifica
de forma din
amica. Ahora, el punto importante es que para cada posici
on dentro del arreglo se debe conocer cu
al es el pr
oximo
elemento dada una posici
on.
De este modo, la Fig. 12 muestra un ejemplo de una posible distribuci
on del tipo List empleando arreglos.
50
campo pN ext hasta llegar al final de la lista. Empleando apuntadores, el final de la lista se ubica cuando el pr
oximo es NIL
(representado por el smbolo \\ en la figura.
pFirst
tInfo e1
tInfo e2
pNext
tInfo e3
pNext
pNext
tInfo e4
pNext
c l a s s N o d e <T>
public :
T tInfo
N o d e<T> p N e x t
end
c l a s s L i s t <T>
private :
N o d e<T> p F i r s t
I n t e g e r iN
// a p u n t a d o r a l p r i m e r nodo
// n
u mero de e l e m e n t o s en l a
public :
Type N o d e<T> t P o s i t i o n
// l a
lista
posici o
n e s un a p u n t a d o r a Node<T>
Constructor List ( )
iN = 0
p F i r s t = NIL
end
Destructor List ( )
N o d e<T> p T e m p
w h i l e p F i r s t != NIL t h e n
pTemp = pFirst
pFirst = ( pFirst ) . pNext
d e l e t e pTemp
end
end
f u n c t i o n I s E m p t y ( ) : Boolean
r e t u r n p F i r s t == NIL
end
function First ()
return pFirst
end
function Last ( )
r e t u r n NIL
end
tPosition
tPosition
ref T
51
iN = iN + 1
end
void Delete ( tPosition pValue )
i f p F i r s t == p V a l u e t h e n
pFirst = pFirst . pNext
else
N o d e<T> p T e m p = p F i r s t
w h i l e p T e m p . p N e x t != p V a l u e do
pTemp = pTemp . pNext
end
pTemp . pNext = pValue . pNext
end
delete pValue
iN = iN 1
end
function Size ( )
r e t u r n iN
end
end
Integer
// a p u n t a d o r a l nodo c a b e z a . E s t e a p u n t a d o r no s e m o d i f i c a
// a p u n t a d o r a l u
l t i m o nodo ( nodo cuyo pr
o ximo e s NIL )
// n
u mero de e l e m e n t o s en l a l i s t a
public :
Type N o d e<T> t P o s i t i o n
// l a
posici o
n e s un a p u n t a d o r a Node<T>
Constructor List ( )
iN = 0
p F i r s t = new N o d e ( )
pLast = pFirst
p F i r s t . p N e x t = NIL
end
Destructor List ( )
N o d e<T> p T e m p
w h i l e p F i r s t != NIL t h e n
pTemp = pFirst
pFirst = ( pFirst ) . pNext
d e l e t e pTemp
end
end
f u n c t i o n I s E m p t y ( ) : Boolean
r e t u r n p F i r s t . p N e x t == NIL
end
function First ()
return pFirst
end
function Last ( )
return pLast
end
tPosition
tPosition
52
Integer
Implementaci
on eficiente con apuntadores En la primera implementaci
on con apuntadores todas las operaciones son O(1)
a excepci
on de las funciones Insert y Delete. Para lograr que estas operaciones sean O(1), se debe emplear como posici
on la
direcci
on del campo pNext del nodo anterior. Dado que el primer nodo no posee un nodo anterior, se emplea la direcci
on de
pFirst. De esta manera, no se buscar
a al nodo anterior en la inserci
on y eliminaci
on ya que se referenciar
a al campo pNext
del nodo anterior. As, todas las operaciones son O(1) a excepci
on de Last() porque esta debe retornar el apuntador al campo
pNext del u
ltimo nodo (o la direcci
on de pFirst) de complejidad O(N ) en el peor de los casos. Para evitar ello, se introduce
un atributo apuntador para el u
ltimo campo pNext como atributo de la lista, el cual posiblemente deba actualizarse durante
la operaci
on de inserci
on y eliminaci
on.
c l a s s N o d e <T>
public :
T tInfo
N o d e<T> p N e x t
end
c l a s s L i s t <T>
public :
Type N o d e<T > t P o s i t i o n
private :
N o d e<T> p F i r s t
tPosition pLast
I n t e g e r iN
// l a
posici o
n e s un a p u n t a d o r d o b l e a Node<T>
// a p u n t a d o r a l p r i m e r nodo
// a p u n t a d o r a l u
l t i m o nodo
// n
u mero de e l e m e n t o s en l a l i s t a
public :
Constructor List ( )
iN = 0
p F i r s t = NIL
pLast = r e f pFirst
end
Destructor List ( )
N o d e<T> p T e m p
w h i l e p F i r s t != NIL t h e n
pTemp = pFirst
pFirst = ( pFirst ) . pNext
d e l e t e pTemp
end
end
f u n c t i o n I s E m p t y ( ) : Boolean
r e t u r n p F i r s t == NIL
53
end
function First () : tPosition
return r e f pFirst
end
function Last ( )
return pLast
end
tPosition
ref T
1.2
Integer
Doblemente Enlazada
Especificaci
on
La especificaci
on de las operaciones de una lista doblemente enlazada general se puede definir como una clase de la siguiente
forma:
c l a s s L i s t D o u b l e <T>
public :
54
// t i p o de d a t o p o s i c i o
n p a r a d e s p l a z a r s e ( no s e muestra l a i m p l e m e n t a c i
o -
Constructor ListDouble ()
// c o n s t r u y e l a l i s t a vac a ( )
C o n s t r u c t o r L i s t D o u b l e ( r e f L i s t <T> l S o u r c e )
// c o n s t r u c t o r de c o p i a
Destructor ListDouble ()
// d e s t r u c t o r de l a c l a s e . L i b e r a l a v l c l i s t a de memoria
end
f u n c t i o n I s E m p t y ( ) : Boolean
// r e t o r n a True s i l a l i s t a e s vac a , y f a l s e en c a s o c o n t r a r i o
function Start () : tPosition
// r e t o r n a l a p o s i c i o
n d e l i n i c i o de l a l i s t a ( p r e v i o a l p r i m e r o )
function First () : tPosition
// r e t o r n a l a p o s i c i o
n d e l 1 e r e l e m e n t o de l a l i s t a
f u n c t i o n End ( ) : tPosition
// r e t o r n a l a p o s i c i o
n f i n a l de l a l i s t a ( despu
e s del u
ltimo )
function Last ( ) : tPosition
// r e t o r n a l a p o s i c i o
n d e l u
l t i m o e l e m e n t o de l a l i s t a
v o i d N e x t ( r e f t P o s i t i o n p V a l u e ) // Pre : pValue != End ( )
v o i d P r e v ( r e f t P o s i t i o n p V a l u e ) // Pre : pValue != S t a r t ( )
f u n c t i o n G e t ( t P o s i t i o n p V a l u e ) : r e f T // Retorna l a r e f e r e n c i a a l a i n f o r m a c i o
n c o n t e n i d a en pValue
v o i d P r e I n s e r t ( r e f T x , t P o s i t i o n p V a l u e ) // Pre : pValue != S t a r t ( ) . I n s e r t a x a n t e s de
pValue .
v o i d P o s t I n s e r t ( r e f T x , t P o s i t i o n p V a l u e ) // Pre : pValue != End ( ) . I n s e r t a x despu
e s de pValue .
void Delete ( tPosition pValue )
// Pre : pValue e s v
a l i d a . E l i m i n a e l e l e m e n t o de p o s i c i
o n pValue .
function Size ( ) : I n te g e r
// r e t o r n a e l n
u mero de e l e m e n t o s en l a l i s t a
1.2.2
Ejemplos
!= 3 ) do
Implementaci
on
De forma similar que las listas simplemente enlazadas, existen diversas implementaciones de las listas doblemente enlazadas:
empleando arreglos y apuntadores. Un aspecto relevante es la posibilidad de particularizar la estructura de datos para resolver
problemas especficos. Por ejemplo, buscar en un rango ordenado de valores de forma eficiente un valor; representar los lugares
de una mesa redonda como una lista circular (caso particular de lista doblemente enlazada); o emplear m
ultiples apuntadores
dentro de una lista para crear sub-listas (una lista de enteros donde se ordenen los n
umeros pares e impares como sublistas de
esta).
En la Fig. 14 se muestra una representaci
on de una estructura ListDouble empleando apuntadores. En ella, existen dos
apuntadores principales pFirst y pLast. Al mismo tiempo, en cada nodo existen 2 apuntadores que van a permitir el recorrido
en ambos sentidos: pNext y pPrev.
Es posible que una lista con enlaces no solo tenga una conexi
on con el nodo anterior y con el previo, sino que requiera
conectarse con otro nodo de forma salteada de acuerdo ala naturaleza del problema. Por ello, a continuaci
on se muestra las
listas multienlazadas o con m
ultiples enlaces.
55
pFirst
pLast
tInfo e1
pPrev
tInfo e2
tInfo e3
tInfo e4
pPrev
pPrev
pPrev
pNext
pNext
pNext
pNext
Lista Multienlazada
Una lista multienlazada o n-enlazada tiene como caracterstica que sus nodos contienen enlaces que los asocian con m
as de
una lista. Esto quiere decir que con una misma lista fsica, los diferentes apuntadores hacen que en realidad se enlacen n listas
l
ogicas o se manipulen de forma particular de acuerdo a dichos enlaces.
De este modo, las listas doblemente enlazadas son un caso particular de listas multienlazadas donde:
1. Cada nodo tiene 2 identificadores de tipo Pointer
2. Los apuntadores son exactamente inversos una de otro
As, en una lista multienlazada cada nodo puede tener cualquier cantidad de apuntadores a otros nodos que pueden formar
diversas estructuras o no. Por ejemplo, dada una lista de personas enlazada entre s de dos maneras:
1. Ordenada alfabeticamente por el primer apellido
2. Ordenada ascendentemente por su documento de identidad
Es posible representar dicha informaci
on como dos listas, pero existe el problema de la doble representaci
on de los nodos
(nodos duplicados) tanto en su representaci
on como en el desarrollo de sus operaciones. Entonces, las operaciones de Insert o
Delete deben realizarse en ambas listas. Una soluci
on es representar mediante el uso de apuntadores en una lista multienlazada
estas dos listas l
ogicas en una sola lista fsica, definiendo sus nodos (ver Fig. 15).
CPerson
56
public :
String strName
Integer iDocIdentidad
end
c l a s s Node
public :
CPerson Info
Node pNextN
Node pNextC
end
lista
57
2.1
Una estructura Sparse Matrix, o matriz esparcida o matriz dispersa es una combinaci
on de estructuras que se utiliza para
representar solamente los elementos que son significativos en una matriz est
atica grande, buscando lograr una menor complejidad en memoria. Esta estructura deriva del an
alisis numerico donde una Sparse Matrix es una matriz la cual la mayora
de sus elementos son cero (inverso a matriz densa). La estructuta de matriz esparcida es por naturaleza m
as f
acil de comprimir
sus datos y requiere del uso de algoritmos que difieren de los cl
asicos empleados en matrices densas.
Para analizar un poco la ventaja en complejidad en espacio que puede representar una matriz esparcida se muestra un ejemplo:
Dada una matriz de 50 50 elementos y solo son significativos 100 de ellos (no nulos, diferentes a cero, con valor true, etc.,
dependiendo de la clase de informaci
on que se guarde), existe un desperdicio de memoria significativo.
Calculando la complejidad en memoria de una matriz de enteros est
atica de tama
no 50 50.
Array a M a t r i x o f I n t e g e r [ 1 . . 5 0 ] [ 1 . . 5 0 ]
C M ( a M a t r i x ) = ( 5 0 1 + 1 ) ( 5 0 1 + 1 ) C M ( I n t e g e r ) = 2500 p a l a b r a s
Esto indica que aMatrixSparse es solo una quinta parte de aMatrix en espacio en memoria.
2.1.1
Implementaci
on
La forma cl
asica de implementar una estructura Sparse Matrix es empleando apuntadores para la definici
on de los elementos
que la conformar
a. A continuaci
on se muestra una posible representaci
on implementada con apuntadores.
c l a s s N o d e <T>
public :
T tInfo
I n t e g e r iIdF , iIdC
N o d e<T> p N e x t R , p N e x t C
58
end
c l a s s N o d e R <T>
// e n c a b e z a d o s de l a s
public :
I nt e g er iIdR
T tInfo
N o d e R <T> p N e x t
N o d e <T> p F i r s t
end
f i l a s de l a m a t r i z
c l a s s N o d e C <T>
// e n c a b e z a d o s de l a s columnas de l a m a t r i z
public :
I nt e g er iIdC
N o d e C <T> p N e x t
N o d e <T> p F i r s t
end
c l a s s H e a d N o d e M <T>
public :
N o d e R <T> p F i r s t R
N o d e C <T> p F i r s t C
end
c l a s s S p a r s e M a t r i x <T>
public :
H e a d N o d e M <T> M a t r i x
f u n c t i o n i s E l e m e n t O f ( I n t e g e r iI , i J ) : B o o l e a n
v o i d I n s e r t ( T t I n f o , I n t e g e r iI , i J )
v o i d D e l e t e ( I n t e g e r iI , i J )
end
N
otese que las listas dentro de una matriz esparcida tambien se pueden usar doblemente enlazadas incorporando dos apuntadores a cada tipo Node: uno para el previo por fila y otro para el previo por columna (o en las listas de nodos cabeza (i.e.
Node* pPrevR, pPrevC).
2.1.2
Ventajas y Desventajas
Tipo Stack
Es una estructura de datos representado como un conjunto de elementos ordenados, donde el acceso a cada uno de sus elementos
es en orden inverso a como se han agregado. El tipo Stack, sigue el esquema LIFO (last in first out) donde el u
ltimo en entrar
(ser insertado en la estructura) ser
a el primero en salir o ser tratado para almacenar y recuperar datos. Hay m
ultiples a
mbitos
donde se utilizan este tipo pila como estructura de datos debido su simplicidad y orden implcito. (e.g. la pila de ambientes
de programas, simulaci
on de una pila de libros o una mano de cartas, almacenar expresiones en notaci
on polaca, etc.). En
todo momento, solamente se tiene acceso a la parte superior de la pila (tope). Para el manejo de los datos, las operaciones
act
uan sobre el tope de la pila: colocar un objeto (push/apilar) y su operaci
on inversa, retirar el u
ltimo elemento apilado
(pop/desapilar).
La Fig. 18 se observa de forma gr
afica un tipo Stack. Se puede ver que existe un tope y una base, donde los elementos entran
a la pila por el tope y el primer elemento insertado siempre formar
a la base.
3.1
Especificaci
on
59
C o n s t r u c t o r S t a c k ( ) // c o n s t r u y e l a p i l a vac a .
Destructor Stack ()
// d e s t r u y e l a p i l a .
f u n c t i o n I s E m p t y ( ) : Boolean
// i n d i c a s i l a p i l a e s t a
vac a o no
void Push ( r e f T x )
// a g r e g a un nuevo e l e m e n t o a l t o p e de l a p i l a . S s e g u r a que Top ( )==x
void Pop ( )
// p r e c o n d i c i o
n : l a p i l a no puede e s t a r vac a . E l i m i n a e l e l e m e n t o d e l t o p e
function Size ( ) : I n te g e r
// d e v u e l v e e l \# de e l e m e n t o s en l a p i l a
f u n c t i o n Top ( ) : T
// p r e c o n d i c i
o n : l a p i l a no puede e s t a r vac a y r e t o r n a l a i n f o r m a c i o
n d e l t o p e
end
3.2
Implementaci
on
Implementaci
on reutilizando la clase List Empleando el mecanismo de herencia, se puede implementar una pila basado en
superclase lista aplicando todas las operaciones definidas en su especificaci
on. Se emplea la herencia simple, donde todos los
miembros p
ublicos de la clase List ser
an privados dentro de la subclase Stack.
c l a s s S t a c k <T> i n h e r i t e d L i s t <T>
public :
C o n s t r u c t o r S t a c k ( ) // c o n s t r u y e l a p i l a vac a . El c o n s t . de l a
// s e puede i n v o c a r a t h i s . L i s t ( ) p e r o no e s n e c e s a r i o
end
D e s t r u c t o r S t a c k ( ) // s e d e s t r u y e l a
end
f u n c t i o n I s E m p t y ( ) : Boolean
r e t u r n L i s t<T > : : I s E m p t y ( )
end
// l a
s u p e r c l a s e e s i n v o c a d a i m p l c i t a m e n t e
p i l a . El d e s t r u c t o r de l a
pila
est
a vac a s i
la
s u p e r c l a s e e s i n v o c a d a i m p l c i t a m e n t e
lista
( superclase ) lo
v o i d P u s h ( r e f T x ) // s e asume que e l t o p e e s e l p r i m e r o de l a
Insert ( x , First () )
end
void Pop ( )
// dado que e l t o p e e s e l p r i m e r o de l a
Delete ( First () )
end
f u n c t i o n S i z e ( ) : I n t e g e r // e l tama
n o de l a
r e t u r n L i s t<T > : : S i z e ( )
end
f u n c t i o n Top ( ) : T
// r e t o r n a
return Get ( First ( ) )
end
end
est a
lista
l i s t a , se elimina
e l primero
p i l a s e r e d u c e a s a b e r e l tama
n o de l a
e l e l e m e n t o d e l tope , e s d e c i r ,
e l 1 r o de l a
lista
lista
Implementaci
on con apuntadores En esta caso, se realiza la implementaci
on directamente con apuntadores al tipo Node
siguiendo la especificaci
on ya definida.
c l a s s N o d e <T>
public :
T tInfo
N o d e<T> p N e x t
60
end
c l a s s S t a c k <T>
private :
N o d e<T> p T o p
I n t e g e r iN
public :
Constructor Stack ()
iN = 0
p T o p = NIL
end
Destructor Stack ()
w h i l e p T o p != NIL do
N o d e<T> p T e m p = p T o p
pTop = pTop . pNext
d e l e t e pTemp
end
end
function IsEmpty ()
r e t u r n i N == 0
end
: Boolean
void Push ( r e f T x )
N o d e<T> p N e w = new N o d e
pNew . x = x
pNew . pNext = pTop
pTop = pNew
iN = iN + 1
end
void Pop ( )
N o d e<T> p T e m p = p T o p
pTop = pTop . pNext
d e l e t e pTemp
iN = iN 1
end
function Size ( )
r e t u r n iN
end
Integer
f u n c t i o n Top ( ) : T
return pTop . tInfo
end
end
3.3
Algoritmos
A continuaci
on una serie de algoritmos sencillos para demostrar el uso del tipo Stack.
3.3.1
Par
entesis
El problema de la parentesis consiste en verificar que una secuencia de parentesis sea correcta en al abrir-cerrar, es decir,
se consideran correctos (()), [], ()[] dado que para smbolo de parentesis de apertura siempre tendr
a su equivalente de cierre
(basado en agrupamiento). Se consideran incorrectos los siguientes por ejemplo (()(, [[)]] ([)] entre otros.
f u n c t i o n P a r e n t h e s i s ( S t r i n g strText , I n t e g e r iN ) : Boolean
S t a c k <Char> S
f o r I n t e g e r i K = 1 t o i N do
i f s t r T e x t [ i k ] == ' ( ' o r s t r T e x t [ i k ] == ' [ ' o r s t r T e x t [ i k ] == ' { ' t h e n
S . Push ( s t r T e x t [ ik ] )
e l s e i f S . IsEmpty ( ) then
return f a l s e
else
// v e r i f i c a r o no que s e a ' ) ' , ' ] ' o ' } '
S . Pop ( )
end
end
return S . IsEmpty ()
end
String strText = {() () [ ] }
i f P a r e n t h e s i s ( strText , 8) then
Print ( Correcto )
end
61
Notaci
on PostFija
La notaci
on postfija o notaci
on polaca inversa (Reverse Polish Notation - RPN) es un metodo algebraico alternativo de
representaci
on de datos de entrada. En la RPN cada operador est
a antes de sus operandos, por ejemplo 3 4 + representa 3 +
4.
f u n c t i o n I s D i g i t ( Char c V a l u e ) : B o o l e a n
r e t u r n ( c V a l u e >= ' 0 ' and c V a l u e <= ' 9 ' )
end
f u n c t i o n C h a r 2 I n t ( Char c V a l u e ) :
return cValue ' 0 '
end
Integer
f u n c t i o n C o m p u t e ( I n t e g e r i O p 1 , i O p 2 , Char c O p ) :
i f c O p == '+' t h e n
return iOp1 + iOp2
e l s e i f c O p == ' ' t h e n
return iOp1 iOp2
e l s e i f c O p == ' ' t h e n
return iOp1 iOp2
e l s e i f c O p == ' / ' t h e n
return iOp1 / iOp2
// iOp2 must be != 0
end
Integer
f u n c t i o n R P N ( S t r i n g s t r E x p , I n t e g e r i N ) : I n t e g e r // R e v e r s e P o l i s h N o t a t i o n
I n t e g e r iOp1 , iOp2
S t a c k <I n t e g e r > S
f o r I n t e g e r i K = 1 t o i N do
i f I s D i g i t ( strExp [ iK ] ) then
S . Push ( C h a r 2 I n t ( strExp [ iK ] ) )
else
iOp1 = S . Top ( )
S . Pop ( )
iOp2 = S . Top ( )
S . Pop ( )
S . Push ( C o m p u t e ( iOp1 , iOp2 , strExp [ iK ] ) )
end
end
return S . Top ( )
end
P r i n t ( R P N ( 59+2 , 5 ) )
3.3.3
// o u t p u t : 28
Invertir Pila
Utilizando u
nicamente las primitivas de la clase Stack, la idea es invertirla sin utilizar estructuras auxiliares. Este problema
se basa en el hecho de aprovechar que las invocaciones recursivas se comportan como una pila de estados y permiten guardar
en cada estado, una serie de variables.
v o i d I n s e r t E n d ( r e f S t a c k <I n t e g e r > S ,
i f S . IsEmpty ( ) then
S . Push ( iValue )
else
I n t e g e r iTop = S . Top ( )
S . Pop ( )
InsertEnd ( r e f S , iValue )
S . Push ( iTop )
end
end
Integer iValue )
v o i d R e v e r s e ( r e f S t a c k <I n t e g e r > S )
i f no t S . I s E m p t y ( ) t h e n
I n t e g e r iTop = S . Top ( )
S . Pop ( )
Reverse ( r e f S )
InsertEnd ( r e f S , iTop )
end
end
void PrintStack ( Stack S )
w h i l e no t S . I s E m p t y ( ) do
62
Print ( S . Top ( ) )
S . Pop ( )
end
end
S t a c k <I n t e g e r > s V a l u e s
fillWithSomeValues ( r e f sValues )
// a s i g n a r l e
PrintStack ( sValues )
// i . e . 8 6 3 5 2 7 9
Reverse ( r e f sValues )
PrintStack ( sValues )
// i . e . 9 7 2 5 3 6 8
3.4
valores
Recursi
on
Es posible emplear una estructura de pila para simular los ambientes de programas recursivos (recursi
on simple/ m
ultiple/
anidada/ indirecta). La idea consiste en apilar los resultados obtenidos en un ambiente, para luego combinarlos (extracci
on
del tope) con una operaci
on actual en cierto estado recursivo. De esta forma, es posible simular un algoritmo recursivo de
forma iterativa empleando una pila para almacenar los resultados de cada ambiente recursivo.
Veamos un ejemplo simple con la funci
on Factorial:
Versi
on Iterativa
Su versi
on cl
asica iterativa sirve como gua.
f u n c t i o n F a c t o r i a l ( I n t e g e r iN ) :
Integer iResult = 0
i f i N <= 1 t h e n
return 1
else
iResult = Factorial ( n 1)
return iResult n
end
end
Integer
Versi
on que simula la recursi
on
Una forma de simularla es a
nadiendo todos los valores y con los valores, ir extrayendolos uno a uno y calcular el valor del
factorial.
f u n c t i o n F a c t o r i a l ( I n t e g e r iN ) : I n t e g e r
Integer iResult = 1
S t a c k <I n t e g e r > S
w h i l e i N > 1 do
S . Push ( iN )
iN = iN 1
end
iResult = 1
w h i l e ( no t S . I s E m p t y ( ) ) do
iResult = iResult S . Top ( )
P . Pop ( )
end
end
63
Tipo Queue
Es una estructura de datos representada como una lista ordenada donde el acceso a sus elementos se realiza desde un extremo
de esta. Una cola sigue el esquema FIFO (first in first out) donde el primer elemento en ser agregado ser
a el primero en ser
removido o tratado para almacenar y recuperar datos. En una cola existe la definici
on de back (por donde se insertan los
elementos) y front (por donde se extraen). El proceso de a
nadir un elemento se conoce como encolar (queue) y el proceso inverso
desencolar (dequeue). En muchos problemas se utilizan colas: cola en una taquilla, cola de impresi
on, cola de transacciones
bancarias en software, cola de autos, etc.
La Fig. 19 muestra la forma del tipo Queue donde se aprecia el Back (por donde se insertan los elementos) y Front (por donde
se extraen los elementos).
4.1
Especificaci
on
c l a s s Q u e u e <T>
public :
C o n s t r u c t o r Q u e u e ( ) // c o n s t r u y e l a c o l a vac a
Destructor Queue ()
// d e s t r u y e l a c o l a
end
f u n c t i o n I s E m p t y ( ) : Boolean
// i n d i c a s i l a c o l a e s t
a vac a o no
void Enqueue ( r e f T x )
// a g r e g a e l e l e m e n t o x a l f i n a l de l a c o l a
void Dequeue ()
// p r e c o n d i c i o
n : c o l a no vac a , e l i m i n a e l e l e m e n t o que e s t
a p r i m e r o en l a c o l a
function Size ( ) : I n te g e r
// d e v u e l v e e l \# de e l e m e n t o s de l a c o l a
function Head ( ) : T
// p r e c o n d i c i
o n : c o l a no vac a , r e t o r n a l a i n f o r m a c i o
n d e l p r i m e r e l e m e n t o dela cola
La especificaci
on del tipo Queue es muy simple y cuenta b
asicamente con las funciones de Enqueue, Dequeue y Head las cuales
permiten que opere con el esquema FIFO.
4.2
Implementaci
on
Al igual que la clase Stack, es posible implementar la clase Queue como una clase que hereda de List o con apuntadores
simples.
Implementaci
on reutilizando la clase List Empleando el mecanismo de herencia, se puede implementar una pila basado en
superclase lista que implemente todas las operaciones del tipo Queue empleando herencia simple.
c l a s s Q u e u e <T> i n h e r i t e d L i s t <T>
public :
C o n s t r u c t o r Q u e u e ( ) // s e c o n s t r u y e l a c o l a vac a . El c o n s t r u c t o r de l a
citamente
end
s u p e r c l a s e e s i n v o c a d a i m p l -
D e s t r u c t o r Q u e u e ( ) // s e d e s t r u y e l a c o l a . El d e s t r u c t o r de l a
end
s u p e r c l a s e e s i n v o c a d a i m p l c i t a m e n t e
f u n c t i o n I s E m p t y ( ) : Boolean
r e t u r n L i s t<T > : : I s E m p t y ( )
end
( superclase ) lo
void Enqueue ( r e f T x )
Insert ( x , Last ( ) )
end
// l a c o l a e s t a
vac a s i
// s e i n s e r t a
void Dequeue ()
// s e e l i m i n a
Delete ( First () )
e l elemento a l
e l que e s t
a de p r i m e r o
64
la
lista
f i n a l de l a c o l a
est
a
end
f u n c t i o n S i z e ( ) : I n t e g e r // e l tama
n o de l a
r e t u r n L i s t<T > : : S i z e ( )
end
p i l a s e r e d u c e a s a b e r e l tama
n o de l a
lista
f u n c t i o n H e a d ( ) : T // s e a c c e d e a l p r i m e r e l e m e n t o de l a c o l a ( e l e l e m e n t o a t e n d i d o )
return Get ( First ( ) )
end
end
Implementaci
on con apuntadores
c l a s s N o d e <T>
public :
T tInfo
N o d e<T> p N e x t
end
c l a s s Q u e u e <T>
private :
N o d e<T> p F i r s t
N o d e<T> p L a s t
I n t e g e r iN
public :
Constructor Queue ()
iN = 0
p F i r s t = p L a s t = NIL
end
Destructor Queue ()
N o d e<T> p T e m p
w h i l e p F i r s t != NIL do
pTemp = pFirst
pFirst = pFirst . pNext
d e l e t e pTemp
end
end
function IsEmpty ()
r e t u r n i N == 0
end
: Boolean
void Enqueue ( r e f T x )
N o d e<T> p N e w = new N o d e
pNew . tInfo = x
p N e w . p N e x t = NULL
i f p F i r s t == NULL t h e n
pFirst = pNew
else
pLast . pNext = pNew
end
pLast = pNew
iN = iN + 1
end
void Dequeue ()
N o d e<T> p T e m p = p F i r s t
pFirst = pFirst . pNext
d e l e t e pTemp
iN = iN 1
i f p F i r s t == NULL t h e n
p L a s t = NULL
end
end
function Size ( )
r e t u r n iN
end
Integer
function Head ( ) : T
return pFirst . tInfo
end
end
65
Otras estructuras
Existen diversas estructuras de datos en la literatura para el uso en programas computacionales, a continuaci
on se describen
algunas de ellas.
5.1
Una estructura de cola doblemente terminada, o abreviada como deque (double-ended queue) y a veces llamada lista enlazada
cabeza-cola, es una generalizaci
on de cola donde los elementos pueden ser insertados o removidos por delante (head) o por
detr
as (tail). Esta estructura de datos puede contener restricciones en las operaciones de insertar/borrar. De hecho, la
estructura cola y pila derivan de estas restricciones.
5.2
Una cola de prioridad (priority queue) es una estructura de datos muy similar a una lista pero cada elemento tiene una prioridad
asociada. En una cola de prioridad, el elemento con m
as alta prioridad es manejado/procesado antes que un elemento de
prioridad baja. Si existen dos elementos con prioridades iguales, entonces se procesa de acuerdo al orden de la cola.
Una implementaci
on usual es con un heap (ver secci
on 7, parte VI) donde se permite extraer el elemento de mayor prioridad
en O(1).
5.3
Es una estructura de datos que almacena un par clave-valor (key-value), donde la clave representa un identificador (generalmente u
nico) y el valor consiste en el dato a almacenar. Tambien se conoce como map, tabla de smbolos o
diccionario. Un
arreglo asociativo se considera una colecci
on donde siempre se a
naden y remueven elementos del tipo clave-valor. Igualmente,
es posible modificar el valor de un elemento de la colecci
on dada la clave. As, existe una forma de direccionamiento de una
posici
on de la colecci
on dada una clave (lookup).
Una implementaci
on usual es con una tabla hash6 ya que permite una correspondencia (mapping) entre valores y claves.
La utilidad de estructuras de arreglos asociativos deriva b
asicamente en el almacenamiento de datos basados en operaciones
de b
usqueda, eliminaci
on e inserci
on. Las operaciones comunes en este tipo de estructura son:
Insert: Agrega un par (key, value) a la colecci
on, realizando una asociaci
on de la clave con su valor asociado. Los
par
ametros de est
a funci
on son key y value.
Modify: Reemplaza el valor de uno de los pares (key,value) existentes en la colecci
on, cambiando el valor almacenado
en cierto key. Los par
ametros de est
a funci
on son key y value.
Delete: Elimina el valor de uno de los pares (key,value) existentes en la colecci
on. Solo requiere el par
ametro key.
Lookup: Busca el valor (si existe) que est
a asociado a cierto valor de key. El par
ametro de est
a funci
on es el valor de
key y retorna value. Si no se encuentra un valor asociado, entonces deber retornar un valor que indique nulo (o una
excepci
on).
Size: Retorna el n
umero de elementos almacenados en la colecci
on
6 Un
66
Generalmente, la implementaci
on en diversos lenguajes de programaci
on de esta estructura de datos se conoce como map o
hash. Un ejemplo de arreglos asociativos se puede observar en una empresa de alquiler de autos:
{ Ford BRD052 : L u i s M a r t i n e l l i }
{ Volkswagen AFV867 : L u i s M a r t i n e l l i }
{ Ford AAR309 : L u i s a M a r t i n e l l i }
5.4
Tipo Set
Un conjunto (set) es un tipo de dato que almacena valores sin un orden en particular sin repetici
on. Un set es la implementaci
on
matem
atica de un conjunto finito considerando sus operaciones (uni
on, intersecci
on, diferencia y subconjunto). Del mismo
modo, la estructura de datos conjunto puede ser est
atica (inmutable) o din
amica (mutable). La primera de estas permite hacer
consultas para un valor dado y determinar si pertenecen o no a un conjunto. La segunda permite las mismas operaciones que
la est
atica a
nadiendo inserci
on y eliminaci
on.
Un conjunto puede ser de cualquier tipo de dato e implementado de forma contigua en memoria (arreglos) o de forma dispersa
(apuntadores). Las operaciones b
asicas de una estructura conjunto se pueden resumir en: isEmpty, size, insert, delete, add
y elementOf. Existe una estructura de datos llamada multiset o bag la cual es una generalizaci
on del tipo set. La diferencia
radica en que permite repetir valores. De esta forma, es posible considerar dos elementos iguales como un solo elemento y
manteniendo un contador de dicho elemento o
considerados equivalentes y almacenarlos de forma distinta y u
nica. Dependiendo
de la implementaci
on de conjunto, se pueden establecer relaciones de equivalencia dentro de los conjuntos.
Ideas Finales
La estructura din
amica ofrece una ventaja sobre las estructuras est
aticas porque permite expandir o reducir en tiempo
de ejecuci
on el n
umero y tama
no que ocupan sus elementos
Las operaciones que se realizan sobre los tipos de datos din
amicos resultan m
as complejos que su contraparte est
atica
B
asicamente, el tipo List, Stack, Queue y sus derivados ofrecen un orden entre sus elementos tal que imponen restricciones
de c
omo acceder, insertar o eliminar dichos valores
De forma general, es posible implementar diversas estructuras de datos basados en el tipo List. Adicionalmente, el uso
de apuntadores ofrece una flexibilidad que se puede adecuar al problema a resolver
Problemas
1. Las listas enlazadas son por definici
on estructuras de datos homogeneas (es decir, todos sus nodos almacenan elementos
del mismo tipo y estructura). Eso es totalmente cierto?, es decir, Sera posible tener una lista que almacene elementos
diferentes en cada uno de sus nodos (tanto en tipo como en estructura)? Justifique su respuesta
2. Implemente una lista basada en arreglos que simule una lista circular de caracteres con n posiciones y dados dos enteros
m e i, imprima m valores a partir de la posici
on i.
3. Dada un tipo Sparse Matrix M , elabore un algoritmo que imprima los elementos de la diagonal principal si estos est
an
presentes
4. Dada una pila, se desea conocer el promedio de los elementos que ella almacena. Como restricci
on la pila puede ser
recorrida una sola vez.
5. Cu
al sera la utilidad de una cola que contenga el metodo BeTheFirst, que permite colocar un elemento al inicio de la
cola?
6. Una cola medieval se comporta como una cola ordinaria, con la u
nica diferencia de que los elementos almacenados en
ella se dividen en dos grupos: nobles y plebeyos. Dentro de cada grupo, los elementos deben ser atendidos en orden de
llegada; pero siempre que haya nobles en la cola, estos deben ser atendidos antes que los plebeyos. Implemente una cola
medieval heredando de una cola normal, pero sobrescribiendo el metodo Enqueue.
7. Dise
ne un algoritmo que, dado el esquema de prelaci
on de las materias de la carrera Computaci
on y el c
odigo de una
materia, imprima un listado con todas las asignaturas que tengan prelaci
on a una materia dada, en orden cronol
ogico
67
Parte VI
Arboles
Una vez estudiada las estructuras de datos lineales como pilas y colas y con experiencia en recursi
on, estudiaremos el tipo de
dato llamado Tree (
arbol). Los a
rboles son empleados en muchas a
reas de las Ciencias de la Computaci
on, que se incluyen
sistemas operativos, gr
aficos, sistemas de base de datos, y redes de computadoras. Las estructuras de datos Tree tiene mucho
en com
un con su equivalente en bot
anica. Un tree tiene raz, ramas y hojas. La principal diferencia radica en que la raz se
encuentra en la parte superior y las hojas en la parte inferior.
Conceptualmente, el
arbol es una estructura de datos jer
arquica que puede ser definida recursivamente como una colecci
on de
nodos, y cada nodo tiene un valor junto con una lista que referencia a un conjunto de nodos. Del mismo modo, los a
rboles
tienen como restricci
on que no existen elementos duplicados y ning
un elemento apunta a la raz. Pueden existir a
rboles vacos
y conjuntos de a
rboles (llamados bosques).
Un ejemplo se puede ver a continuaci
on:
Figura 21: El
arbol representa el sistema de archivos en Unix. En un sistema de archivos existen archivos y directorios como
una estructura de
arbol.
N
otese que empezando desde la raz, se puede recorrer hasta la parte inferior del a
rbol en un u
nico camino. Igualmente, se
puede ver que todos los hijos de un nodo son independientes de los hijos de otro nodo. As, cada nodo de la parte inferior
(nodo hoja) es u
nico, es decir, existe un solo camino para llegar a este.
Como es sabido, es posible mover un directorio completo de un lugar del sistema de archivos a otros. Cuando se realiza este
proceso, todos los hijos asociados q dicho nodo se mover
an (a este conjunto de nodos se denomina sub
arbol). Por ejemplo, es
posible mover el sub
arbol que empieza en /etc/ (quitarlo del nodo /) y colocarlo por debajo de /usr. As, la ruta de acceso a
http cambiar
a, quedando /usr/etc/http/ sin afectar el contenido o a cualquier directorio hijo de http.
Otro ejemplo basado en un sistema de a
rbol es una p
agina Web escrita en HTML. Para el siguiente c
odigo en HTML:
<html xmlns= h t t p : / /www. w3 . o r g /1999/ xhtml
xml : l a n g= en l a n g= en >
<head>
<meta httpe q u i v= ContentType
c o n t e n t= t e x t / html ; c h a r s e t=u t f 8 />
< t i t l e>P r e m i o N o b e l</ t i t l e>
</ head>
<body>
<h1>L o s c a n d i d a t o s a l p r e m i o s o n :</ h1>
<u l>
< l i >H o m e r J . S i m p s o n</ l i >
< l i >P e t e r G r i f f i n</ l i >
</ u l>
<h2><a h r e f= h t t p : / /www. f a k e p a g e . o r g / v o t i n g >C o n s u l t a r l a s v o t a c i o n e s</ a><h2>
</ body>
</ html>
Su a
rbol asociado se muestra en la Fig. 22.
Definiciones
Formalmente, un a
rbol es un grafo conexo acclico cuyos nodos se relacionan mediante una jerarqua.
En su implementaci
on, un a
rbol de tipo T es una estructura homogenea producto de la concatenaci
on de un elemento de tipo
T junto con un n
umero finito de a
rboles disjuntos (sub
arboles). Una forma particular de un a
rbol es una estructura vaca. Un
a
rbol puede ser representado por una estructura est
atica (arreglos/registros/clases) o
din
amica (apuntadores/listas).
De forma recursiva, un a
rbol es una colecci
on de nodos T1 , T2 , . . . , Tk del mismo tipo tal que:
68
Si k == 0, entonces el
arbol es vaco
Si k > 0, entonces existe un nodo especial llamado raz (generalmente el primero de la definici
on, i.e. T1 ) y los dem
as
nodos forman parte de n 0 conjuntos disjuntos que a su vez son a
rboles. Estos a
rboles se denominan sub
arboles del
nodo raz
Conceptos asociados en la estructura Tree
Nodo - Es la parte fundamental del a
rbol. Es posible que contenga un identificador (llamado key) e informaci
on adicional
(payload)
Enlace Algunas veces llamadas ramas, es otra parte fundamental del a
rbol, un enlace conecta dos nodos y muestra la
relaci
on que existe entre estos. Cada nodo, con excepci
on de la raz, est
a conectado con exactamente un enlace entrante
desde otro nodo. Cada nodo puede tener muchos enlaces salientes
Raz La raz de un a
rbol es el u
nico nodo del a
rbol que no tiene enlaces entrantes. Por ejemplo, el nodo html
Hijos El conjunto de nodos c que tienen enlaces entrantes desde un mismo nodo n se denominan hijos de n. Por ejemplo,
los nodos meta y title son hijos del nodo head.
Padre El concepto inverso a Hijo.
Hermanos Nodos con el mismo padre.
Camino Un camino es una lista ordenada de nodos conectadas por enlaces. Por ejemplo html body h1
Longitud de un camino Es el n
umero de veces que se debe aplicar la relaci
on padre-hijos entre dos nodos que forman
un camino
Descendiente Un nodo alcanzable por un proceso repetitivo empleando los enlaces desde padres a sus hijos (un camino).
Ancestro - A veces llamado antecesor, es un nodo alcanzable por un proceso repetitivo empleando los enlaces desde los hijos
a sus padres (un camino)
Sub
arbol Un sub
arbol es un conjunto de nodos y enlaces formados por un padre y todos los descendientes de ese padre.
Nodo Hoja Tambien llamado nodo terminal o
externo. Es un nodo que no tiene hijos.
Nodo Interno Tambien llamado nodo no-terminal. Es un nodo con al menos un hijo (no es hoja).
Grado Es el n
umero de sub
arboles de un nodo.
Grado de un
arbol Es el m
aximo grado de todos los nodos del a
rbol, i.e. la cantidad m
axima de hijos que soporta cada
nodo
Nivel Es la longitud del camino desde la raz hasta un nodo. Si un a
rbol solo contiene la raz, su nivel es 0.
Altura La altura de un a
rbol se cuenta como el n
umero de enlaces desde el nodo raz hasta la hoja m
as lejana, es decir, el
m
aximo nivel de cualquier nodo en el a
rbol.
Profundidad La longitud m
axima del camino desde un nodo a cualquier de sus descendientes.
Peso El peso de un a
rbol se refiere al n
umero de nodos que contiene el a
rbol.
69
General Tree
2.1
Especificaci
on
Se muestra a continuaci
on la especificaci
on de la clase GenTree que representa a un a
rbol general.
c l a s s G e n T r e e <T>
public :
Constructor GenTree ()
// c r e a un a
r b o l vac o
Destructor GenTree ()
// d e s t r u y e e l
a rbol
function GetRoot ( ) : Node
// r e t o r n a e l nodo c o r r e s p o n d i e n t e a l a r a z
function GetChild ( Node idNode ) : Node
// r e t o r n a e l nodo d e l 1 e r h i j o de idNode ( s e g u
n c o n v e n c i
o n , e l m
as a la izq )
function GetRBrother ( Node idNode ) : Node
// r e t o r n a l a r a z d e l 1 e r sub
a r b o l a l a d e r de idNode con e l mismo p a d r e
f u n c t i o n E x i s t R B r o t h e r ( N o d e i d N o d e ) : B o o l e a n // i n d i c a s i t i e n e hermano d e r e c h o
function GetValue ( Node idNode ) : T
// r e t o r n a e l c o n t e n i d o d e l nodo idNode
function GetParent ( Node idNode ) : Node
// r e t o r n a e l p a d r e de idNode
f u n c t i o n isLeaf ( Node idNode ) : Boolean
// r e t o r n a v e r d a d / f a l s o s i idNode e s h o j a
f u n c t i o n i s E m p t y ( ) : Boolean
// r e t o r n a v e r d a d / f a l s o s i e l
a r b o l no c o n t i e n e nodos
function Insert ( Node idNode )
// i n s e r t a e l nodo idNode a l a
r b o l ( no s e e s p e c i f i c a d
o nde )
function Delete ( Node idNode )
// e l i m i n a e l nodo idNode d e l a
rbol
end
Un ejemplo para el c
alculo del nivel en un GenTree es como sigue:
f u n c t i o n L e v e l ( N o d e<T> i d N o d e ) :
Integer iLevel = 0
N o d e<T> n T e m p = i d N o d e
while nTemp
!= E M P T Y do
nTemp = GetParent ( nTemp )
iLevel = iLevel + 1
end
return iLevel
end
Integer
70
2.2
Implementaci
on
Para la implementaci
on del tipo GenTree se requiere de una estructura tipo Node que almacene el valor de la informaci
on del
a
rbol (el tipo T) e informaci
on de los hijos de dicho nodo. Es importante destacar que cada nodo representa a un a
rbol, o
sub
arbol, por lo que tiene 0 o m
as hijos. Una primera implementaci
on se puede definir como un arreglo de punteros al tipo
Node.
c l a s s N o d e<T>
public :
T tInfo
Array a C h i l d o f N o d e<T> [ 1 . . N ]
end
c l a s s G e n T r e e <T>
private :
N o d e<T> p R o o t
public :
. . . // t h e p u b l i c f u n c t i o n s
end
En dicha implementaci
on, se requiere definir el n
umero m
aximo de hijos que puede tener un nodo. Es decir, si se conoce el
grado del a
rbol, entonces el n
umero m
aximo de dicho a
rbol corresponde con el grado del a
rbol. Sin embargo, es posible que
en un momento dado una gran parte de los nodos tenga un n
umero de nodos menor al grado del a
rbol, implicando que se
desperdicie memoria en dicha implementaci
on. As, una mejor implementaci
on requiere solo crear/reservar espacio en memoria
de los nodos que son creados. Para ello, una implementaci
on en donde los hijos de un nodo se construyen como una lista
basada en apuntadores resulta eficiente. A continuaci
on se muestra un ejemplo de ello.
c l a s s N o d e<T>
public :
T tInfo
L i s t<T> L
end
c l a s s G e n T r e e <T>
private :
N o d e<T> p R o o t
public :
. . . // t h e p u b l i c f u n c t i o n s
end
2.3
Recorridos
El proceso de recorrido de un a
rbol consiste en visitar/recorrer/consultar o realizar una acci
on en cada nodo tal que no
modifique la estructura del
arbol (e.g. imprimir, contar, comparar). Esta visita se realiza bajo cierto orden y la acci
on se
efect
ua una sola vez por nodo. B
asicamente se pueden definir dos recorridos para a
rboles generales: preorder o postorder.
El recorrido en preorder consiste en recorrer primeramente el nodo raz, y luego los nodos que contienen a los hijos desde el
nodo m
as a la izquierda hasta el nodo m
as a la derecha. El recorrido postorder primero recorre los nodos hijos de derecha a
izquierda y luego el nodo raz.
En el ejemplo mostrado en la Fig. 23 sus respectivos recorridos son:
Preorder: 2, 1, 4, 3, 5, 6, 7, 9, 8
Postorder: 1, 4, 5, 6, 9, 7, 8, 3, 2
Binary Tree - BT
Es posible representar diversos comportamientos empleando decisiones de aceptar/rechazar, si/no, fuera/dentro, etc. En
Ciencias de la Computaci
on, se suele emplear estructuras de datos que permitan manejar dichos comportamientos para
solucionar diversos problemas. Por ejemplo, el lanzamiento de una moneda (i.e. moneda ideal) solo tiene dos posibilidades:
cara (H) o sello (T). As, el evento de lanzamiento de una moneda se puede representar como un a
rbol de decisi
on. Por ejemplo
el lanzamiento de una moneda se puede representar gr
aficamente como se muestra en la Fig. 24
Por cada lanzamiento es posible obtener H o T, entonces partiendo desde la raz se muestran las 8 posibles combinaciones (de
izquierda a derecha): HHT, HHT, HTH, HTT, THH, THT, TTH y TTT.
71
3.1
Definiciones
En la teora de a
rboles, un a
rbol es llamado k-ario si cada nodo contiene como m
aximo k hijos. Un caso particular es el
arbol
binario donde k = 2. Si todos los nodos del
arbol, a excepci
on de las hojas, posee exactamente k hijos entonces dicho a
rbol es
completo.
3.2
Recorridos
Un recorrido en un a
rbol binario implica recorrer todos sus nodos de forma sistem
atica y asegurando que se aplica una
operaci
on sobre cada uno de estos solo una vez. Existen tres tipos b
asicos de recorridos: Preorder, Inorder (tambien llamado
Simetrico), y Postorder.
El recorrido preorder (pre-orden) consiste en visitar/evaluar el nodo raz del a
rbol o sub
arbol, luego su sub
arbol izquierdo y
finalmente su sub
arbol derecho. Claramente, el proceso de visitar/evaluar los sub
arboles consiste en aplicar la misma operaci
on
mientras el nodo no sea nulo o vaco. Una posible implementaci
on es:
void Preorder ( IdNode root )
i f r o o t == E M P T Y t h e n
Visit ( root )
Preorder ( Left ( root ) )
Preorder ( Right ( root ) )
end
end
72
Postorder: + - A * B C D (expresi
on postfija)
3.3
Implementaci
on
Implementaci
on basada en arreglos La implementaci
on de un BST empleando arreglos debe conocer el n
umero m
aximo de
nodos o estimarlo (est
atica o din
amica) tal que en cada posici
on se almacene un nodo. La idea es almacenar los hijos izquierdo
y derecho, en ese orden, de un nodo k en las posiciones 2 k + 1 y 2 k + 2 respectivamente. En la Fig. 26 se muestra un
ejemplo de la implementaci
on basada en arreglos.
73
derecho al sub
arbol cuyo nodo raz contiene al valor 569, y como hijo izquierdo el nodo (sub
arbol) que contiene el valor de
300. Los nodos hoja tienen los punteros a ambos hijos a nulo.
74
end
end
v o i d s e t R i g h t C h i l d ( N o d e<T> p R i g h t )
this . pRight = pRight
end
v o i d s e t L e f t C h i l d ( N o d e<T> p L e f t )
this . pLeft = pLeft
end
void setInfo ( T tInfo )
this . tInfo = tInfo
end
N o d e<T> g e t R i g h t C h i l d ( )
return pRight
end
N o d e<T> g e t L e f t C h i l d ( )
return pLeft
end
void getInfo ( T tInfo )
return tInfo
end
end
3.4
Algoritmos
A continuaci
on se presentan una serie de algoritmos sencillos empleando a
rboles binarios.
3.4.1
Contar el n
umero de nodos
Dado un a
rbol binario, determinar el n
umero de nodos (su peso) que contiene. Para ello, el algoritmo planteado es muy simple
basado en la idea que:
1. Si el a
rbol est
a vaco, contiene 0 nodos
2. Si el
arbol no est
a vaco, contiene 1 nodo (el actual) m
as la cantidad de nodos que contenga su sub
arbol derecho y su
sub
arbol izquierdo
El algoritmo se puede escribir como sigue:
f u n c t i o n C o u n t ( N o d e<T> p N o d e ) : I n t e g e r
i f p N o d e == NIL t h e n
return 0
else
return 1 + Count ( pNode . pRight ) + Count ( pNode . pLeft )
end
end
La funci
on retorna el n
umero de nodos del a
rbol, o siendo equivalente, la cantidad de nodos que no fueron NIL.
3.4.2
El problema de buscar el elemento mnimo consiste en encontrar el nodo con el valor de tInf o mnimo. Dependiendo del tipo
de dato de tInf o, para realizar este algoritmo se debe garantiza que exista la funci
on de comparaci
on menor que.
Para este problema, se crean 2 funciones adicionales: una para obtener el mnimo entre dos valores, y otra para determinar si
un nodo es hoja o terminal. Asumiendo que el tipo de dato del a
rbol es del tipo Integer, se puede escribir el algoritmo como
sigue:
f u n c t i o n Min ( I n t e g e r a ,
i f a > b the
return b
end
return a
end
Integer b) :
Integer
f u n c t i o n i s L e a f ( N o d e<I n t e g e r > p N o d e ) : B o o l e a n
r e t u r n p N o d e . p R i g h t == NIL and p N o d e . p L e f t
end
75
f u n c t i o n M i n ( N o d e<I n t e g e r > p N o d e ) : I n t e g e r
i f isLeaf ( pNode ) then
return pNode . tInfo
else
r e t u r n Min ( pNode . tInfo , Min ( Min ( pNode . pRight ) , Min ( pNode . pLeft ) ) )
end
end
Es importante destacar que debido al polimorfismo, es posible tener dos funciones de nombre M in pero que ambas tienen
par
ametros distintos.
As, la idea del algoritmo es b
asicamente obtener el valor mnimo entre el nodo actual (nodo no-terminal) y el valor mnimo
de su sub
arbol derecho e izquierdo. La unidad mnima de un sub
arbol es cuando contiene un solo nodo, es decir, cuando es
un nodo hoja.
3.4.3
Calcular la profundidad
Arboles
binarios iguales
Dado un BST de valores del tipo Integer, se quiere construir una funci
on que sume todos los elementos de los nodos y lo
retorne. Una posible funci
on es como sigue:
f u n c t i o n S u m A l l ( N o d e<I n t e g e r > p N o d e ) : I n t e g e r
i f p N o d e == NIL t h e n
return 0
else
return pNode . tInfo + SumAll ( pNode . pRight ) + SumAll ( pNode . pLeft )
end
76
La funci
on verifica en su caso base si es NIL o no. En la parte recursiva, invoca a la funci
on con los nodos derecho e izquierdo.
Ahora, si un nodo del a
rbol no tiene hijos, o solo tiene hijo derecho, o solo tiene hijo izquierdo entonces cuando se genere el
ambiente recursivo habr
a de retornar 0 por el caso base (debido a que no aporta en la suma). Este enfoque puede resultar
ineficiente debido a que si una de las ramas del nodo es NIL, entonces no es necesario invocar a la funci
on. Por ejemplo, para
un a
rbol completo de altura h se realizar
an 2h+1 invocaciones que siempre retornar
an 0 (i.e. los nodos hojas).
Entonces, sera ideal primero verificar el n
umero de hijos que posee un nodo para no hacer invocaciones que no aporten al
c
omputo (la suma final). A continuaci
on se muestra una nueva versi
on donde se toma en cuenta dichos aspectos, siendo m
as
eficientes en solo generar las invocaciones necesarias para el c
alculo.
f u n c t i o n i s L e a f ( N o d e<I n t e g e r > p N o d e ) : B o o l e a n
r e t u r n p N o d e . p R i g h t == NIL and p N o d e . p L e f t
end
f u n c t i o n S u m A l l ( N o d e<I n t e g e r > p N o d e ) : I n t e g e r
i f p N o d e != NIL t h e n
i f isLeaf ( pNode ) then
return pNode . tInfo
e l s e i f p N o d e . p R i g h t == NIL t h e n
return pNode . tInfo + SumAll ( pNode . pLeft )
e l s e i f p N o d e . p L e f t == NIL t h e n
return pNode . tInfo + SumAll ( pNode . pRight )
else
return pNode . tInfo + SumAll ( pNode . pRight ) + SumAll ( pNode . pLeft )
end
r e t u r n 0 // s o l o s e d e b e r a i n v o c a r s i e l a
r b o l e s vac o
end
77
4.1
Especificaci
on
// puede r e t o r n a r un Node<T>
// puede r e t o r n a r un B o o l e a n
4.2
Implementaci
on
A continuaci
on se muestra la implementaci
on de la clase BST. Se mostrar
a las funciones con una breve explicaci
on de cada
una.
La implementaci
on inicial de la clase BST consiste en el constructor, destructor, la funci
on que retorna la raz y verificar si el
a
rbol es vaco o no. Todas estas funciones son muy similares en todas las estructuras din
amicas.
c l a s s BST<T>
public :
Constructor BST ( )
p R o o t = NIL
end
Destructor BST ( )
end
function GetRoot ()
return pRoot
end
: N o d e<T>
f u n c t i o n I s E m p t y ( ) : Boolean
r e t u r n p R o o t == NIL
end
78
f u n c t i o n L o o k u p ( N o d e<T> p N o d e , T t I n f o ) : B o o l e a n
i f p N o d e == NIL t h e n
return f a l s e
else
select
tInfo < pNode . tInfo : r e t u r n Lookup ( pNode . pLeft , tInfo )
tInfo > pNode . tInfo : return Lookup ( pNode . pRight , tInfo )
t I n f o == p N o d e . t I n f o : r e t u r n t r u e
end
end
end
El proceso de inserci
on consiste en dado el BST y una clave/informaci
on colocarla en el lugar correcto. Se retorna el apuntador
de la posici
on donde fue insertado. Para ello se realizan los siguientes pasos:
Si el BST es vaco, se crea el nodo raz del a
rbol
Si el BST tena al menos la raz, se verifica d
onde se debe insertar el nodo nuevo recorriendo el a
rbol desde la raz, y
descendiendo por la rama izquierda si el valor a insertar es menor o por la derecha si es mayor que el nodo raz actual
en cada invocaci
on recursiva.
Si la clave/informaci
on a insertar ya se encuentra en el a
rbol se debe verificar de alguna forma (i.e. mensaje de error,
retorna NIL, etc). En la implementaci
on mostrada se asume que no habr
a claves repetidas pero no inserta un nodo
nuevo.
Si la clave/informaci
on no existe en el a
rbol, se crea un nodo nuevo como el paso 1 y se inserta siempre como una hoja
hija derecha o izquierda del nodo hallado en el paso 2.
La Fig. 29 muestra de forma gr
afica el proceso de insertar los elementos 11, 6, 8, 19, 4, 10, 5, 17 (en ese orden) en un BST.
79
select
tInfo < pNode . tInfo :
p N o d e . p L e f t = I n s e r t ( p N o d e >p L e f t , t I n f o )
tInfo > pNode . tInfo :
p N o d e . p R i g h t = I n s e r t ( p N o d e >p R i g h t , t I n f o )
t I n f o == p N o d e . t I n f o :
return pNode
// s e asume que no hay c l a v e s r e p e t i d a s en e l BST
end
return pNode
end
end
Para la operaci
on Delete en un BST se deben considerar 3 casos posibles en cuanto a la ubicaci
on de un nodo:
El nodo a eliminar es hoja (no tiene hijos): En este caso se elimina el nodo sin mayores problemas.
El nodo a eliminar tiene solo un hijo o sub
arbol (izquierdo o derecho): Se reenlaza al padre del nodo a eliminar con el
hijo existente.
El nodo a eliminar tiene dos hijos: En este caso se debe buscar:
1. El nodo de mayor clave en su sub
arbol izquierdo. En la Fig. 30 corresponde al segundo a
rbol, el nodo m
as a la
derecha del sub
arbol.
2. El nodo de menor clave en su sub
arbol derecho. En la Fig. 30 corresponde al tercer a
rbol, el nodo m
as a la
izquierda del sub
arbol. La clave de este nodo se le asigna al nodo par
ametro de la funci
on y posteriormente se
elimina el nodo.
v o i d D e l M i n ( r e f N o d e<T> p N o d e , r e f T t I n f o )
i f p N o d e . p L e f t != NIL t h e n
DelMin ( r e f pNode . pLeft , r e f tInfo )
else
N o d e<T> p T e m p = p N o d e
tInfo = pNode . tInfo
pNode = pNode . pRight
d e l e t e pTemp
80
end
end
La operaci
on Delete consiste entonces en determinar en cu
al caso se encuentra para el nodo a eliminar y siempre asegurar
que el apuntador al nodo que se va a intercambiar desde su padre no quede con alg
un valor. Un ejemplo se observa en la Fig.
30 donde en el caso del mayor del sub
arbol izquierdo, el apuntador al sub
arbol derecho del nodo con clave 15 debe quedar
apuntando a un valor de NIL. Igualmente sucede en el caso del menor del sub
arbol derecho, donde el apuntador del sub
arbol
izquierdo del nodo con clave 23 debe estar en NIL.
Una implementaci
on de dicha operaci
on se muestra a continuaci
on:
v o i d D e l e t e ( N o d e<T> p N o d e , T t I n f o )
i f p N o d e != NIL t h e n
select
tInfo < pNode . tInfo :
Delete ( pNode . pLeft , tInfo )
tInfo > pNode . tInfo :
Delete ( pNode . pRight , tInfo )
t I n f o == p N o d e . t I n f o :
N o d e<T> p T e m p = p N o d e
select
p N o d e . p L e f t == NIL and p N o d e
p N o d e = NIL
d e l e t e pTemp
p N o d e . p L e f t == NIL and p N o d e
pNode = pNode . pRight
d e l e t e pTemp
p N o d e . p L e f t != NIL and p N o d e
pNode = pNode . pLeft
d e l e t e pTemp
p N o d e . p L e f t != NIL and p N o d e
DelMax ( r e f pNode , r e f pNode
pNode . tInfo = tInfo
end
end
end
end
end
. p R i g h t == NIL : // no t i e n e
hijos
. p R i g h t != NIL : // t i e n e
h i j o derecho
. p R i g h t == NIL : // t i e n e
hijo
izquierdo
. p R i g h t != NIL : // t i e n e ambos h i j o s
. tInfo )
// o DelMin
Una vez definida las operaciones de un BST es posible entonces aplicar diversos algoritmos sobre su estructura. Por ejemplo,
dado un a
rbol binario de b
usqueda no vaco, se quiere retornar el mnimo valor dentro del a
rbol.
Es importante destacar que dada la estructura del BST no es necesario recorrer todo el a
rbol para encontrar el valor mnimo,
o de hecho, un valor cualquiera dado su orden implcito. El valor mnimo corresponde entonces al nodo que se encuentra m
as
a la izquierda del a
rbol:
f u n c t i o n M i n V a l u e ( N o d e<T> p N o d e ) :
N o d e<T> p T e m p = p N o d e
w h i l e ( p T e m p . p L e f t != NIL ) do
pTemp = pTemp . pLeft
end
return pTemp . tInfo
end
Integer
4.3
Problema de Desequilibrio
El orden de inserci
on en un BST determina la forma estructural del
arbol. La Fig. 31 muestra un ejemplo de distintos tipos
de inserci
on en un BST del tipo Char, siendo insertados de izquierda a derecha.
Dado este aspecto, si los nodos de un BST son insertados en orden creciente (3er caso de la Fig. fig:BSTDesequilibrado) el
a
rbol crecer
a solo hacia el lado derecho como una lista simplemente enlazada, y todos los apuntadores izquierdos ser
an NIL.
Del mismo modo, si son insertados en orden decreciente (U,T,P,O,M,C,A). La forma de una lista enlazada degrada
la complejidad logartimica del a
rbol.
Por el motivo anterior, es ideal construir un mecanismo que no permita construir a
rboles de b
usqueda que sean degradados
sino conseguir a
rboles tan equilibrados como sea posible. Para ello se muestra brevemente los a
rboles AVL y Red-Black.
81
Figura 31: Ejemplo de 3 tipos de BST generados con el mismo conjunto de datos en diferente orden.
AVL
Un a
rbol AVL, llamado as por el nombre de sus inventores Georgy Adelson-Velsky y Evgenii Landis, es un BST que se auto
equilibra, es decir, cuando se inserta o remueve un nodo se aplican operaciones que tratan de mantener el a
rbol equilibrado.
En un a
rbol AVL, las alturas de los sub
arboles de cualquier nodo difiere a lo sumo en 1, y en caso de no cumplirse esto se
debe re-equilibrar para mantener dicha propiedad. Entonces, en la condici
on de los a
rboles AVL se considera un factor de
equilibrio (balance): balance = height(lef t) height(right)
En la Fig. 32 se muestra un ejemplo de 3 a
rboles AVL. El valor dentro de cada nodo (en esta ilustraci
on) representa el factor
de equilibrio de cada nodo, donde los valores positivos indican que la altura del sub
arbol izquierdo es mayor a la altura del
sub
arbol derecho, y nos negativos el caso contrario. El factor de equilibrio 0 significa que ambos sub
arboles tienen la misma
altura.
82
5.1
Inserci
on en un AVL
Relaci
on de altura
hijo Izq. > hijo Der.
hijo Izq. = hijo Der.
hijo Izq. < hijo Der.
Descripci
on
La altura del sub
arbol izquierdo es mayor que la altura del sub
arbol derecho (uno m
as)
La altura del sub
arbol izquierdo es igual que la altura del sub
arbol derecho
La altura del sub
arbol izquierdo es menor que la altura del sub
arbol derecho (uno menos)
El algoritmo de inserci
on en un AVL realiza los siguientes pasos:
1. Buscar en el a
rbol el lugar donde se insertar
a el nuevo nodo (nodo terminal). Para ello se recorre un camino desde
la raz hasta el lugar de inserci
on. La complejidad de este paso es O(log2 n) dado que la altura de un a
rbol AVL es
O(log2 n), siendo n el n
umero de nodos.
83
2. Regresar por el camino recorrido en el paso 1 y se ajustan los factores de equilibrio. Si se insert
o en el sub
arbol izquierdo
se suma uno al valor del campo balance en cada nodo. Si se insert
o por el sub
arbol derecho se resta uno al valor del
campo balance. En cada paso de este retorno se pasa informaci
on acerca de la variaci
on de la altura del a
rbol en caso
que se incremente. Este paso consume un tiempo de ejecuci
on O(log2 n).
3. Si existe alg
un desequilibrio (el campo balance de alg
un toma el valor 2 o +2) se debe reorganizar el sub
arbol que tiene
como raz dicho nodo llamado pivote (el que ocasiona el desequilibrio). La operaci
on de re-equilibrar se efect
ua mediante
una secuencia de re-asignaci
on de apuntadores que determinan una o dos rotaciones de dos o tres nodos, adem
as de la
actualizaci
on de los factores de equilibrio en cada nodo. Este paso es de O(1). Los posibles casos una vez insertado un
valor para el campo balance son:
Campo balance
(antes de Insertar)
+1
0
-1
Campo balance
(Insertar Izquierda)
+2
+1
0
Campo balance
(Insertar Derecha)
0
-1
-2
Las celdas marcadas representan aquellos casos donde se debe re-equilibrar el sub
arbol partiendo del hecho que el nodo ocasiona
el desequilibrio. Para ello se emplear
an operaciones conocidas como rotaciones que se explican a continuaci
on.
5.2
Rotaciones
Una operaci
on de Rotaci
on se emplea para restablecer el equilibrio de un AVL cuando se pierde debido a una operaci
on de
inserci
on o eliminaci
on. Para conocer el tipo de Rotaci
on a aplicar se debe identificar primero el caso donde se realiza un
desequilibrio. Hay b
asicamente 4 casos posibles: Left-Right, Left-Left, Right-Left y Right-Right. Ya el nombre de cada caso
identifica la ubicaci
on de los nodos desequilibrados.
Cuando el factor de equilibrio de un nodo es +2 se puede observar en la Fig. 34 particularmente en el nodo A. Cuando el
a
rbol tiene un desequilibrio positivo entonces est
a en el caso Left-Left o Left-Right. El caso Left-Left es cuando el a
rbol no se
inclina hacia la derecha, y se puede hacer una rotaci
on de todo el
arbol hacia la derecha desde el nodo C, es decir, el elemento
se insert
o en el sub
arbol izquierdo del hijo izquierdo del ascendiente m
as cercano con factor +2.
Figura 34: De izquierda a derecha: casos de desequilibrio Left-Right, Left-Left, y el resultado del a
rbol ya equilibrado.
En la Fig. 34, el caso Left-Left se refiere al a
rbol central, donde desde el nodo C se aplica una rotaci
on hacia la derecha para
conseguir el a
rbol m
as a la derecha (equilibrado). Ahora, cuando el elemento es insertado como sub
arbol derecho del hijo
izquierdo del ascendiente m
as cercano con factor +2, se est
a en presencia del caso Left-Right (
arbol m
as a la izquierda de la
figura). En dicho caso, primero se hace una rotaci
on hacia la izquierda desde C y luego se estar
a en el caso Left-Left donde
se hace una rotaci
on hacia la derecha de todo el
arbol desde C.
84
Cuando el factor de equilibrio de un nodo es 2 se puede observar en la Fig. 35 particularmente en el nodo A. Cuando el
a
rbol tiene un desequilibrio negativo entonces est
a en el caso Right-Right o Right-Left. El caso Right-Right es cuando el a
rbol
no se inclina hacia la izquierda, y se puede hacer una rotaci
on de todo el
arbol hacia la izquierda desde el nodo C, es decir, el
elemento se insert
o en el sub
arbol derecho del hijo derecho del ascendiente m
as cercano con factor 2.
Figura 35: De izquierda a derecha: casos de desequilibrio Right-Left, Right-Right, y el resultado del
arbol ya equilibrado.
En la Fig. 35, el caso Right-Right se refiere al a
rbol central, donde desde el nodo C se aplica una rotaci
on hacia la izquierda
para conseguir el a
rbol m
as a la derecha (equilibrado). Ahora, cuando el elemento es insertado como sub
arbol izquierdo del
hijo derecho del ascendiente m
as cercano con factor 2, se est
a en presencia del caso Right-Left (
arbol m
as a la izquierda
de la figura). En dicho caso, primero se hace una rotaci
on hacia la derecha desde C y luego se estar
a en el caso Right-Right
donde se hace una rotaci
on hacia la izquierda de todo el a
rbol desde C.
A nivel de implementaci
on se suele manejar 3 apuntadores de la siguiente forma:
Pointer A: Apuntador del nodo con factor de equilibrio no permitido 2.
Pointer B: Apuntador al hijo izquierdo o derecho de A, y se ubica de acuerdo a las siguientes reglas:
Si A.balance = +2, entonces B es el hijo izquierdo de A.
Si A.balance = 2, entonces B es el hijo derecho de A.
Pointer C: Apuntador al hijo del hijo (nieto) de A. Este nodo es afectado si se est
a en el caso Left-Right o Right-Left, y
se ubica de acuerdo a las siguientes reglas:
Si B es el hijo izquierdo de A, entonces C es el hijo derecho
Si B es el hijo derecho de A, entonces C es el hijo izquierdo
Para el caso de la Fig. 34 y 35, los apuntadores A, B y C corresponden con cada uno de los nodos asociados a esos valores.
Es importante destacar que cuando el caso de Left-Left o Right-Right, el n
umero de nodos afectados es 2 (A y B). Ahora,
cuando el caso es Left-Right o Right-Left el n
umero de nodos afectados es 3 (A, B y C).
5.3
Ejemplo de Insertar
85
86
Figura 39: De izq. a der.: estando en un caso Left-Left, se hace una rotaci
on hacia la derecha y se equilibra el a
rbol; con
una rotaci
on hacia la izquierda; se inserta LE; y se inserta el nodo CA.
87
Figura 40: De izq. a der.: se inserta el nodo LU; y el nodo GR. El nodo GR causa un desequilibrio 2 en el nodo
BA, teniendo as un caso Right-Left.
88
Red-Black
6.1
Propiedades
6.2
Operaciones
En el peor de los casos, las operaciones de insertar, eliminar y buscar tienen un tiempo de ejecuci
on proporcional a la altura
del a
rbol, O(logn), siendo una mejor opci
on que un BST. Esto se debe por la propiedad #4 que hace que ning
un camino
pueda tener dos nodos rojos seguidos. As, el camino m
as corto posible tiene todos sus nodos negros, y el m
as largo alterna
entre nodos rojos y negros. Dado que todos los caminos m
aximos tienen el mismo n
umero de nodos negros por la propiedad
#5, no hay ning
un camino que pueda tener longitud mayor que el doble de la longitud de otro camino.
Los a
rboles red-black son muy empleados en lenguajes con soporte a programaci
on funcional, donde son una de las estructuras
de datos persistentes m
as com
unmente utilizadas en la construcci
on de arreglos asociativos y conjuntos que pueden retener
versiones previas tras mutaciones.
Heap
El Heap (o montculo) es un a
rbol binario complejo o esencialmente completo: todos los niveles est
an llenos, excepto posiblemente el u
ltimo, en donde los nodos se encuentran en las posiciones m
as a la izquierda. B
asicamente cuando se insertan
89
7.1
Operaciones
Las operaciones b
asicas de un Heap de pueden resumir como:
Construir un Heap vaco
Comprobar si un Heap es vaco
Obtener el mayor elemento
Eliminar el mayor elemento
Insertar un elemento
Una buena de representaci
on del heap es empleando un arreglo, donde en cada posici
on se guarda un elemento basado en la
numeraci
on de los nodos del
arbol por niveles. El esquema estructural del heap es como se muestra en la Fig. 26 de la secci
on
3.3, la u
nica diferencia radica en que dicha imagen no cumple la propiedad de ordenamiento.
En dicho esquema, se almacena el i-esimo elemento en la i-esima posici
on del arreglo. El hijo izquierdo de i en la posici
on
2 i, el hijo derecho de i en 2 i + 1, y el padre de i en 2i .
7.1.1
Implementaci
on
La funci
on constructora, la funci
on IsEmpty y GetRoot resultan muy simples con est
a implementaci
on:
Constructor Heap ( )
iSize = 0
end
90
f u n c t i o n I s E m p t y ( ) : Boolean
r e t u r n i S i z e == o
end
function GetRoot ()
return aHeap [ 1 ]
: T
91
end
i f aHeap [ iPos ] < aHeap [ iC ] then
swap ( r e f aHeap [ iPos ] , r e f aHeap [ iC ] )
iPos = iC
iC = 2 iC
else
bFlag = true
end
end
iSize = iSize 1
end
Esta implementaci
on es muy simple, existen otras versiones un poco m
as simplificadas. Lo importante es que la operaci
on
DownHeap es de complejidad O(log2 n).
Por su parte, la operaci
on de Insertar aplica el DownHeap en sentido inverso llamado up-heap, sift-up o heapify-up (llamado
tambien flotar). La funci
on de complejidad O(log2 n) se puede escribir como:
void UpHeap ( Integer x )
iSize = iSize + 1
aHeap [ iSize ] = x
I nt e g er iPos = iSize
I nt e g er iParent = iPos div 2
w h i l e ( i P a r e n t >= 1 and a H e a p [ i P o s ] > a H e a p [ i P a r e n t ] ) do
swap ( r e f aHeap [ iPos ] , r e f aHeap [ iParent ] )
iPos = iParent
iParent = iPos div 2
end
end
Adem
as, estas operaciones permiten construir un algoritmo de ordenamiento basado en comparaciones llamado Heapsort. El
Heapsort se puede ver como una mejora a Selection Sort donde la entrada se divide en una regi
on ordenada y otra desordenada,
y se itera sobre la regi
on no ordenada extrayendo siempre el m
aximo elemento y moviendolo hacia la regi
on ordenada. Esta
operaci
on en un tiempo de O(nlogn).
Ideas Finales
Un a
rbol es una estructura de datos que puede ser definida de forma recursiva como una colecci
on de nodos (desde la
raz) empleando una relaci
on de jerarqua
Dependiendo del n
umero de relaciones de jerarqua que tenga cada nodo del a
rbol, se dice que un a
rbol k-ario es aquel
que tiene un m
aximo de k enlaces/relaciones por nodo
Cuando k = 2 se trata de un a
rbol binario, en donde cada nodo puede tener hasta dos hijos (derecho e izquierdo).
Un BST o
arbol binario ordenado o de b
usqueda permite almacenar valores ordenados por una clave lo cual permite su
b
usqueda recorriendo desde la raz hacia las hojas realizando comparaciones simples
Tanto el
arbol AVL como el red-black son
arboles binarios de b
usqueda auto-equilibrados con operaciones muy similares por las propiedades de equilibrio que imponen las cuales son distintas. Los a
rboles AVL est
an m
as rgidamente
equilibrados que los del tipo red-black
92
Adem
as del a
rbol AVL y red-black existen otros tipos de a
rboles auto-equilibrados como los a
rboles 2-3, AA, Scapegoat,
Splay, Treap y otros m
as.
Problemas
1. Usando las primitivas de a
rboles generales, implemente la operaci
on DeleteLeaves, la cual consiste en eliminar todos
aquellos nodos que son hojas en un a
rbol.
2. El lenguaje de programaci
on Beta no permite la recursi
on, y para simularla emplea una pila donde almacena en el caso
de los a
rboles, el camino recorrido desde la raz hasta el nodo visitado. Realice el algoritmo que permita recorrer un
a
rbol binario (sin utilizar recursi
on) en Inorder.
3. Determine si un a
rbol binario est
a equilibrado. Se dice que un a
rbol est
a equilibrado si la diferencia de altura de su
sub
arbol derecho e izquierdo difieren en k.
4. Escriba una funci
on que retorne el n
umero de nodos internos de un
arbol binario.
5. Establezca similitudes y diferencias desde el punto de vista de complejidad en memoria y tiempo entre un BST y AVL
de las operaciones de acceso y b
usqueda.
6. Para un a
rbol AVL inicialmente vaco indique detalladamente el estado del a
rbol a medida que se insertan los valores:
10, 5, 9, 11 y 13. Sobre el a
rbol final indique su altura y que se imprime usando un recorrido en Preorder.
93
Bibliografa
Aho, A., Hopcroft, J., and Ullman, J. 1988. Estructuras de Datos y Algoritmos, 1ra ed. Pearson - Addison Wesley.
Cormen, T. 2009. Introduction to Algorithms, 3ra ed. The MIT Press.
Nyhoff, L. 2006. TADs, Estructuras de datos y resoluci
on de problemas con C++, 2da ed. Pearson.
Ramrez, E. 2015. Alpha: Una notaci
on algortmica basada en pseudoc
odigo. Telematique 14, 1, 97121.
Scalise, E., and Carmona, R. 2001. An
alisis de algoritmos y complejidad. Tech. Rep. ND-2001-05, Lecturas en Ciencias
de la Computaci
on, Escuela de Computaci
on, UCV.
Sedgewick, R. 2006. Algorithms in C++. Addison Wesley.
Stroustrup, B. 2013. The C++ Programming Language. Addison-Wesley Professional.
94