Este documento presenta una introducción a los árboles como estructura de datos no lineal. Explica que un árbol consiste en nodos con conexiones jerárquicas donde cada nodo puede tener múltiples nodos hijos pero sólo un padre. Describe árboles binarios como un caso especial donde cada nodo tiene a lo sumo dos hijos, e introduce árboles binarios de búsqueda que permiten búsquedas eficientes al mantener un orden entre los nodos.
4. Árboles
• Si bien una estructura dinámica lineal brinda varias
ventajas sobre las estructuras estáticas contiguas,
todavía tiene una gran limitante, el acceso a los
elementos se debe realizar de forma secuencial.
• Para los casos donde esto es un problema
aparecen las estructuras de datos no lineales
(estructuras multienlazadas), en especial los
árboles.
5. Árboles
• El árbol es una estructura de datos fundamental en
informática, muy utilizada en todos sus campos.
• Algorítmica: métodos de clasificación y
búsqueda
• Compiladores: árboles sintácticos de una
gramática
• Inteligencia artificial: árboles de juegos, árboles
de decisión, etc.
• Se utilizan principalmente para representar datos
con relación jerárquica.
6. Árboles
• Un árbol es una estructura de datos homogénea,
dinámica y no lineal, en la que cada nodo
(elemento) puede tener varios nodos posteriores,
pero sólo puede tener un nodo anterior.
• Un árbol es:
• Dinámico: Su estructura puede cambiar durante
la ejecución de un programa.
• No lineal: Cada elemento del árbol puede
contener varios elementos que dependen de él.
7. Árboles
• Las definiciones importantes a tener en cuenta
son:
• Nodo: Son todos los vértices o elementos del
árbol.
• Raíz: Es el nodo del cual se derivan todos los
demás nodos. Solamente se puede tener una
en cada árbol.
• Nodo terminal (hoja, leaf node): Es aquel nodo
que no contiene ningún subárbol
• Camino (arco): Enlace entre dos nodos
consecutivos.
8. Árboles
• Las definiciones importantes a tener en cuenta
son:
• Nodo Padre: Nodo antecesor o ascendiente del
actual. La raíz no tiene un nodo padre.
• Nodos Hermanos: Nodos de un mismo padre.
• Nodos Interiores: Nodos que no son hojas ni
raíces.
• Bosque: Colección de dos o más árboles.
9. Árboles
• Las definiciones importantes a tener en cuenta
son:
• Rama: Camino que termina en una hoja.
• Nivel de un nodo: Longitud del camino desde la
raíz al nodo específico. Se dice que la raiz tiene
un nivel 0.
• Altura del árbol (profundidad): Número máximo
de nodos de una rama. Equivale al nivel más
alto de los nodos más uno.
• Peso del árbol: Número de nodos hoja.
12. Árboles
• La definición de un árbol implica una estructura
recursiva.
• De la raíz se desprenden otros árboles
denominados “subárboles del raíz” u offspring, los
cuales a su vez tienen su propia raíz.
14. Árboles Binarios
● Es un árbol en el que cada nodo puede tener
únicamente 0, 1 o 2 subárboles.
● Los subárboles reciben el nombre de “Subárbol
izquierdo” y “Subárbol derecho”.
● Puede ser implementado fácilmente en una
computadora.
16. Árboles Binarios
● Los árboles binarios tienen cierta terminología
propia de su estructura.
● Árboles Similares: Son aquellos que
tienen la misma estructura
● Árboles Equivalentes: Son aquellos que
además de ser similares contienen la
misma información.
● Árbol Equilibrado: Es aquel en que la
altura de los dos subárboles de la raíz se
diferencian en como máximo una unidad.
17. Árboles Binarios
● Los árboles binarios tienen cierta terminología
propia de su estructura.
● Árbol Completo: Es aquel en que todos
los nodos tienen exactamente 0 o dos
subárboles.
● Árbol Lleno: Es aquel árbol completo en
el que todos los niveles están llenos.
● Árbol Degenerado: Es aquel árbol en
que todos sus nodos tienen solamente
un subárbol.
24. Árboles Binarios
● Para los árboles binarios, especialmente para
los árboles llenos se cumple lo siguiente:
● Para una altura H
○ La cantidad máxima de nodos N está
dada por ((2^H) - 1)
○ La cantidad máxima de nodos n en el
último nivel está dada por 2^(H-1)
● Para una cantidad de nodos N
○ La altura del árbol debe ser como
mínimo log(n+1)
25. Conversión a Binarios
● Existe un algoritmo sencillo para convertir
cualquier árbol a Binario.
● Se copia la raíz.
● Se coloca el primer hijo del árbol
tradicional como hijo izquierdo.
● Todos los hermanos de éste se colocan
sucesivamente como hijos derechos.
● Se repite recursivamente en todas las
ramas.
33. Recorridos
● El recorrido es el proceso que permite acceder
una única vez a cada uno de los nodos del
árbol.
● Al recorrer el árbol se debe examinar el
contenido completo del mismo.
● Existen varios métodos de recorrer un árbol
binario.
● Las tareas asociadas son:
○ Visitar la raíz
○ Recorrer el subárbol izquierdo
○ Recorrer el subárbol derecho
34. Recorrido Pre-Orden
● Las tareas asociadas se realizan
recursivamente en el siguiente orden:
○ Visitar la raíz
○ Recorrer el subárbol izquierdo
○ Recorrer el subárbol derecho
35. Recorrido In-Orden
● Las tareas asociadas se realizan
recursivamente en el siguiente orden:
○ Recorrer el subárbol izquierdo
○ Visitar la raíz
○ Recorrer el subárbol derecho
36. Recorrido Post-Orden
● Las tareas asociadas se realizan
recursivamente en el siguiente orden:
○ Recorrer el subárbol izquierdo
○ Recorrer el subárbol derecho
○ Visitar la raíz
42. El problema de las búsquedas
● Cuando analizamos los métodos de búsqueda
secuencial y binario determinamos que el
segundo es mucho más eficiente.
● El problema del método binario es que necesita
que el listado se encuentre ordenado
previamente.
● Los procesos para mantener un arreglo o lista
ordenados luego de las inserciones y
eliminaciones son muy complejos.
43. Árboles binarios de búsqueda
● Es una estructura donde los elementos pueden
ser eficazmente localizados, insertados o
borrados.
● Es ideal para los casos donde se tienen que
manejar gran número de operaciones.
● Esta estructura también es llamada “Árbol
binario clasificado”, “Binary search tree” o
“ABB”.
44. Árboles binarios de búsqueda
● El dato que contendrá el árbol debe permitir
clasificación, es decir, debe poder compararse
con otro para determinar si es mayor, menor o
igual.
● El primer valor recibido siempre será la raiz.
● En cualquier nodo, todos los valores del
subárbol izquierdo son menores o iguales al
valor del nodo.
● Igualmente, todos los valores del subárbol
derecho son mayores al valor del nodo.
47. Búsqueda
● La búsqueda en un árbol binario no es más que
una búsqueda binaria.
● En lugar de calcular un nuevo centro utilizamos
al padre como centro.
● Si no se encuentra el elemento, nos movemos
hacia el subárbol izquierdo o derecho según
corresponda.
● La condición de terminación es llegar a un nodo
hoja o encontrar el elemento buscado.
48. Inserción
● Se debe recorrer el árbol buscando la posición
ideal para insertarlo.
● Se evalúa el padre, si es nulo se inserta en esta
posición.
● Si no es nulo se evalúa si corresponde
insertarlo a la izquierda o a la derecha
● Se realiza una llamada recursiva al método de
inserción para el subárbol correspondiente.
53. Eliminación
● Es la operación más complicada.
● Se debe conservar el orden de los elementos
del árbol.
● Se consideran diferentes casos según la
posición del nodo en el árbol:
○ Si es una hoja
○ Si solo tiene un descendiente
○ Si tiene los dos descendientes
55. Eliminación
● Cuando tiene solamente un hijo, se borra el
padre y se sustituye por el hijo.
● Ejemplo: Eliminar F
56. Eliminación
● Cuando tiene los dos hijos, se sustituye por el
elemento situado lo más a la derecha del
subárbol izquierdo o más a la izquierda del
subárbol derecho.
● Ejemplo: Eliminar B o D
57. Árbol AVL
● Es un árbol binario de búsquedas auto
balanceable.
● Es decir que la rama izquierda y la derecha no
difieren en altura por más de uno.
● Fue ideado en 1962 por los matemáticos
Georgii Adelson-Velskii y Yevgeniy Landis.
● La razón de mantener este balance es que el
crecimiento de una operación de búsqueda se
mantenga lo más cercano a O(logn).
58. Árbol AVL
● Es un árbol binario de búsquedas auto
balanceable.
● Es decir que la rama izquierda y la derecha no
difieren en altura por más de uno.
● Fue ideado en 1962 por los matemáticos
Georgii Adelson-Velskii y Yevgeniy Landis.
● La razón de mantener este balance es que el
crecimiento de una operación de búsqueda se
mantenga lo más cercano a O(logn).
59. Factor de Equilibrio
● La principal diferencia entre los ABB y los AVL
es la existencia del “Factor de Equilibrio”.
● Es un número que se calcula como “altura del
subárbol izquierdo” - “altura del subárbol
derecho”.
● Este se recalcula al realizar una inserción o
borrado.
● Si el valor absoluto del factor de equilibrio es
mayor a 1 se debe hacer el proceso de
Rotación.
60. Factor de Equilibrio
● La propiedad de mantener este factor de
equilibrio se llama “Altura invariante”.
● Es considerada una restricción adicional a la ya
presente en los Árboles Binarios de Búsqueda
de “Orden invariante”.
66. Rotaciones
● Para poder re balancear estos árboles existen
mecanismos denominados rotaciones.
● Las rotaciones son de dos tipos:
● Izquierda
● Derecha