Вы находитесь на странице: 1из 10

Qu es un rbol de decisin?

Un rbol de decisin es un mapa de los posibles resultados de una serie de decisiones


relacionadas. Permite que un individuo o una organizacin comparen posibles acciones
entre s segn sus costos, probabilidades y beneficios. Se pueden usar para dirigir un
intercambio de ideas informal o trazar un algoritmo que anticipe matemticamente la mejor
opcin.

Un rbol de decisin, por lo general, comienza con un nico nodo y luego se ramifica en
resultados posibles. Cada uno de esos resultados crea nodos adicionales, que se ramifican
en otras posibilidades. Esto le da una forma similar a la de un rbol.

Hay tres tipos diferentes de nodos: nodos de probabilidad, nodos de decisin y nodos
terminales. Un nodo de probabilidad, representado con un crculo, muestra las
probabilidades de ciertos resultados. Un nodo de decisin, representado con un cuadrado,
muestra una decisin que se tomar, y un nodo terminal muestra el resultado definitivo de
una ruta de decisin.

Los rboles de decisin tambin se pueden dibujar con smbolos de diagramas de flujo,que
a algunas personas les parecen ms fciles de leer y comprender.
Smbolos de los rboles de
decisin

Figura Nombre Significado

Nodo de decisin Indica una decisin que


se tomar

Nodo de Muestra mltiples


probabilidad resultados inciertos
Figura Nombre Significado

Ramificaciones Cada ramificacin indica


alternativas un posible resultado o
accin

Alternativa Muestra una alternativa


rechazada que no estaba
seleccionada

Nodo terminal Indica un resultado


definitivo
Cmo dibujar un rbol de
decisin
Para dibujar un rbol de decisin, primero debes elegir un medio. Puedes dibujarlo a mano
en un papel o una pizarra, o puedes usar un software de rboles de decisin. En cualquier
caso, te mostramos los pasos que debes seguir:

1. Comienza con la decisin principal. Dibuja un pequeo recuadro para representar este
punto, luego dibuja una lnea desde el recuadro hacia la derecha para cada posible solucin
o accin. Etiqutalas correctamente.

2. Agrega nodos de decisin y probabilidad para expandir el rbol del siguiente modo:

Si otra decisin es necesaria, dibuja otro recuadro.

Si el resultado es incierto, dibuja un crculo (los crculos representan nodos de


probabilidad).

Si el problema est resuelto, djalo en blanco (por ahora).


Desde cada nodo de decisin, dibuja soluciones posibles. Desde cada nodo de probabilidad,
dibuja lneas que representen los resultados posibles. Si deseas analizar tus opciones de
forma numrica, incluye la probabilidad de cada resultado y el costo de cada accin.

3. Contina con la expansin hasta que cada lnea alcance un extremo, lo que significa
que no hay ms decisiones que tomar o resultados probables que considerar. Luego, asigna
un valor a cada resultado posible. Puede ser una puntuacin abstracta o un valor financiero.
Agrega tringulos para indicar los extremos.
Con un rbol de decisin completo, ya ests listo para comenzar a analizar la decisin que
enfrentas.

Ejemplo de anlisis de un rbol


de decisin
Al calcular la utilidad o el valor esperado de cada decisin en el rbol, puedes minimizar el
riesgo y maximizar la probabilidad de obtener un resultado deseado.

Para calcular la utilidad esperada de una decisin, solo debes restar el costo de esa decisin
a los beneficios esperados. Los beneficios esperados son iguales al valor total de todos los
resultados que puedan derivar de esa decisin, y cada valor se multiplica por la
probabilidad de que ocurra. A continuacin te mostraremos cmo nosotros calcularamos
estos valores para el ejemplo descrito anteriormente:
Al identificar cul es el resultado ms deseable, es importante tener en cuenta las
preferencias de utilidad del encargado de tomar la decisin. Por ejemplo, algunos prefieren
opciones de bajo riesgo, mientras que otros estn dispuestos a correr riesgos si el beneficio
es mayor.

Al usar tu rbol de decisin acompaado por un modelo de probabilidad, puedes emplearlo


para calcular la probabilidad condicional de un evento o la probabilidad de que suceda, en
el caso de que otro evento ocurra. Para hacerlo, simplemente empieza con el evento inicial,
luego sigue la ruta desde ese evento hasta el evento objetivo, y multiplica la probabilidad de
cada uno de esos eventos juntos.

De este modo, un rbol de decisin se puede emplear como un diagrama de rbol


tradicional, que traza las probabilidades de determinados eventos, como lanzar una moneda
dos veces.
Ventajas y desventajas
Los rboles de decisin siguen siendo populares por razones como las siguientes:

Son muy fciles de entender

Pueden ser tiles con o sin datos fehacientes, y cualquier dato requiere una
preparacin mnima

Se pueden agregar nuevas opciones a los rboles existentes

Su valor al seleccionar la mejor de numerosas opciones

Se combinan fcilmente con otras herramientas de toma de decisiones

Sin embargo, los rboles de decisin pueden volverse excesivamente complejos. En esos
casos, un diagrama de influencia ms compacto puede ser una buena alternativa. Los
diagramas de influencia se enfocan en los objetivos, las entradas y las decisiones
fundamentales.
rboles de decisin en minera de
datos y aprendizaje automtico
Un rbol de decisin tambin puede usarse para ayudar a crear modelos predictivos
automatizados, que puedan emplearse en el aprendizaje automtico, la minera de datos y
las estadsticas. Conocido como "el aprendizaje basado en rboles de decisin", este
mtodo toma en consideracin las observaciones sobre un elemento para predecir su valor.

En estos rboles de decisin, los nodos representan datos en lugar de decisiones. Este tipo
de rbol tambin se conoce como "rbol de clasificacin". Cada ramificacin contiene un
conjunto de atributos o reglas de clasificacin asociadas a una etiqueta de clase especfica,
que se halla al final de la ramificacin.

Estas reglas, tambin conocidas como "reglas de decisin", se pueden expresar en una
clusula "Si... entonces...". Cada valor de datos o decisin forma una clusula, de tal
manera que, por ejemplo, "si las condiciones 1, 2 y 3 se cumplen, entonces el resultado X
ser el resultado definitivo con certeza Y".

Cada dato adicional ayuda a que el modelo prediga de forma ms precisa a qu conjunto
finito de valores pertenece el asunto en cuestin. Esa informacin se puede usar
posteriormente como una entrada en un modelo ms grande de toma de decisiones.

A veces la variable predicha ser un nmero real, como un precio. Los rboles de decisin
con resultados posibles, infinitos y continuos se llaman "rboles de regresin".

Para una mayor precisin, se suelen combinar mltiples rboles con mtodos de
ensamblado:

Bagging (Ensamblado) crea mltiples rboles de decisin haciendo un remuestreo


de los datos de origen, luego hace que los rboles voten para llegar a un consenso.

Un clasificador de selva aleatoria consiste en mltiples rboles diseados para


aumentar la tasa de clasificacin.

Los rboles ampliados se pueden usar en rboles de clasificacin y de regresin.


Los rboles en una Selva aleatoria (Rotation Forest) se entrenan mediante el uso
del anlisis de componentes principales (ACP) en una porcin aleatoria de los datos.

Un rbol de decisin se considera ideal cuando representa la mayor cantidad de datos con el
menor nmero de niveles o preguntas. Los algoritmos diseados para crear rboles de
decisin optimizados incluyen CART, ASSISTANT, CLS y ID3/4/5. Un rbol de decisin
tambin se puede generar mediante la creacin de reglas de asociacin, ubicando la variable
objetivo a la derecha.

Cada mtodo debe determinar cul es la mejor forma de dividir los datos en cada nivel. Los
mtodos comunes para hacerlo incluyen la medicin de la impureza de Gini, la obtencin
de informacin y la reduccin de variaciones.

Emplear los rboles de decisin en el aprendizaje automtico tiene numerosas ventajas:

El costo del uso del rbol para predecir los datos disminuye con cada punto de datos
adicional.

Funciona para los datos numricos o categricos.

Puede modelar problemas con mltiples resultados.

Usa un modelo de caja blanca (lo que hace que los resultados sean fciles de
explicar).

La fiabilidad de un rbol se puede cuantificar y poner a prueba.

Tiende a ser preciso independientemente de si viola las suposiciones de los datos de


origen.

Pero tambin tienen algunas desventajas:

Cuando se presentan datos categricos con mltiples niveles, la informacin


obtenida se inclina a favor de los atributos con mayora de niveles.

Los clculos pueden volverse complejos al lidiar con la falta de certezas y


numerosos resultados relacionados.

Las conjunciones entre nodos se limitan a AND, mientras que los grficos de
decisin admiten ndulos relacionados mediante OR.

Вам также может понравиться