Un rbol de decisiones es una de las ms simples y exitosas formas de
algoritmos de aprendizaje. Sirve mucho como introduccin al rea del
aprendizaje inductivo, es muy fcil de implementar. Primero describimos el elemento principal, y luego se muestra como aprende. De esta forma, le introducimos ideas que aparecen en todas las reas del aprendizaje inductivo. Un rbol de decisin toma como entrada un objeto o situacin descrita por un grupo de atributos y da como salida una decisin. Los atributos iniciales pueden ser discretos o continuos al igual que los de salida. El aprendizaje en funcin de valores discretos se llama clasificacin de aprendizaje, mientras que en funcin de valores continuos se llama regresin. Esto ayuda a una clasificacin booleana de los resultados donde se pueden tomar uno de dos caminos: verdadero (positivo) o falso (negativo). Luego, un rbol de decisin llega a decidir mediante una secuencia de pruebas. Cada nodo interno del rbol corresponde a una prueba de valor de una de las propiedades, y las ramificaciones salientes de los nodos son catalogadas con los posibles valores obtenidos. Cada rama de nodo en el rbol especifica un valor logrado. Esta representacin arbrea parece muy natural en los seres humanos; por esta razn, muchos manuales de usuario se escriben como rboles de decisin simple en la mayora de sus pginas. Tenemos que establecer que atributos estn disponibles para describir ejemplos dominantes. -Alternate (alternativa): si hay algn restaurante cerca -Bar: Si el restaurante tiene un rea de bar que sea apropiada para esperar -Fri/Sat (Vie/Sab): Si hay atencin los viernes y sbados -Hungry (Con hambre): Si tenemos hambre. -Patrons (Cantidad de personas): Cuanta gente hay en el restaurante (ninguno, unos cuantos, lleno) -Price (Precio): El rango de precios del restaurante -Raining (Est lloviendo): Si est lloviendo afuera -Reservation (Est reservado): Si hicimos una reservacin -Type(tipo): La clase de restaurante (francs, italiano, thai, o burger) -WaitEstimate (Tiempo de espera por ser atendido): Tiempo estimado de atencin (0-10, 10-30, 30-60, >60 minutos). Los rboles de decisin tienen hiptesis particulares para saber si vale la pena esperar. Esto puede verse como una asercin de esta forma:
Los rboles de decisiones son buenos para algunas funciones matemticas que para otras, pero no logra representarlas todas. Volviendo al campo de la toma de decisiones, un rbol consiste de un vector de atributos de entrada X, una salida booleana de valor y. Con esto, un conjunto de ejemplos (X 1 ,y 1 ),, (X 12 ,y 12 ) Por ejemplo, en el caso del restaurante, el atributo Type (Tipo) solo arroja 4 posibles salidas, mientras que Patrons (Cantidad de personas) lleva a ms opciones dependiendo si no hay gente, hay algunos o mucha gente, todas las decisiones subsecuentes parten de ella En teora de la informacin, un bit puede tener dos respuestas: s o no, como tirar una moneda al aire. En general, si las posibles respuestas v i tienen una probabilidad P(v i ), entonces el contenido de informacin I de la respuesta es: Para el rbol de decisiones, debe haber un estimado de probabilidades de posibles respuestas antes que los atributos sean probados, y esto confronta elementos positivos (p) y negativos(n) en el conjunto de alternativas Luego, entre las elecciones aleatorias posibles existe una probabilidad promedio luego de elegir un atributo A, el cual sera un residuo o sobrante (Remainder). Esto ayuda a tener un atributo que tenga una informacin obtenida (gain), que es ms precisa y se da por la resta entre la informacin contenida menos el sobrante, nos ayuda a tener un grado de certeza del atributo.