Los valores que pueden tomar las entradas y las salidas pueden ser discretos o continuos. Cuando se utilizan valores discretos se habla de modelos de clasificación y cuando son continuos de modelos de regresión.
Un Árbol de Decisión realiza un testeo a medida que recorre sus hojas hasta alcanzar una decisión. En un árbol se distinguen: nodos internos, nodos de probabilidad, nodos hoja y ramas.
Nodo de decisión:
Indica que una decisión necesita tomarse en ese punto del proceso. Está representado por un cuadrado.
Nodo de probabilidad:
Indica que en ese punto del proceso ocurre un evento aleatorio. Está representado por un círculo.
Rama:
Nos muestra los distintos caminos que se pueden emprender cuando tomamos una decisión o bien ocurre algún evento aleatorio:
q Los Árboles de Decisión se utilizan para descubrir patrones en los datos, se recogen estas pautas y se organizan en modelos que se utilizarán posteriormente para hacer predicciones.
q Los árboles son gráficos en los que cualesquiera dos nodos están conectados por exactamente un camino. Cada nodo es un camino elegido sobre la base de las pruebas realizadas en los atributos de entrada, hasta que al final de una “hoja” se alcanza un nodo. El nodo hoja representa una decisión y se utiliza como el resultado previsto para nuevos y desconocidos datos venideros.
Ejemplo de Árbol de Decisión
Una compañía de seguros nos ofrece una indemnización por accidente de 210.000$. Si no aceptamos la oferta y decidimos ir a juicio podemos obtener 185.000$, 415.000$ o 580.000$dependiendo de las alegaciones que el juez considere aceptables. Si perdemos el juicio, debemos pagar las costas que ascienden a30.000$.Sabiendo que el 70% de los juicios se gana, y de éstos, en el 50% se obtiene la menor indemnización, en el 30% la intermedia y en el 20% la más alta, determinar la decisión más acertada.
No hay comentarios:
Publicar un comentario