q ¿Cómo almacenar de forma segura esa información?
q ¿Es posible obtener el máximo rendimiento de la
información disponible en las organizaciones?
q ¿Con qué medios contamos para la gestión eficiente de
los datos?
Algunos sistemas que son sólo
parcialmente conocidos, producen una cantidad inmensa de datos; estos datos con
frecuencia contienen valiosa información que puede resultar muy útil. Se trata
de auténticas vetas de oro para los ejecutivos de una corporación.
¿Cuál es el
problema?
La mayoría de las multinacionales
generan más información en una semana que la que cualquier persona podría leer
en toda su vida, e incluso las pequeñas empresas generan un volumen de datos
que no son capaces de manejar.
El Data Mining se considera un área multidisciplinar del entorno de la
Inteligencia de Negocio constituida por un conjunto de metodologías y
herramientas que permiten extraer conocimiento útil (patrones de
comportamiento, modelos operativos, de tendencia, etc.) para dar soporte a la
toma de decisiones, comprensión y mejora de los procesos y sistemas, a partir
de grandes cantidades de datos.
¿Cuándo tiene utilidad aplicar las
técnicas de Minería de Datos?
q Cuando la toma de decisiones debe estar basada en el
conocimiento.
q Cuando el
escenario es cambiante.
q Cuando los
métodos disponibles no son óptimos o el sistema es parcialmente desconocido.
q Cuando se
dispone de un gran volumen de datos, accesibles y con potencial de información
interesante.
Campos de aplicación de las técnicas de
Minería de Datos
q APLICACIONES DE NEGOCIOS
§ Marketing dirigido
§
Detección de fugas de clientes
§
Comportamiento del cliente en supermercados
ciertos días de la semana.
§
Inversiones, deportes y entrenamiento,
telecomunicaciones, e-Commerce, etc.
q APLICACIONES WEB
§
Mecanismos de búsqueda, rastreadores de
páginas web, etc.
q APLICACIONES
DE GOBIERNO
§
Mejora de las leyes, detección de fraudes,
anti-terrorismo, etc.
Algunas técnicas que se aplican en Data Mining:
q La asociación resuelve problemas del tipo “Análisis
de la Bolsa de la Compra”, con el fin de obtener las tendencias de compra
de los clientes.
q Trata la
posible relación entre dos sucesos aparentemente independientes.
q La expresión
de una regla de asociación tiene dos componentes, el antecedente (cuando los
alumnos cursan AOO), y el consecuente (cursan asignatura optativa POO)
SECUENCIACIÓN
q Es similar a la asociación, pero incluye el tiempo de
análisis añadiendo comparaciones de tiempo, como el análisis del tiempo
transcurrido entre el suceso inductor y el suceso inducido.
q Dentro de los
seis primeros meses, al cabo de quince días, la próxima vez que,
CLASIFICACIÓN
q Agrupa todas las herramientas que permiten asignar un
elemento a un determinado grupo o clase.
q Se utiliza en
la detección de transacciones fraudulentas, riesgo en la entrega de créditos,
identificación de procedimientos médicos, etc.
q Utiliza datos
históricos (conjunto de entrenamiento) para predecir un comportamiento futuro
en cada clase (perfil de la clase).
q Se utiliza para:
q Clasificar
cada elemento a partir de los valores de sus variables.
q Ver que
variables influyen en otras.
REGRESIÓN
q Similar a la clasificación.
q El modelo
generado intenta predecir el valor más probable para una observación.
AGRUPAMIENTO
q Se utiliza en Marketing (población con las mismas
afinidades), Medicina (pacientes con los mismos malestares), etc.
q Partición de la
base de datos en subconjuntos en base a un criterio, de forma que los elementos
tengan comportamientos comunes en sus variables.
q Diferencia con clasificación: NO se parte de un
conjunto de entrenamiento.
No hay comentarios:
Publicar un comentario