Colabore con el blog Estadistica

martes, 9 de octubre de 2012

Introducción al Data Mining

El objetivo del presente artículo, es el de presentar un sencilla técnica estadística de análisis. La mayoría de las empresas generan y almacenan gran cantidad de información.

q  ¿Cómo almacenar de forma segura esa información?
q  ¿Es posible obtener el máximo rendimiento de la información disponible en las organizaciones?
q  ¿Con qué medios contamos para la gestión eficiente de los datos?
 
Algunos sistemas que son sólo parcialmente conocidos, producen una cantidad inmensa de datos; estos datos con frecuencia contienen valiosa información que puede resultar muy útil. Se trata de auténticas vetas de oro para los ejecutivos de una corporación.
 
¿Cuál es el problema?
La mayoría de las multinacionales generan más información en una semana que la que cualquier persona podría leer en toda su vida, e incluso las pequeñas empresas generan un volumen de datos que no son capaces de manejar.
 
 
 
El Data Mining se considera un área multidisciplinar del entorno de la Inteligencia de Negocio constituida por un conjunto de metodologías y herramientas que permiten extraer conocimiento útil (patrones de comportamiento, modelos operativos, de tendencia, etc.) para dar soporte a la toma de decisiones, comprensión y mejora de los procesos y sistemas, a partir de grandes cantidades de datos.
 
¿Cuándo tiene utilidad aplicar las técnicas de Minería de Datos?
 
q  Cuando la toma de decisiones debe estar basada en el conocimiento.
q  Cuando el escenario es cambiante.
q  Cuando los métodos disponibles no son óptimos o el sistema es parcialmente desconocido.
q  Cuando se dispone de un gran volumen de datos, accesibles y con potencial de información interesante.
 
Campos de aplicación de las técnicas de Minería de Datos
 
q  APLICACIONES DE NEGOCIOS
   §   Marketing dirigido
§   Detección de fugas de clientes
§   Comportamiento del cliente en supermercados ciertos días de la semana.
§   Inversiones, deportes y entrenamiento, telecomunicaciones, e-Commerce,  etc.
q  APLICACIONES WEB
§   Mecanismos de búsqueda, rastreadores de páginas web, etc.
q   APLICACIONES DE GOBIERNO
§   Mejora de las leyes, detección de fraudes, anti-terrorismo, etc.
 
Algunas técnicas que se aplican en Data Mining:
 
 Asociación:
q  La asociación resuelve problemas del tipo “Análisis de la Bolsa de la Compra”, con el fin de obtener las tendencias de compra de los clientes.
q  Trata la posible relación entre dos sucesos aparentemente independientes.
q  La expresión de una regla de asociación tiene dos componentes, el antecedente (cuando los alumnos cursan AOO), y el consecuente (cursan asignatura optativa POO)
SECUENCIACIÓN
 
q  Es similar a la asociación, pero incluye el tiempo de análisis añadiendo comparaciones de tiempo, como el análisis del tiempo transcurrido entre el suceso inductor y el suceso inducido.
q  Dentro de los seis primeros meses, al cabo de quince días, la próxima vez que,
CLASIFICACIÓN
 
q  Agrupa todas las herramientas que permiten asignar un elemento a un determinado grupo o clase.
q   Se utiliza en la detección de transacciones fraudulentas, riesgo en la entrega de créditos, identificación de procedimientos médicos, etc.
q   Utiliza datos históricos (conjunto de entrenamiento) para predecir un comportamiento futuro en cada clase (perfil de la clase).
q  Se utiliza para:
q    Clasificar cada elemento a partir de los valores de sus variables.
q    Ver que variables influyen en otras.
REGRESIÓN
 
q  Similar a la clasificación.
q   El modelo generado intenta predecir el valor más probable para una observación.
AGRUPAMIENTO
 
q Se utiliza en Marketing (población con las mismas afinidades), Medicina (pacientes con los mismos malestares), etc.
q Partición de la base de datos en subconjuntos en base a un criterio, de forma que los elementos tengan comportamientos comunes en sus variables.
q Diferencia con clasificación: NO se parte de un conjunto de entrenamiento.

No hay comentarios: