Colabore con el blog Estadistica

martes, 11 de septiembre de 2007

Introducción al Data Mining

1. Definición de Data Mining

Es un proceso de descubrimiento de los patrones, perfiles y tendencias significativas a través del análisis de los datos, mediante el uso de tecnologías de reconocimiento de patrones y técnicas estadísticas y matemáticas.

El Data Mining difiere de otros métodos de análisis de datos de un modo fundamental:
  • Descubre estructuras ocultas, ratios patrones y tendencias.
  • Es una técnica dinámica sólo por el hecho de no necesitar una búsqueda (query) o configurar el análisis para resolver un problema particular antes de realizar la minería.
Para construir un modelo útil se deben descubrir dos aspectos clave dentro del fichero de datos:
  • Los atributos significativos.
  • Los intervalos que identifican un patrón o firma de los clientes de la compañía.
Las herramientas OLAP y Query ofrecen información limitada para la toma de decisiones, ya que aportan información sobre lo que ha ocurrido pero no sobre las causas que han originado esa situación, siendo el analista quien debe deducirlo. Es en este punto donde entran en juego las herramientas de Data Mining, encontrando reglas o hechos de negocio relevantes del estudio particular de una masa de datos de forma inductiva.

2. Objetivos
  • Explicar los fenómenos.
  • Transformar la información en decisiones útiles y eficaces.
  • Permitir la construcción de modelos automáticos e inteligentes.
3. Beneficios
  • Modelos descriptivos: En un contexto de objetivos definidos, permite a las empresas explorar automáticamente, visualizar y comprender los datos e identificar patrones, relaciones y dependencias que impactan en la cuenta de resultados.
  • Modelos predictivos: permite expresar relaciones no descubiertas como reglas de negocio o modelos predictivos.

No hay comentarios: