Data Mining, análisis predictivo
- 28 nov 2016
- 2 Min. de lectura

La minería de datos ("Data Mining") o explotación de información consiste en en un conjunto de procesos y algoritmos que permiten descubrir patrones de comportamiento en grandes volúmenes de información.. Utiliza métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior.
La Explotación de la información es la sub-disciplina informática que aporta a la Inteligencia de Negocios o Business Intelligence las herramientas para la transformación de información en conocimiento. Es la búsqueda de patrones interesantes y regularidades importantes en grandes masas de información.
Para más información leer el artículo "¿Por qué una solución Business Intelligence?": http://www.weikopit.com.ar/single-post/2016/10/24/%C2%BFPor-qu%C3%A9-una-soluci%C3%B3n-Business-Intelligence
Metodología CRISP-DM
Metodología iniciada por un grupo de Empresas europeas a finales de 1996. Surge de la necesidad de aprender nuevas técnicas para aplicar y comprender de mejor manera a la Minería de Datos y sus resultados basándose en un proceso jerárquico. El objetivo de dicha metodología es desarrollar proyectos de Data Mining (DM) mediante un proceso estandarizado.
Modelo CRISP-DM
La metodología se describe en términos de un proceso jerárquico consistente en un grupo de tareas descritas en cuatro niveles de abstracción ( de general a específico)
Fase
Tareas generales
Tareas específicas
Instancias del proceso
Ciclo de vida de un proyecto
La metodología provee una representación completa del ciclo de vida de un proyecto de DM, que se divide en seis fases, sus tareas y relaciones entre ellas.
Entendimiento del negocio
Entender los objetivos y requerimientos del proyecto desde una perspectiva del negocio.
Entendimiento de los datos
Descubrir datos iniciales en los datos o detectar subconjuntos para tomar hipótesis sobre información escondida.
Preparación de los datos
Aquí se incluye la integración, selección, limpieza y transformación de los datos.
Modelaje
Varias técnicas de modelado son seleccionadas y aplicadas.
Evaluación
Se evalúa el modelo y se revisa la construcci;on. Comprobar que se cumplan los objetivos del negocio.
Implementación o despliegue
Revisar el proyecto a fin de identificar fracasos y éxitos y potenciales áreas de mejora para el uso en futuros proyectos
Ejemplos de aplicación
Identificación de las características de los alumnos con mayor nivel académico.
Cuales son los rasgos y/o características de las materias electivas que elige los alumnos.
Identificación de factores que inciden en el alza de las ventas de un producto dado.
Rasgos distintos de clientes con un alto grado de fidelidad a la marca.
Conclusión
La Minería de Datos ha sufrido transformaciones en los últimos años de acuerdo con cambios tecnológicos, de estrategias de marketing, la extensión de los modelos de compra en línea, entre otros factores. Debido a que día a día se procesan cada vez más datos, con el surgimiento también de las redes sociales, la disciplina de Data Mining va utilizarse y a crecer en un futuro inmediata, para poder descubrir nuevos patrones de comportamiento en grandes masas de información con el uso complementario de Big Data. Para saber más sobre Big Data, leer el artículo: "Big Data, el futuro de los datos"
¿Te ha gustado este artículo? Compártelo en las redes sociales. ¡Muchas Gracias!





















Comentarios