Information Management

Icon

Reflexiones sobre las tecnologías de la información

Data Mining: Glosario de conceptos (1 de 2)

Como hicimos en uno de los primeros post de este blog, volvemos a realizar un glosario. Esta vez sobre Data Mining. Primero es preciso tener claro el concepto. Una definición sencilla es la siguiente. 

La minería de datos comprende una serie de técnicas clave para comprender a los clientes y operaciones de negocio, permitiendo descubrir nuevas tendencias, relaciones y patrones de comportamiento.

Los servicios de minería de datos deben contemplar básicamente cuatro etapas:  

  • La preparación, acondicionamiento y análisis previo de los datos de partida sobre los que se generarán los modelos.
  • La modelización en sí misma, entendiendo en esta etapa la construcción de los modelos mediante el procesado de la información de partida.
  • La validación de los modelos generados, tanto desde un punto de vista técnico como de negocio.
  • La puesta en producción y aplicación de los modelos en el entorno final, ya sea informacional u operacional.

Todo el proceso en su conjunto es por naturaleza iterativo, lo que implica la necesidad de una alta integración y automatización de cada una de sus etapas.

Para poder hablar en el futuro con propiedad vamos a construir un glosario.
  • Precisión (en inglés Accuracy): se define como la medida de un modelo predictivo que refleja la proporción número de veces que el modelo es correcto cuando se aplica a los datos. 
  • Application Programming Interface (API): interficie de lenguaje de programación (que relaciona o permite extender el programa). 
  • Inteligencia Artificial (en inglés Artificial Intelligence): campo de la ciencia que concierne a la creación de comportamiento inteligente en una máquina.
  • Red neuronal artificial (en inglés Artificial Neural Network (ANN)): véase red neuronal.
  • Regla de asociación (en inglés Association Rule): regla en la forma “si esto entonces” que asocia acontecimientos en una base de datos. Por ejemplo, hábitos de compra.
  • Retropropagación (en inglés Back Propagation): uno de los algoritmos más comunes en la formación de redes neuronales consistente consiste en minimizar un error (comúnmente cuadrático) por medio de gradiente descendiente.
  • Algoritmo de fuerza bruta (en inglés Brute Force Algorithm): técnica que utiliza la repetición exhaustiva de pasos simples con el fin de encontrar una solución óptima. Está en contraste con técnicas más complejas más caras y difíciles de construir pero mucho más eficientes.

Hasta aquí la primera parte de este post.

Archivado bajo:Data Mining , ,

2 Responses

  1. [...] Como hicimos en uno de los primeros post de este blog, volvemos a realizar un glosario. Esta vez sobre Data Mining. Primero es preciso tener claro el concepto. Una definición sencilla es la siguiente. La minería de datos comprende una … Original Josep Curto [...]

  2. [...] Management: Fases del cambio, Orientados al cliente, Data Mining: Glosario de conceptos: 1 y 2. Además ahora escribo en otro blog sobre otra de mis pasiones: la plataforma [...]

Leave a Reply

Twitter

 

Septiembre 2008
L M X J V S D
« Ago   Oct »
1234567
891011121314
15161718192021
22232425262728
2930  

Archivo