lunes, 5 de agosto de 2013

Minería de secuencias contínuas de datos

La minería de datos, según Frawley y sus colegas, en el artículo escrito el año 1992 titulado “Descubrimiento de conocimiento en bases de datos”, se define formalmente como “un conjunto de técnicas y herramientas aplicadas al proceso no trivial de extraer y presentar conocimiento implícito, previamente desconocido, potencialmente útil y humanamente comprensible, a partir de grandes conjuntos de datos, con objeto de predecir, de forma automatizada, tendencias o comportamientos y descubrir modelos previamente desconocidos”. Desde el punto de vista empresarial, en palabras de Molina, reportadas en el artículo escrito el año 2001 titulado “Torturando a los datos hasta que confiesen”, los términos minería de datos y extracción del conocimiento son tratados como sinónimos, y se lo define como: “La integración de un conjunto de áreas que tienen como propósito la identificación de conocimiento obtenido a partir de las bases de datos que aporten un sesgo hacia la toma de decisiones”. Según Pautsch, en la tesis de grado escrita el año 2009 titulada “Minería de datos aplicada al análisis de la deserción en la carrera de analista en sistemas de computación”, no se debe confundir a la minería de datos con un gran software ya que durante el desarrollo de un proyecto de este tipo, deben utilizarse diferentes aplicaciones para cada etapa. Las mismas pueden ser aplicaciones estadísticas, de visualización de datos o de inteligencia artificial. Actualmente existen aplicaciones comerciales muy poderosas que facilitan el desarrollo de un proyecto, pero es muy probable que deban complementarse con otras herramientas. El objetivo de la minería de datos es extraer la información oculta en las profundidades de las base de datos para luego intentar predecir futuras tendencias y comportamientos. De esta forma permiten a las organizaciones tomar decisiones proactivas y así adaptarse a un entorno permanentemente cambiante y sumamente competitivo. Las técnicas utilizadas en la minería de datos son el resultado de un largo proceso de investigación y desarrollo de productos que comenzó cuando los datos de negocio fueron almacenados por primera vez en computadoras y luego, con varias tecnologías, permitieron que los usuarios naveguen entre los datos en tiempo real. La minería de datos engloba todas estas técnicas para brindar información prospectiva y proactiva. Según Fayyad y sus colegas, en el artículo escrito el año 1996 titulado “De la minería de datos al descubrimiento del conocimiento en bases de datos”, la minería de datos está lista para su aplicación ya que está sostenida por cuatro tecnologías que ya se encuentran suficientemente maduras: (1) Recolección masiva de datos. (2) Potentes computadoras con multiprocesadores. (3) Almacenes de datos. (4) Algoritmos de minería de datos. En términos estrictamente académicos, las palabras minería de datos y descubrimiento de conocimiento en bases de datos no deben utilizarse de manera indistinta. La minería de datos es un paso esencial en el descubrimiento de conocimiento en bases de datos que utiliza algoritmos para generar patrones a partir de los datos procesados de manera antelada. El investigador Daniel Barbara, en el artículo escrito el año 2002 titulado “Requisitos para la agrupación de datos de secuencias”, menciona que en los primeros años del siglo veintiuno, los investigadores en bases de datos y las comunidades que se preocupan en minar datos, enfocaron su atención en un modelo nuevo de procesamiento de datos, donde los datos llegan en forma de streams o una secuencia continúa de datos. Estos datos que llegan de forma continua y rápida presentan un gran desafío para la minería de datos tradicional, ya que es realmente desafiante realizar las operaciones que habitualmente se usan en el análisis de enormes cantidades de datos. Chen y sus colegas, en el artículo escrito en año 2002 titulado “Análisis de regresión multidimensional de secuencias continuas de datos en series de tiempo” complementan mencionando que este nuevo modelo de análisis es denominado “minería de secuencias continuas” y se puede definir como un proceso de extracción del conocimiento de estructuras de registros rápidos y continuos de datos. Los ejemplos de secuencias continuas de datos incluyen tráfico de la red de computadoras, conversaciones telefónicas, transacciones de cajeros automáticos, búsquedas Web y datos de sensores.

No hay comentarios:

Publicar un comentario en la entrada