Mineria de datos en Redes Sociales: Segunda parte Aprendizaje automático

En la tesis de doctorado de José Giraldez, publicada el año 1999 con el título “Modelo de toma de decisiones y aprendizaje en sistemas multiagente” el primer método inductivo supervisado es el denominado “Inducción descendente de árboles de decisión”, que es una estrategia que puede emplearse para solucionar el problema que plantea el aprendizaje. Consiste en dividir el conjunto de entrenamiento en subconjuntos, empleando la estrategia “divide y vencerás” además de los criterios que separen más los ejemplos. Cuando los ejemplos están descritos en lógica de atributos, esta división se hace introduciendo en el mismo conjunto todos los ejemplos que comparten un mismo valor de un atributo dado. Smith, en el libro publicado el año 1988 con el título “Análisis de decisiones, un enfoque bayesiano”, menciona que si se representa mediante nodos de un árbol cada uno de los subconjuntos así formados, puede construirse un árbol de decisión que permita clasificar instancias. El tipo de métodos que hacen esto se llama: Inducción descendente de árboles de decisión, y el más conocido de ellos es el ID3, que fue seguido por versiones más potentes como C4.5, ambos trabajados por Quinlan, reportados en los libros publicados los años 1983 y 1993 titulados “Procedimientos de clasificación eficiente de aprendizaje y sus aplicaciones al juego del ajedrez” y “C4.5: Programas para el aprendizaje automático”.

Otro método inductivo supervisado es denominado “Programación lógica inductiva”, cuyo objetivo fundamental es aprender programas lógicos que describan un concepto a partir de un conjunto de entrenamiento compuesto por ejemplos. En el artículo de Bratko y Muggleton, publicado en año 1995 con el título “Aplicaciones de la programación lógica inductiva”, se menciona que este paradigma se presta fácilmente al uso de conocimiento del dominio durante el proceso de aprendizaje, siempre que se exprese en el lenguaje de programación lógica. Además, el poder expresivo del lenguaje de entrada y de salida es mayor que en el caso de otros paradigmas de aprendizaje automático que usan lenguajes proposicionales tipo atributo-valor como en el método ID3. Como consecuencia de esto, se extiende el número de aplicaciones que pueden tratarse con métodos de aprendizaje inductivo. En el articulo “Aprendizaje de definiciones lógicas a partir de relaciones”, escrito por Quinlan el año 1990, se presenta el sistema FOIL, que aprende definiciones de conceptos expresadas en forma de cláusulas de Horn, a partir de ejemplos expresados de manera relacional. Entre sus características más relevantes se encuentran: (a) Que es capaz de aprender definiciones recursivas del concepto objetivo; (b) el uso de métodos eficientes adaptados de sistemas de aprendizaje inductivo que emplean el formalismo de representación proposicional atributo-valor; y (c) que es capaz de aprender reglas que, aunque puedan ser ocasionalmente inexactas, son útiles.

En relación con los métodos no inductivos destacan los métodos: Aprendizaje basado en la explicación y el razonamiento basado en casos. Los métodos de aprendizaje basado en la explicación, se encargan de explicar por qué un ejemplo en particular es una instancia de un concepto. Mitchell y sus colegas, en el artículo escrito el año 1986 con el título “Generalización basada en la explicación: Una vista unificada”, mencionan que estas explicaciones son convertidas en reglas y empleadas para la categorización. Los métodos de aprendizaje basado en la explicación son analíticos y hacen un uso intensivo del conocimiento, mientras que los métodos inductivos son empíricos y hacen un uso muy pobre del conocimiento disponible por lo que necesitan muchos ejemplos. Los métodos de aprendizaje basado en la explicación pueden generalizar a partir de un único ejemplo, analizando por qué ese ejemplo es una instancia del concepto. La explicación identifica las características relevantes del ejemplo que constituyen condiciones suficientes para la descripción del concepto. La potencia de los métodos de aprendizaje basado en la explicación radica en su capacidad de utilizar la teoría del dominio para guiar el proceso de análisis.

Por su parte, el investigador Watson, en el libro publicado el año 1997 con el título “Aplicación del razonamiento basado en casos”, menciona que los sistemas de razonamiento basado en casos resuelven nuevos problemas adaptando soluciones que sirvieron para resolver problemas antiguos. Este paradigma de razonamiento es similar al que las personas usan habitualmente para resolver problemas. Según Aha, en el artículo escrito el año 1998 titulado “La omnipresencia del razonamiento basado en casos en la ciencia y su aplicación”, el proceso de resolución de problemas puede resumirse en las siguientes etapas: (1) Extracción. Dado un problema propuesto al sistema de razonamiento basado en casos, se extrae de una biblioteca donde están almacenados los casos en forma de tripletas: Problema, solución, resultado. (2) Reutilización. Se aplican una o más soluciones de estos casos extraídos al problema en cuestión. También pueden aplicarse combinaciones de las soluciones entre ellas y con conocimiento disponible del dominio de aplicación. (3) Adaptación. Se adapta la solución extraída según se necesite para resolver el nuevo problema. (4) Evaluación. Se evalúa el resultado de aplicar la solución adaptada al problema, y si el resultado no es aceptable, se vuelve a la etapa de adaptación. (5) Conservación. se considera el añadido del nuevo caso a la biblioteca de casos. Aquí se precisa de una métrica de la similitud que afectará decisivamente el éxito del sistema de razonamiento basado en casos.

Este proceso de resolver los problemas pertenece a un tipo de solucionado de problemas denominado perezoso, definido en el artículo escrito por Aha y sus colegas el año 1991 titulado “Algoritmos de aprendizaje basados en instancias”, debido a que los cálculos son realizados bajo demanda. Un solucionador de problemas perezoso se caracteriza por: (1) No procesar los datos de que dispone hasta que se le solicita información; (2) responder a peticiones de información combinando información obtenida a partir de datos almacenados; y (3) eliminar resultados intermedios empleados en el proceso de construcción de la solución. La técnica de aprendizaje automático empleada se denomina “Aprendizaje basado en instancias”, debido a que se encuentra basado en instancias específicas para generar predicciones de clasificación.

Mineria de datos en Redes Sociales

lunes, 20 de julio de 2015

Segunda parte Aprendizaje automático

No hay comentarios:

Publicar un comentario

Colaboradores