lunes, 2 de marzo de 2015

Modelado estadístico neuronal

Las redes neuronales constituyen una herramienta de análisis, modelado y predicción que se puede encontrar cómodamente integrada en muy diversos campos: Informática, robótica, ingeniería, psicología y otros. Según Castellano, en la tesis doctoral publicada el año 2009 con el título “Modelización estadística con redes neuronales”, en sus aplicaciones a cada ámbito, las redes neuronales adoptan connotaciones diferentes, y son vistas como herramientas de la ingeniería, réplicas del pensamiento racional, modelos de caja negra. En todos los casos las redes se rigen por la filosofía general de obtener modelos coherentes con la realidad observada, de tal modo que sean los datos los que determinen el comportamiento de la red, bien a través de la determinación de su estructura, bien de sus parámetros internos. Estas ideas acercan las redes neuronales a las ideas de los métodos no paramétricos de análisis de datos, en particular y en general al ámbito de la estadística, donde las redes neuronales son consideradas como potentes herramientas estadísticas de análisis de datos

Según Haykin, en el libro publicado el año 2009 titulado “Redes neuronales y aprendizaje automático”, el nombre redes neuronales surge de la analogía con el cerebro humano y el modo en que las personas pueden acercarse a la tarea de reconocer muestras. Un largo camino las separa ya de sus raíces biológicas. Se han hecho grandes avances, y aunque muchos de ellos se han opuesto a un cuidadoso escrutinio, los métodos de las redes neuronales han tenido un gran impacto en la práctica del reconocimiento de patrones. Como complemento Bishop, en el libro publicado el año 1995 con el título “Redes neuronales para el reconocimiento de patrones”, menciona que las redes neuronales artificiales pueden considerarse como una herramienta estadística completa para el análisis de datos.

Castellano, en la tesis citada, manifiesta que las redes neuronales artificiales se usan principalmente con tres objetivos diferenciados: (1) Como modelos biológicos e inteligentes. Parte de las motivaciones biológicas que dieron lugar a las redes neuronales se han conservado, por ello y se siguen empleando como instrumentos que ayudan a entender y duplicar el funcionamiento de los sistemas nerviosos de los seres vivos. (2) Como procesadores adaptativos de señales en tiempo real, o controladores, implementados en hardware para aplicaciones como robots. Esta es el área del reconocimiento de patrones. La tecnología, la ciencia y los negocios han aportado nuevas tareas de interés: Diagnóstico de enfermedades, leer códigos comprimidos, los cuales, en algunos casos, son eminentemente tecnológicas, como la lectura de códigos de barras, y en otros muchos las llevan a cabo expertos humanos. El objetivo es construir máquinas que realicen estas labores de un modo más “rápido”, más “barato”, y más “aproximado” que las personas. Cada vez es más factible idear sistemas automáticos que sustituyan y mejoren al especialista, como la “cuenta de crédito de un cliente”, o clonar al experto, ayuda al diagnóstico médico. (3) Como métodos de análisis de datos. De hecho en multitud de ocasiones si se analiza detalladamente lo que está haciendo una red se descubrirá que se dedica a rescribir métodos estadísticos clásicos. Así mismo cualquier red, aún cuando su objetivo final sea algo muy concreto y a simple vista alejado de la estadística, como “la voz” del desfibrilador que dice que el paciente tiene pulso y no puede recibir la descarga, fue diseñada, y por lo tanto puede ser analizada desde un punto de vista meramente estadístico. Esta tercera faceta de las redes fue estudiada con detenimiento por Sarle, en el artículo escrito el año 1994 titulado “Redes neuronales y modelos estadísticos”.

En el año 1943, los investigadores McCulloch y Pitts, en el artículo titulado “Calculo lógico de las ideas inmanentes en la actividad nerviosa”, propusieron un modelo matemático sencillo del funcionamiento de las neuronas: La neurona dispara un potencial de acción cuando la combinación lineal de sus entradas supera un umbral. Este modelo se utiliza como unidad de procesamiento en las redes neuronales artificiales, bajo el nombre de perceptrón. Algunos de los primeros trabajos en inteligencia artificial se basaban en estas redes neuronales artificiales. Otros nombres para este campo son: Computación neuronal, procesamiento distribuido paralelo y conexionismo. Según Montaño, en la tesis publicada el año 2002 titulada “Redes neuronales artificiales aplicadas al análisis de datos”, en el primer período de la reemergencia del conexionismo que se encuentra situado en la segunda mitad de los años 1980, la idea que se trataba de transmitir consistía en que los modelos neuronales habían surgido como una forma totalmente novedosa de solucionar problemas de clasificación y predicción, sobrepasando siempre en eficacia a las técnicas tachadas de convencionales, como la estadística. A lo largo de la década de los años 1990, una vez reconocido el campo de las redes neuronales ante la comunidad científica, surgieron una serie de trabajos teóricos entre los cuales la comparación entre las redes neuronales artificiales y la estadística pone de manifiesto la similitud y, en muchos casos, la identidad entre ambas perspectivas. Uno de los aspectos que han fomentado la idea errónea acerca de las diferencias entre las redes neuronales y la estadística versa sobre la terminología utilizada en la literatura de ambos campos. Se recuerda que el campo de las redes neuronales surge como una rama de la inteligencia artificial con una fuerte inspiración neurobiológica y su desarrollo ha sido debido a la contribución de investigadores procedentes de una gran variedad de disciplinas.

No hay comentarios:

Publicar un comentario en la entrada