2b) Conexionismo

Enfoque conexionista de la mente - Presenta una nueva posición respecto al soporte físico en el que se desarrollan los p

Views 179 Downloads 10 File size 343KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Enfoque conexionista de la mente - Presenta una nueva posición respecto al soporte físico en el que se desarrollan los procesos mentales y sobre las características esenciales de esos procesos. - Sobre el soporte físico: Rumelhart, Hilton y MacClelland (1992) señalan que las operaciones o procesos están inspirados neuralmente. Ello implica que se deja de lado la metáfora del computador característica del enfoque cognitivista clásico por la denominada “metáfora del cerebro”. En este sentido, se arguye que la arquitectura cognitivista se habría alejado en exceso de una adecuación biológica. Y en esta línea, los autores se muestran escépticos frente a la eficiencia que puedan alcanzar operaciones que se realizan de forma serial por medio de algoritmos; puesto que, desde el punto de vista biológico, las neuronas tienen una velocidad de procesamiento que no podría explicar cómo se desarrollan procesos mentales complejos: “Las neuronas operan en una escala temporal de milisegundos mientras que los componentes del computador operan en una escala temporal de nanosegundos –un factor de 10% más rápido.” (Rumelhart, et al., 1992: 108). Rumelhart señala que se tiende a utilizar la metáfora del computador porque es la tecnología más avanzada de nuestro tiempo, así como en otras épocas pudo haberse comparado la inteligencia humana con el funcionamiento de un reloj. De este modo, en el enfoque conexionista: “The architecture that we are exploring is not one based on the von Neumann architecture of our current generation of computers but rather an architecture based on considerations of how brain themselves might function” (Rumelhart, 1998: 134). - Sobre las características de los procesos mentales: en este enfoque se afirma que todo el conocimiento está en las conexiones. Esto implica que no hay almacenamiento de información en las unidades del sistema, ello sólo podría darse de forma temporal en el estado de ciertas unidades (a corto plazo). Sin embargo, el almacenamiento a largo plazo, o conocimiento, se expresa a través de las conexiones que existen en el conjunto de unidades del sistema: “El conocimiento no es directamente accesible a la interpretación por algún procesador separado, sino que es construido en el procesador mismo y determina directamente el curso del procesamiento” (Rumelhart, et al., 1992: 109). Respecto a la naturaleza del procesamiento cognitivo, éste es considera en un nivel más abstracto que el del enfoque computacionalista (Rumelhart, et al., 1992; Rumelhart, 1998). El comportamiento inteligente es producto de un conjunto de componentes que interactúan paralelamente y que se restringen unos a otros; de forma que el procesamiento, en sí, es consecuencia de un proceso de satisfacción de dichas restricciones por parte del sistema en su globalidad. - Aspectos principales de un modelo general de Procesamiento Distribuido en Paralelo (PDP), propuesto por Rumelhart, Hilton y MacClelland (1992). Enmarcado en el enfoque conexionista de la mente, este modelo general subraya la idea de que el procesamiento ocurre por una activación propagadora en paralelo. Los aspectos principales de dicho modelo son: (Este modelo lo vimos en clases. La idea es advertir la diferencia entre enfoque conexionista de la mente y un modelo en específico que trabaja dentro de este enfoque, en este caso, el PDP) i. ii. iii. iv.

un conjunto de unidades de procesamiento, un estado de activación, una función de salida para cada unidad, un patrón de conexión entre las unidades,

v. vi. vii. viii. i.

ii.

iii.

iv.

v.

vi.

una regla de propagación para propagar patrones de actividad a través de las conexiones, una regla de activación para combinar entradas que afectan a una unidad con el estado actual de esa unidad, de forma que produzca un nuevo nivel de activación para la unidad, una regla de aprendizaje por el cual los patrones de conexión son modificados por la experiencia, un ambiente dentro del cual debe operar el sistema

De este modo, cualquier modelo de PDP, como primer paso, independiente del dominio o ámbito del conocimiento en el que se focalice, debe especificar un conjunto de unidades simples a través de las cuales se lleva a cabo el procesamiento. Cada unidad representa un rasgo en particular, un elemento abstracto que, en conjunto con las otras unidades, define un patrón de activación significativo. Es por ello que se define como distribuida al tipo de representación que se explica por medio de este conjunto de unidades (rasgos). En el desarrollo del procesamiento, el trabajo de cada una de las unidades se limita a recibir la entrada de las unidades vecinas y, en función de ellas, computar un valor de salida hacia otras unidades. Dado que este trabajo puede ser realizado de forma simultánea por varias unidades, se denomina como paralelo a este tipo de procesamiento. Por otro lado, todo sistema considerará unidades de entrada, de salida y ocultas. Las primeras reciben señales de fuentes externas al sistema específico que se esté modelando y, al contrario, las de salida envían señales hacia afuera del sistema. Se denomina, por otra parte, unidades ocultas a aquellas que son internas al sistema y que por ello no son asequibles. Por otro lado, el estado de activación corresponde al que exhibe el sistema en un momento t y que se representa a través de un patrón de activación del conjunto de unidades de procesamiento. Los autores señalan que “es útil ver el procesamiento en el sistema como la evolución, a través del tiempo, de un patrón de activación del conjunto de unidades” (Rumelhart, et al., 1992: 84); puesto que, es este patrón de activación el que captura lo que el sistema representa. Asimismo, en términos generales, la interacción que existe entre las unidades que forman parte del sistema, y que genera un estado de activación, está determinada por la intensidad de la señal que cada una propaga hacia sus vecinas, esto es, su función de salida; a su vez, dicha intensidad depende del grado de activación de la unidad. Un estado de interacción “conocido” por el sistema (conocimiento codificado) y que, por ello, determina la forma en que éste reacciona frente a una entrada cualquiera constituye un patrón de conexión. Determinar el patrón de conexión de un sistema permite “especificar el sistema de procesamiento y el conocimiento codificado en su interior” (Rumelhart, et al., 1992: 84). La conexión entre cada una de las unidades dependerá del peso de la misma, el que puede ser excitatorio (peso positivo) o inhibitorio (peso negativo); de modo que el patrón total de conexión, en los sistemas más simples, puede ser representado especificando los pesos de cada conexión en el sistema o en lo que se denomina una matriz de peso. El valor absoluto de una matriz de peso reflejará, entonces, la fuerza de la conexión. En este ámbito, los autores señalan que el patrón de conexión es fundamental, puesto que es el que determina lo que cada unidad representa. Otro concepto central dentro del PDP es el de regla de propagación, que expresa matemáticamente cómo se extienden las activaciones a través de las conexiones; ello se realiza por medio de una regla que explica el resultado de la interacción entre el valor de la función de salida de una unidad y las matrices de conexión (pesos) “para producir una entrada neta para cada tipo de entrada en la unidad” (Rumelhart, et al., 1992: 85). Por otra parte, existe una regla de activación que representa el efecto de las entradas netas que afectan a una unidad en su estado actual de activación y que produce un nuevo estado de activación de las mismas.

vii.

viii.

En el PDP el aprendizaje del sistema se produce por una modificación en sus patrones de conexión como resultado de la experiencia, lo que, por ende, altera su estructura de procesamiento (o de conocimiento). Esta variación implica esencialmente un cambio en los pesos o intensidades de las conexiones, aunque también puede ser producto del desarrollo de nuevas conexiones o por la pérdida de las ya existentes; aunque estos dos últimos motivos pueden ser explicados también como efecto de un cambio de peso (por ejemplo, de cero a un valor positivo o negativo, o, por otro lado, que una conexión pierda su fuerza de conexión hasta llegar a cero). En este contexto, se denomina regla de aprendizaje a la función que representa el fortalecimiento del peso de las conexiones, el que deriva de la interconexión entre una unidad que recibe una entrada de otra unidad en un contexto de alta activación para ambas. Finalmente, todo sistema debe operar dentro de un ambiente. En el PDP éste corresponde a una función caracterizada como un conjunto de probabilidades “de que cualquiera de los posibles conjuntos de patrones de entrada esté afectando a las unidades de entrada” (Rumelhart, et al., 1992: 89). En otras palabras, el ambiente provee al sistema de “experiencia”, y se representa por medio de un conjunto de vectores de activación (patrones de entrada) para las unidades de entrada. En coherencia con esta idea, resulta importante recordar que, como se señaló más arriba, las unidades de entrada (distintas de las de salida y las ocultas) se definen como aquellas que reciben señales de fuentes externas al sistema específico, es decir, del ambiente.

- Otro fenómeno de interés está en la dirección de los procesos cuando existen muchos estadios o niveles dentro del sistema; lo que en ciencias cognitivas se conoce como procesos bottom up, top down e interactivos. En este sentido, la organización jerárquica de una red en el PDP puede ser representada sobre la base de constreñimientos o restricciones dado por la activación de las unidades de nivel inferior, en el caso de que el proceso sea bottom up (abajo-arriba), o, por otro lado, por la activación de las unidades de nivel superior cuando el proceso es top down (arriba-abajo). De la misma manera, en el caso de un proceso interactivo, equivaldría, en el caso más radical, a “una restricción de la libre comunicación entre todas las unidades” (Rumelhart, et al., 1992: 94). (Aquí podríamos agregar unos ejemplos del artículo que expusieron Palo, Karen y Tere, creo, sobre modelos conexionistas de la producción). En síntesis, el PDP se presenta como una explicación formal que utiliza un lenguaje matemático para representar los procesos de activación de los sistemas cognitivos. Pero más allá de la formalización del enfoque, éste propone una perspectiva de comprensión diferente respecto del procesamiento cerebral y la conducta inteligente. - Contraste entre los enfoques computacionalista y conexionista de la mente. 1. En ambos enfoques la cognición se comprende como un complejo procesador de información y se representa el procesamiento por medio de un lenguaje formal lógico-matemático. En el cognitivismo clásico y el conexionismo, el procesamiento cognitivo implica esencialmente la realización de cómputos sobre las unidades que conforman el sistema. No obstante lo anterior, en el caso del computacionalismo, esta operación de cálculo es realizada sobre un sistema de símbolos. Estas estructuras simbólicas, por su parte, representan algo (una entidad, una proposición, un esquema). De ello deriva, por consiguiente, que la conducta inteligente se explique por esta capacidad de la mente de representar internamente el mundo. La computación simbólica posibilita una representación formal del valor semántico de las representaciones, puesto que “los programadores han codificado toda distinción semántica para su programa y la han expresado en la sintaxis de su lenguaje

2.

3.

4.

5.

6.

simbólico. En un ordenador, la sintaxis refleja la proyección semántica o es paralela a ella” (Varela, 1990: 40). Existe, por lo tanto, una relación fundamental entre las reglas algorítmicas y la semántica del sistema. Sin embargo, el modo en que las expresiones simbólicas adquieren su significado no es abordado directamente por este enfoque. En el caso de la propuesta de Newell y Simon, por ejemplo, el programa o, más específicamente, los programadores son quienes adjudican dichos valores al momento de diseñar el programa. Respecto al procesamiento de la información, en el enfoque computacional, la cognición en sí misma se explica como un procesamiento o manipulación de símbolos por medios de la aplicación de reglas. Por otro lado, de la naturaleza física de los símbolos deviene la posibilidad de que cualquier dispositivo que pueda manipular un sistema de símbolos físicos (típicamente los computadores) tendrá la capacidad de generar conductas inteligentes. Si el sistema está constituido por símbolos que representan de forma apropiada el entorno y, por medio del procesamiento, logra resolver los problemas a los que se le enfrenta, se puede afirmar que éste funciona con éxito. En el modelo conexionista se reemplaza la metáfora computacional de la mente humana por la del cerebro y sus estructuras básicas (redes de neuronas), en búsqueda de una mayor adecuación biológica del enfoque. En este sentido, para algunos investigadores “era evidente que el cerebro operaba a partir de interconexiones masivas, de forma distribuida, de modo que las conexiones entre conjuntos de neuronas cambian como resultado de la experiencia” (Varela, 1990: 53). Por lo tanto, el procesamiento en el enfoque conexionista deja de depender de unidades simbólicas, dotadas de un significado (o representacionales), para proponer que se sustenta en un conjunto de unidades simples que sólo por medio de la interacción, a través de la conexión entre ellas, generan un estado de activación. Y este estado de activación es el que captura lo que el sistema representa. Se abandona la concepción computacionalista de las relaciones que se establecen entre las unidades que integran el sistema cognitivo extraída de la lógica proposicional. Pero se mantiene la formalización por medio de un lenguaje matemático que explica dichas relaciones. No existen reglas o estructuración sintáctica que explique el procesamiento, sino que conexiones y activación propagadora en paralelo de las unidades. En el enfoque cognitivo tradicional todo procesamiento es el resultado de una ejecución secuencial o en serie, en donde las reglas se aplican una a la vez. Esta condición que impone el computacionalismo se transforma en una gran limitación para la eficacia del sistema frente a tareas que requieren de una gran cantidad de operaciones en muy poco tiempo. En este contexto, el conexionismo responde con una propuesta de procesamiento semejante al que se produce por medio de las conexiones sinápticas en el cerebro: un procesamiento en paralelo. De este modo, en un mismo punto en el tiempo, varias unidades interactúan por medio de microprocesos de activación-excitación (peso positivo) o inhibición (peso negativo) hasta conseguir un output o respuesta inteligente por parte del sistema. Esta propuesta se muestra más apropiada para explicar la eficacia del sistema cognitivo, el que es capaz de realizar procesamientos altamente complejos con gran rapidez. Otra de las distinciones entre los modelos, es la idea de representación como componente fundamental para el enfoque computacionalista. El sistema está conformado por estructuras simbólicas que representan información relevante para la realización del procesamiento; de ello se deriva que la información está localizada en un lugar concreto (la memoria). Por lo tanto, cualquier daño o pérdida dentro de esos espacios derivará en un deterioro del sistema en su conjunto. Al contrario, en el modelo de Procesamiento Distribuido en Paralelo (PDP), la representación está distribuida en la red. Ninguna de las unidades de la red representa, por ejemplo, un concepto, sino que éste se encuentra distribuido en el sistema y emerge como consecuencia de la activación de un patrón de conexión entre las unidades. Consecuentemente, este enfoque podría dar

explicación de la plasticidad que muestra el cerebro ante mutilaciones o deterioros. La representación distribuida tiene una capacidad potencial mayor de persistencia que aquella que responde a la concepción localista característica del computacionalismo, en donde toda pérdida de información es definitiva. 7. Se puede advertir que en el modelo simbolista existe una concepción de inteligencia que está centrada en la resolución de problemas generales. Los que requieren de varios conocimientos y la toma de decisiones, generalmente conscientes para su resolución, problemas que suelen considerarse difíciles o interesantes (considérese, por ejemplo, la propuesta del GPS de Newell y Simon). Con el conexionismo, por otro lado, hay una búsqueda por explicar una inteligencia más elemental, que se sostenga por medio de los mismos mecanismos de activación y propagación. Esta propuesta puede interpretarse como un procesamiento “fundamental”, menos especificado (o no modular) que aspira explicar tanto la inteligencia más básica como los procesos cognitivos más complejos. 8. En ambos enfoques persisten: “La idea básica de que el cerebro es un dispositivo para procesar información y que reacciona selectivamente ante ciertas características ambientales persiste en el núcleo de la neurociencia moderna y de la percepción del público” (1990: 51). No obstante lo anterior, no debe obviarse la existencia de otros enfoques referidos a la cognición que plantean nuevos problemas y desafíos a la hora de explicar cuáles son los mecanismos a través de los cuales los individuos logran conocer y comprender. Dichas propuestas, representadas en el enfoque corpóreo y el modelo de sistemas dinámicos, ponen en cuestión, por ejemplo, las características de arbitrariedad e independencia del sustrato físico (amodalidad) de los símbolos (Barsalou, 1999), en el caso del primero; y, por otro lado, se cuestiona que el foco esté en explicar los procesos cognitivos por medio del análisis de los estados del sistema, descuidando lo que sucede entre el paso de un estado a otro, en el caso del modelo de sistemas dinámicos (van Gelder, 1998). De este modo, en la medida que, desde las diferentes disciplinas que conforman las ciencias cognitivas, el avance de las investigaciones devela nuevas complejidades referidas a la cognición y al procesamiento, surge una comprensión cada vez más profunda y detallada de los mecanismos a través de los cuales se crea el conocimiento.