Archivo de la categoría: C

Conceptos en animales no humanos

Para la tradición filosófica, sólo una especie animal posee conceptos: la humana (Davidson, 1982, 2001; Brandom, 1994; McDowell, 1994). Ahora, ¿es esto realmente así? ¿O hay también animales no humanos que dominan conceptos? En las últimas décadas, un número creciente de filósofos (Andrews, 2015; Glock 2000, 2010, 2018; Camp, 2009; Allen, 1999; Allen y Hauser, 1991; Newen y Bartels, 2007; Monsó, 2019; Nelson, 2020) y científicos (Pepperberg, 1999; Seyfarth y Cheney, 2015, Vauclair, 2002; Shettleworth, 2010) se ha inclinado por responder afirmativamente el último interrogante. El tópico sigue siendo, sin embargo, altamente controvertido.

Al aproximarnos al problema de si los animales no humanos poseen conceptos hay al menos dos factores a considerar. Por una parte, debemos sopesar la información empírica disponible sobre los comportamientos y habilidades de distintas especies animales. Por otra, debemos contar con respuestas a un conjunto de interrogantes filosóficos generales que operan como trasfondo del debate, tales como: ¿qué son los conceptos?, ¿cuál es su función?, ¿cuáles son sus rasgos distintivos?, ¿qué condiciones debe satisfacer una criatura para poseer conceptos?, etc. Un abordaje relativamente acabado de estos interrogantes y de la evidencia relevante excede los límites de esta entrada. Por ello, en lo que sigue adoptaré una estrategia diferente: examinaré las posiciones de los principales detractores y defensores de la tesis de que los animales poseen conceptos, focalizándome en qué requerimientos consideran que deben satisfacerse para ello. Apoyándome en este examen previo, luego presentaré un par de ejemplo empíricos y argumentaré que hay buenas razones para pensar que, al menos en estos casos, estamos ante animales que dominan conceptos.

1. Posiciones escépticas: razones en contra de la atribución de conceptos a los animales no humanos

Numerosos filósofos, a los que llamaré, siguiendo a Glock (2000, 2010, 2017), “lingualistas”, rechazan la posibilidad de que los animales no humanos posean conceptos. Aunque hay diferencias en sus posiciones, todos ellos consideran que la posesión de un lenguaje natural es condición necesaria para el dominio conceptual. De allí que, a su entender, los animales carentes de lenguaje están privados de conceptos (Brandom, 1994, 2000; Davidson, 1982; McDowell, 1994, 2009).

Estos filósofos tienden, además, a distinguir tajantemente entre dos tipos de respuestas al entorno: las discriminatorias y las conceptuales. La mera discriminación no basta, piensan, para que una criatura domine conceptos. Discriminar es meramente responder de un modo diferenciado a las entidades de una clase y abstenerse de dar estas respuestas ante otro tipo de entidades. En este sentido, el girasol que gira ante la luz del sol, o la puerta automática que se abre ante la cercanía de un cuerpo, estarían dando respuestas discriminatorias. Identificar la posesión de conceptos con la mera capacidad de discriminación supondría, por tanto, un claro riesgo de volverla trivial. Para esta tradición, aplicar a una entidad particular x el concepto general F consiste en representar o pensar a x como F. Hazaña que, añaden, sólo podemos realizar los animales humanos, lingüísticamente competentes. Ahora bien, ¿qué razones nos ofrecen para sostener tal afirmación? La respuesta a este interrogante depende de qué entendamos por pensar o representar algo como F. Davidson, por ejemplo, sostiene que aplicar un concepto consiste en clasificar un particular bajo una clase de un modo que involucra comprensión. ¿Pero qué quiere decir esto?  Citando al propio Davidson (1997, p.139):

“…tener un concepto es clasificar objetos, propiedades, situaciones o eventos, mientras se comprende que lo que ha sido clasificado puede no pertenecer a la  clase asignada”.

De acuerdo con esta cita, la criatura que domina conceptos no sólo ha de ser susceptible de errar en la aplicación de conceptos, sino que ha de poder comprender que tal error es posible.Ahora bien, para Davidson, quien aplica un concepto general F a un particular x, forma un juicio o una creencia con un contenido proposicional específico: que x es F. Luego, errar en la aplicación de un concepto equivale a formar una creencia o juicio erróneo, y comprender que se ha errado en tal empresa exige la capacidad para volverse reflexivamente sobre los propios juicios y creencias evaluándolos como verdaderos o falsos. De esto se sigue que sólo poseerán conceptos quienes puedan tener estados mentales de segundo orden acerca del estatus epistémico –verdadero o falso— de sus pensamientos. A lo cual se suma que, para este filósofo, los sofisticados contrastes entre verdad-falsedad y objetivo-subjetivo sólo pueden adquirirse en el contexto de la interpretación lingüística. Por ello, en último término, únicamente quienes dominen un lenguaje poseerán conceptos.

Brandom es otro filósofo que se niega tajantemente a equiparar la posesión de conceptos con la posesión de capacidades discriminatorias. La razón de ello, nos dice, es que quien aplica un concepto general F a una entidad particular x ha de comprender tanto las razones que dan sustento a tal clasificación, como las consecuencias inferenciales que se siguen de ella. A esto se suma que quienes dominan conceptos no solo han de poder llevar a cabo las inferencias adecuadas, sino que han de ser capaces de explicitar y ofrecer sus razones para aplicar conceptos como lo hacen, así como también de solicitar dichas razones a otros (Brandom, 1994, 2000).

Al carecer de lenguaje, los animales no humanos son incapaces de dar y pedir razones de modo público y explícito, con lo cual cabe concluir a priori que no pueden poseer conceptos. Asimismo, distintas afirmaciones de Brandom sugieren que, para él, los animales tampoco son capaces de comprender o usar razones, con lo cual se refuerza su idea de que debemos excluirlos del reino de las criaturas conceptuales. Este escepticismo brandomiano se manifiesta, por ejemplo, en su examen del comportamiento del loro que es capaz de proferir la palabra “rojo” ante las cosas rojas. Aunque parezca lingüística y conceptual, su respuesta es, nos dice, meramente discriminatoria. ¿Por qué? Básicamente, porque el loro no logra comprender las conexiones inferenciales que se seguirían de atribuir el concepto “rojo” a un particular, ni cuáles son buenas razones que puedan justificar dicha atribución. En contra de esta posición Nelson (2019) argumenta que los experimentos de Pepperberg (1999) con el loro Alex muestran que este animal sí satisface el requisito de articulación inferencial, con lo cual puede ser considerado un genuino propietario de conceptos.

No es posible revisar aquí las respuestas que se han dado en contra de estos argumentos escépticos (se puede encontrar algunas de ellas en Newen y Bartels 2007, Glock 2020, Camp 2009, Griffin 2018, Kalpokas 2018 y Danón 2016). Sin embargo, cabe señalar que, aun si admitimos que el dominio conceptual no consiste en meras capacidades discriminatorias, no por ello hemos de aceptar que requiera, necesariamente, de la capacidad para formular juicios lingüísticos (Glock 2000). Por el contrario, muchos filósofos consideran posible delimitar requerimientos para el dominio de conceptos que permitan distinguir la discriminación de la clasificación conceptual, pero que resulten, al menos en principio, independientes de la posesión de lenguaje. Si esto es así, queda abierta la posibilidad empírica de que siquiera algunos animales satisfagan tales requisitos y merezcan ser considerados propietarios de conceptos. El próximo apartado estará dedicado a examinar estas distintas propuestas.

2. Las posiciones optimistas y los requisitos para la posesión de conceptos por parte de (algunos) animales no humanos  

En lo que sigue, presentaré sucintamente aquellas posiciones según las cuales es posible que los animales no humanos posean conceptos. Podemos comenzar por señalar que los defensores de la atribución de conceptos a animales no humanos tienden a compartir un núcleo importante de tesis. En primer lugar, suelen reconocer, como los lingualistas, que la mera capacidad discriminatoria no equivale a la posesión de conceptos (Allen, 1999; Allen y Hauser, 1991; Glock, 2000; Newen y Bartels, 2007; Monsó, 2019). Ahora bien, si la posesión de conceptos no es una mera capacidad discriminatoria, ¿cómo hemos de entenderla? Con frecuencia, estos filósofos se inclinan por la siguiente respuesta: poseer el concepto de P es ser capaz de clasificar distintos particulares como siendo P (Glock, 2010; Newen y Bartels, 2007; Monsó, 2019). No obstante, a diferencia de los lingualistas, se esfuerzan por caracterizar la clasificación conceptual como una habilidad diferente de la discriminación pero que, en principio, podría hallarse en (siquiera algunos) animales no humanos.  

En primer lugar, los defensores de la atribución de conceptos a animales suelen sostener que mientras la discriminación es una respuesta rígida a estímulos perceptuales específicos que no puede modificarse o inhibirse, la habilidad para clasificar algo como F es una capacidad flexible (Newen y Bartels, 2007; Allen, 1999; Allen y Hauser, 1991) y, añaden algunos, relativamente independiente de los estímulos perceptuales (Allen, 1999; Allen y Hauser, 1991). En relación con este requisito de independencia del estímulo, se ha sostenido que quienes poseen conceptos han de poder formar representaciones que trasciendan los estímulos sensoriales específicos que los afectan de modo inmediato (Allen y Hauser, 1991; Allen, 1999). Esto puede entenderse de dos modos. Bajo una caracterización minimalista, las criaturas conceptuales deben poder integrar diversas fuentes de información perceptual formando representaciones que guíen sus respuestas al entorno. Bajo una versión más exigente, al menos parte de la información a integrar debe ir más allá de lo perceptualmente accesible en su entorno inmediato. Esta capacidad para integrar información diversa de un modo que trascienda los estímulos provenientes de una modalidad sensorial determinada o que, en ocasiones, incluso que exceda los límites de lo que se puede percibir actualmente, posibilita a quienes dominan conceptos responder a su medio de modo flexible. Puede permitirles, por ejemplo, responder al mismo estímulo en dos situaciones distintas aplicando conceptos diferentes, en función del modo en que este se vincule, en cada caso, con otra información a su disposición. O, de manera inversa, les posibilita aplicar el mismo concepto en dos situaciones en las que se vean afectados por distintos estímulos sensoriales puntuales.

Otro requerimiento que suele considerarse central para la posesión de conceptos es el de aspectualidad (Duhau, 2011; Glock, 2000, 2010; Monsó, 2019). La idea básica es la siguiente: quien clasifica a una entidad como F lo hace debido a que esta posee ciertos rasgos (los relevantes para pertenecer a la clase F). Pensar a una entidad como siendo F es, por ello, pensarla bajo un aspecto (esto es, pensarla como teniendo ciertas propiedades específicas) entre otros posibles.

También suelen aparecer, en las discusiones sobre conceptos en animales, requisitos relativos al carácter normativo del empleo de conceptos. Allen (1999), por ejemplo, parece pensar que quien aplica conceptos no sólo puede cometer errores en tal tarea, sino que, además, debe poder percatarse de ellos y corregirse. Luego, podemos atribuir justificadamente el dominio de un concepto F a una criatura cuando esta no sólo es capaz de (i) discriminar aquellas entidades que poseen la propiedad F de las que no la poseen, sino que, además, (ii) puede detectar algunos de los errores que comete en tales intentos de discriminación y (iii) como consecuencia de la detección de tales errores, aprende a discriminar mejor las entidades que son F de las que no lo son. Presuntamente, esta capacidad para detectar errores discriminatorios descansa en la posesión de una representación de F, que opera como un estándar que el animal puede comparar con lo que efectivamente percibe, a fin de determinar si está o no ante un F y corregir sus respuestas discriminatorias cuando sea necesario.  

Glock es otro filósofo que subraya la dimensión normativa del empleo de conceptos. Conceptualizar algo como F, nos dice, es una tarea que una criatura lleva a cabo intencional y deliberadamente, apoyándose en ciertos estándares y pudiendo equivocarse cuando no logra ajustarse a ellos. La clasificación es deliberada porque quien subsume un particular x bajo un concepto general F debe decidir entre distintas opciones: clasificar al particular x como F o abstenerse de hacerlo, clasificar a x como F antes que como G, H, I, etc. Finalmente, la clasificación se ve guiada por estándares normativos en la medida en que, para decidir entre las opciones antes mencionadas, la criatura ha de tomar en consideración la presencia (o ausencia) de un conjunto de rasgos distintivos del ser F. Ahora bien, esto no implica que quien aplica conceptos deba poder pensar en estos estándares como tales. Esto es, no necesita reflexionar explícitamente sobre cuáles son las reglas que guían su conducta clasificatoria. Sólo debe ser capaz de ponerlas en uso para discernir cómo son las cosas: esto es, discernir que x es F antes que G o H, etc. (Glock, 2018, 2010).

Otros requisitos propuestos en la literatura atañen al rol que suele otorgarse a los conceptos como unidades representacionales mínimas que componen los contenidos proposicionales. En sus formas paradigmáticas, estos contenidos proposicionales representan un objeto particular teniendo una propiedad y se encuentran compuestos por dos tipos de conceptos: el del objeto particular y el de la propiedad general. Apoyándose en estas ideas, Newen y Bartels (2007) señalan que, quien posee conceptos y forma con ellos contenidos proposicionales, ha de poder atribuir la misma propiedad a distintos objetos y representar distintas propiedades en un mismo objeto. Todo lo cual supone, a su vez, que las criaturas conceptuales han de poder recombinar al menos algunos conceptos de propiedades y algunos conceptos de objetos para formar nuevos pensamientos.

Cabe añadir, finalmente, una última condición que introducen Newen y Bartels (2007). Para ellos, la posesión de un concepto –como verde o cuadrado— exige que se cuente con una “red semántica mínima” compuesta por algunos otros conceptos vinculados entre sí. Luego, para poseer un concepto como el de “rojo”, un animal debe poseer también algunos “conceptos contrarios”, como “azul” o “verde”, así como un concepto general, como “color”, que los abarque a todos ellos .

El conjunto de requerimientos que hemos examinado en este apartado basta para evidenciar que los filósofos proclives a atribuir conceptos a animales no equiparan la posesión de conceptos con la capacidad para discriminar ciertos rasgos puntuales del entorno y dar respuestas específicas a ellos. Por el contrario, aunque no siempre se discuta el punto explícitamente, muchos parecen asumir que el dominio de conceptos debe permitir que una criatura: (i) se forme una multiplicidad de estados mentales, interconectados entre sí, sobre cómo pueden ser las cosas y (ii) pueda ejercer estas capacidades representacionales de un modo relativamente autónomo, flexible, activo, espontáneo, productivo, e independiente de los estímulos del entorno. Los requisitos de aspectualidad, recombinabilidad y holismo parecen garantizar (i), mientras que los de flexibilidad, distancia y normatividad nos dan razones para pensar que quien los satisface cuenta también con (ii).

3. Animales que poseen conceptos: las hembras babuino y el rango social

En el apartado anterior examiné una serie de requisitos que usualmente se proponen como aquellos que debe satisfacer un animal para poseer conceptos: flexibilidad en las respuestas, capacidad para distanciarse de los estímulos y representar ciertas entidades bajo determinados aspectos, alguna sensibilidad a las normas que guían la clasificación conceptual, alguna capacidad para recombinar conceptos formando con ellos pensamientos proposicionales y la posesión de una red de conceptos inferencial y semánticamente vinculados entre sí. Sin embargo, queda en pie la pregunta: ¿hay animales que, por satisfacer los requerimientos relevantes, merezcan ser clasificados como propietarios de conceptos? A modo de respuesta inicial, querría examinar aquí un ejemplo ilustrativo, entre otros posibles, que parece satisfacer los diversos requisitos examinados.  El caso en cuestión es el de las hembras babuino que clasifican a otras hembras de su grupo según el lugar que ocupan en la jerarquía social.

Según señalan Cheney y Seyfarth, los babuinos son primates cuya supervivencia y reproducción dependen de sus habilidades sociales, incluyendo entre estas últimas tanto capacidades para reconocer a los individuos del grupo, como para detectar y representar conceptualmente algunos de sus atributos y relaciones sociales. Estos primates viven en África en grupos de entre 50 y 150 individuos. Los machos emigran del grupo entre los 8 y los 10 años de edad, pero las hembras permanecen en su grupo toda su vida, manteniendo vínculos cercanos con sus parientes maternos. Las hembras pueden ser ubicadas, a su vez, en relaciones jerárquicas de dominancia o subordinación de acuerdo a la familia a la que pertenezcan (de modo tal que, por ejemplo, si la familia A ocupa un lugar superior en la jerarquía que la familia B, entonces todos los miembros de A son dominantes respecto de los miembros de B). A su vez, es posible encontrar diferencias de rangos jerárquicos entre los individuos de cada familia. Estas relaciones jerárquicas suelen permanecer estables, sufriendo sólo modificaciones excepcionales. Ahora, qué posición jerárquica ocupe cada babuino incidirá de distintos modos en sus interacciones con los demás, determinando qué comida se le permita comer y cuándo, a dónde puede sentarse, con quién puede aparearse, a quién puede espulgar, etc. (Cheney y Seyfarth, 2007; Seyfarth y Cheney, 2013, 2015).

La evidencia sugiere que las hembras babuino son capaces de reconocer y rastrear el rango jerárquico de las otras hembras del grupo, detectando sus vínculos de dominancia o subordinación. Entre los datos que apoyan esta hipótesis, se destacan los resultados de un estudio experimental que mostró cómo estos animales responden de un modo cuando escuchan vocalizaciones de otros pares de hembras que se ajustan a las relaciones de jerarquía existentes y de otro muy diferente cuando escuchan secuencias de vocalizaciones que parecen violar esa jerarquía. En particular, cuando las hembras escuchan vocalizaciones “anómalas” en las que una subordinada B gruñe de modo amenazador a la dominante A y, en respuesta, esta grita atemorizada, se sorprenden y miran por más tiempo en la dirección de la que provienen los sonidos. Para los investigadores, esto evidencia su capacidad para reconocer quién emite cada vocalización y cuáles son las relaciones jerárquicas entre dichas interlocutoras (Cheney y Seyfarth, 2013; Cheney y Seyfarth, 2007).

Ahora, si apelamos a la batería de requerimientos que hemos identificado a lo largo de este trabajo, podemos preguntarnos: ¿tenemos razones para coincidir con la evaluación de estos etólogos y atribuir conceptos de rango jerárquico a las hembras babuino? Un primer punto a señalar es que el rango social de dichas hembras no se correlaciona con ningún atributo físico perceptualmente discernible, como el tamaño o la edad (cf. Cheney y Seyfarth, 2007, p. 91). Luego, la detección del rango de otras hembras no ocurre como respuesta rígida a un estímulo perceptual específico. Antes bien, parece depender de la formación de categorías de relativa complejidad y abstracción, que se aplican de modo flexible en función de la integración de información diversa, mucha de la cual se ha adquirido a lo largo del tiempo y no resulta accesible perceptualmente en el momento (cf. Cheney y Seyfarth, 2013, p. 113). Con lo cual, las categorías sociales asociadas al rango de estos animales satisfacen, en buena medida, los requisitos de flexibilidad y distancia. A su vez, el que las hembras babuino representen el rango social de otros miembros del grupo de este modo versátil, incorporando múltiple información adquirida a lo largo del tiempo y actualizando adecuadamente su conocimiento en los raros casos en los que se modifican las relaciones jerárquicas pre-existentes, sugiere que no estamos ante una respuesta automática y ciega, sino ante una actividad clasificatoria que, como requiere Glock, se apoya en ciertos parámetros.

Por otra parte, estos animales se muestran capaces de reconocer las relaciones de jerarquía entre todas las hembras babuino de su grupo (Cheney y Seyfarth, 2013), pudiendo formar representaciones que, de modo tosco y vago, podemos expresar como A es superior a B, B es subordinado de C, etc. Ahora, si este es el caso, parece que pueden recombinar sus conceptos generales –como los de rango jerárquico— con conceptos de individuos particulares (Seyfarth y Cheney 2015 pp. 58-61 y Cheney y Seyfarth 2013, pp. 111-112), para formar contenidos proposicionales que representen distintos estados de cosas. A su vez, las hembras babuino pueden rastrear otras relaciones sociales, como las de alianza, parentesco, etc. Esto sugiere que sus capacidades combinatorias no sólo les permiten atribuir la misma propiedad a distintos individuos, sino también atribuir distintas propiedades al mismo individuo, como requieren Newen y Bartels (2007). Si esto último es el caso, parece que también pueden representar al mismo individuo particular bajo diferentes aspectos (A puede ser representado como subordinado a B, pariente de C, etc.,), satisfaciendo el requisito de aspectualidad. Finalmente, se desprende de lo dicho que los babuinos no contarían con representaciones aisladas del rango social de otros, sino con la capacidad de representar un conjunto de propiedades sociales, algunas de las cuales –como los pares “subordinado/dominante” – se encuentran vinculadas sistemáticamente entre sí, conformando una red semántica mínima.

Parece, pues, que hay razones robustas para pensar que las hembras babuino cuentan con conceptos relativos al rango social, en la medida en que satisfacen, en alguna variante, los diversos requerimientos propuestos por quienes consideran posible que los animales posean conceptos. Este no es, por otra parte, el único caso empírico relevante. Otros animales también muestran patrones conductuales que sugieren que también ellos satisfacen todos, o al menos algún subconjunto relevante, de los requisitos para considerar que dominan conceptos. Contamos con evidencia, por ejemplo, de que los perros que después de observar a un experimentador esconder un tipo de alimento en una caja encuentran en ella otro alimento diferente, reaccionan con sorpresa, oliendo por más tiempo dentro de la caja que quienes encuentran el mismo alimento (Brauer y Call 2011). Para los investigadores, esto indica que los perros son capaces de recordar qué alimento específico fue escondido en la caja y de formarse la expectativa de hallar precisamente ese alimento al buscar en ella. En otros estudios, los perros sujetos del experimento observaron cómo un bizcocho quedaba oculto tras una pantalla. Segundos después, la pantalla se elevaba para revelar, la mitad de las veces, un bizcocho idéntico al original y, la otra mitad, un bizcocho de otro tamaño o de otro color. Lo que se observó en este caso fue que los perros se quedaban mirando por más tiempo al bizcocho cuyo tamaño o color era diferente del original, algo que para los investigadores revela que ha tenido lugar un quiebre de sus expectativas previas (Pattison, Laude y Zentall 2013). Si examinamos estos estudios a la luz de los requerimientos para la posesión de conceptos que se han venido discutiendo, parece que también en los perros  hallamos una capacidad para formar distintas representaciones de ciertos objetos –como el bizcocho tras la pantalla o el alimento en la caja– y de varias propiedades de los mismos –como su localización espacial, su color o su tamaño—, que se recombinarían entre sí para formar representaciones complejas sobre estados de cosas (como, por ejemplo, que el bizcocho que está tras la pantalla es pequeño, que el bizcocho tras la pantalla es grande, etc.). A su vez, los estudios indican que los animales pueden seguir representando a los objetos en cuestión, y a sus propiedades, aun cuando ya no puedan observarlos. Todo esto sugiere, pienso, que estos animales satisfacen, en cierta medida al menos, los requisitos de recombinabilidad, holismo, aspectualidad y distancia de los estímulos perceptuales.  

Por razones de espacio, no parece posible ahondar aquí en el análisis de otros ejemplos empíricos relevantes. La evidencia presentada debería bastar, sin embargo, para darnos una primera comprensión inicial de qué está en juego cuando se defiende –o se critica— la tesis de que los animales no humanos pueden poseer conceptos y cómo algunas ideas filosóficas, presentes en este debate, pueden ser herramientas útiles para interpretar cierta evidencia empírica sobre los comportamientos y capacidades de otras especies.

Laura Danón
(Universidad Nacional de Córdoba, CONICET)

Referencias

  • Allen, C. y Hauser M. (1991): «Concept Attribution in Non-Human Animals: Theoretical and Methodological Problems in Ascribing Complex Mental Processes”, Philosophy of Science, 58 pp. 221-240.
  • Allen, C. (1999): “Animal Concepts Revisited: the use of Self-Monitoring as an Empirical Approach”, Erkenntnis, 51, pp. 537-544.
  • Andrews, K. (2015), The Animal Mind: An Introduction to the Philosophy of Animal Cognition, New York, Routledge.
  • Brandom, R. (1994): Making it Explicit: Reasoning, Representing and Discursive Commitment, Cambridge, Mass., Harvard University Press.
  • Bräuer, J. y Call, J. (2011): “The Magic Cup: Great Apes and Domestic dogs (Canis familiaris) Individuate Objects According to Their Properties”, Journal of Comparative Psychology, 125, pp. 353-361.
  • Camp. E. (2009): “Putting Concepts to Work: Concepts, Sistematicity, and Stimulus-Independence”, Philosophy and Phenomenological Research, 78, pp. 275-311.
  • Cheney, D. y Seyfarth, R. (2007): Baboon Metaphysics: The Evolution of a Social Mind, Chicago, University of Chicago Press.
  • Danón, L. (2016): “Opacidad referencial y atribución intencionales a animales sin lenguaje”, Principia, 20, pp. 143-164.
  • Davidson, D. (1982): “Rational Animals”, Dialectica, 36, pp. 317-327.
  • Davidson, D. (1997): “Seeing Through Language”, Truth, Language and History, New York, Oxford University Press.
  • Duhau, L. (2011): “Do Bees Really Have Concepts? A Discussion of Carruthers’ Criteria of Conceptuality”, Teorema, 29, pp. 125-134.
  • Glock, H-J. (2000): “Animals, Thoughts and Concepts”, Synthese, 123, pp. 35-64.
  • Glock, H-J. (2010): “Can Animals Judge?”, Dialectica, 64, pp. 11-33.
  • Glock, H-J. (2018), “Animal Rationality and Belief” en K. Andrews y J. Beck (eds.), The Routledge Handbook of Philosophy of Animal Minds, New York, Routledge, pp. 89-99.
  • Griffin, N. (2018): “Brandom and the Brutes”, Synthese, 195, pp. 5521-5547.
  • Kalpokas, D. (2018): “Percepción y mentes animales”, Revista de Filosofia, 43, pp. 201-221.
  • McDowell, J. (1994): Mind and World, Cambridge (Mass), Harvard University Press.
  • Monsó, S. (2019): “How to Tell if Animals Can Understand Death”, Erkenntnis, https://doi.org/10.1007/s10670-019-00187-2
  • Nelson, E. (2019): “What Frege asked Alex the Parrot: Inferentialism, Number Concepts and Animal Cognition”, Philosophical Psychology, 33, pp. 206-227.
  • Newen, A. y Bartels, A. (2007): “Animal Minds and the Possession of Concepts”, Philosophical Psychology, 20, pp. 283-308.
  • Pattison, K. F., Laude, J. R., & Zentall, T. R. (2013): “The case of the magic bones: Dogs’ memory of the physical properties of objects”, Learning and Motivation, 44, pp. 252–257.
  • Pepperberg, I. (1999): The Alex Studies: Cognitive and Communicative Abilities of Grey Parrots, Cambridge, Mass., Harvard University Press.
  • Seyfarth, R. y Cheney, D. (2015): “The Evolution of Concepts about Agents”, en E. Margolis y S. Laurence (eds.), The Conceptual Mind: New Directions in the Study of Concepts, Cambridge, Mass., The MIT Press
  • Vauclair, J. (2002): “Categorization and Conceptual Behavior in Nonhuman Primates”, en M. Bekoff, C. Allen y G.M. Burghardt (eds.), The Cognitive Animal: Empirical and Theoretical Perspectives in Animal Cognition, Cambridge, Mass., The MIT Press, pp. 239-245.
  • Seyfarth, R. y Cheney, D. (2013): “The Primate Mind before Tools, Language and Culture”, en G. Hatfield & H. Pittman, eds., Evolution of Mind, Brain and Culture, Philadelphia, University of Pennsylvania Press, pp. 105-122.
  • Shettleworth, S. (2010): Cognition, Evolution and Behavior, New York, Oxford University Press.

Lecturas recomendadas en castellano

  • García Rodríguez, A. (2023): El pensamiento de los animales: un modelo expresivo, Madrid, Cátedra.
  • Gómez, J.C. (2007): El desarrollo de la mente en los simios, los monos y los niños, Ediciones Morata.
  • Monsó, S. (2021): La zarigüella de Schrödinger: cómo viven y entienden la muerte los animales, Plaza y Valdés.

Entradas relacionadas

Cómo citar esta entrada

Danón, Laura (2021) “Conceptos en animales no humanos”,  Enciclopedia de la Sociedad Española de Filosofía Analítica (URL: http://www.sefaweb.es/conceptos-en-animales-no-humanos/).

 


Contexto

He aquí una obviedad: conocer el contexto es clave para interpretar correctamente las palabras de alguien. A menudo necesitamos algo de contexto, o más contexto, para entender lo que se quiso decir, o malinterpretamos las citas sacadas de contexto, etc. Por ejemplo, si oímos a alguien decir «Esa película es muy buena», necesitamos saber a qué película está refiriendo. La dependencia contextual hace que la noción de contexto ocupe un lugar central en el análisis del significado y la comunicación.

La cuestión a la que se enfrenta la filosofía del lenguaje es la siguiente: dados los fenómenos lingüísticos que nos interesa explicar, ¿cómo podemos representar de manera precisa el contexto? En la actualidad conviven dos nociones principales. La primera representa el contexto como una secuencia de elementos o parámetros. La segunda, por el contrario, identifica el contexto con la información compartida por los interlocutores.

1. El contexto como secuencia de elementos

La primera concepción surge dentro del proyecto de definir una semántica composicional para el lenguaje natural. Utilizando semántica formal y, en concreto, teoría de modelos, Montague fue pionero en el análisis formal del significado en los lenguajes naturales e introdujo una semántica intensional. En una teoría semántica intensional, el significado, o valor semántico, se define como una intensión, esto es, una función de mundos posibles a extensiones. En el caso de un enunciado completo, el valor semántico será una función de mundos posibles a valores de verdad. Por ejemplo, el valor semántico de «Platón es un filósofo» es una función de mundos posibles a valores de verdad; esta función es verdadera en los mundos posibles en que Platón es un filósofo. A su vez, el valor de verdad del enunciado es relativo al mundo posible en que se evalúe. En el mundo real, el enunciado es verdadero, pero hay mundos posibles en los que es falso. Este tipo de teoría puede generalizarse para analizar la sensibilidad contextual. La idea básica es la siguiente. Del mismo modo que el valor de verdad de cualquier enunciado es relativo al mundo posible en que se evalúe, el valor de verdad de los enunciados que contienen deícticos («yo», «aquí», «ahora», etc.) es relativo a una serie de elementos: quién es el hablante, cuál es el lugar de proferencia, cuál es el momento de proferencia, etc.  Así, una intensión puede definirse como una función de una secuencia de elementos a valores de verdad. Esta secuencia de elementos, denominada índice, incluye todo aquello de lo que depende el valor de verdad del enunciado. Si, por ejemplo, estamos analizando un lenguaje con pronombres temporales, el índice incluirá un tiempo además de un mundo posible. Lenguajes con más tipos de expresiones sensibles al contexto requerirán índices más complejos. Por ejemplo, podemos entender el significado de «Ayer fui al parque» como una función de secuencias de tiempos, hablantes y mundos posibles a valores de verdad. De este modo, el análisis de la sensibilidad contextual queda integrado dentro de la semántica del lenguaje natural. El contexto, denominado índice, es representado como una secuencia de elementos (Lewis, 1970).

A pesar de sus ventajas, Kaplan (1989a) y Stalnaker (1970) mostraron que una teoría semántica como la anterior no es del todo satisfactoria. Un análisis adecuado de la semántica de los deícticos requiere distinguir dos tipos de significado: el significado lingüístico o convencional, común a todos los usos de un mismo enunciado, y el contenido o proposición expresado en cada uso. Un enunciado que contenga algún deíctico expresará contenidos diferentes en contextos diferentes. Por otra parte, dos enunciados diferentes pueden expresar el mismo contenido. Stalnaker da el siguiente ejemplo. O’Leary pregunta «¿[Tú] vas a ir a la fiesta?» y Daniels responde «Sí, [yo] voy a ir». Parece que hay aquí un contenido común a la pregunta y la respuesta (que Daniels va a ir a la fiesta). Sin embargo, este contenido no aparece por ninguna parte en el análisis anterior. Una semántica como la descrita anteriormente cuenta con una noción de significado lingüístico, pero no con una noción adicional de contenido o proposición expresada. Debido a ello, no tiene los recursos necesarios para identificar el contenido común que, en el ejemplo anterior, expresan enunciados con significados lingüísticos diferentes, esto es, el hecho de que mediante los pronombres «tú» y «yo», o las desinencias verbales correspondientes, O’Leary y Daniels refieren a la misma persona. El problema es que es precisamente este contenido el que tiene interés desde el punto de vista comunicativo. Con su proferencia, Daniels está respondiendo una pregunta y transmitiendo la información de que él, Daniels, va a ir a la fiesta. En la medida en que una teoría semántica tiene como objetivo contribuir a una teoría más general de la comunicación, debe proporcionar un contenido como resultado, y no solo un valor de verdad.

Este tipo de consideraciones, junto con ciertos problemas derivados de la imposibilidad de representar el funcionamiento de los operadores temporales y otras expresiones con un único índice, llevaron a la semántica bidimensional o de doble índice. En este tipo de teorías, la determinación del valor de verdad procede en dos pasos: primero se determina un contenido y, una vez que se tiene un contenido, se determina un valor de verdad. El índice se desdobla y se recupera una noción más intuitiva de contexto según la cual este tiene que ver con la determinación de lo que se dice (algo que queda oscurecido en la maquinaria de las teorías previas). En su influyente teoría semántica para deícticos y demostrativos, Kaplan (1989a) distingue carácter y contenido. El carácter, que correspondería con el significado lingüístico, se concibe como una función de contextos a contenidos. El contenido es a su vez una función de circunstancias de evaluación a extensiones (para enunciados, a valores de verdad). Esta distinción permite capturar aquello que es común a las proferencias de O’Leary y Daniels: en el contexto descrito, el contenido que expresa O’Leary al decir «Tú vas a venir a la fiesta» es el mismo que el que expresa la proferencia de Daniels de «Yo voy a ir a la fiesta».

De este modo, en el marco kaplaniano, el índice se divide en contexto y circunstancia de evaluación. El rol del contexto consiste en resolver la sensibilidad contextual, determinando un referente para deícticos y demostrativos y, con ello, lo que se dice con el enunciado en una ocasión de uso, el contenido expresado. El contexto se concibe como un cuádruplo de agente, lugar, tiempo y mundo (Kaplan, 1989a). Estos elementos, que se corresponden con el hablante, lugar, tiempo y mundo de proferencia, son objetivos, y proporcionan los referentes de expresiones como «yo», «aquí», «ahora» y «realmente». Se trata, por decirlo de algún modo, de un conjunto de factores extraídos de la situación concreta en la que tiene lugar la proferencia. Para dar cuenta de los demostrativos, Kaplan (1989b) añade a cada contexto un oyente o una secuencia de oyentes (referentes de «tú») y un objeto o secuencia de objetos (referentes de otros demostrativos, como «esto»). La circunstancia de evaluación, por su parte, tiene como función la determinación del valor de verdad. Incluye un mundo y un tiempo: el mundo y el tiempo en el que se evalúa si el contenido expresado es verdadero o falso. La razón para incluir un tiempo además de un mundo es poder dar cuenta de enunciados con operadores temporales. Así, los elementos que antes encontrábamos agrupados en un único índice se hallan ahora repartidos entre el contexto (si su trabajo es determinar el contenido) y la circunstancia de evaluación (si su trabajo es determinar un valor de verdad).

Si bien el interés de Kaplan reside en los deícticos y demostrativos, un análisis más amplio de la sensibilidad contextual en los lenguajes naturales requeriría incluir parámetros adicionales. Como ejemplo, Lewis (1980) incluye los estándares de precisión como un elemento más del contexto para poder dar cuenta de la semántica de expresiones como «hexagonal». Por otra parte, algunos autores han señalado la necesidad de incluir las intenciones del hablante entre aquellos factores que determinan el referente de deícticos y demostrativos. Perry (2012) distingue deícticos automáticos y discrecionales. Los deícticos automáticos son expresiones como «yo» u «hoy», cuyo referente queda fijado por hechos contextuales objetivos (hablante, día de proferencia). Por el contrario, en el caso de los deícticos discrecionales, como «aquí» o «ella», así como con los demostrativos, el referente parece depender, al menos parcialmente, de las intenciones del hablante o incluso de consideraciones acerca de qué es relevante en la situación de uso. «Aquí» refiere a un lugar, pero cuál sea ese lugar no está determinado de manera automática. Surge así la cuestión de si los contextos kaplanianos deben incluir las intenciones del hablante como un parámetro más (Stokke, 2010; Bach, 2012) y, de modo más general, de si una noción de contexto objetiva como esta puede dar cuenta de todas las formas de dependencia contextual.

Por último, cabe señalar que en algunas ocasiones se identifica el contexto con la situación de habla, en lugar de con una secuencia de elementos extraídos de la misma (por ejemplo, en Lewis, 1980). En esta línea, la semántica situacional de Barwise y Perry utiliza la noción de situación para explicar ciertos fenómenos de dependencia contextual, como la restricción del dominio de cuantificación (Barwise y Perry, 1983).

2. El contexto como trasfondo común

A diferencia de Kaplan, Stalnaker concibe el contexto como un cuerpo de información que se presupone compartido entre los interlocutores, el trasfondo común (common ground) (Stalnaker, 1978, 2002, 2014). De este modo, Stalnaker pone el énfasis en la información que manejan los interlocutores en lugar de en los hechos objetivos de la situación concreta de habla. La razón tiene que ver con la práctica comunicativa. Para que la comunicación sea exitosa, no basta con que haya factores contextuales que determinen el contenido de los enunciados sensibles al contexto. Más bien, la información necesaria para interpretar una proferencia debe ser accesible para los intérpretes. Siguiendo esta idea, Stalnaker concibe el contexto como un conjunto de proposiciones que los interlocutores presuponen que todos ellos comparten. Este conjunto de proposiciones determina un conjunto de mundos posibles (los mundos posibles compatibles con ese conjunto de proposiciones), denominado conjunto del contexto.

La idea intuitiva que apoya esta noción de contexto es la siguiente. En una conversación, los interlocutores presuponen, o dan por hecho, ciertas cosas. Podemos modelar aquello que se presupone como proposiciones. Por ejemplo, la proposición de que la conversación tiene lugar en tal o cual ciudad, que tal persona ha dicho tal cosa, etc. Pero los interlocutores no solo presuponen ciertas cosas, sino que además presuponen que los demás interlocutores presuponen esas mismas cosas. En este sentido, la actitud de presuponer una proposición es una actitud social. Si todo va bien y el contexto no es defectuoso, las proposiciones que cada interlocutor presupone coincidirán con las que presuponen los demás.

El trasfondo común puede definirse a partir de las actitudes proposicionales de los participantes en la conversación. Stalnaker (2002) identifica las presuposiciones del hablante con aquellas proposiciones que el hablante cree que son creencias comunes o mutuas y toma como base para el trasfondo común la noción de creencia común. En concreto, el trasfondo común está formado por las proposiciones que son creencias comunes para los interlocutores, esto es, las creencias que comparten y que reconocen que comparten. Al igual que el de presuposición, el concepto de creencia común tiene una estructura iterativa: una proposición p es una creencia común para un grupo si y solo si todos creen p, y todos creen que todos creen p, etc.

De acuerdo con Stalnaker, el contexto desempeña dos funciones que dan lugar a una interacción dinámica. Por un lado, guía la interpretación de las proferencias que tienen lugar durante la conversación. Dado que quién es el hablante, cuál es el lugar de proferencia, etc. suelen ser parte del trasfondo común, este puede contener la información necesaria para interpretar las expresiones sensibles al contexto. La información del contexto kaplaniano queda así integrada en esta segunda noción de contexto. Aún más, dado que el referente de los deícticos discrecionales y los demostrativos no parece quedar fijado únicamente por hechos objetivos, sino que depende de las intenciones del hablante o de qué es relevante, la noción de trasfondo común puede resultar más adecuada que la kaplaniana. Qué objetos o individuos son relevantes en un momento dado de la conversación puede ser parte de la información compartida por los interlocutores. Por otro lado, la proferencia misma afecta al contexto. Stalnaker considera el caso de la aseveración. Si todo va bien, lo que se dice mediante una aseveración pasa a formar parte del trasfondo común. El efecto de la aseveración es una reducción del conjunto del contexto: los mundos posibles incompatibles con lo que se ha dicho son eliminados (Stalnaker, 1978). Dentro de esta dinámica puede entenderse la conversación como una investigación en la que progresivamente se van reduciendo las alternativas hasta llegar a descubrir cómo es el mundo real.

Una aproximación similar a la dinámica conversacional puede hallarse en Lewis (1979). Estableciendo una analogía con un partido de baseball, Lewis concibe el contexto como un marcador conversacional. Hay una doble influencia entre el marcador y lo que ocurre en la conversación: el marcador refleja qué ha ocurrido en la conversación y, a su vez, influye en cómo se interpretan las nuevas proferencias y en qué proferencias  son correctas o aceptables.

3. Otras formas de dependencia contextual

Además de los deícticos y los demostrativos, otras muchas expresiones han sido consideradas sensibles al contexto: términos relacionales como «lejano», adjetivos que admiten gradación como «alto», predicados de gusto como «es divertido», cuantificadores como «todos», etc. Yendo un paso más allá, autores como Perry (1986) han defendido la existencia de constituyentes inarticulados, esto es, elementos que no aparecen de forma explícita en el enunciado pero que son necesarios para que exprese un contenido completo. Por ejemplo, el enunciado «Llueve» no contiene de manera explícita una referencia a un lugar. No obstante, para poder evaluar una proferencia de este enunciado como verdadera o falsa necesitaríamos determinar a qué lugar hace referencia. Así, el contenido de ese enunciado depende del contexto.

Tomando como guía el proceso interpretativo, Perry distingue cuatro niveles en los que recurrimos al contexto (Perry, 2012). En primer lugar, para interpretar una proferencia es necesario identificar el enunciado proferido: qué idioma se ha usado, cuál es la estructura sintáctica y cómo se resuelven las posibles ambigüedades léxicas y gramaticales. Se trata de un uso presemántico del contexto. El segundo paso es identificar el contenido de la proferencia. En caso de que haya expresiones sensibles al contexto (deícticos, demostrativos, adjetivos que admiten gradación, etc.) será necesario determinar cuál es su referente. Aquí podemos hablar de contexto semántico. En tercer lugar, cuando determinamos los constituyentes inarticulados hacemos un uso postsemántico del contexto. Perry denomina a este uso complementador de contenido. Finalmente, para interpretar qué intenta el hablante hacer con su proferencia, qué quiere transmitir más allá del significado convencional de sus palabras, hacemos un uso pragmático del contexto.

Generalizando aún más la dependencia contextual del lenguaje, contextualistas como Recanati (2004) sostienen que el significado de cualquier enunciado puede ser modulado, esto es, ajustado al contexto de uso. Así, «rojo» puede, en según qué contexto, significar «superficialmente rojo», «rojo en el interior», «con tinta roja», etc., dependiendo, entre otras cosas, de si estamos hablando de una manaza o un bolígrafo. De acuerdo con este enfoque, el contenido expresado por una proferencia depende del contexto de uso no solo en caso de que dicho enunciado contenga algún deíctico o demostrativo, sino de forma general. Esta forma generalizada de dependencia contextual hace difícil mantener una distinción estricta entre los usos semánticos y los usos postsemánticos del contexto.

En este punto puede ser interesante distinguir la función metafísica del contexto de su función epistémica. Como señala Bach (2005, 2012), el contexto puede desempeñar dos funciones: puede determinar en sentido metafísico el contenido, es decir, la proposición expresada por un enunciado en una ocasión de uso, sus condiciones de verdad, o puede proporcionar indicios o pistas para que el intérprete infiera o conjeture qué es lo que el hablante quiere decir, esto es, para averiguar el significado del hablante. Bach denomina contexto estrecho al contexto que tiene una función metafísica y contexto amplio al que tiene una función epistémica. De acuerdo con Bach, los fenómenos a los que alude Recanati no tienen que ver con la determinación del contenido de la proferencia en un sentido metafísico sino con averiguar qué es aquello que el hablante quiere decir. En este sentido, el contexto no determinaría (en sentido metafísico) el contenido de la proferencia, sino que englobaría aquella información y aquellas pistas a las que recurrimos para averiguar el significado del hablante. No obstante, la distinción entre función metafísica y función epistémica no está exenta de críticas (Recanati, 2013).

Claudia Picazo Jaque
(Universidad de Granada)

Referencias

  • Bach, K. (2005): “Context ex Machina” en Szabó Gendler, Z. ed., Semantics versus Pragmatics, Oxford, Clarendon Press, pp. 15-44.
  • — (2012): “Context Dependence” en García-Carpintero, M. y M. Kölbel, eds., The Continuum Companion to the Philosophy of Language, Continuum International.
  • Barwise, J. y J. Perry (1983): Situations and Attitudes, MIT Press.
  • Kaplan, D. (1989a): “Demonstratives” en Almog, J., J. Perry y H. Wettstein, eds., Themes From Kaplan, Oxford University Press, Oxford, pp. 481-563.
  • — (1989b): “Afterthoughts” en Almog, J., J. Perry y H. Wettstein, eds., Themes From Kaplan, Oxford University Press, Oxford, pp. 481-563.
  • Lewis, D. (1970): “General semantics”, Synthese, 22(1-2), pp.18-67.
  • — (1980): “Index, context, and content” en Kanger, S. y S. Öhman, eds., Philosophy and Grammar, Reidel, pp. 79-100.
  • Perry, J. (1986): “Thought without representation”, Proceedings of the Aristotelian Society, 60(1), pp. 137-151.
  • — (2012): Reference and Reflexivity, Stanford, CSLI Publications. 2ª ed., [ Perry, J. (2006): Referencialismo crítico. La teoría reflexivo-referencial del significado, trad. por Kepa Korta, Rodrigo Agerri, CSLI Publications].
  • Recanati, F. (2004): Literal Meaning, Cambridge University Press, Cambridge. [Recanati, F. (2006): El significado literal, trad. por. François Récanati, Madrid, Antonio Machado Libros].
  • — (2013): Reply to Devitt. Teorema: International Journal of Philosophy 32(2), pp. 103-107.
  • Stalnaker, R. (1970): “Pragmatics”, Synthese 22(1-2), pp. 272-289.
  • — (1978): “Assertion”, Syntax and Semantics, 9, pp. 315-332.
  • — (2002): “Common ground”, Linguistics and Philosophy 25(5-6), pp. 701-721.
  • — (2014): Context, Oxford, Oxford University Press.
  • Stokke, S. (2010): “Intention-sensitive semantics”, Synthese 175(3), pp. 383-404.
Cómo citar esta entrada

Picazo, Claudia (2020) “Contexto”, Enciclopedia de la Sociedad Española de Filosofía Analítica (URL: http://www.sefaweb.es/contexto/).

 

Conceptos fenoménicos

Llamamos “conocimiento fenoménico” al conocimiento de nuestras experiencias conscientes: al saber cómo es tener una determinada experiencia. Los conceptos fenoménicos son aquellos asociados a este conocimiento y refieren, de modo introspectivo y directo, a las propiedades fenoménicas de nuestras experiencias. El papel que juegan estos conceptos es esencial en la filosofía de la mente contemporánea en la medida que muchos de sus defensores creen que una explicación adecuada de su naturaleza nos permitirá disipar un sinfín de rompecabezas epistemológicos (sobre la relación de los individuos con sus estados fenoménicos) y metafísicos (que giran en torno a la naturaleza de la consciencia). Estos problemas son dos caras de la misma moneda y una respuesta a uno conlleva, necesariamente, implicaciones para el otro.

Mi objetivo en este artículo es ofrecer una introducción al papel que desempeñan los conceptos fenoménicos en el debate metafísico en torno a la naturaleza de la consciencia. En especial, esta exposición se centra en la Estrategia de los Conceptos Fenoménicos, una de las respuestas fisicistas a los argumentos dualistas cuya conclusión es que no es posible acomodar una explicación de la consciencia en un marco fisicista. Para ello, en §1 describo la tesis central del fisicismo y presento uno de los más célebres argumentos en su contra: el argumento del conocimiento. Enseguida, en §2 expongo qué son los conceptos fenoménicos y en qué difieren de otro tipo de conceptos, en §3 explico el modus operandi de la Estrategia de los Conceptos Fenoménicos en respuesta a los retos dualistas señalados en §1, y en §4 menciono algunas de las objeciones más frecuentes en contra de esta estrategia. Finalmente, en §5 hago una síntesis de los puntos esenciales discutidos en este artículo.

1. El fisicismo y el argumento del conocimiento

El fisicismo es la tesis según la cual la ontología básica del mundo es física. De ello se sigue que no hay verdades sobre la consciencia más allá de las verdades de la física. De acuerdo con el fisicismo, nuestros estados mentales conscientes no son nada más que estados o procesos físicos o funcionales: mi creencia de que está lloviendo afuera ahora mismo, el dolor de muelas que sufrí anoche y el miedo que he tenido esta mañana al ver un perro callejero corriendo agresivamente hacia mí no son nada más que procesos ocurriendo en mi cerebro. 

A pesar de la aparente sencillez de la definición que acabo de presentar, es importante dejar claro que el fisicismo es una tesis compleja que está lejos de agotarse en una sola formulación. De hecho, algunas de las formulaciones del fisicismo se basan en nociones muy distintas entre sí, como la realización (los estados mentales son realizados por los estados físicos [Putnam 1975]), la sobreveniencia (los estados mentales son sobrevenientes sobre los estados físicos [Davidson, 1970]), la emergencia (los estados mentales emergen de los estados físicos [Searle, 1984, 1992, 1997]) o incluso, en una versión más extrema y quizás más problemática, la noción de identidad (los estados mentales son idénticos a los estados físicos [Smart, 1959; Place, 1956]). Teniendo en cuenta que, debido a limitaciones de espacio, en este artículo no podré dar cuenta de las diferencias entre cada una de estas formulaciones, tomaré la tesis da la identidad como ejemplo. Asumiré, por tanto, que los estados mentales son idénticos a los estados físicos, aunque el argumento que expongo en §3 deberá aplicarse a cualquier formulación de la tesis fisicista.

A simple vista, el fisicismo contradice nuestras intuiciones preteóricas con respecto a nuestra vida mental. ¿Cómo puede la riqueza de nuestras experiencias más íntimas no ser nada más que procesos físicos ocurriendo en nuestros cerebros? Esta es la pregunta que subyace al problema difícil de la consciencia [the hard problem of consciousness (Chalmers, 1996)]—el problema mente-cuerpo—que sigue protagonizando, a día de hoy, innúmeros debates entre fisicistas y dualistas. Si bien las intuiciones per se no equivalen a argumentos, una teoría que defiende la identidad entre los estados mentales y los estados físicos debe explicar por qué motivo nuestro sentido común respalda la intuición contraria. 

Ahora bien, el problema mente-cuerpo no se apoya únicamente en intuiciones. Se han propuesto diversos argumentos epistémicos y modales a fin de demostrar que los estados mentales no son idénticos a los estados físicos y, por ende, que el fisicismo es o bien incoherente, o bien falso. Por una parte, se dice de los primeros que son epistémicos porque establecen un hiato epistemológico—no se puede deducir a priori, de los conceptos y el conocimiento físicos, los conceptos y el conocimiento fenoménicos—y de ahí infieren que ese hiato epistemológico representa un hiato metafísico: los estados fenoménicos no son idénticos a los estados físicos. El último paso de este conjunto de argumentos es inferir, del hiato metafísico, la falsedad del fisicismo (p.ej., Jackson, 1982, 1986; Levine, 1983). Por otra parte, se dice del otro grupo de argumentos contra el fisicismo que es modal porque mantiene que ninguna cantidad de información física sobre cualquier individuo implica lógicamente que ese individuo tenga consciencia. Quienes argumentan así sostienen que hay un mundo posible con individuos físicamente o funcionalmente idénticos a nosotros, pero que difieren profundamente de nosotros en que no tienen vida mental consciente. En consecuencia, asumiendo que todo lo que es concebible es metafísicamente posible, argumentan que si estos individuos son idénticos a nosotros en todos sus aspectos físicos o funcionales y aún así nosotros tenemos algo adicional que ellos no tienen—vida mental consciente—, entonces el fisicismo es falso (p.ej., Chalmers, 1996; Kripke, 1980).

Veamos un célebre argumento del primer grupo—el argumento del conocimiento (Jackson, 1982, 1986)—que nos ayudará a comprender más fácilmente el papel de los conceptos fenoménicos en el debate en torno al problema mente-cuerpo. 

El argumento del conocimiento: Mary está confinada en una habitación blanca y negra desde su nacimiento. Dentro de esa habitación, educan a Mary mediante libros y una pantalla, ambos en blanco y negro, y aprende todo lo que hay que saber sobre la naturaleza física del mundo: conoce todos los hechos físicos sobre los humanos y sobre su entorno, y adquiere un conocimiento exhaustivo sobre la neurofisiología de la visión, en especial de la visión cromática. ¿Qué sucede cuándo Mary sale de su habitación y ve por primera vez los colores? ¿Adquiere algún conocimiento nuevo? Si el fisicismo es verdadero, la respuesta ha de ser negativa, puesto que Mary poseía un conocimiento físico exhaustivo antes de ser liberada; creer lo contrario equivale a suponer que hay más por conocer a parte de todos los hechos físicos. Esto es justamente lo que afirman los defensores del argumento del conocimiento. Según su punto de vista, al ver por primera vez los colores Mary adquiere conocimiento de nuevos hechos. Ergo, bajo esta interpretación, el fisicismo es falso.

Uno de los argumentos aducidos por el fisicismo en respuesta al argumento del conocimiento y a otros argumentos que apuntan hacia la misma conclusión busca mostrar que sus defensores no tienen en cuenta la importante distinción entre, por una parte, los conceptos fenoménicos y, por otra, los conceptos físicos. Esta respuesta fisicista ha sido denominada Estrategia de los Conceptos Fenoménicos (de ahora en adelante, ECF). Antes de explicar cómo opera esta estrategia, es imprescindible primero saber qué es un concepto fenoménico y en qué sentido se supone que difiere de otro tipo de conceptos. El apartado siguiente se ocupa de la respuesta a estas dos preguntas.

2. ¿Qué son los conceptos fenoménicos?

Los conceptos fenoménicos son aquellos conceptos que usamos en primera persona, de modo introspectivo y directo, cuando—aunque no solamente cuando—atendemos a nuestros qualia, es decir, las cualidades o propiedades fenoménicas de nuestras experiencias. Se supone, además, que están estrechamente asociados al conocimiento fenoménico que poseemos de ellos, es decir, el tipo de conocimiento que nos permite saber cómo es tener una determinada experiencia. Al haber tenido anoche, por primera vez, un terrible dolor de muelas adquirí no solo el concepto fenoménico DOLOR que refiere directamente a la propiedad de mi experiencia—en este caso, el dolor—, sino que también adquirí conocimiento fenoménico de ese tipo de experiencia: el dolor. (Usaré MAYÚSCULAS para nombrar conceptos y negrita para referirme a las propiedades de la experiencia; en los casos en los que no uso ninguna notación en particular, estoy simplemente empleando palabras que expresan o bien conceptos, o bien experiencias o sus propiedades.)

Pensar en el carácter fenoménico de nuestras experiencias de modo introspectivo y directo es muy distinto a pensar en el mismo fenómeno, digamos, en términos de procesos cerebrales. Pongamos por caso que un neurofisiólogo, pese a sufrir de una enfermedad que le incapacita para sentir dolor, llega a descubrir, tan solo en virtud de sus conocimientos teóricos y de mi conducta, que sufro un dolor punzante en la muela del juicio. El neurofisiólogo será capaz de decirme, “Tú sufres un dolor punzante en tu muela del juicio”, por lo que podría decirse que posee el concepto asociado a experiencias de dolor. Sin embargo, su concepto sería más bien un concepto teórico o físico y no un concepto fenoménico (llamémosle Dolor[FÍSICO] a este concepto), mientras que el concepto que yo poseo de mi experiencia es un concepto fenoménico (llamémosle Dolor[FENOMÉNICO]).  En resumen, el neurofisiólogo y yo tenemos cada uno un concepto diferente, Dolor[FÍSICO] y Dolor[FENOMÉNICO], que refieren al dolor de mi experiencia. Ambos conceptos son, por tanto, correferenciales.

Al involucrar esta relación directa con nuestros estados fenoménicos, se supone que los conceptos fenoménicos pueden explicar el conocimiento íntimo y privilegiado de un individuo sobre sus propios estados fenoménicos. En última instancia, este es uno de los rasgos que los distingue de los conceptos físicos como SILLÓN o SATURNO. El concepto fenoménico ROJO, por ejemplo, no es el concepto que usamos para referir a objetos rojos, ni tampoco es el concepto perceptivo que adquirimos al observar objetos de este color. Más bien, es el concepto que refiere al carácter específico de la experiencia de la rojez, es decir, al quale de una clase de experiencias que, en condiciones óptimas, resultan de la exposición al color rojo. De hecho, muchos filósofos—incluso dualistas—han recurrido a estos conceptos a fin de explicar algunos rompecabezas epistemológicos en torno a la relación de los individuos con su vida mental, tales como (i) el contacto directo que estos tienen con sus estados fenoménicos (al aplicar un concepto fenoménico se supone que el individuo está en contacto directo con sus estados fenoménicos, así que una caracterización adecuada de la naturaleza de estos conceptos debe explicar en qué consiste esta relación epistémica especial entre los individuos y sus qualia); (ii) la asimetría epistémica (la presunción según la cual cada individuo tiene un acceso privilegiado, en primera persona, a su vida mental que no es accesible desde una perspectiva de tercera persona); (iii) y la infalibilidad/ incorregibilidad de ciertos juicios de un individuo sobre sus propios estados fenoménicos (por ejemplo, el juicio que uno expresaría naturalmente diciendo “Estoy teniendo este tipo de experiencia ahora mismo”). Por cuestiones de espacio, en este artículo no voy a analizar los méritos de estas explicaciones (para un examen de estos puntos, véase p.ej., Balog, 2009, 2012b). Mi objetivo aquí se enfoca en la otra cara del debate, aquella que se centra en la función de los conceptos fenoménicos en las discusiones acerca del estatus metafísico de la consciencia.

En las últimas décadas se han formulado diferentes caracterizaciones de la naturaleza de los conceptos fenoménicos que buscan responder a variadas cuestiones, entre ellas: ¿Cómo refieren los conceptos fenoménicos? ¿Cuáles son sus condiciones de adquisición/posesión? ¿Qué es lo que distingue los conceptos fenoménicos de los conceptos físicos? De modo esquemático, podemos dividirlas en dos grupos. Tenemos pues, por una parte, las que consideran el hecho de que los conceptos fenoménicos refieren directamente a los estados fenoménicos como el rasgo peculiar que permite distinguirlos de otro tipo de conceptos y, por otra, las que defienden que los conceptos fenoménicos son, al menos en parte, constituidos por un caso particular del tipo de experiencia a la que refieren, tomando así la idea de constitucióncomo su rasgo especial. Del primer grupo forman parte, por ejemplo, las caracterizaciones de conceptos fenoménicos como conceptos de reconocimiento o conceptos deícticos y, del segundo grupo, las caracterizaciones de conceptos fenoménicos como conceptos citacionales o conceptos que, al menos en parte, están constituidos por la experiencia a la que refieren.

A continuación, expondré algunas de las caracterizaciones de conceptos fenoménicos que han recibido más atención en la literatura filosófica.

Conceptos de reconocimiento: son conceptos demostrativos-tipo que tienen la forma <X ES UNA EXPERIENCIA DE ESE TIPO> donde X es una experiencia actual y ese expresa un concepto fenoménico que refiere a una propiedad fenoménica de la que X es caso particular. Según esta caracterización, la referencia de los conceptos fenoménicos está determinada por las habilidades de los individuos de reconocer una experiencia como perteneciendo a un determinado tipo sin recurrir a información o conocimiento teórico. Loar (1990/1997), Carruthers (2004) y Levin (2007) han sugerido versiones de esta caracterización. 

Conceptos deícticos: son conceptos análogos a los conceptos como ESTO, AQUÍ y AHORA. Bajo esta caracterización, el uso de los conceptos fenoménicos es similar a un gesto ostensivo interno y tienen la forma <ESTE TIPO DE EXPERIENCIA>, lo cual involucra una conexión a priori con el concepto de primera persona: al expresar que estoy teniendo <ESTA EXPERIENCIA>, sé a priori que estoy teniendo esta experiencia. Algunos defensores de los conceptos fenoménicos como conceptos deícticos son, por ejemplo, Ismael (1999), O’Dea (2002), Perry (2001) y Shröer (2010).

Conceptos constitucionales/citacionales: son conceptos constituidos, al menos en parte, por un caso particular del tipo de experiencia a la que refieren. Según esta caracterización, el concepto fenoménico DOLOR refiere a un tipode experiencia—la experiencia de dolor—y es en parte constituido por un caso particular de ese tipo de experiencia. Papineau (2002, 2007), Block (2007), Balog (2012a,b) han formulado versiones diferentes de esta caracterización. Del mismo modo, algunos dualistas, entre ellos Chalmers (2003) y Fürst (2014), también han defendido que los conceptos fenoménicos son en parte constituidos por la experiencia a la que refieren.

Otras caracterizaciones: A parte de las caracterizaciones mencionadas, algunos filósofos han defendido que los conceptos fenoménicos son conceptos condicionales, es decir, que refieren a estados no-físicos si estos estados existen y, si no existen, refieren a estados físicos (p.ej., Hawthorne, 2002; Braddon-Mitchell, 2003). A su vez, otros han argumentado que lo que distingue los conceptos fenoménicos de los conceptos físicos son las condiciones que justifican su aplicación (p.ej., Hill, 1997; Hill & McLaughlin, 1997). Una alternativa diferente inspirada en el enfoque teórico-informacional de Dretske y que relaciona los conceptos fenoménicos con los conceptos sensoriales ha sido también desarrollada por Aydede & Güzeldere (2005).

Cada una de las caracterizaciones anteriores responde de manera distinta a las cuestiones sobre cómo refieren estos conceptos, cómo explican la relación epistémica de un individuo con sus estados fenoménicos y por qué motivo las conclusiones ontológicas de los argumentos dualistas no son correctas. No obstante, dejando de lado las pequeñas diferencias, podemos aislar dos rasgos de los conceptos fenoménicos compartidos por la gran mayoría de estas caracterizaciones:

  • Dependencia de la experiencia: se supone que los conceptos fenoménicos son perspectivistas, es decir, que requieren la perspectiva del individuo sobre el carácter fenoménico de sus propias experiencias. Esto implica que para poseer un concepto fenoménico P el individuo necesita haber tenido la experiencia relevante para P. Puesto que los conceptos físicos no ofrecen la perspectiva de primera persona sobre las propiedades de la experiencia, su posesión no permite explicar cómo es para un individuo tener una determinada experiencia.
  • Aislamiento conceptual: se piensa que los conceptos fenoménicos están conceptualmente aislados de los conceptos físicos, así que no es posible inferirlos a priori a partir de los últimos. Esto significa que no debemos esperar una explicación de la consciencia fenoménica a partir de información proveniente de la física, por muy exhaustiva que sea.

La ECF se apoya en estos dos rasgos para responder a los retos dualistas mencionados en el apartado anterior. A continuación, veremos en qué consiste esta estrategia, cómo responde a estos argumentos y sus ventajas frente a otras estrategias fisicistas. En §4 mencionaré algunas de las objeciones más frecuentes a la ECF.


3. La estrategia de los conceptos fenoménicos

La ECF consiste en un intento teórico que recurre a la diferente naturaleza de los conceptos fenoménicos y físicos a fin de argumentar que la existencia del hiato epistémico señalado por muchos filósofos es consistente con la verdad del fisicismo. Usando las palabras de Sundström (2011), se trata de una estrategia defensiva, puesto que opera bajo la convicción de que tenemos buenas razones para aceptar el fisicismo buscando rebatir los argumentos que lo rechazan. Su objetivo no es proveer una defensa del fisicismo por encima de otras tesis metafísicas, sino más bien demostrar que hay una explicación de la consciencia fenoménica compatible con el fisicismo.

Muchos filósofos, entre ellos Nagel (1974) y Jackson (1982, 1986), han reconocido la importancia de los conceptos fenoménicos para el debate en torno al problema mente-cuerpo. Sin embargo, el primer intento de formular una explicación de estos conceptos y usarla como respuesta a los argumentos dualistas se debe a Loar, quien en el artículo “Phenomenal States” (1990, 1997) sugiere que el problema mente-cuerpo no tiene necesariamente repercusiones metafísicas, pudiendo ser entendido como una consecuencia de nuestra forma especial de concebir, en primera persona, nuestros estados conscientes: un mismo estado mental puede ser concebido de modo físico, empleando conceptos físicos, y de modo fenoménico, empleando conceptos fenoménicos. A juicio de Loar, esta diferencia conceptual no representa un cambio en la referencia de ambos conceptos, sino dos formas distintas de concebir una misma entidad. La idea central de la ECF es justamente la de que aceptar un dualismo conceptual no involucra rechazar un monismo ontológico. En definitiva, el filósofo dualista falla en su análisis al no tener en cuenta la diferente naturaleza de estos dos tipos deconceptos, de ahí que sus argumentos no conllevan necesariamente un rechazo del fisicismo.

Teniendo en cuenta el dualismo conceptual que está en la base de la ECF y los dos rasgos de los conceptos fenoménicos mencionados anteriormente—la dependencia de la experiencia y el aislamiento conceptual—, veamos en qué consiste la respuesta fisicista al argumento del conocimiento aludido en §1.

En su respuesta al argumento del conocimiento, el defensor de la ECF mantiene que Mary experimenta un progreso epistémico al ver por primera el color rojo, puesto que este conocimiento no podría ser derivado a priori del conocimiento físico exhaustivo que poseía dentro de su habitación blanca y negra. Este conocimiento fenoménico que adquiere nada más salir de la habitación y que le permite saber cómo es ver rojo requiere una perspectiva singular del propio individuo sobre la rojez de la experiencia, por lo que solo es posible adquirirlo a posteriori, es decir, tras haber tenido la experiencia de la rojez. No obstante, según el fisicista, Mary no adquiere conocimiento de nuevos hechos o entidades al ver por primera vez rojo; más bien, adquiere un nuevo concepto—el concepto fenoménico Rojo­—que le permite tener nuevos pensamientos sobre los mismos hechos en los cuales pensaba dentro de su habitación empleando únicamente conceptos físicos. Asimismo, la situación post-liberación de Mary es la de quien posee dos conceptos que refieren a una mismaentidad. Esto, argumentan los defensores de la ECF, es compatible con el fisicismo.

Ahora bien, en el primer párrafo he dicho que la ECF es una estrategia defensiva por contraste con otras estrategias fisicistas. Diré un poco más sobre esto, dado que nos ayudará a ver su atractivo frente a otras estrategias análogas.

La ECF es defendida por un grupo de filósofos llamados fisicistas a posteriori o de tipo-B, usando la expresión de Chalmers (1996). Estos están de acuerdo con el dualista al mantener que los enunciados de identidad psicofísica, como “dolor = estado cerebral p”, son excepcionales en contraste con los enunciados de identidad teórica, como “agua = H2O”, porque involucran conceptos de tipo diferente: conceptos fenoménicos y conceptos físicos. Debido a esta diferencia conceptual resulta que no se puede conocer a priori, a través del análisis conceptual de los conceptos involucrados, los enunciados psicofísicos, al contrario de lo que sucede con los enunciados físicos. Con esto se quiere decir que el conocimiento de los enunciados psicofísicos depende de investigaciones empíricas (p.ej., Papineau, 2002, 2007; Block, 2007; Loar, 1990,1997; Balog, 2012a,b). Es más, al igual que los dualistas, estos fisicistas se oponen al llamado fisicismo a priori o de tipo-A que niega el carácter excepcional de los enunciados de identidad psicofísica (p.ej., Dennett, 1991; Jackson, 1995, 1998; Dretske, 1995; Lewis, 1990). Según este fisicismo no-excepcionalista, no hay nada de especial en los enunciados psicofísicos que nos impida conocerlos a priori. Al contrario del fisicista a posteriori, el fisicista a prioriadopta una estrategia deflacionaria al responder a los argumentos dualistas, puesto que no recurre a conceptos fenoménicos. En su respuesta al argumento del conocimiento, el fisicista a priori mantiene que al ser liberada de la habitación blanca y negra Mary no adquiere nuevo conocimiento proposicional—es decir, no adquiere nuevos conceptos—, sino solamente nuevas habilidades (p.ej., Lewis, 1983, 1988; Nemirow, 1980, 1990, 2007).

A estas dos estrategias podemos añadir otra defendida por un grupo de filósofos comúnmente llamados “misteriosistas” [mysterians] (p.ej., McGinn, 1989). Estos comparten la intuición de que los enunciados psicofísicos son excepcionales en contraste con los enunciados físicos, pero sostienen que, debido a nuestras limitaciones cognitivas, nuestros conceptos y teorías actuales fallan en captar adecuadamente esta excepcionalidad. Esta limitación cognitiva es lo que, en última instancia, explica el carácter elusivo de la consciencia.

Podemos ver que los fisicistas a posteriori y los misteriosistas hacen hincapié en la excepcionalidad de los enunciados de identidad psicofísica también compartido por los dualistas. La diferencia entre ambos estriba en que mientras el misteriosistas cree que hay una teoría capaz de explicar la necesidad y la transparencia de las identidades psicofísicas, como “dolor = estado cerebral p”, de modo similar a las identidades teóricas, como “agua = H2O”—aunque mantiene que nuestras capacidades cognitivas son demasiado limitadas para que podamos llegar a conocerla—, el fisicista a posteriori rechaza tajantemente la creencia en una presunta teoría que explique la identidad de enunciados del primer tipo. En cambio, apoyándose en la naturaleza distinta de los conceptos físicos y fenoménicos que hemos visto arriba, el argumento del fisicista a posteriori es que no debemos esperar encontrar una teoría que explique a priori enunciados de identidad psicofísica del mismo modo que encontramos una teoría que explica a priori enunciados de identidad teórica, justamente porque los enunciados del primer tipo, al contrario de los enunciados teóricos, involucran conceptos de naturaleza muy distinta. Es esa naturaleza distinta que impide que se pueda inferir, a partir de los conceptos físicos, los conceptos fenoménicos.

A mi juicio, la ECF es más atractiva que las demás estrategias fisicistas por los siguientes motivos. Por una parte, respeta nuestras intuiciones preteóricas de que la riqueza de nuestra fenomenología no se captura con una explicación exhaustiva del funcionamiento del cerebro. Por consiguiente, esta estrategia elude las criticas frecuentes al fisicismo a priori de que no toma en serio el problema difícil de la consciencia e intenta eliminar el problema en lugar de explicarlo. Por otra parte, al sugerir que podemos explicar por qué motivo hay un problema difícil de la consciencia recurriendo a la diferente naturaleza de los conceptos involucrados en los enunciados de identidad psicofísica, esta estrategia elude igualmente las objeciones usuales al misteriosismo que sostienen que la complejidad del problema difícil de la consciencia no implica que este sea intratable a causa de nuestras limitaciones cognitivas. Es más, es conveniente recordar que la motivación de la ECF no es argumentar en favor de una metafísica fisicista por encima de otras tesis metafísicas. Más bien, lo que sus defensores buscan es demostrar que los estados fenoménicos pueden ser idénticos a los estados físicos, aunque su conexión no se pueda conocer a priori y, por ende, que una explicación de la consciencia es compatiblecon el fisicismo. Al alcanzar esta explicación, el fisicista habrá hecho todo lo que tenía que hacer para defender el fisicismo.

No todos los filósofos se han dejado convencer del éxito de la ECF. En los últimos años, la ECF ha enfrentado duras objeciones provenientes tanto de fisicistas como de dualistas. Antes de terminar este artículo, mencionaré en el siguiente apartado algunas de las más importantes.

4. Críticas a la estrategia de los conceptos fenoménicos

4.1.  Dependencia de la experiencia y aislamiento conceptual

Pongamos por caso que, a causa de la radiación cósmica, una réplica molecularmente idéntica a mí misma surge ahora mismo de la nada y es inmediatamente aprisionada en una habitación blanca y negra sin acceso a experiencias de color. ¿Posee mi réplica el concepto fenoménico ROJO? Aunque mi réplica nunca ha tenido tales experiencias, nuestra intuición parece decirnos que posee el concepto fenoménico ROJO puesto que yo poseía ese mismo concepto en el exacto momento en que ella súbitamente surgió a partir de mi. 

Dennett (2007) formuló un experimento mental parecido a fin de argumentar que, si nuestra intuición no falla, tendremos que aceptar la conclusión de que es posible para un individuo llegar a poseer un concepto fenoménico sin jamás haber tenido la experiencia relevante. En la misma línea, Tye (2000, p. 27) sugirió que los conceptos fenoménicos podrían ser implementados en los cerebros de los individuos por medio de la neurocirugía o como fruto de un milagro. Otros filósofos han planteado argumentos distintos basados en el externismo semántico que ponen en duda la tesis de la necesidad de la experiencia para la posesión de los conceptos fenoménicos. Ball (2009) y Tye (2009), por ejemplo, han aplicado los célebres argumentos de Burge (1979) en favor del externismo social a los conceptos fenoménicos y, en consecuencia, han defendido que los conceptos fenoménicos, al igual que muchos de nuestros conceptos comunes, son deferenciales. Dicho de modo muy sencillo, esto quiere decir que un individuo puede adquirir un dado concepto fenoménico P únicamente en virtud del intercambio lingüístico con otros hablantes sin haber tenido la experiencia relevante para P. En otras palabras, el individuo puede, por ejemplo, adquirir el concepto fenoménico Dolor tan solo en virtud del intercambio lingüístico con otros hablantes sin nunca haber tenido la experiencia de dolor. Estos escenarios ponen en jaque la tesis de la necesidad de la experiencia para la posesión de los conceptos fenoménicos.

Imaginemos ahora que un individuo se expone a un amplio rango de diferentes matices de azul, de modo que adquiere los conceptos fenoménicos correspondientes a cada uno de estos matices. No parece descabellado creer que ese individuo es capaz de inferir un concepto fenoménico de un matiz intermedio de azul a partir de otros matices más oscuros y más claros que haya observado previamente, aunque no haya tenido la experiencia visual de ese matiz en particular. Esta posibilidad fue planteada por David Hume en sus Tratado de la Naturaleza Humana y Investigación sobre el Conocimiento Humano y, a simple vista, nos invita a dudar de la necesidad de la experiencia para la posesión de los conceptos fenoménicos.

No obstante, hay que prestar atención al hecho de que el escenario planteado por Hume difiere de los anteriores, pues lo único que asume es que un individuo puede inferir nuevos conceptos fenoménicos a partir de otros conceptos fenoménicos que posee de antemano. Los últimos, a su vez, son adquiridos gracias a la experiencia, así que este escenario por sí mismo no representa una amenaza estricta a la tesis de la necesidad de la experiencia para la posesión de los conceptos fenoménicos.

En cualquier caso, podemos concluir que la tesis de la dependencia de la experiencia es un punto problemático de la ECF. Si una defensa del fisicismo depende realmente de esta tesis, no cabe duda de que necesitamos con urgencia una formulación más precisa del criterio de adquisición y posesión de los conceptos fenoménicos. De hecho, esto es así independientemente de si nos convencen o no los argumentos que he mencionado en este apartado. Algunos filósofos mantienen que, como sucede en el caso de los conceptos fenoménicos, es posible que la posesión de otro tipo de conceptos—por ejemplo, deícticos o perceptivos—requiera también la exposición del individuo a las características relevantes de su entorno y que, además, es igualmente posible que estos conceptos estén también conceptualmente aislados (p.ej., Loar, 1990,1997; Levine, 2001). Asimismo, no queda claro cuál es exactamente la especificidad de los conceptos fenoménicos frente a los conceptos físicos.

4.2.  El dilema de Chalmers

Chalmers (2007) argumentó que el defensor de la ECF debe aceptar, simultáneamente, dos principios:

  • Los conceptos fenoménicos explican la relación epistémica de los individuos con sus estados fenoménicos.
  • Los conceptos fenoménicos son físicamente explicables.

Chalmers argumenta que ninguna versión de la ECF satisface ambos desiderata. Para desarrollar su argumento, nos invita a suponer que C es la tesis según la cual los humanos tenemos conceptos fenoménicos y P representa el conjunto de todas las verdades físicas del universo. Enseguida, plantea la pregunta: ¿es P & ~C concebible? El fisicista tiene dos salidas posibles:

  • Responder afirmativamente y aceptar que los conceptos fenoménicos están conceptualmente aislados de todas las verdades físicas.
  • Responder negativamente y aceptar que los conceptos fenoménicos no están conceptualmente aislados de todas las verdades físicas.

Chalmers argumenta que cualquiera de las opciones arriba conlleva consecuencias inaceptables para el fisicismo. Por una parte, si bien (a) acepta que los conceptos fenoménicos explican la relación epistémica de los individuos con sus estados fenoménicos, mantiene que los conceptos fenoménicos están conceptualmente aislados de las verdades físicas y, por tanto, no son físicamente explicables, de modo que la opción (a) no explica la premisa (ii) del dilema. Por otra parte, (b), al sostener que los conceptos fenoménicos no están conceptualmente aislados de todas las verdades físicas y, por consiguiente, son derivables a partir de ellas, sugiere que es concebible un escenario en el que los zombis—seres físicamente o funcionalmente idénticos a nosotros, pero que no tienen consciencia fenoménica—tienen conceptos fenoménicos. No obstante, los zombis no son concebibles de este modo, es decir, como seres epistémicamente relacionados con la consciencia fenoménica, así que la opción (b) no explica la premisa (i) del dilema. De aquí Chalmers concluye que el defensor de la ECF confronta un dilema: los conceptos fenoménicos o bien explican la relación epistémica de los individuos con sus estados fenoménicos, o bien pueden ser explicados físicamente.

Varios filósofos han respondido a este dilema. Diaz-León (2010), por ejemplo, ha argumentado que la conclusión de Chalmers, a pesar de ser verdadera, no representa ningún problema para la ECF, puesto que “la ECF no tiene por qué explicar nuestra situación epistémica completa, sino solamente que hay una desconexión inferencial entre las verdades físicas y las verdades fenoménicas, es decir, por qué no se puede inferir las últimas a partir de las primeras” (p. 944). Otros filósofos, entre ellos Balog (2012a), Carruthers & Veillet (2007), Papineau (2007) y Elpidorou (2013), también han ofrecido respuestas distintas a este dilema. 

Un problema adicional para la ECF es explicar en un marco fisicista cómo puede la referencia a una propiedad objetiva ser determinada por conceptos fenoménicos subjetivos. Otro problema diferente aunque relacionado con el último surge con el criterio internista de posesión de los conceptos fenoménicos. Según este criterio, un sujeto adquiere un dado concepto fenoménico únicamente en virtud de un contacto directo con sus estados fenoménicos. El problema que se enfrentan quienes defienden este criterio es el de explicar la normatividad del lenguaje aceptado incluso por muchos de los defensores de la ECF. Estas son cuestiones que una caracterización satisfactoria de la naturaleza de los conceptos fenoménicos debe ser capaz de explicar. Sin dicha explicación, el uso de la ECF como respuesta a los retos dualistas se ve seriamente amenazada. 

5. Conclusiones

Este artículo se centra en la ECF, una de las respuestas fisicistas más potentes a los retos dualistas que han sido formulados por lo menos a lo largo de las últimas tres décadas. Los defensores de esta estrategia recurren a la presunta naturaleza distinta de los conceptos fenoménicos y los conceptos físicos a fin de explicar por qué motivo las conclusiones metafísicas que los dualistas sacan de sus argumentos están equivocadas. Con el fin de explicar en qué consiste dicha estrategia, en §1 he empezado por describir la intuición fisicista básica que respalda la idea de que la naturaleza última del mundo es física, de ahí que, según el fisicista, no hay verdades más allá de las verdades de la física. En este apartado he introducido también uno de los argumentos epistemológicos que más ríos de tinta ha hecho correr en la literatura filosófica y al cual la ECF debe responder, el argumento del conocimiento, propuesto inicialmente por Jackson (1982, 1986). Después, en §2 he puesto de relieve la peculiaridad de los conceptos fenoménicos, he clarificado cuáles sus diferencias en relación con los conceptos físicos y he expuesto algunas de las caracterizaciones más comunes de la naturaleza de los conceptos fenoménicos. En §3 he explicado la motivación fundamental de la ECF, así como su aplicación como respuesta a los retos dualistas. Dentro de este apartado, he contrastado la ECF con otras estrategias fisicistas que buscan igualmente responder a los argumentos dualistas, lo cual ha permitido hacer hincapié en las ventajas de la ECF sobre las demás estrategias. Para terminar, en §4 he señalado algunas de las objeciones más fuertes que la ECF ha sufrido en años recientes y algunas respuestas a esas mismas objeciones.

A pesar de que la gran mayoría de los filósofos de la mente contemporáneos están de acuerdo que la clave para cerrar el debate metafísico en torno a la naturaleza de la consciencia consiste en encontrar una explicación adecuada de los conceptos fenoménicos, las objeciones a la ECF destacadas en este artículo demuestran más allá de cualquier duda que esta estrategia se enfrenta, a día de hoy, a problemas serios. Sus retos más comunes son sobre todo semánticos, epistemológicos y metafísicos y requieren un análisis puramente filosófico. La cuestión de si los avances en el campo de la psicología o de la neurociencia pueden contribuir al menos a una mejor comprensión de la consciencia fenoménica es todavía una cuestión por determinar.

Diana Couto
(Universitat de Barcelona)

Agradecimientos Estoy en deuda con Manuel García-Carpintero, Marta Jorba, Marc Artiga, Sofia Miguens, João Alberto Pinto y Andrea Rivadulla Duró por sus comentarios, sugerencias y correcciones lingüísticas a este artículo. 

Referencias

  • Aydede, M. y G. Güzeldere (2005): “Cognitive Architecture, Concepts, and Introspection: An Information-Theoretic Solution to the Problem of Phenomenal Consciousness”, Noûs, 39, pp. 197-255.
  • Ball, D. (2009): “There are no Phenomenal Concepts”, Mind, 118, pp. 935-962.
  • Balog, K. (2009): “Phenomenal Concepts”, en McLaughlin, B., A. Beckermann, y S. Walter, eds., The Oxford Handbook of Philosophy of Mind, Oxford, Oxford University Press, pp. 292-312.
  • Balog, K. (2012a): “In Defense of Phenomenal Concept Strategy”, Philosophy and Phenomenological Research, 84, pp. 1-23.
  • ——(2012b): “Acquaintance and The Mind-Body Problem”, en Gozzano, S. y C. Hill, eds., New Perspectives on Type-Identity: The Mental and The Physical, Cambridge, Cambridge University Press, pp. 16-42.
  • Block, N. (2007): “Max Black’s Objection to Mind-Body Identity”, en Alter, T. y S. Walter, eds., Phenomenal Concepts and Phenomenal Knowledge: New Essays on Consciousness and Physicalism, Oxford, Oxford University Press, pp. 249-306.
  • Braddon-Mitchell, D. (2003): “Qualia and Analytical Conditionals”, The Journal of Philosophy, pp. 111-135.
  • Burge, T. (1979): “Individualism and the Mental”, en Foundations of Mind, Oxford, Oxford University Press, pp. 110-150.
  • Carruthers, P. (2004): “Phenomenal Concepts and Higher-Order Experiences”, Philosophy and Phenomenological Research, 68, pp. 316-336.
  • Carruthers, P. y B. Veillet (2007): “The Phenomenal Concepts Strategy”, Journal of Consciousness Studies, 14, pp. 212-236.
  • Chalmers, D. (1996): The Conscious Mind: In Search of a Fundamental Theory, Oxford, Oxford University Press. [Chalmers, D. (1999): La Mente Consciente, trad. por José Ángel Álvarez, Barcelona, Gedisa].
  • ——(2003): “The Content and Epistemology of Phenomenal Belief”, en Smith, Q. y A. Jokić, eds., Consciousness: New Philosophical Perspectives, Oxford, Clarendon Press, pp. 220-272.
  • ——(2007): “Phenomenal Concepts and The Explanatory Gap”, en Torin, A. y S. Walter, edits., Phenomenal Concepts and Phenomenal Knowledge: New Essays on Consciousness and Physicalism, Oxford, Oxford University Press, pp. 167-194.
  • Davidson, D. (1970): “Mental Events”, en Foster, L. y J. Swanson, eds., Experience and Theory, New York, Humanities Press. [ Davidson, D. (1994): “Acontecimentos Mentales”, en Filosofía de la Psicología, trad. por Miguel Candel, Barcelona, Anthropos].
  • Dennett, D. (1991): Consciousness Explained, New York, Little Brown. [Dennett, D. (1995): La Consciencia Explicada, trad. por Sergio Balari Ravera, Barcelona, Paidós].
  • ——(2007): “What Robot Mary Knows”, en Alter, T. y S. Walter, eds., Phenomenal Concepts and Phenomenal Knowledge: New Essays on Consciousness and Physicalism, Oxford, Oxford University Press, pp. 14-31.
  • Diaz-Leon, E. (2010): “Can Phenomenal Concepts Explain The Epistemic Gap”, Mind, 119, pp. 933-952.
  • Dretske, F. (1995): Naturalizing the Mind, Cambridge, MIT Press.
  • Elpidorou, A. (2013): “Having it Both Ways: Consciousness, Unique Not Otherworldly”, Philosophia, 41, pp. 1181-1203.
  • Fürst, M. (2014): “A Dualist Account of Phenomenal Concepts”, en Lavazza, A. y H. Robinson, eds., Contemporary Dualism. A Defense, London, Routledge, pp. 112-135.
  • Hawthorne, J. (2002): “Advice for Physicalists”, Philosophical Studies, 109, pp. 17-52.
  • Hill, C. (1997): “Imaginability, Conceivability, Possibility and The Mind-Body Problem”, Philosophical Studies, 87, pp. 61-85.
  • Ismael, J. (1999): “Science and the Phenomenal”, Philosophy of Science, 66(3), pp. 351-369.
  • Jackson, F. (1982): “Epiphenomenal Qualia”, Philosophical Quarterly, pp. 127-136. [Jackson, F. (2003), “Qualia epifenoménicos”, trad. por L. E. Enríquez, en Ezcurdia, M. y O. Hansberg, eds., La Naturaleza de la Experiencia, México, UNAM, pp. 95-110].
  • ——(1986): “What Mary Didn’t Know”, Journal of Philosophy, 83, 291-295. [Jackson, F. (2003): “Lo que María no Sabía”, trad. por Laura. E. Manríquez, en Ezcurdia, M. y O. Hansberg, eds., La Naturaleza de la Experiencia, México, UNAM, pp. 111-118]
  • ——(1995): “Postscript”, en Moser, P. K. y J. D. Trout, edits., Contemporary Materialism, New York, Routledge, pp. 184-189.
  • ——(1998): “Postscript on Qualia”, en Mind, Method, and Conditionals: Selected Essays, London, Routledge, pp. 76-79.
  • Kripke, S. (1980): Naming and Necessity, Oxford, Blackwell. [Kripke, S. (1985): El Nombrar y la Necesidad, trad. por M. Valdés, México, UNAM].
  • Levin, J. (2007): “What is a Phenomenal Concept?”, en Alter, T. y S. Walter, eds., Phenomenal Concepts and Phenomenal Knowledge: New Essays on Consciousness and Physicalism, New York, Oxford, pp. 87-110.
  • Levine, J. (1983): “Materialism and Qualia: The Explanatory Gap”, Pacific Philosophical Quarterly, 64, pp. 254-261.
  • Levine, J. (2001): Purple Haze: The Puzzle of Consciousness, Oxford, Oxford University Press.
  • Lewis, D. (1983): “Postscript to ‘Mad Pain and Martian Pain’”, en Philosophical Papers, 1, Oxford, Oxford University Press, pp. 130-132.
  • ——(1990): “What Experience Teaches”, en William G. Lycan, ed., Mind and Cognition, Malden, Blackwell, 13, pp. 29-57.
  • Loar, B. (1990): “Phenomenal States”, Philosophical Perspectives, 4, pp. 81-108.
  • ——(1997): “Phenomenal States”, en Block, N., O. Flanagan y G. Güven, eds., The Nature of Consciousness: Philosophical Debates, Cambridge, MIT Press, pp. 597-616.
  • McGinn, C. (1989): “Can We Solve the Mind-Body Problem?”, Mind, 98, pp. 349-366.
  • Nagel, T. (1974): “What is it Like to Be a Bat?”, Philosophical Review, 83, pp. 435-450. [Nagel, T. (2003): “¿Cómo es ser un murciélago?”, trad. por Hector Islas, en Ezcurdia, M. y O. Hansberg, eds., La Naturaleza de la Experiencia, México, UNAM, pp. 45-63.)
  • ——(1980): “Physicalism and the Cognitive Role of Acquaintance”, en William G. Lycan, ed., Mind and Cognition, Malden, Blackwell, pp. 29-57.
  • ——(1980): “Review of Thomas Nagel, Mortal Questions”, Philosophical Review, 89, pp. 473-477.
  • ——(2007): “So This is What it’s Like: A Defense of the Ability Hypothesis”, en Alter, T. y S. Walter, eds., Phenomenal Concepts and Phenomenal Knowledge, New Essays on Consciousness and Physicalism, Oxford, Oxford University Press, pp. 32-51.
  • O’dea, J. (2002): “The Indexical Nature of Sensory Concepts”, Philosophical Papers, 31(2), 169-181. doi: org/10.1080/05568640209485100
  • Papineau, D. (2002): Thinking About Consciousness, Oxford, Oxford University Press.
  • ——(2007): “Phenomenal and Perceptual Concepts”, en Alter, T. y S. Walter, eds., Phenomenal Concepts and Phenomenal Knowledge, New Essays on Consciousness and Physicalism, New York, Oxford University Press, pp. 111-144.
  • Perry, J. (2001): Knowledge, Possibility, and Consciousness, Cambridge, MIT Press.
  • Place, U. T. (1956): “Is Consciousness a Brain Process?”, British Journal of Psychology, 47(1), pp. 44-50.
  • Putnam, H. (1975): “The Nature of Mental States”, en Philosophical Papers II – Mind, Language and Reality, Cambridge, Cambridge University Press. [Putnam, H. (1981): “La Naturaleza de los Estados Mentales”, trad. por Margarita M. Valdés, en Cuadernos de Crítica, 15, México, Instituto de Investigaciones Filosóficas].
  • Schröer, R. (2010): “Where’s the Beef? Phenomenal Concepts as Both Demonstrative and Substantial”, Australasian Journal of Philosophy, 88(3), pp. 505-522. doi: doi.org/10.1080/00048400903143861
  • Searle, J. (1984): Minds, Brains and Science, Cambridge, Harvard University Press. [Searle, J. (1996): Mentes, Cerebros y Ciencia, trad. por Luis Valdés, Madrid, Cátedra].
  • ——: The Rediscovery of the Mind, Cambridge, MIT Press. [Searle, J. (1996): El Redescubrimiento de la Mente, trad. por Luis M. Valdés Villanueva Barcelona, Crítica].
  • ——(1997): The Mystery of Consciousness, New York, New York Review. [Searle, J. (2000): El Misterio de la Consciencia, trad. por Antonio Domèch Figueras, Barcelona, Paidós].
  • Smart, J.J.C. (1959): “Sensations and Brain Processes”, Philosophical Review, 68(2), pp.141-156.
  • Sundström, P. (2011): “Phenomenal Concepts”, Philosophy Compass, 6(4), pp. 267-281.
  • Tye, M. (2000): Consciousness, Color and Content, Cambridge, MIT Press.
  • ——(2009): Consciousness Revisited: Materialism without Phenomenal Concepts, Cambridge, MIT Press.

Entradas relacionadas

Cómo citar esta entrada

Couto, Diana (2020) «Conceptos fenoménicos», Enciclopedia de la Sociedad Española de Filosofía Analítica (URL: http://www.sefaweb.es/conceptos-fenomenicos).

 

Conexionismo

El conexionismo es una teoría sobre la arquitectura cognitiva—la forma de entender la estructura y el funcionamiento de los sistemas cognitivos—que apareció en los años 80. En cierto modo, el conexionismo supuso un desafío para la teoría dominante en las ciencias cognitivas y la inteligencia artificial de la época y ofreció nuevas herramientas para entender la forma en la que los procesos cognitivos (p.ej., percepción, atención, memoria, lenguaje) pueden estar implementados o pueden emerger de sistemas neuronales.

         Los debates propiciados por la aparición del conexionismo siguen vigentes en la ciencia cognitiva contemporánea y en su filosofía. Además, la investigación más puntera en modelos de redes neuronales mantiene su inspiración en propuestas conexionistas y comparte muchos de sus principios básicos. El conexionismo es, por tanto, una teoría que ayuda a comprender tanto el desarrollo histórico de las ciencias cognitivas como su estado actual.

1. Breve Historia

Desde la revolución cognitiva a finales de los años 50 (Miller, 2003), tanto las ciencias cognitivas como la investigación en inteligencia artificial han estado dominadas por un paradigma basado en principios representacionalistas y computacionales que ha venido a ser llamado cognitivismo (Garnham, 2009). El cognitivismo se fundamenta en la metáfora computacional: el sistema mente-cerebro es una computadora. Más concretamente, la mente es el software que funciona sobre el hardware cerebral (Thagard, 2005).

Entre otros factores, el cognitivismo encontró su éxito gracias a que la metáfora computacional permitía el estudio de la mente desde coordenadas puramente físicas. Los estados mentales, antaño restringidos a la esfera privada que no era accesible desde los métodos de la ciencia contemporánea, podían ahora ser entendidos como estados de un sistema computacional mediante el uso de herramientas formales (Anderson, 1983, 2007; Newell, 1990; Russell y Norvig, 2003). Además, la metáfora computacional resolvía el problema mente-cerebro: los estados mentales son estados semánticos que se procesan en términos puramente sintácticos (formales) en los mecanismos cerebrales. De este modo, al igual que no hay problemas para reconciliar software y hardware en una computadora, no los hay para reconciliar mente y cerebro.

El cognitivismo enfrentaba y enfrenta serios problemas tanto teóricos como empíricos (McCarthy y Hayes, 1969; Searle, 1980). Sin embargo, pronto se convirtió en el paradigma dominante en las ciencias cognitivas. Una de las consecuencias de este hecho es que los detalles de implementación de los procesos cognitivos quedaron relativamente relegados en la investigación cognitiva. Las computadoras se pueden entender como sistemas formales que pueden implementarse físicamente de formas muy diversas. Del mismo modo, si el sistema mente-cerebro es una computadora, puede ser estudiado en términos formales y el hecho de que su implementación sea una compleja red neuronal no es, en principio, central para la explicación—la idea general tras esta afirmación se ha llamado realización múltiple en algunos círculos filosóficos (Polger y Shapiro, 2016): si la metáfora computacional típica del cognitivismo es cierta, entonces la mente es múltiplemente realizable y esto conlleva que la implementación de los estados mentales no es central para la explicación de la naturaleza de estos estados. En otras palabras, las computadoras son independientes de su medio de implementación y, por tanto, el sistema mente-cerebro también lo es.

A pesar de la poca atención que el cognitivismo, en general, presta a la implementación de los estados cognitivos, esta no ha sido la actitud general a lo largo de la historia de la psicología y de las ciencias cognitivas. Ya desde los años 40, arquitecturas que, hasta cierto punto, imitaban la estructura de red del cerebro se empezaron a desarrollar—por ejemplo, las pequeñas redes desarrolladas por McCulloch y Pitts (1943) o el pandemonium (Selfridge, 1959). Sin embargo, en pleno dominio cognitivista, no es hasta los años 80 que ideas sobre la relevancia de la implementación de los procesos cognitivos vuelven a la palestra, a través, por ejemplo, de los modelos de memoria asociativa en paralelo (Hinton y Anderson, 1981) o el propio conexionismo (Rumelhart y McClelland, 1986). Estos modelos buscaban desarrollar arquitecturas cognitivas inspiradas en redes neuronales biológicas que pudiesen dar cuenta de diversos procesos cognitivos.  En este sentido, se convirtieron en desafíos e incluso alternativas al cognitivismo en tanto que perseguían la explicación de los mismos fenómenos desde asunciones teóricas distintas en lo que tiene que ver con su implementación o con las nociones de computación y representación, por ejemplo. De todas ellas, el conexionismo es la más rica y compleja. Y, sin duda, la que ha tenido una mayor influencia en la ciencia cognitiva.

2. Principios básicos

El elemento fundamental para entender el lugar del conexionismo en la ciencia cognitiva, así como sus principios básicos, es que es una arquitectura cognitiva que, como el cognitivismo, es computacional. Las redes conexionistas están vagamente inspiradas en las redes neuronales de los cerebros biológicos. En las redes conexionistas, las unidades que imitan las neuronas implementan algún tipo de función computacional. Así, estas redes se pueden entender como un sistema computacional en paralelo, es decir, en el que las unidades de computación actúan simultáneamente.

Con esta idea en mente, las redes conexionistas son modelos computacionales que se basan de una forma abstracta en lo que sabemos sobre el cerebro y las redes neuronales que lo constituyen. Se cree que el cerebro humano contiene entre 1010 y 1011 neuronas y cada una de ellas puede llegar a tener 105 conexiones con otras neuronas. Estas conexiones pueden ser excitatorias, las que fomentan la actividad de otras neuronas, o inhibitorias, las que frenan o bloquean la actividad de otras neuronas. Además, el aprendizaje de nuevas habilidades y contenidos se basa en la modificación de estas conexiones, usualmente entendida como el refuerzo o la debilitación de sus sinapsis.

Dados estos hechos sobre el cerebro humano, las redes conexionistas consisten en un número de elementos simples, llamados unidades o nodos, que actúan de manera similar a las neuronas biológicas y que están conectados a través de unas conexiones que les permiten transmitir señales simples. Estas conexiones, que pretenden ser análogas a las sinapsis y que pueden ser tanto excitatorias como inhibitorias, tienen un peso que determina la forma en la que el nodo conectado a uno de sus extremos puede influenciar al nodo conectado en el otro extremo. Los nodos (o unidades) están normalmente organizados en capas. Una capa de entrada, que lleva la información del exterior al sistema, una capa de salida que devuelve el resultado del procesamiento de la información y una o varias capas escondidas (que no están siempre presentes en las redes conexionistas), que se sitúan entre las capas de entrada y salida y que no tienen contacto con el entorno del sistema (Figura 1). En los modelos más básicos de redes conexionistas, las capas se conectan unidireccionalmente y las conexiones van de la capa de entrada a la de salida pasando por la capa escondida. En otros modelos mas avanzados, que incluyen retroalimentación, por ejemplo, las conexiones entre nodos pueden ser cíclicas o de otro tipo.

Figura 1. Ejemplo de red conexionista de tres capas (entrada, escondida y salida). Los nodos y las conexiones, junto con la dirección de procesamiento, están indicados.

En general, los nodos y las conexiones en redes conexionistas tienen habilidades muy limitadas. A través de sus conexiones de salida, los nodos solamente transmiten valores números que son una función de los valores numéricos que reciben a través de sus conexiones de entrada (o que reciben del entorno, en el caso de los nodos de la capa de entrada). Usualmente, cada nodo toma un grupo de valores de entrada y los transforma, mediante un proceso computacional, en un único valor de salida que es transmitido a los nodos de la siguiente capa. Estas transformaciones están normalmente limitadas a operaciones matemáticas muy simples, como diversos tipos de suma (para una explicación técnica de los aspectos básicos de las redes conexionistas, ver Rumelhart y McClelland, 1986, p. 45 y siguientes).

3. ¿Cómo funciona una red conexionista?

Teniendo en cuenta que tanto nodos como conexiones tienen un funcionamiento simple y limitado, la pregunta es: ¿Qué hacen las redes conexionistas para conseguir llevar a cabo procesos complejos? La respuesta ya ha sido anticipada: procesamiento paralelo. Los procesos computacionales llevados a cabo por la red conexionista ocurren en paralelo a lo largo de los nodos en lugar de ocurrir en serie, como es el caso en la computación tradicional. En este sentido, los nodos mismos, como unidades computacionales, no son individualmente responsables de solucionar un problema, sino que lo solucionan de forma colectiva.

De forma general, la información que llega a la red conexionista es distribuida por toda la red. En este sentido, las redes conexionistas instancian lo que se puede llamar representaciones distribuidas: patrones de activación simultánea de todos los nodos de la red. Así, por ejemplo, un patrón de activación en particular a través de los 15 nodos de la red conexionista de la Figura 1 puede ser la representación de “cebra”, mientras que otro patrón de activación a través de los mismos nodos puede ser la representación de “jirafa”. Por lo tanto, una red conexionista podría ser capaz de producir la palabra “cebra”, cuando la información de entrada fuese una fotografía de una cebra, alcanzando el patrón de activación de “cebra” en sus nodos y, de la misma forma, producir la palabra “jirafa”, cuando la información de entrada fuese la fotografía de una jirafa, alcanzando el patrón de activación de “jirafa” en sus nodos. Este ejemplo nos lleva a los dos aspectos fundamentales del funcionamiento de una red conexionista: la activación de los nodos y el algoritmo de retropropagación.

3.1 La activación de los nodos

Los nodos en una red conexionista implementan una función de transferencia que determina la forma en la que el valor de cada nodo se actualiza en función de la información de entrada que recibe desde el entorno (en el caso de los nodos de la capa de entrada) o desde los nodos de otra capa (en el caso de los nodos de la capa escondida y de la de salida). Normalmente, la función de transferencia trata computacionalmente la información que recibe y la aplica a una función de activación que es la que determina el valor de salida que va a entregar a la siguiente capa de la red (Figura 2).

Figura 2. Diagrama de un nodo o unidad de una red conexionista. (A) Diagrama de un nodo o unidad con todos sus componentes. Las entradas al nodo (E) que son resultado de la información entrante desde el entorno en el caso de la capa de entrada y de las activaciones de los nodos de las capas previas en el caso de la capa escondida y la capa de salida. (B) Ejemplos de diferentes funciones de activación: umbral, lineal, gaussiana y sigmoidal. La diferencia entre ellas es que el cambio en las entradas (eje X de las gráficas) afecta de forma distinta la activación de salida del nodo. Por ejemplo, en la activación lineal, los primeros valores de activación de entrada no cambian la activación de salida. Después, hay un grupo de valores que incrementan la activación de salida de forma lineal. Al final, el grupo de valores altos de activaciones de entrada vuelve a no provocar cambios en la activación de salida del nodo.

Un tipo de procesamiento habitual en la función de transferencia de un nodo dado es la multiplicación de las activaciones que recibe desde los nodos de la capa previa por los pesos de las conexiones por las que esas activaciones llegan (este proceso es a veces referido como función de entrada de red), para después sumar los resultados de esas multiplicaciones y enviarlas a la función de activación (Figura 2A). La función de activación, entonces, aplica algún tipo de computación a esa entrada, y de esa computación depende el perfil de activación del nodo (Figura 2B). Por ejemplo, la función de activación puede requerir un nivel de entrada mínimo para entonces provocar un aumento súbito en la activación del nodo y así enviar esa activación hacia la siguiente capa de la red. Esta función de activación se puede entender como un umbral de activación. En otros nodos, la función de activación puede simplemente requerir un valor específico de entrada para provocar la máxima activación del nodo y enviarla hacia la siguiente capa de la red. Esta función de activación se puede entender como una activación gaussiana.

3.2 El algoritmo de retropropagación

En las redes conexionistas, la activación de cualquier nodo depende de las activaciones de entrada que recibe desde las capas previas o desde el entorno de la red. Las funciones de transferencia de los nodos—que comprenden la función de entrada de red y la función de activación—suelen ser fijas y no cambian durante el funcionamiento de la red. Sin embargo, las conexiones entre nodos sí que pueden cambiar su peso y, por tanto, influir en la información que llega a los nodos. En este sentido, la clave de la evolución y el aprendizaje en las redes conexionistas tiene que ver con los cambios que se producen en los pesos de las conexiones entre nodos. La forma en la que estos cambios se producen suele estar basada en algoritmos de retropropagación.

El primer algoritmo de retro-propagación (“backpropagation” en inglés) en el contexto de redes conexionistas fue introducido por Rumelhart, Hinton y Williams (1986). Diferentes métodos de retropropagación se venían desarrollando desde los años 60 (Bryson, 1961; Kelley, 1960). Entre ellos, el conocido como regla delta ganó relevancia y, a mitad de los años 80, los mencionados fundadores del conexionismo generalizaron la regla delta para su propio modelo de red conexionista. Fundamentalmente, lo que la regla delta y los algoritmos de retroprogramación llevan a cabo es un cambio de los pesos de las conexiones entre los nodos usando como referencia la diferencia entre los resultados de las operaciones de la red y los resultados esperados si la red tuviese un comportamiento exitoso. La regla delta simple usa una tasa de error basada en esta diferencia para llevar a cabo los cambios en los pesos de las conexiones entre nodos. Por su parte, la regla delta generalizada lleva a cabo un proceso similar, pero tiene en cuenta las contribuciones de los nodos al error total y la forma en la que tal error se distribuye a través de las diferentes capas de la red. En este sentido, la señal de error se retropropaga a través de las capas de la red y guía las modificaciones de los pesos de sus conexiones.

Los principios básicos de la regla delta y de su generalización como algoritmo de retropropagación son el refuerzo sináptico y el aprendizaje supervisado. Por un lado, Donald Hebb (1949) demostró que las conexiones sinápticas entre neuronas en cerebros biológicos se refuerzan cuando las neuronas conectadas están activas simultáneamente. Se cree que este fenómeno es uno de los mecanismos fundamentales del aprendizaje y, en este sentido, inspira la idea del cambio de pesos de las conexiones entre nodos de las redes conexionistas como fundamento de los procesos de aprendizaje que en ellas se dan. Por otro lado, el aprendizaje supervisado es una forma básica de aprendizaje tanto en humanos como en animales. Madres y padres corrigen a sus hijas e hijos, profesoras y profesores a sus alumnas y alumnos, etc. Cuando un aprendiz comete un error, quien se encarga de la supervisión hace ese error explícito e intenta provocar un cambio en el aprendiz para que el error no se produzca y la tarea sea exitosa. En los algoritmos de retro-propagación, la tasa de error calculada al comparar los resultados obtenidos a los resultados esperados en la actividad de la red conexionista, cumple el papel de supervisión en su proceso de aprendizaje. En este sentido, el funcionamiento de las redes conexionistas, tanto al nivel nodos y conexiones individuales como a nivel general en términos de actividad y aprendizaje, está inspirado en aspectos conocidos de los sistemas cognitivos biológicos.

4. Algunos problemas del conexionismo

La viabilidad del conexionismo como paradigma para el desarrollo de la inteligencia artificial y, en general, como paradigma de las ciencias cognitivas ha sido puesta en cuestión desde diversas perspectivas. Por un lado, el hecho de que el conexionismo ponga en juego la idea de representaciones distribuidas—o, incluso, la eliminación del concepto de representación (Churchland, 1989)—ha sido visto como un problema para dar cuenta de uno de los aspectos esenciales de la psicología popular: la idea de que estados mentales funcionalmente discretos y semánticamente interpretables tienen poderes causales (Ramsey, Stich y Garon, 1990). La funcionalidad de una red conexionista está basada en la distribución de los pesos de las conexiones entre sus nodos tal que una sola distribución puede hacer que la red exhiba la funcionalidad deseada (p.ej., categorización o aprendizaje del tiempo pasado). En este sentido, los estados de las redes conexionistas no son funcionalmente discretos ni semánticamente interpretables, con lo que una de las intuiciones fundamentales de la psicología popular es abandonada.

Por otro lado, y sobre todo en los albores del conexionismo como paradigma, las redes conexionistas fueron puestas en cuestión en base a consideraciones biológicas. En particular, la plausibilidad biológica de las redes conexionistas fue altamente cuestionada. En estas redes, los nodos tenían un comportamiento similar, las capas de nodos eran capas discretas, y el flujo de información era unidireccional, por ejemplo. Ninguna de estas tres características da cuenta de las propiedades anatómicas y funcionales de los cerebros. Por tanto, las redes conexionistas eran consideradas poco realistas. Este hecho, entre otros, fue el que llevó a la evolución de las diversas generaciones de redes conexionistas que han surgido en las ultimas décadas y que se acercan más a una situación de realismo biológico.

Más allá de cuestiones de compatibilidad con la psicología popular o con la biología cerebral, el gran reto teórico que el conexionismo ha tenido que enfrentar es el reto de la sistematicidad propuesto por Jerry Fodor y Zenon Pylyshyn (1988). El reto de la sistematicidad se enmarca en el debate entre conexionismo y cognitivismo. El conexionismo se presenta como una alternativa al cognitivismo y, por ello, debe dar cuenta de los mismos fenómenos. O, al menos, esta es la idea de algunos defensores del cognitivismo, como lo eran Fodor y Pylyshyn. Para ellos, las redes conexionistas no pueden dar cuenta del pensamiento humano porque el pensamiento humano es sistemático y las redes conexionistas no lo son. Y, más aún, si las redes conexionistas pudiesen dar cuenta de la sistematicidad del pensamiento humano, se convertirían en meros modelos de implementación del cognitivismo.

La sistematicidad se fundamenta en otra propiedad: la composicionalidad. Un sistema es composicional cuando está constituido por elementos atómicos que pueden combinarse siguiendo unas determinadas reglas. Por ejemplo, la lengua castellana es composicional. La frase “Juan quiere a Lola” esta constituida por tres partes: “Juan”, “quiere a”, y “Lola”. Y el significado de la frase depende de las partes que la componen y la sintaxis del castellano. Algunos sistemas composicionales son también sistemáticos, es decir, son capaces de producir cualquier combinación legal de los átomos que los constituyen. De nuevo, el lenguaje castellano es sistemático: al igual que puede producir “Juan quiere a Lola”, puede producir “Lola quiere a Juan”.

De acuerdo con Fodor y Pylyshyn, el pensamiento humano es composicional y sistemático: está constituido por representaciones/conceptos y es capaz de producir cualquier combinación legal de ellos. Sin embargo, las redes conexionistas no son sistemáticas porque no son composicionales. Las representaciones distribuidas típicas de las redes conexionistas no son atómicas: la representación “Lola quiere a Juan” consiste en un patrón especifico de activaciones de todas las unidades de la red. Esta representación no puede cambiar a “Juan quiere a Lola” sin cambiar el patrón de activación de toda la red. En este sentido, no hay elementos atómicos que constituyan el sistema composicional, por lo que las redes conexionistas no son composicionales. Y al no ser composicionales, no pueden ser sistemáticas.

Los defensores del conexionismo han respondido al reto de la sistematicidad de muy diversas maneras (Calvo y Symons, 2014). Por un lado, los hay que han intentado argumentar que las redes conexionistas pueden ser sistemáticas. Por ejemplo, Smolensky (1987, 1988) defiende que la sistematicidad se puede basar en una noción de composicionalidad débil en la que los estados de una red conexionista se pueden entender como vectores definidos por las matrices de los pesos de las conexiones de la red y los componentes de esos estados (p.ej., “Juan” en “Juan quiere a Lola”) como los vectores individuales que componen el vector de la red. Estos vectores se pueden combinar siguiendo ciertas normas y dependiendo del contexto. En este sentido, la combinación de vectores individuales da cuenta de la composicionalidad sin necesidad de apelar a estados funcionalmente discretos y, por tanto, las redes conexionistas pueden ser sistemáticas.

Por otro lado, los hay que argumentan que el pensamiento humano no es sistemático y que, por tanto, las redes conexionistas no necesitan serlo. Este es el caso de Chemero (2014), que analiza la noción de sistematicidad usada por Fodor y Pylyshyn y que concluye que no hay sustento empírico para ella tras un recorrido por los usos de la palabra “sistematicidad” en las ciencias cognitivas. En este sentido, el reto de la sistematicidad es un argumento hegeliano: un argumento basado en pura especulación, pero sin respaldo en la ciencia cognitiva. Chemero (2009) considera que los argumentos hegelianos son poco convincentes, lo que va en contra del reto de la sistematicidad. A pesar de ello, es un hecho constatable que el reto de la sistematicidad sigue vigente en las disputas teóricas respecto al conexionismo.

5. Conexionismo hoy

Las redes conexionistas han sido aplicadas a tareas cognitivas muy diversas, tales como tareas lingüísticas, de percepción, o de toma de decisiones. Con su éxito, el conexionismo ha demostrado que ciertas asunciones del cognitivismo no son necesarias para comprender y explicar la forma en la que los sistemas cognitivos funcionan—por ejemplo, las redes conexionistas no precisan de una descripción formal o de reglas explícitas de procesamiento computacional. Este hecho diferenciador ha provocado un amplio desarrollo del paradigma conexionista desde que apareció en los años 80 y, hoy en día, podemos hablar de una segunda, una tercera, e incluso una cuarta generación del conexionismo (las generaciones son también conocidas como “olas del conexionismo”).

Un importante ejemplo de las redes conexionistas de segunda generación es el predictor de oraciones de Elman (1990). La mayor novedad de este predictor de segunda generación con respecto a las redes conexionistas de primera generación es que está basado en una red recurrente. Las redes recurrentes se distinguen por incluir una capa de nodos de contexto que actúan como una forma de memoria (Figura 3). Normalmente, la capa de contexto copia los estados de la capa escondida y los reintroduce en esa capa en el siguiente ciclo de activación. En este sentido, las redes recurrentes explotan las propiedades temporales de la actividad de las redes conexionistas para así proporcionar a la red mayor capacidad de procesamiento.

Figura 3. Ejemplo de red conexionista recurrente. Es una red conexionista estándar a la que se añade una capa extra, o capa de contexto. La capa escondida se copia en cada ciclo (flechas discontinuas azules). En el siguiente ciclo la capa de contexto es, junto a la capa de entrada, la que alimenta a la capa escondida.

La tercera generación de conexionismo, el conexionismo dinámico (McClelland et al., 2010), introduce en las redes conexionistas algunas características que aumentan su plausibilidad biológica. Por ejemplo, permitiendo diferencias entre los nodos para usar algunos de ellos con propósitos especiales, incluyendo una conectividad más compleja, retardos, procesamiento en tiempo continuo, entradas analógicas, ruido, etc. Y la cuarta generación, más actual si cabe, es la que introduce principios del procesamiento predictivo (Friston, 2010) en la arquitectura conexionista, permitiendo el procesamiento bidireccional basado en probabilidad bayesiana. En estas redes, el aprendizaje se consigue mediante la combinación de flujos informativos bidireccionales—esto es, de la capa de entrada a la de salida y viceversa.

El conexionismo, por tanto, sigue siendo un paradigma relevante dentro de las ciencias cognitivas y sigue proponiendo alternativas a los modelos clásicos tanto en psicología y neurociencia cognitiva como en inteligencia artificial. Además, es de esperar que el avance en el conocimiento de los sistemas neuronales biológicos repercuta en los modelos conexionistas y que estos sean cada vez más refinados y puedan seguir contribuyendo al avance del conocimiento de los procesos cognitivos.

Vicente Raja
(Rotman Institute of Philosophy,
Western University)

Referencias

  • Anderson, J. R. (1983): The Architecture of Cognition, Cambridge, Mass., Harvard University Press.
  • ———— (2007): How Can the Human Mind Occur in the Physical Universe?, Oxford, Oxford University Press.
  • Bryson, A. E. (1961): “A gradient method for optimizing multi-stage allocation processes”, en Proceedings of the Harvard University Symposium on Digital Computers and their Applications, Cambridge, Mass., Harvard University.
  • Calvo, P. y J. Symons (2014): The Architecture of Cognition, Cambridge, Mass., MIT Press.
  • Chemero, A. (2009): Radical Embodied Cognitive Science, Cambridge, Mass., MIT Press.
  • ———— (2014): “Systematicity and interaction dominance”, en Calvo, P. y J. Symons, eds., The Architecture of Cognition, Cambridge, Mass., MIT Press, pp. 353-369.
  • Churchland, P. M. (1989): A Neurocomputational Perspective: The Nature of Mind and the Structure of Science, Cambridge, Mass., MIT Press.
  • Elman, J. (1990): “Finding structure in time”, Cognitive Science, 14(2), pp. 179-211.
  • Fodor, J. y Z. Pylyshyn (1988): “Connectionism and cognitive architecture: A critical analysis”, Cognition, 28, pp. 3-71.
  • Friston, K. (2010): “The free-energy principle: A unified brain theory?”, Nature Reviews Neuroscience, 11(2), pp. 127-138.
  • Garnham, A. (2009): “Cognitivism”, en Symons, J. y P. Calvo, eds., The Routledge Companion to Philosophy of Psychology, Nueva York, Routledge, pp. 99-110.
  • Hebb, D.O. (1949): The Organization of Behavior, Nueva York, Wiley.
  • Hinton, G. y J. Anderson (1981): Parallel Models of Associative Memory, Hillsdale, Lawrence Erlbaum Assoc.
  • Kelley, H. J. (1960): “Gradient theory of optimal flight paths”, ARS Journal, 30(10), pp. 947-954.
  • McCarthy, J. y P. Hayes (1969): “Some philosophical problems from the standpoint of artificial intelligence”, en Meltzer, B. y D. Michie, eds., Machine Intelligence 4, Edimburgo, Escocia, Edinburgh University Press, pp. 463-502.
  • McClelland, J. L., M. M. Botvinick, D. C. Noelle, D. C. Plaut, T. T. Rogers, M. S. Seidenberg y L. B. Smith (2010): “Letting structure emerge: Connectionist and dynamical systems approaches to cognition”, TRENDS in Cognitive Sciences, 14(8), pp. 348-356.
  • McCulloch, W. y W. Pitts. (1943): “A logical calculus of the ideas immanent in nervous activity”, Bulletin of Mathematical Biophysics, 5, pp. 115-133.
  • Miller, G. A. (2003): “The cognitive revolution: A historical perspective”, TRENDS in Cognitive Sciences, 7(3), pp. 141-144.
  • Newell, A. (1990): Unified Theories of Cognition, Cambridge, Mass., Harvard University Press.
  • Polger, T. y L. Shaprio (2016): The Multiple Realization Book, Oxford, Oxford University Press.
  • Ramsey, W., S. Stich y J. Garon (1990): “Connectionism, eliminativism and the future of folk psychology”, Philosophical Perspectives, 4, pp. 499-533.
  • Rumelhart, D. E., G. E. Hinton y R. J. Williams (1986): “Learning internal representations by error propagation”, en Rumelhart, D. E. y J. L. McClelland, eds., Parallel Distributed Processing: Explorations in the Microstructure of Cognition. Vol. 1, Foundations, pp. 318-362, Cambridge, Mass., MIT Press.
  • Rumelhart, D. E., J. L. McClelland y PDP Research Group (1986): Parallel Distributed Processing, 1, 2, Cambridge, Mass., MIT Press.
  • Russell, S. J. y P. Norvig (2003): Artificial Intelligence: A Modern Approach, Upper Saddle River, Prentice Hall.
  • Searle, J. (1980): “Minds, brains, and programs”, Behavioral and Brain Sciences, 3, pp. 417-457.
  • Selfridge, O. G. (1959): “Pandemonium: A paradigm for learning”, en Blake, D. V. y A. M. Uttley, eds., Proceedings of the Symposium on Mechanisation of Thought Processes, pp. 511-529, Londres.
  • Smolensky, P. (1987): “The constituent structure of mental states: A reply to Fodor and Pylyshyn”, Southern Journal of Philosophy, 25, pp.137-460.
  • ———— (1988): “On the proper treatment of connectionism”, Behavioral and Brain Sciences, 2, pp. l-23.
  • Thagard, P. (2005): Mind: Introduction to Cognitive Science, Cambridge, Mass., MIT Press.

Lecturas recomendadas en castellano

  • Campanario, J. M. (2004): “El enfoque conexionista en psicología cognitiva y algunas aplicaciones sencillas en didáctica de las ciencias”, Enseñanza de las Ciencias, 22(1), pp. 93-104.
  • Pineda, D. (2012): La Mente Humana: Introducción a la Filosofía de la Psicología, Madrid, España, Ediciones Cátedra.
  • Pons Parra, R. M. y J. M. Serrano Gonzalez-Tejero (2011): “Conexionismo e instrucción”, Educación y Humanismo, 13(21), pp. 51-82.

Entradas relacionadas

Cómo citar esta entrada

Raja, Vicente (2019) “Conexionismo”,  Enciclopedia de la Sociedad Española de Filosofía Analítica (URL: http://www.sefaweb.es/conexionismo/).

 

Consecuencia lógica

1. Modalidad, formalidad, y la relación de consecuencia lógica

Los lógicos han procedido a menudo bajo el supuesto implícito de que existe una relación natural especial que se da a veces entre las premisas y la conclusión de un argumento, la relación de consecuencia lógica. Las premisas de un argumento forman un conjunto de oraciones ∑ (en el sentido técnico de ‘conjunto’, que incluye al “conjunto” vacío, sin oraciones, y a los “conjuntos” de una sola oración) y la conclusión es una oración O. Los lógicos han pensado a menudo que, cuando la relación de consecuencia lógica es ejemplificada por un argumento ∑/O, debe darse una relación de implicación modal muy estricta entre las oraciones de ∑ y la oración O: en algún sentido especialmente exigente de ‘no podría’, no podría ser el caso que las oraciones de ∑ fueran verdaderas y la oración O falsa. Este es el rasgo de modalidad de la supuesta relación natural de consecuencia lógica. Además, se ha pensado a menudo que cuando se da la relación de consecuencia lógica entre un conjunto de oraciones ∑ y una oración O, la implicación correspondiente debe tener la cualidad de formalidad: si una oración O es consecuencia lógica de un conjunto de oraciones ∑, entonces si ∑’/O’ es un argumento con la misma forma lógica que ∑/O, O ha de ser consecuencia lógica de ∑.

No siempre que hay implicación o consecuencia en un sentido intuitivo hay también una implicación modal apropiadamente estricta. Por ejemplo, del conjunto de oraciones integrado por la única oración ‘Los objetos físicos observados hasta ahora se rigen por las leyes de la mecánica cuántica’ se “sigue” en algún sentido la oración ‘Todos los objetos físicos se rigen por las leyes de la mecánica cuántica’. Pero no es un caso de consecuencia lógica, pues no es excesivamente difícil imaginar un objeto físico posible que no se rija por las leyes de la mecánica cuántica. El tipo de fuerza modal que conecta a ∑ y O cuando hay consecuencia lógica entre ellos es más bien, se ha solido pensar, la fuerza que conecta a ‘Juana es la nuera de Pedro’ con ‘Juana está casada con un hijo de Pedro’: esta última oración no puede ser falsa en ningún sentido sensato si la primera es verdadera. Se ha solido pensar, de manera más general y teórica, que la fuerza modal que conecta a ∑ y O cuando hay consecuencia lógica entre ellos es la de las implicaciones analíticas, y consiguientemente que una consecuencia lógica de un conjunto de oraciones puede extraerse a priori a partir de ellas.

Ahora bien, la implicación entre ‘Juana es la nuera de Pedro’ y ‘Juana está casada con un hijo de Pedro’ ilustra a su vez la idea habitual entre los lógicos de que hay implicaciones modalmente estrictas pero sin la cualidad de formalidad. Según la opinión más común entre los lógicos, el argumento {‘Pepa es la fontanera de Pablo’}/‘Pepa está divorciada de un contable de Pablo’ tiene la misma forma lógica que el argumento {‘Juana es la nuera de Pedro’}/‘Juana está casada con un hijo de Pedro’. Esa forma común vendría dada por algo parecido al esquema ‘{‘a está en la relación R con b’}/ ‘a está en la relación S con una cosa que está en la relación T con b’’. Pero ese último argumento ni siquiera ejemplifica una relación de implicación, menos aún la relación de consecuencia lógica.

Algunos ejemplos de argumentos que se ha pensado que ejemplifican la relación de consecuencia lógica, y que por tanto cuando menos parecen poseer las cualidades de modalidad y de formalidad, son los siguientes:

{‘Si Pedro viene a la fiesta, Juana se irá’, ‘Pedro viene a la fiesta’}/‘Juana se irá’;
{‘Todo hombre es mortal’, ‘Sócrates es hombre’}/‘Sócrates es mortal’;
{‘Todo griego es hombre’, ‘Todo hombre es mortal’}/‘Todo griego es mortal’.

En efecto, en cada uno de estos casos parece evidente que las premisas no podrían ser verdaderas sin que lo fuera la conclusión. Además, lo que normalmente se pensaría que son las formas lógicas de estos argumentos serían esquemas parecidos a los siguientes:

{‘Si a tiene la propiedad P, b tiene la propiedad Q’, ‘a tiene la propiedad P’}/‘b tiene la propiedad Q’;
{‘Toda cosa que tiene la propiedad P tiene la propiedad Q’, ‘a tiene la propiedad P’}/‘a tiene la propiedad Q’;
{‘Toda cosa que tiene la propiedad P tiene la propiedad Q’, ‘Toda cosa que tiene la propiedad Q tiene la propiedad R’}/‘Toda cosa que tiene la propiedad P tiene la propiedad R’.

Y cuando uno inspecciona estos esquemas no puede evitar sentir que cualquier argumento que proceda de ellos rellenando sus letras esquemáticas con palabras apropiadas (con las mismas letras siempre sustituidas por las mismas palabras) será un argumento que ejemplificará una implicación modalmente estricta, y que tendrá automáticamente la cualidad de formalidad.

El frecuente supuesto implícito de los lógicos de que existe una relación natural de consecuencia lógica ha quedado cuestionado, especialmente en tiempos recientes, por las discrepancias en cuanto a cuál ha de ser la modalidad apropiada en el rasgo de modalidad y cuál ha de ser la noción apropiada de forma lógica en el rasgo de formalidad. Algunos lógicos (v.g. Quine, 1970) han negado que la modalidad apropiada pueda ser la de implicación analítica e incluso que pueda ser la de implicación por necesidad metafísica, sugiriendo que debe ser alguna otra modalidad menos estricta correspondiente a una noción relativamente débil de validez (en el sentido de ‘validez’ que veremos más abajo). Otros lógicos se han mostrado escépticos acerca de la existencia de una noción de forma lógica que permita que dos argumentos con elementos léxicos diferentes tengan la misma forma lógica (v.g. Etchemendy, 1990). Otros, a veces con fundamento en esas discrepancias, han propuesto que no hay una sola relación que merezca el nombre ‘consecuencia lógica’; según ellos, es compatible con la comprensión preteórica del concepto de consecuencia lógica que la modalidad en cuestión sea la de implicación analítica, la de implicación por necesidad metafísica, e incluso varias modalidades correspondientes a nociones débiles de validez (v.g. Beall y Restall, 2006); y según otros, la comprensión preteórica del concepto de forma lógica no determina suficientemente que a cualquier argumento dado le corresponde exclusivamente un esquema privilegiado que revela su forma lógica, habiendo varias nociones de forma lógica igualmente aceptables (v.g. Varzi, 2002).

2. Derivabilidad, validez, y la caracterización de la relación de la consecuencia lógica

Sin embargo, todos los lógicos, tanto si cuestionan el supuesto tradicional de que hay una única relación natural de consecuencia lógica con los rasgos de modalidad y formalidad como si no, han buscado clarificar la relación o las relaciones de consecuencia lógica, y lo han hecho usando aproximaciones similares. Esas aproximaciones generalmente incluyen la propuesta de caracterizaciones de la o las relaciones de consecuencia lógica para argumentos de lenguajes formales que buscan modelar fragmentos del lenguaje natural, caracterizaciones que normalmente se dan en términos de conceptos matemáticos. Gran parte de la literatura sobre la filosofía de la consecuencia lógica se ha concentrado en examinar caracterizaciones de la o las relaciones de consecuencia lógica para determinar si o en qué medida capturan las relaciones preteóricas que se busca caracterizar. Hay dos grandes tipos de caracterizaciones: las basadas en nociones de derivabilidad y las basadas en nociones de validez.

Las caracterizaciones basadas en nociones de derivabilidad se asocian especialmente al nombre de Frege, fundador de la lógica moderna a finales del siglo XIX. Frege inventó un lenguaje formal (o una serie de lenguajes), diseñado especialmente para la formalización de argumentos matemáticos, dentro del cual siempre es enteramente claro cuál es la forma lógica de un argumento y si dos argumentos tienen la misma forma lógica o no. El lenguaje que inventó Frege es lo que hoy llamaríamos un lenguaje cuantificacional de orden superior, y contenía como fragmento lo que hoy llamaríamos un lenguaje cuantificacional de primer orden, un lenguaje como los que se presentan hoy en los cursos básicos de lógica. Para ese lenguaje, Frege ofreció un sistema formal como los que se estudian hoy en esos cursos, especificando con gran rigor un conjunto de formas axiomáticas básicas y un conjunto de reglas de inferencia básicas.

Una vez especificados estos elementos del sistema formal, es posible proponer una caracterización muy precisa del conjunto de argumentos del lenguaje formalizado del sistema que ejemplifican la relación deseada de consecuencia lógica, o que son lógicamente correctos: podemos proponer que la relación de consecuencia lógica se da entre un conjunto de premisas {P1, P2, P3, …} y una conclusión C (del lenguaje del sistema) exactamente cuando existe una serie de aplicaciones de las reglas de inferencia que, partiendo de {P1, P2, P3, …} y posiblemente también de oraciones de las formas axiomáticas básicas, acaba en C. Cuando una serie tal existe se dice que C es derivable en el sistema formal a partir de {P1, P2, P3, …}. Y ciertamente, como subrayaremos después, si el sistema formal se construye con esmero, al concluir uno quedará convencido al menos de que todos los argumentos cuya conclusión es derivable de sus premisas (en el sistema) son argumentos lógicamente correctos en el sentido deseado, es decir, uno quedará convencido de que la derivabilidad de la conclusión a partir de las premisas (en el sistema) es una condición suficiente para que un argumento sea un ejemplo de consecuencia lógica. La cuestión de si podemos convencernos de que es también una condición necesaria la trataremos más adelante.

Nuestra comprensión de la relación de derivabilidad en un sistema como el de Frege es sin duda mejor y más clara que nuestra comprensión del concepto de consecuencia lógica. El acercamiento a la noción de consecuencia lógica en términos de la de derivabilidad en ciertos sistemas goza por tanto de un gran atractivo metodológico y explicativo. En gran parte por estos motivos, este acercamiento proporcionó la concepción dominante de la consecuencia lógica entre los lógicos durante largo tiempo después de la obra de Frege. Pero en la lógica ha existido también, ya desde Aristóteles, un tipo de aproximación alternativo, y en cierto modo complementario, a la caracterización de la relación o las relaciones de consecuencia lógica. Este tipo de aproximación se basa plenamente en los dos rasgos intuitivos de la noción de consecuencia lógica. Recordemos que el segundo rasgo consiste en que todo argumento con la misma forma lógica que uno lógicamente correcto es también lógicamente correcto. Como señalamos, esto proporciona una condición necesaria de los argumentos lógicamente correctos, aunque en términos de la noción de consecuencia lógica. Pero también sugiere una condición necesaria en términos de la noción de verdad. Observemos que si un argumento es lógicamente correcto entonces no tiene premisas verdaderas y conclusión falsa; pues si así fuera las premisas no implicarían modalmente a la conclusión (bajo ninguna comprensión plausible de la idea de modalidad) y entonces, por el primer rasgo de la noción de consecuencia lógica, el argumento no sería lógicamente correcto después de todo. Por tanto, por el segundo rasgo de la noción de consecuencia lógica, un argumento es lógicamente correcto sólo si ningún argumento con la misma forma lógica tiene premisas verdaderas y conclusión falsa. Esta es la condición necesaria en términos de la noción de verdad a la que me refería antes; llamémosla ‘(Φ)’.

La aproximación alternativa a la caracterización de la consecuencia lógica usa siempre alguna variante de la condición (Φ), proponiéndola en cada caso como necesaria y suficiente. La caracterización de Tarski es la representante paradigmática de este tipo de aproximación. Tarski (1936) ofreció su caracterización para los lenguajes formales fregeanos, aceptando la noción de forma lógica para argumentos de estos lenguajes implícita en Frege. Sin embargo, el método abstracto de Tarski se puede usar, y se ha usado, para dar caracterizaciones similares incluso para lenguajes que extienden los lenguajes de Frege, o que son simplemente diferentes de ellos.

La propuesta de Tarski consiste en extender el requisito expresado por la condición (Φ) con el objeto de incorporar, al menos parcialmente, la idea de que las letras esquemáticas en la forma lógica de un argumento lógicamente correcto no pueden ser reinterpretadas de tal manera que las premisas se vuelvan verdaderas y la conclusión falsa (y no meramente la idea expresada en (Φ), de que un argumento lógicamente correcto no puede convertirse en uno con premisas verdaderas y conclusión falsa reemplazando las letras esquemáticas de su forma lógica por expresiones en un lenguaje fijado). En otras palabras, Tarski busca incorporar la idea de que una oración O es una consecuencia lógica de un conjunto de oraciones ∑ cuando toda interpretación de las letras esquemáticas en la forma lógica de ∑/O según la cual todas las oraciones de ∑ son verdaderas es una interpretación según la cual O es verdadera. O, como se dice a veces, cuando toda interpretación preserva la verdad de las premisas en la conclusión. Cuando toda interpretación preserva la verdad se dice también que el argumento es válido. Si un argumento es válido, entonces, incluso si no es lógicamente correcto, la conclusión se puede inferir de las premisas sin miedo de que sea falsa si las premisas son verdaderas. De manera que todos los argumentos válidos son correctos al menos en este sentido.

Tarski propuso una versión matemáticamente manejable de la noción de validez usando el aparato desarrollado por él para dar definiciones matemáticas de conceptos “semánticos”, como los de satisfacción, definibilidad y verdad. El método de Tarski se basa en definir, de una manera análoga a la manera como él mismo define verdad para un lenguaje en Tarski (1935), la noción de verdad en una estructura conjuntista. Para una oración de un lenguaje fregeano, una estructura es un objeto conjuntista que incluye una asignación de denotaciones a las letras esquemáticas de su forma lógica, además de un conjunto de objetos del que se extraen esas denotaciones y que proporciona el rango o recorrido de las variables de primer orden e induce recorridos para las variables de órdenes superiores. Por ejemplo, un ejemplo de estructura para el lenguaje que consta de las letras ‘a’, ‘P’ y ‘Q’ es el objeto conjuntista <{Aristóteles, Frege, Tarski}, ‘a’→Frege, ‘P’→{Aristóteles, Frege}, ‘Q’→{Tarski}>; en esta estructura, el conjunto {Aristóteles, Frege, Tarski} es el recorrido de las variables, Frege es la denotación de ‘a’, el conjunto {Aristóteles, Frege} es la denotación de ‘P’, y el conjunto {Tarski} es la denotación de ‘Q’.

La condición por medio de la cual se caracteriza la consecuencia lógica para el lenguaje relevante es entonces la siguiente:

(VT) Toda estructura en la que todas las oraciones del conjunto ∑ son verdaderas es también una estructura en la que la oración O es verdadera. (Abreviemos esta condición por medio de la notación ‘ValT(∑,O)’.)

‘VT’ significa “validez tarskiana”. El subíndice ‘T’ se usa para subrayar que ‘ValT(∑,O)’ denota la validez tarskiana y que esta es posiblemente diferente de otras nociones de validez, basadas en otras nociones de interpretación. Tal como uso aquí la noción de interpretación que aparece en la caracterización de la validez, esta es una noción imprecisa e intuitiva, mientras que la noción de estructura que aparece en una caracterización de la validez tarskiana es una noción técnica bastante precisa. A todo lenguaje formal fregeano se le puede proporcionar una condición de validez tarskiana usando el método de Tarski. Lo mismo es verdad de muchos lenguajes diferentes de los fregeanos, y para los cuales se han dado nociones razonables de estructura. (Un ejemplo estándar lo proporcionan los lenguajes de las lógicas modales; véase, v.g., Hughes y Cresswell, 1996.) Cuando una noción de estructura es razonable, está claro que toda estructura modela la capacidad de una o varias interpretaciones de hacer verdaderas las premisas y falsa la conclusión de algún argumento.

3. Las relaciones entre derivabilidad y validez

3.1. Corrección y compleción

Como señalamos antes, si uno construye un sistema formal con cuidado, uno podrá convencerse de que todos los argumentos cuya conclusión es derivable de sus premisas son argumentos lógicamente correctos en el sentido deseado. La razón de esto es que uno puede usar su intuición de un modo muy sistemático para obtener ese convencimiento: uno puede incluir en su sistema axiomas que le parezcan a uno consecuencias lógicas de cualquier conjunto de premisas; y uno puede incluir como reglas de derivación de su sistema reglas que le parezca a uno que producen oraciones que se siguen lógicamente de las oraciones a las que se aplican. Entonces, dada la definición de derivabilidad para el sistema formal que vimos más arriba, es inmediatamente claro para uno que no se podrá derivar de un conjunto de oraciones ninguna oración que no se siga lógicamente de ese conjunto de oraciones. Empleando otra terminología, que se explica a sí misma, podemos decir que si uno construye su sistema formal con cuidado, la caracterización correspondiente en términos de derivabilidad (en ese sistema) es correcta con respecto a la noción deseada de consecuencia lógica—o, simplemente, que la derivabilidad es correcta con respecto a la consecuencia lógica.

De igual modo, es intuitivamente obvio que si uno tiene a mano una noción tarskiana de validez para un lenguaje dado, entonces todos los argumentos lógicamente correctos (del lenguaje) serán argumentos válidos en el sentido tarskiano. La razón es simple: si un argumento no es válido en el sentido tarskiano entonces hay una estructura, y por tanto una interpretación, que hace verdaderas sus premisas y falsa su conclusión. Por tanto sería en principio posible construir un argumento de la misma forma lógica, cuyos términos tendrían denotaciones lógicamente posibles, y que tendría premisas verdaderas y conclusión falsa. Pero el segundo rasgo intuitivo de la noción de consecuencia lógica implica que si el argumento original era lógicamente correcto entonces no hay ningún argumento de la misma forma lógica con premisas verdaderas y conclusión falsa. Habiendo concluido que todos los argumentos lógicamente correctos son válidos en el sentido tarskiano, podemos decir, empleando otra terminología, que la caracterización en términos de validez tarskiana es completa con respecto a la noción de consecuencia lógica—o, simplemente, que la validez tarskiana es completa con respecto a la consecuencia lógica.

Usemos las siguientes dos abreviaturas: ‘DerS(∑,O)’ para ‘O es derivable de ∑ en el sistema formal S’, y  ‘CL(∑,O)’ para ‘O es consecuencia lógica (en el sentido preteórico en juego) de ∑’. Entonces, si S es un sistema formal construido con cuidado, la situación a la que hemos llegado se resume en el siguiente diagrama:

(1)  DerS(∑,O)  ⇒  CL(∑,O)  ⇒  ValT(∑,O).

La primera implicación es la corrección de la derivabilidad con respecto a la consecuencia lógica; la segunda implicación es la compleción de la validez tarskiana con respecto a la consecuencia lógica. Ahora bien, para convencernos de que las caracterizaciones de la consecuencia lógica en términos de DerS(∑,O) y ValT(∑,O) son apropiadas tendríamos que convencernos también de las implicaciones conversas:

(2)  ValT(∑,O)  ⇒?  CL(∑,O)  ⇒?  DerS(∑,O),

o sea de que la validez tarskiana es correcta con respecto a la consecuencia lógica, y de que la derivabilidad es completa con respecto a la consecuencia lógica. Convencerse de que esto es el caso, o de que no es el caso, resulta ser una tarea difícil (quizá sorprendentemente difícil) para un buen número de lenguajes. Hay sin embargo una manera de convencerse en algunos casos de que las implicaciones con interrogante se dan de hecho. Esa manera de convencerse se basa en una observación sencilla pero profunda de Kreisel (1967).

3.2. La observación de Kreisel

Hay una cantidad considerable de lenguajes formales para los que existen nociones de validez tarskiana y de derivabilidad en un sistema S. Entre estos, hay un buen número para los que la validez tarskiana es intuitivamente completa y la derivabilidad correcta con respecto a la noción deseada de consecuencia lógica. En estos últimos casos se dan las implicaciones de (1). Y a su vez, entre estos últimos lenguajes, hay muchos para los que es posible dar una demostración matemática de que la derivabilidad es completa con respecto a la validez tarskiana, o sea una demostración de esta otra implicación:

(3)  ValT(∑,O)  ⇒  DerS(∑,O).

Kreisel llamó la atención sobre el hecho de que (3) (junto con (1)) implica que la validez tarskiana es correcta con respecto a la consecuencia lógica, o sea que se da la primera implicación de (2). Esto quiere decir que cuando se da (3) la noción de validez tarskiana ofrece una caracterización apropiada de la de consecuencia lógica. Puede añadirse a lo subrayado por Kreisel que (3) (junto con (1)) implica que la derivabilidad en S es completa con respecto a la consecuencia lógica, o sea que se da la segunda implicación de (2). Esto quiere decir que cuando se da (3) la noción de derivabilidad en un cierto sistema ofrece también una caracterización apropiada de la noción deseada de consecuencia lógica.

Un caso especialmente significativo en el que, bajo ciertos supuestos razonables acerca de la idea preteórica de consecuencia lógica, se da la implicación (3) (para ciertos sistemas formales S) y las implicaciones (1), y por tanto se dan las implicaciones (2), es el de los lenguajes cuantificacionales de primer orden. Eso quiere decir que uno puede convencerse de que tanto la noción de derivabilidad como la de validez tarskiana (definidas de un modo apropiado para esos lenguajes) son caracterizaciones apropiadas de una cierta noción preteórica razonable de consecuencia lógica para los lenguajes de primer orden.

3.3. Incompleción

La situación no es tan clara en otros lenguajes especialmente significativos para la tradición lógica: los cuantificacionales de órdenes superiores a 1. Es posible demostrar que ya para un lenguaje de segundo orden no hay un sistema formal S que haga verdadero (3) cuando la derivabilidad en S es correcta con respecto a la validez tarskiana—para la noción de validez tarskiana como se define usualmente para un lenguaje tal. Podemos llamar a este resultado la incompleción de los sistemas formales de segundo orden con respecto a la validez tarskiana. De hecho vale un resultado más fuerte: no hay un conjunto de oraciones de segundo orden para el cual un sistema formal correcto con respecto a la validez tarskiana permita la derivación de todas las consecuencias tarskianas del conjunto; dicho de otra manera: para todo conjunto de oraciones ∏ y todo sistema formal S correcto con respecto a la validez tarskiana hay una oración O tal que ValT(∏,O) pero no es el caso que DerS(∏,O). Podemos llamar a este resultado la incompleción fuerte de los sistemas formales de segundo orden con respecto a la validez tarskiana.

En esta situación no es posible aplicar el argumento de Kreisel para concluir (2). De hecho, la incompleción de los sistemas formales de segundo orden muestra que, dado cualquier sistema formal S que satisfaga (1), una de las implicaciones de (2) es falsa (o ambas lo son): o la derivabilidad en S es incompleta con respecto a la consecuencia lógica o la validez tarskiana es incorrecta con respecto a la consecuencia lógica. Una conclusión similar vale para la incompleción de los sistemas formales para lenguajes clásicos de órdenes superiores y para otros lenguajes que incluyan a estos. Diferentes autores han extraído moralejas diferentes de la incompleción. Una reacción común (v.g. la de Etchemendy (1990)) es pensar que la validez tarskiana debe ser incorrecta con respecto a cualquier noción razonable de consecuencia lógica, pero en general no hay argumentos plenamente satisfactorios en defensa de esta tesis o de la tesis alternativa (defendida, v.g., por Tarski) de que la derivabilidad (en cualquier sistema correcto para la validez tarskiana) es incompleta con respecto a una noción razonable de consecuencia lógica. (Sobre esta cuestión puede verse Gómez Torrente (1998/9).

Mario Gómez Torrente
(Instituto de Investigaciones Filosóficas, UNAM)

Referencias

  • Beall, J.C. y G. Restall (2006): Logical Pluralism, Clarendon Press, Oxford.
  • Etchemendy, J. (1990): The Concept of Logical Consequence, Cambridge Mass., Harvard University Press,
  • Gómez Torrente, M. (1998/9): “Logical Truth and Tarskian Logical Truth”, Synthèse, 117, pp. 375-408.
  • Hughes, G. E. y M. J. Cresswell (1996): A New Introduction to Modal Logic, Routledge, Londres.
  • Kreisel, G. (1967): “Informal Rigour and Completeness Proofs”, en I. Lakatos, comp., Problems in the Philosophy of Mathematics, North-Holland, Ámsterdam, pp.138-171.
  • Quine, W. V. (1970): Philosophy of Logic, Prentice-Hall, Englewood Cliffs, N.J.
  • Tarski, A. (1935): “The Concept of Truth in Formalized Languages”, en Tarski, A. (1983): Logic, Semantics, Metamathematics, 2ª ed., Hackett, Indianápolis, pp. 152-278.
  • Tarski, A. (1936): “On the Concept of Logical Consequence”, en Tarski (1983), pp. 409-420. [Tarski, A. (1984): “Sobre el concepto de consecuencia lógica”, trad. por L. Vega Reñón, en Vega Reñón L. y P. Castrillo, comps., Lecturas de Lógica II, UNED, Madrid,pp. 178-192.
  • Tarski, A. (1983): Logic, Semantics, Metamathematics, 2a ed., Hackett, Indianápolis.
  • Varzi, A. (2002): “On Logical Relativity”, Philosophical Issues, 12, pp. 197-219.

Lecturas recomendadas en castellano

  • Badesa, C., I. Jané y R. Jansana (1998): Elementos de lógica formal, Ariel, Barcelona.
  • Frápolli, M. J., coord., (2007): Filosofía de la lógica, Tecnos, Madrid.
  • Gómez Torrente, M. (2000): Forma y modalidad. Una introducción al concepto de consecuencia lógica, Buenos Aires, Eudeba.
  • Haack, S. (2001): Filosofía de las lógicas, Cátedra, Madrid.
  • Kneale, W. y M. Kneale (1972): El desarrollo de la lógica, Tecnos, Madrid.
  • Manzano, M. (1996): Extensions of First-Order Logic, Cambridge, Cambridge University Press.
  • Sagüillo, J. M. (2007): “Validez y consecuencia lógica. La concepción clásica”, en Frápolli, M. J., (2007): Filosofía de la Lógica, Tecnos, Madrid, pp.55-81.
  • Sainsbury, M. (2001): Logical Forms: An Introduction to Philosophical Logic, 2a ed., Blackwell, Oxford.

Entradas relacionadas

Pluralismo lógico

Silogística

Cómo citar esta entrada

Gómez-Torrente, Mario (2018) «Consecuencia lógica»,  Enciclopedia de la Sociedad Española de Filosofía Analítica (URL:http://www.sefaweb.es/consecuencia-logica).