Archivo de la categoría: Letras

El tiempo

1. La naturaleza y estructura del tiempo

Los filósofos se hacen muchas preguntas sobre el tiempo. Para empezar, está la pregunta socrática: ¿qué es el tiempo? Como en el caso del espacio y los puntos en el espacio, se puede pensar en el tiempo como un tejido compuesto por instantes de tiempo que existen independientemente uno del otro; o, de lo contrario, se puede pensar en el tiempo como una estructura de instantes de tiempo interrelacionados, donde esos instantes de tiempo no son más que puntos en esa estructura y, por lo tanto, no podrían existir sin el resto de esa estructura. El tiempo también se caracteriza a menudo como una dimensión: a saber, la dimensión a lo largo de la cual se desarrollan los cambios; vamos a decir más sobre la noción de cambio más adelante.

Hay otras preguntas igualmente profundas sobre la estructura del tiempo. Por ejemplo: ¿el tiempo tiene una dirección? O: ¿el tiempo tiene un principio o un final? ¿Podría tener una estructura circular? Más adelante consideraremos una de esas preguntas, a saber, si el tiempo es lineal o más bien se ramifica hacia el futuro.

A principios del siglo XX, el filósofo británico John M. E. McTaggart observó que hay dos formas distintas de ordenar instantes temporales o cosas en el tiempo (McTaggart, 1908). Podemos ordenar dos elementos distintos según si uno precede (o es anterior) al otro. McTaggart llamó a este ordenamiento la «serie-B». Por otra parte, también podemos ordenar dichos elementos diciendo de cada uno si es presente, pasado o futuro. Este ordenamiento es lo que McTaggart llamó la «serie-A». McTaggart planteó después la pregunta metafísica sobre cuál de estos ordenamientos es más fundamental.

La serie-B es permanente en el siguiente sentido: para dos instantes de tiempo o cosas en el tiempo, x e y, si xalguna vez precede a y, entonces, siempre cuando ambos existen, x precede a y. Por el contrario, la serie-A no es permanente. Es decir, no pasa que, para todos los instantes de tiempo o cosas en el tiempo, x e y, si x es presente e y es pasado, entonces, siempre cuando ambos existan, x es presente mientras y es pasado. Por ejemplo, el momento de tu lectura de este texto es presente, mientras que el momento de tu nacimiento ya pasó. Pero en algún momento en el pasado, el momento de tu nacimiento era presente, mientras que el momento de tu lectura de este texto no.

McTaggart pensó que la serie-A implicaba la atribución de propiedades como ser presente, ser pasado y ser futuro. Sin embargo, no es necesario que todas ellas sean propiedades básicas. Podemos decir que algo es pasado cuando ha sidopresente y que algo es futuro cuando va a ser presente. Por lo tanto, a lo sumo necesitamos considerar la propiedad de ser presente; y el resto de lo que queremos decir se puede expresar fácilmente usando las conjugaciones temporales del verbo ‘ser’.

2. Pasado, presente y futuro

En la vida ordinaria distinguimos entre el pasado, el presente y el futuro. Por ejemplo, lamentamos que los dodos pertenezcan para siempre al pasado, nos preguntamos qué nos depara el futuro y nos preocupamos por lo que sucede en el presente. Esto suena como si pensáramos en el pasado, el presente y el futuro como sectores de la realidad que pueden contener elementos que los otros sectores no contienen. Pero esta imagen del pasado, el presente y el futuro como contenedores no tiene necesariamente que ser entendida literalmente. La distinción persiste incluso si recurrimos a formas más modestas de expresar, en el fondo, las mismas ideas. Así, podríamos decir que lamentamos que ya no haya dodos -es decir, que solía haber dodos, pero que ninguno existe o volverá a existir-, que nos preguntamos qué va a ocurrir y que nos preocupamos por lo que está sucediendo actualmente. De acuerdo con esto, podemos establecer la distinción mediante flexiones verbales, como en lo que una vez fue el caso, lo que actualmente es el caso y lo que será el caso (cf. Prior, 2019).

Una de las preguntas centrales de la metafísica del tiempo es si esta distinción es objetiva o, más bien, se trata de un mero artefacto de nuestra forma de conceptualizar la realidad desde el punto de vista temporal que ocupamos -aproximadamente de la misma manera en que la distinción entre lo que es el caso aquí y lo que es el caso allá se debe simplemente a nuestra perspectiva espacial contingente desde la cual nos miramos las cosas y eventos en el espacio y los clasificamos en relación con nosotros mismos.

Los ‘teóricos-A’ piensan que si bien puede no haber un contraste objetivo, independiente de la mente, entre lo que es el caso aquí y lo que es el caso allá, sí existe tal contraste objetivo, independiente de la mente, entre lo que era el caso, lo que actualmente es el caso y lo que será el caso. Los ‘teóricos-B’ sostienen que esto es un error y que no hay ninguna razón para un tratamiento desigual del espacio y el tiempo. Según los ‘teóricos-B’, una descripción objetiva del espacio y el tiempo puede ser exhaustiva sin mencionar los contrastes que solo podríamos apreciar desde una perspectiva espacio-temporal particular.

Las diferencias entre estos dos puntos de vista metafísicos se harán más obvias una vez que consideremos dos áreas temáticas de disputa, el cambio y la existencia.

3. Tipos de cambio

Estamos familiarizados con los objetos que experimentan cambios. Los tomates, de la variedad más común, son verdes hasta que maduran, y una vez maduros, son rojos. Fijémonos en un tomate maduro cualquiera: este tomate solía ser verde pero ahora es rojo. Fijémonos ahora en un tomate cualquiera que no sea maduro: este tomate ahora es verde, pero será rojo una vez que haya madurado. Tales patrones de descripciones temporales parecen ser medios adecuados para representar los cambios sufridos por los objetos que persisten a lo largo de estos cambios. Si esto es correcto, también debemos admitir otros tipos de cambio que no involucren objetos persistentes que adquieran propiedades de las que antes carecían, o que pierdan propiedades que tenían anteriormente.

Por ejemplo, también podemos decir que, gracias al uso de vacunas, ahora hay menos casos de hepatitis que nunca, y que pronto no habrá ninguno; o que no había eventos climáticos provocados por el hombre, pero ahora los hay, y habrá en el futuro más eventos de este tipo de los que hay ahora. Estos son también cambios. Pero a menos que pensemos en el mundo como un objeto persistente capaz de sufrir cambios, es muy probable que estos cambios no se entiendan como cambios en objetos persistentes.

Decir que actualmente hay casos de hepatitis, pero que no habrá ninguno en el futuro no es decir que hay un número de humanos que están enfermos pero que se curarán. Y decir que no había eventos climáticos provocados por el hombre, pero ahora los hay, no es decir de tales eventos que sufrieron algún tipo de cambio, ni de ningún grupo particular de humanos que pasaron de no provocar eventos climáticos a provocar eventos climáticos. Además, decir que el número de infecciones de hepatitis actualmente es n, mientras que solía ser el caso de que el número de infecciones de hepatitis era m, siendo m mayor que n, no quiere decir, de ningún conjunto de infecciones de hepatitis, que ha cambiado en número, ni de ningún número que se ha hecho más pequeño de lo que era. Y lo mismo se aplica mutatis mutandis al cambio que describimos cuando decimos que habrá más eventos climáticos provocados por el hombre que los que hay actualmente.

El formato de las descripciones de cambio, en este sentido más general de «cambio», es el siguiente: parte de lo que alguna vez fue el caso, actualmente ya no es el caso, y parte de lo que actualmente es el caso, nunca fue el caso antes; y de manera similar, parte de lo que será el caso, aún no es el caso, y parte de lo que es actualmente el caso, ya no será el caso más adelante. En este sentido más general, los cambios son cambios en lo que es el caso -siendo los cambios en los objetos simplemente una subvariedad de tales cambios (cf. Prior, 2019).

4. Concepciones dinámicas vs estáticas de la realidad

En el debate entre los ‘teóricos-A’ y los ‘teóricos-B’, las dos partes pueden estar de acuerdo en que las descripciones temporales que se acaban de dar -de los cambios en los objetos y, más en general, los cambios en lo que es el caso- son bastante acertadas. Sin embargo, los participantes en el debate no están de acuerdo sobre si la estructura temporal de esas descripciones refleja adecuadamente la estructura de la realidad. Así, según los teóricos-A, una descripción completa y totalmente articulada de la realidad debe usar flexiones verbales temporales. Según los teóricos-B, por el contrario, esto no es así.

Una forma de establecer la distinción entre estas dos posiciones es apelando a la noción de hechos temporales. Para los teóricos-A, en cualquier momento, la realidad incluye hechos temporales; y, en consecuencia, ninguna descripción de la realidad sería completa y totalmente articulada si no incluyera aseveraciones temporales aptas para representar estos hechos. Dado que algunos de estos hechos no siempre se dan, qué descripción temporal de este tipo es correcta cambiará con el tiempo, donde tales cambios en la descripción corresponderán a los cambios en los hechos subyacentes. Por el contrario, los teóricos-B insisten en que lo que hemos denominado «cambios en lo que es el caso» no son realmente variaciones transtemporales de los hechos que existen. Tales «cambios» son, en el fondo, solo combinaciones adecuadas de hechos que se dan eternamente.

Para los teóricos-B, entonces, lo que llamamos «cambios en lo que es el caso» no son realmente cambios en qué hechos se dan. Porque, para ellos, todos los hechos se dan eternamente. Haciéndonos eco de Ludwig Wittgenstein, la realidad es la totalidad de los hechos. En consecuencia, la concepción de la realidad de los teóricos-B es la de un universo estático de hechos. Según los teóricos-A, en contraste, en cualquier momento dado, la realidad está parcialmente compuesta de hechos temporales que no siempre se dan, incluidos hechos que solo se dan una vez (por ejemplo, cuán temporalmente distante se encuentra en este momento un determinado evento en la dirección del pasado o el futuro). Se deduce que, con el tiempo, la realidad misma varía. La concepción teórica-A de la realidad es, por lo tanto, dinámica.

5. Existencia en el tiempo vs ubicación temporal

La caracterización general de la teoría-A dada anteriormente es neutral sobre si la supuesta variación transtemporal de los hechos que hay, incluye alguna variación transtemporal de lo que existe. Los hechos acerca de lo que existe son solo un caso especial de hechos. En otras palabras, la teoría-A es compatible tanto con el supuesto de una ontología permanente como con su rechazo.

Antes de proceder a analizar las posiciones teóricas-A más prominentes sobre la existencia, debemos tener mucho cuidado a la hora de explicar lo que aquí queremos decir con «existencia». En el discurso ordinario, a menudo decimos cosas como «No existieron eventos climáticos provocados por el hombre antes de la Revolución Industrial» o «Los dodos ya no existen». Sin embargo, al reflexionar sobre ello, esta forma de hablar no conlleva ningún compromiso con una tesis ontológica. La ontología tiene que ver con la existencia en el sentido de «existe» en el que este último es equivalente a «es idéntico a algo». Lo que existe en este sentido es lo que está en el rango de nuestros cuantificadores irrestrictos «Todo» y «Algo».

En el discurso ordinario, generalmente, no dudamos en incluir eventos pasados como la Segunda Guerra Mundial dentro del rango de nuestros cuantificadores irrestrictos -ya que consideramos que ese evento es parte de la historia mundial-, y esto independientemente del hecho de que el evento no está ya ocurriendo. Es decir, distinguimos implícitamente entre un evento que actualmente es algo (entre las cosas sobre las cuales se cuantifica) y su ocurrir actualmente. Esa distinción puede aplicarse con igual derecho a eventos futuros (si los hay). De manera similar, distinguimos implícitamente entre cosas como los dodos que actualmente son algo y su estar actualmente entre los seres vivos.

En consecuencia, cuando en conversaciones ordinarias, decimos que no hubo eventos climáticos provocados por el hombre antes de la Revolución Industrial, solo nos comprometemos con que antes de la Revolución Industrial, no ocurrieron tales eventos y no con que no fueran idénticos a algo. Y cuando, en tales conversaciones cotidianas, decimos que los dodos ya no existen, se entiende que nos comprometemos solo con que los dodos ya no están entre los seres vivos y no con que no sean idénticos a algo.

Usemos ‘x está ubicado en el tiempo t‘ de tal manera que sea equivalente a ‘x ocurre en el tiempo t‘ cuando x es un evento, a ‘x está en algún lugar del espacio en el tiempo t‘ cuando x es un trozo de materia, a ‘x está vivo en el tiempo t‘ cuando x es un organismo, etc. Entonces podemos expresar la postura en términos más generales diciendo que las afirmaciones antes mencionadas del discurso ordinario se interpretan de forma natural como atribuyendo ubicaciones temporales (o la falta de tales ubicaciones), en lugar de existencia temporal (o la falta de tal existencia) (cf. Correia y Rosenkranz, de próxima aparición).

Por supuesto, esta observación por sí sola no sugiere a su vez que el discurso ordinario deba tomarse como árbitro cuando se trata de la cuestión ontológica de si existen eventos o cosas pasados o futuros. Lo que muestra es que debemos tener cuidado de no extraer ninguna respuesta a esta pregunta ontológica a partir de nuestras proferencias cotidianas.

6. Ontología permanente vs variación temporal en lo que existe

En el sentido ontológico de «existe», los teóricos-B suelen negar que los hechos que existen varíen a lo largo del tiempo. En consecuencia, no tienen reparos en admitir en su ontología eventos que ocurrieron en el pasado, o que ocurrirán en el futuro. Del mismo modo, los teóricos-B suelen admitir cosas que solían estar o que estarán entre los seres vivos. Para los teóricos-B, siempre, todo existe siempre (Williamson, 2013 cap. 1). Entonces, si en el pasado algún xfue una guerra mundial, o un dodo, x todavía existe (incluso si ya no ocurre o no está vivo); y si en el futuro, algún x será una cura para el cáncer, o una máquina consciente, entonces ya existe (incluso si aún no se ha encontrado o inventado).

Los defensores de la llamada teoría del “foco móvil” coinciden en esto, pero insisten en que todavía hay otra variación factual, por ejemplo la variación en los hechos sobre qué instante de tiempo tiene la propiedad de ser presente. De acuerdo con la teoría del foco móvil, la propiedad de ser presente es sustancial y otorga algún tipo de privilegio metafísico que no puede reducirse a los términos de la teoría-B. A medida que pasa el tiempo, diferentes instantes de tiempo llegan a poseer esa propiedad. Evidentemente, esto puede ser verdad para los instantes de tiempo, aunque ningún instante de tiempo empiece a existir o cese de existir. La teoría del foco móvil combina la teoría-A con el supuesto de una ontología permanente (ver Deasy, 2015 para una discusión más detallada).

Pero hay otras variedades de la teoría-A que característicamente rechazan esa suposición. Tales versiones de la teoría-A rechazan que siempre, todo existe siempre, y por lo tanto afirman que a veces, algo a veces no existe.

La versión más destacada de esta línea es el presentismo. Según los presentistas, siempre, todo en el tiempo está presente. Dado que, en el sentido relevante de estar en el tiempo, los instantes de tiempo están en el tiempo, pero siempre como máximo uno de esos instantes está presente, se deduce que siempre hay como máximo un instante de tiempo, y que tal instante de tiempo está presente. Las cosas en el tiempo que no sean instantes de tiempo están presentes si, y solo si, están ubicadas en el momento presente. El valor de dicha ubicación temporal puede variar entre entidades de diferentes categorías. Como se indicó anteriormente, en el sentido relevante de ubicación temporal, un evento, por ejemplo, se ubica en el momento actual en caso de que ocurra en este momento, mientras que un trozo de materia se encuentra en el momento actual en caso de que ocupe una posición espacial en este momento (ver Correia y Rosenkranz, 2015).

Según la llamada Teoría del Bloque Creciente, siempre todo seguirá existiendo en el futuro, y siempre existe un tiempo que nunca existió en el pasado. La primera mitad de esta tesis asegura que nada se extingue y, por lo tanto, que las cosas pasadas en el tiempo todavía están dentro del rango de nuestros cuantificadores (todavía son algo). La segunda mitad implica que siempre hay un nuevo instante de tiempo que acaba de surgir. Por lo tanto, siempre, aquellas cosas en el tiempo que no se encuentran en ningún instante anterior del nuevo instante son igualmente nuevas. Las dos mitades de la tesis implican conjuntamente que, salvo al comienzo del tiempo -si el tiempo tiene un comienzo- siempre hay un bloque de cosas que no se erosiona al que agregar otras, y siempre hay nuevas adiciones a ese bloque que, por lo tanto, crece continuamente (Correia y Rosenkranz, 2018).

El debate entre la teoría-B, la teoría del foco móvil, el presentismo y la teoría del bloque en crecimiento todavía está en curso, y es probable que se publique un nuevo trabajo mientras leas este texto.

7. El futuro abierto, la bivalencia y la estructura del tiempo

No podemos alterar el pasado; pero el futuro aún puede ser moldeado, al menos en parte, por nuestras elecciones futuras. El pasado está decidido de una vez por todas; el futuro, por el contrario, sigue estando abierto y maleable, al menos en algunos aspectos que nos conciernen, y solo se decidirá respecto a todos esos aspectos cuando llegue el momento y tomemos nuestras decisiones. Esto, en cualquier caso, es una parte integral de nuestra autoconcepción como agentes libres.

Pero, ¿cómo podemos tener la capacidad de dar forma al futuro mediante nuestras elecciones futuras, si cada afirmación sobre el futuro ya es verdadera o falsa? Tales verdades actuales sobre el futuro deben basarse en hechos actuales. Porque, en general, las verdades no “flotan libremente”, sino que están ancladas en la realidad, y lo mismo se aplica a fortiori a las verdades actuales sobre el futuro. Peor aún, si lo que es actualmente verdadero siempre fue verdadero en el pasado, como debe haber sido si, en aquel entonces, cada afirmación sobre lo que entonces era futuro era igualmente verdadera o falsa, entonces la verdad actual de las afirmaciones sobre el actual futuro debe estar basada en hechos pasados, o eso parece. Pero ni esos hechos actuales ni esos hechos pasados son hechos sobre nuestras elecciones futuras (en la medida en que estas elecciones aún no han ocurrido), o si los hechos en cuestión son después de todo hechos sobre estas elecciones futuras, estas elecciones futuras ya no son libres, sino determinadas por los hechos presentes o pasados.

Según el principio de bivalencia cualquier afirmación, independiente de cuál sea su tema, es verdadera o falsa. Ahora, la línea de argumento anterior sugiere un vínculo íntimo entre la verdad presente y lo que está determinado en el presente; y si el futuro está actualmente determinado en todos los aspectos, como parece implicar el principio de bivalencia, entonces, por así decirlo, solo hay un camino hacia adelante, solo un futuro para que las cosas ocurran. Y viceversa: si solo hay una de esas formas futuras, el futuro parecería estar determinado en todos los aspectos. En consecuencia, si el futuro no está actualmente determinado en todos los aspectos, y el principio de bivalencia falla, entonces hay muchas formas de avanzar, muchas formas futuras en que las cosas ocurren. En la medida en que existan algunos aspectos en los que actualmente esté decidido cuál será el caso, las muchas formas futuras en que las cosas ocurren serán exactamente iguales en esos aspectos, pero no en otros; y entonces las afirmaciones sobre el futuro exclusivamente sobre esos aspectos serán de hecho actualmente verdaderas o falsas. Ahora, si en cada instante de tiempo, el tiempo se ramificara en una pluralidad de futuros, y si de cada instante de tiempo solo hay una forma de regresar al pasado, entonces el tiempo tendrá una estructura similar a un árbol, con líneas de tiempo que se superponen en el pasado (el tronco) pero divergen en algún lugar en el futuro (las ramas). Entonces podríamos definir verdad en un instante de tiempo dado como verdad en todas estas líneas de tiempo que pasan a través de este instante (y, en consecuencia, falsedad en un instante de tiempo como falsedad en todas las líneas de tiempo que pasan a través de este instante). En consecuencia, como no está decidido si mañana tomarás cereales para desayunar, sino que es una cuestión que has de decidir cuando amanezca, habrá distintas líneas de tiempo que pasarán por el momento presente -en algunas de las cuales desayunarás cereales y en otras no. La afirmación «Mañana tomarás cereales para desayunar» no será ni verdadera ni falsa. Por el contrario, en la medida en que actualmente está determinado que no vas a desayunar una taza de tornillos, todas estas líneas de tiempo que pasan por el momento presente tienen en común que no vas a desayunar una taza de tornillos al día siguiente. La afirmación «Mañana no desayunarás una taza de tornillos» cuenta como actualmente verdadera (Thomason, 1970).

La mayoría de los filósofos convencidos por la línea de razonamiento aristotélica acepta esta concepción del tiempo como una estructura de ramificación-hacia-adelante en forma de árbol. Después de todo, esta concepción encaja muy bien con las intuiciones que evoca o explota el razonamiento aristotélico. Sin embargo, también hay filósofos del tiempo que continúan pensando en el tiempo de un modo lineal, y que conservan el principio de bivalencia en general y, en cambio, rechazan la idea de que siempre que una afirmación sobre el futuro sea actualmente verdadera, debe existir actualmente (o en el pasado) algún hecho que fundamenta su verdad. Desde su punto de vista, para que tales afirmaciones sean actualmente verdaderas, es suficiente que en el futuro haya hechos adecuados para fundamentar su verdad (Rosenkranz, 2012; Tallant e Ingram, 2015). El debate sobre el futuro abierto continúa abierto.

Fabrice Correia (Universidad de Ginebra)
Sven Rosenkranz (ICREA & Universidad de Barcelona)

Referencias

Correia, F. y S. Rosenkranz (2015): “Presentism without Presentness”, Thought: A Journal of Philosophy, 4(1), pp. 19-27. https://doi.org/10.1002/tht3.153
Correia, F. y S. Rosenkranz (2018): “Nothing to Come – A Defence of the Growing Block Theory of Time”, Synthese Library Series, 395, Cham/Switzerland, Springer Press.
Correia, F. y S. Rosenkranz (forth.): «Temporal Existence and Temporal Location», Philosophical Studies.
Deasy, D. (2015): “The Moving Spotlight Theory”, Philosophical Studies,172, pp. 2073-2089.
McTaggart, J. M. E. (1908): “The Unreality of Time”, Mind, 17, pp. 457-74.
Prior, A. N. (2019): Ensayos sobre filosofía del tiempo, con un prólogo de Kit Fine, trad. por Ignasi Mena, Barcelona, Editorial Alpha Decay.
Rosenkranz, Sven (2012): “In Defence of Ockhamism”, Philosophia – Philosophical Quarterly of Israel, 40, pp. 617-31. [Reimpreso en “In Defense of Ockhamism”, en Fischer, J. M. y P. Todd, eds., Freedom, fatalism, and foreknowledge, New York 2015, Oxford University Press, pp. 343-60].
Tallant, J. y D. Ingram (2015): “Nefarious presentism”, The Philosophical Quarterly, 65, pp. 355-71.
Thomason, Richmond H. (1970): “Indeterminist time and truth-value gaps”, Theoria, 36, pp. 264-281.
Williamson, T. (2013): Modal Logic as Metaphysics, Oxford, Oxford University Press.

Cómo citar esta entrada

Correia, Fabrice y Rosenkranz, Sven (2020) “El tiempo”, Enciclopedia de la Sociedad Española de Filosofía Analítica (URL:http://www.sefaweb.es/el-tiempo/).

Conceptos fenoménicos

Llamamos “conocimiento fenoménico” al conocimiento de nuestras experiencias conscientes: al saber cómo es tener una determinada experiencia. Los conceptos fenoménicos son aquellos asociados a este conocimiento y refieren, de modo introspectivo y directo, a las propiedades fenoménicas de nuestras experiencias. El papel que juegan estos conceptos es esencial en la filosofía de la mente contemporánea en la medida que muchos de sus defensores creen que una explicación adecuada de su naturaleza nos permitirá disipar un sinfín de rompecabezas epistemológicos (sobre la relación de los individuos con sus estados fenoménicos) y metafísicos (que giran en torno a la naturaleza de la consciencia). Estos problemas son dos caras de la misma moneda y una respuesta a uno conlleva, necesariamente, implicaciones para el otro.

Mi objetivo en este artículo es ofrecer una introducción al papel que desempeñan los conceptos fenoménicos en el debate metafísico en torno a la naturaleza de la consciencia. En especial, esta exposición se centra en la Estrategia de los Conceptos Fenoménicos, una de las respuestas fisicistas a los argumentos dualistas cuya conclusión es que no es posible acomodar una explicación de la consciencia en un marco fisicista. Para ello, en §1 describo la tesis central del fisicismo y presento uno de los más célebres argumentos en su contra: el argumento del conocimiento. Enseguida, en §2 expongo qué son los conceptos fenoménicos y en qué difieren de otro tipo de conceptos, en §3 explico el modus operandi de la Estrategia de los Conceptos Fenoménicos en respuesta a los retos dualistas señalados en §1, y en §4 menciono algunas de las objeciones más frecuentes en contra de esta estrategia. Finalmente, en §5 hago una síntesis de los puntos esenciales discutidos en este artículo.

1. El fisicismo y el argumento del conocimiento

El fisicismo es la tesis según la cual la ontología básica del mundo es física. De ello se sigue que no hay verdades sobre la consciencia más allá de las verdades de la física. De acuerdo con el fisicismo, nuestros estados mentales conscientes no son nada más que estados o procesos físicos o funcionales: mi creencia de que está lloviendo afuera ahora mismo, el dolor de muelas que sufrí anoche y el miedo que he tenido esta mañana al ver un perro callejero corriendo agresivamente hacia mí no son nada más que procesos ocurriendo en mi cerebro.

A pesar de la aparente sencillez de la definición que acabo de presentar, es importante dejar claro que el fisicismo es una tesis compleja que está lejos de agotarse en una sola formulación. De hecho, algunas de las formulaciones del fisicismo se basan en nociones muy distintas entre sí, como la realización (los estados mentales son realizados por los estados físicos [Putnam 1975]), la sobreveniencia (los estados mentales son sobrevenientes sobre los estados físicos [Davidson, 1970]), la emergencia (los estados mentales emergen de los estados físicos [Searle, 1984, 1992, 1997]) o incluso, en una versión más extrema y quizás más problemática, la noción de identidad (los estados mentales son idénticos a los estados físicos [Smart, 1959; Place, 1956]). Teniendo en cuenta que, debido a limitaciones de espacio, en este artículo no podré dar cuenta de las diferencias entre cada una de estas formulaciones, tomaré la tesis da la identidad como ejemplo. Asumiré, por tanto, que los estados mentales son idénticos a los estados físicos, aunque el argumento que expongo en §3 deberá aplicarse a cualquier formulación de la tesis fisicista.

A simple vista, el fisicismo contradice nuestras intuiciones preteóricas con respecto a nuestra vida mental. ¿Cómo puede la riqueza de nuestras experiencias más íntimas no ser nada más que procesos físicos ocurriendo en nuestros cerebros? Esta es la pregunta que subyace al problema difícil de la consciencia [the hard problem of consciousness (Chalmers, 1996)]—el problema mente-cuerpo—que sigue protagonizando, a día de hoy, innúmeros debates entre fisicistas y dualistas. Si bien las intuiciones per se no equivalen a argumentos, una teoría que defiende la identidad entre los estados mentales y los estados físicos debe explicar por qué motivo nuestro sentido común respalda la intuición contraria.

Ahora bien, el problema mente-cuerpo no se apoya únicamente en intuiciones. Se han propuesto diversos argumentos epistémicos y modales a fin de demostrar que los estados mentales no son idénticos a los estados físicos y, por ende, que el fisicismo es o bien incoherente, o bien falso. Por una parte, se dice de los primeros que son epistémicos porque establecen un hiato epistemológico—no se puede deducir a priori, de los conceptos y el conocimiento físicos, los conceptos y el conocimiento fenoménicos—y de ahí infieren que ese hiato epistemológico representa un hiato metafísico: los estados fenoménicos no son idénticos a los estados físicos. El último paso de este conjunto de argumentos es inferir, del hiato metafísico, la falsedad del fisicismo (p.ej., Jackson, 1982, 1986; Levine, 1983). Por otra parte, se dice del otro grupo de argumentos contra el fisicismo que es modal porque mantiene que ninguna cantidad de información física sobre cualquier individuo implica lógicamente que ese individuo tenga consciencia. Quienes argumentan así sostienen que hay un mundo posible con individuos físicamente o funcionalmente idénticos a nosotros, pero que difieren profundamente de nosotros en que no tienen vida mental consciente. En consecuencia, asumiendo que todo lo que es concebible es metafísicamente posible, argumentan que si estos individuos son idénticos a nosotros en todos sus aspectos físicos o funcionales y aún así nosotros tenemos algo adicional que ellos no tienen—vida mental consciente—, entonces el fisicismo es falso (p.ej., Chalmers, 1996; Kripke, 1980).

Veamos un célebre argumento del primer grupo—el argumento del conocimiento (Jackson, 1982, 1986)—que nos ayudará a comprender más fácilmente el papel de los conceptos fenoménicos en el debate en torno al problema mente-cuerpo.

El argumento del conocimiento: Mary está confinada en una habitación blanca y negra desde su nacimiento. Dentro de esa habitación, educan a Mary mediante libros y una pantalla, ambos en blanco y negro, y aprende todo lo que hay que saber sobre la naturaleza física del mundo: conoce todos los hechos físicos sobre los humanos y sobre su entorno, y adquiere un conocimiento exhaustivo sobre la neurofisiología de la visión, en especial de la visión cromática. ¿Qué sucede cuándo Mary sale de su habitación y ve por primera vez los colores? ¿Adquiere algún conocimiento nuevo? Si el fisicismo es verdadero, la respuesta ha de ser negativa, puesto que Mary poseía un conocimiento físico exhaustivo antes de ser liberada; creer lo contrario equivale a suponer que hay más por conocer a parte de todos los hechos físicos. Esto es justamente lo que afirman los defensores del argumento del conocimiento. Según su punto de vista, al ver por primera vez los colores Mary adquiere conocimiento de nuevos hechos. Ergo, bajo esta interpretación, el fisicismo es falso.

Uno de los argumentos aducidos por el fisicismo en respuesta al argumento del conocimiento y a otros argumentos que apuntan hacia la misma conclusión busca mostrar que sus defensores no tienen en cuenta la importante distinción entre, por una parte, los conceptos fenoménicos y, por otra, los conceptos físicos. Esta respuesta fisicista ha sido denominada Estrategia de los Conceptos Fenoménicos (de ahora en adelante, ECF). Antes de explicar cómo opera esta estrategia, es imprescindible primero saber qué es un concepto fenoménico y en qué sentido se supone que difiere de otro tipo de conceptos. El apartado siguiente se ocupa de la respuesta a estas dos preguntas.

2. ¿Qué son los conceptos fenoménicos?

Los conceptos fenoménicos son aquellos conceptos que usamos en primera persona, de modo introspectivo y directo, cuando—aunque no solamente cuando—atendemos a nuestros qualia, es decir, las cualidades o propiedades fenoménicas de nuestras experiencias. Se supone, además, que están estrechamente asociados al conocimiento fenoménico que poseemos de ellos, es decir, el tipo de conocimiento que nos permite saber cómo es tener una determinada experiencia. Al haber tenido anoche, por primera vez, un terrible dolor de muelas adquirí no solo el concepto fenoménico DOLOR que refiere directamente a la propiedad de mi experiencia—en este caso, el dolor—, sino que también adquirí conocimiento fenoménico de ese tipo de experiencia: el dolor. (Usaré MAYÚSCULAS para nombrar conceptos y negrita para referirme a las propiedades de la experiencia; en los casos en los que no uso ninguna notación en particular, estoy simplemente empleando palabras que expresan o bien conceptos, o bien experiencias o sus propiedades.)

Pensar en el carácter fenoménico de nuestras experiencias de modo introspectivo y directo es muy distinto a pensar en el mismo fenómeno, digamos, en términos de procesos cerebrales. Pongamos por caso que un neurofisiólogo, pese a sufrir de una enfermedad que le incapacita para sentir dolor, llega a descubrir, tan solo en virtud de sus conocimientos teóricos y de mi conducta, que sufro un dolor punzante en la muela del juicio. El neurofisiólogo será capaz de decirme, “Tú sufres un dolor punzante en tu muela del juicio”, por lo que podría decirse que posee el concepto asociado a experiencias de dolor. Sin embargo, su concepto sería más bien un concepto teórico o físico y no un concepto fenoménico (llamémosle Dolor^[FÍSICO] a este concepto), mientras que el concepto que yo poseo de mi experiencia es un concepto fenoménico (llamémosle Dolor^{[FENOMÉNICO]}). En resumen, el neurofisiólogo y yo tenemos cada uno un concepto diferente, Dolor^[FÍSICO]y Dolor^{[FENOMÉNICO]}, que refieren al dolor de mi experiencia. Ambos conceptos son, por tanto, correferenciales.

Al involucrar esta relación directa con nuestros estados fenoménicos, se supone que los conceptos fenoménicos pueden explicar el conocimiento íntimo y privilegiado de un individuo sobre sus propios estados fenoménicos. En última instancia, este es uno de los rasgos que los distingue de los conceptos físicos como SILLÓN o SATURNO. El concepto fenoménico ROJO, por ejemplo, no es el concepto que usamos para referir a objetos rojos, ni tampoco es el concepto perceptivo que adquirimos al observar objetos de este color. Más bien, es el concepto que refiere al carácter específico de la experiencia de la rojez, es decir, al quale de una clase de experiencias que, en condiciones óptimas, resultan de la exposición al color rojo. De hecho, muchos filósofos—incluso dualistas—han recurrido a estos conceptos a fin de explicar algunos rompecabezas epistemológicos en torno a la relación de los individuos con su vida mental, tales como (i) el contacto directo que estos tienen con sus estados fenoménicos (al aplicar un concepto fenoménico se supone que el individuo está en contacto directo con sus estados fenoménicos, así que una caracterización adecuada de la naturaleza de estos conceptos debe explicar en qué consiste esta relación epistémica especial entre los individuos y sus qualia); (ii) la asimetría epistémica (la presunción según la cual cada individuo tiene un acceso privilegiado, en primera persona, a su vida mental que no es accesible desde una perspectiva de tercera persona); (iii) y la infalibilidad/ incorregibilidad de ciertos juicios de un individuo sobre sus propios estados fenoménicos (por ejemplo, el juicio que uno expresaría naturalmente diciendo “Estoy teniendo este tipo de experiencia ahora mismo”). Por cuestiones de espacio, en este artículo no voy a analizar los méritos de estas explicaciones (para un examen de estos puntos, véase p.ej., Balog, 2009, 2012b). Mi objetivo aquí se enfoca en la otra cara del debate, aquella que se centra en la función de los conceptos fenoménicos en las discusiones acerca del estatus metafísico de la consciencia.

En las últimas décadas se han formulado diferentes caracterizaciones de la naturaleza de los conceptos fenoménicos que buscan responder a variadas cuestiones, entre ellas: ¿Cómo refieren los conceptos fenoménicos? ¿Cuáles son sus condiciones de adquisición/posesión? ¿Qué es lo que distingue los conceptos fenoménicos de los conceptos físicos? De modo esquemático, podemos dividirlas en dos grupos. Tenemos pues, por una parte, las que consideran el hecho de que los conceptos fenoménicos refieren directamente a los estados fenoménicos como el rasgo peculiar que permite distinguirlos de otro tipo de conceptos y, por otra, las que defienden que los conceptos fenoménicos son, al menos en parte, constituidos por un caso particular del tipo de experiencia a la que refieren, tomando así la idea de constitucióncomo su rasgo especial. Del primer grupo forman parte, por ejemplo, las caracterizaciones de conceptos fenoménicos como conceptos de reconocimiento o conceptos deícticos y, del segundo grupo, las caracterizaciones de conceptos fenoménicos como conceptos citacionales o conceptos que, al menos en parte, están constituidos por la experiencia a la que refieren.

A continuación, expondré algunas de las caracterizaciones de conceptos fenoménicos que han recibido más atención en la literatura filosófica.

Conceptos de reconocimiento: son conceptos demostrativos-tipo que tienen la forma <X ES UNA EXPERIENCIA DE ESE TIPO> donde X es una experiencia actual y ese expresa un concepto fenoménico que refiere a una propiedad fenoménica de la que X es caso particular. Según esta caracterización, la referencia de los conceptos fenoménicos está determinada por las habilidades de los individuos de reconocer una experiencia como perteneciendo a un determinado tipo sin recurrir a información o conocimiento teórico. Loar (1990/1997), Carruthers (2004) y Levin (2007) han sugerido versiones de esta caracterización.

Conceptos deícticos: son conceptos análogos a los conceptos como ESTO, AQUÍ y AHORA. Bajo esta caracterización, el uso de los conceptos fenoménicos es similar a un gesto ostensivo interno y tienen la forma <ESTE TIPO DE EXPERIENCIA>, lo cual involucra una conexión a priori con el concepto de primera persona: al expresar que estoy teniendo <ESTA EXPERIENCIA>, sé a priori que estoy teniendo esta experiencia. Algunos defensores de los conceptos fenoménicos como conceptos deícticos son, por ejemplo, Ismael (1999), O’Dea (2002), Perry (2001) y Shröer (2010).

Conceptos constitucionales/citacionales: son conceptos constituidos, al menos en parte, por un caso particular del tipo de experiencia a la que refieren. Según esta caracterización, el concepto fenoménico DOLOR refiere a un tipode experiencia—la experiencia de dolor—y es en parte constituido por un caso particular de ese tipo de experiencia. Papineau (2002, 2007), Block (2007), Balog (2012a,b) han formulado versiones diferentes de esta caracterización. Del mismo modo, algunos dualistas, entre ellos Chalmers (2003) y Fürst (2014), también han defendido que los conceptos fenoménicos son en parte constituidos por la experiencia a la que refieren.

Otras caracterizaciones: A parte de las caracterizaciones mencionadas, algunos filósofos han defendido que los conceptos fenoménicos son conceptos condicionales, es decir, que refieren a estados no-físicos si estos estados existen y, si no existen, refieren a estados físicos (p.ej., Hawthorne, 2002; Braddon-Mitchell, 2003). A su vez, otros han argumentado que lo que distingue los conceptos fenoménicos de los conceptos físicos son las condiciones que justifican su aplicación (p.ej., Hill, 1997; Hill & McLaughlin, 1997). Una alternativa diferente inspirada en el enfoque teórico-informacional de Dretske y que relaciona los conceptos fenoménicos con los conceptos sensoriales ha sido también desarrollada por Aydede & Güzeldere (2005).

Cada una de las caracterizaciones anteriores responde de manera distinta a las cuestiones sobre cómo refieren estos conceptos, cómo explican la relación epistémica de un individuo con sus estados fenoménicos y por qué motivo las conclusiones ontológicas de los argumentos dualistas no son correctas. No obstante, dejando de lado las pequeñas diferencias, podemos aislar dos rasgos de los conceptos fenoménicos compartidos por la gran mayoría de estas caracterizaciones:

Dependencia de la experiencia: se supone que los conceptos fenoménicos son perspectivistas, es decir, que requieren la perspectiva del individuo sobre el carácter fenoménico de sus propias experiencias. Esto implica que para poseer un concepto fenoménico P el individuo necesita haber tenido la experiencia relevante para P. Puesto que los conceptos físicos no ofrecen la perspectiva de primera persona sobre las propiedades de la experiencia, su posesión no permite explicar cómo es para un individuo tener una determinada experiencia.

Aislamiento conceptual: se piensa que los conceptos fenoménicos están conceptualmente aislados de los conceptos físicos, así que no es posible inferirlos a priori a partir de los últimos. Esto significa que no debemos esperar una explicación de la consciencia fenoménica a partir de información proveniente de la física, por muy exhaustiva que sea.

La ECF se apoya en estos dos rasgos para responder a los retos dualistas mencionados en el apartado anterior. A continuación, veremos en qué consiste esta estrategia, cómo responde a estos argumentos y sus ventajas frente a otras estrategias fisicistas. En §4 mencionaré algunas de las objeciones más frecuentes a la ECF.

3. La estrategia de los conceptos fenoménicos

La ECF consiste en un intento teórico que recurre a la diferente naturaleza de los conceptos fenoménicos y físicos a fin de argumentar que la existencia del hiato epistémico señalado por muchos filósofos es consistente con la verdad del fisicismo. Usando las palabras de Sundström (2011), se trata de una estrategia defensiva, puesto que opera bajo la convicción de que tenemos buenas razones para aceptar el fisicismo buscando rebatir los argumentos que lo rechazan. Su objetivo no es proveer una defensa del fisicismo por encima de otras tesis metafísicas, sino más bien demostrar que hay una explicación de la consciencia fenoménica compatible con el fisicismo.

Muchos filósofos, entre ellos Nagel (1974) y Jackson (1982, 1986), han reconocido la importancia de los conceptos fenoménicos para el debate en torno al problema mente-cuerpo. Sin embargo, el primer intento de formular una explicación de estos conceptos y usarla como respuesta a los argumentos dualistas se debe a Loar, quien en el artículo “Phenomenal States” (1990, 1997) sugiere que el problema mente-cuerpo no tiene necesariamente repercusiones metafísicas, pudiendo ser entendido como una consecuencia de nuestra forma especial de concebir, en primera persona, nuestros estados conscientes: un mismo estado mental puede ser concebido de modo físico, empleando conceptos físicos, y de modo fenoménico, empleando conceptos fenoménicos. A juicio de Loar, esta diferencia conceptual no representa un cambio en la referencia de ambos conceptos, sino dos formas distintas de concebir una misma entidad. La idea central de la ECF es justamente la de que aceptar un dualismo conceptual no involucra rechazar un monismo ontológico. En definitiva, el filósofo dualista falla en su análisis al no tener en cuenta la diferente naturaleza de estos dos tipos deconceptos, de ahí que sus argumentos no conllevan necesariamente un rechazo del fisicismo.

Teniendo en cuenta el dualismo conceptual que está en la base de la ECF y los dos rasgos de los conceptos fenoménicos mencionados anteriormente—la dependencia de la experiencia y el aislamiento conceptual—, veamos en qué consiste la respuesta fisicista al argumento del conocimiento aludido en §1.

En su respuesta al argumento del conocimiento, el defensor de la ECF mantiene que Mary experimenta un progreso epistémico al ver por primera el color rojo, puesto que este conocimiento no podría ser derivado a priori del conocimiento físico exhaustivo que poseía dentro de su habitación blanca y negra. Este conocimiento fenoménico que adquiere nada más salir de la habitación y que le permite saber cómo es ver rojo requiere una perspectiva singular del propio individuo sobre la rojez de la experiencia, por lo que solo es posible adquirirlo a posteriori, es decir, tras haber tenido la experiencia de la rojez. No obstante, según el fisicista, Mary no adquiere conocimiento de nuevos hechos o entidades al ver por primera vez rojo; más bien, adquiere un nuevo concepto—el concepto fenoménico Rojo—que le permite tener nuevos pensamientos sobre los mismos hechos en los cuales pensaba dentro de su habitación empleando únicamente conceptos físicos. Asimismo, la situación post-liberación de Mary es la de quien posee dos conceptos que refieren a una mismaentidad. Esto, argumentan los defensores de la ECF, es compatible con el fisicismo.

Ahora bien, en el primer párrafo he dicho que la ECF es una estrategia defensiva por contraste con otras estrategias fisicistas. Diré un poco más sobre esto, dado que nos ayudará a ver su atractivo frente a otras estrategias análogas.

La ECF es defendida por un grupo de filósofos llamados fisicistas a posteriori o de tipo-B, usando la expresión de Chalmers (1996). Estos están de acuerdo con el dualista al mantener que los enunciados de identidad psicofísica, como “dolor = estado cerebral p”, son excepcionales en contraste con los enunciados de identidad teórica, como “agua = H₂O”, porque involucran conceptos de tipo diferente: conceptos fenoménicos y conceptos físicos. Debido a esta diferencia conceptual resulta que no se puede conocer a priori, a través del análisis conceptual de los conceptos involucrados, los enunciados psicofísicos, al contrario de lo que sucede con los enunciados físicos. Con esto se quiere decir que el conocimiento de los enunciados psicofísicos depende de investigaciones empíricas (p.ej., Papineau, 2002, 2007; Block, 2007; Loar, 1990,1997; Balog, 2012a,b). Es más, al igual que los dualistas, estos fisicistas se oponen al llamado fisicismo a priori o de tipo-A que niega el carácter excepcional de los enunciados de identidad psicofísica (p.ej., Dennett, 1991; Jackson, 1995, 1998; Dretske, 1995; Lewis, 1990). Según este fisicismo no-excepcionalista, no hay nada de especial en los enunciados psicofísicos que nos impida conocerlos a priori. Al contrario del fisicista a posteriori, el fisicista a prioriadopta una estrategia deflacionaria al responder a los argumentos dualistas, puesto que no recurre a conceptos fenoménicos. En su respuesta al argumento del conocimiento, el fisicista a priori mantiene que al ser liberada de la habitación blanca y negra Mary no adquiere nuevo conocimiento proposicional—es decir, no adquiere nuevos conceptos—, sino solamente nuevas habilidades (p.ej., Lewis, 1983, 1988; Nemirow, 1980, 1990, 2007).

A estas dos estrategias podemos añadir otra defendida por un grupo de filósofos comúnmente llamados “misteriosistas” [mysterians] (p.ej., McGinn, 1989). Estos comparten la intuición de que los enunciados psicofísicos son excepcionales en contraste con los enunciados físicos, pero sostienen que, debido a nuestras limitaciones cognitivas, nuestros conceptos y teorías actuales fallan en captar adecuadamente esta excepcionalidad. Esta limitación cognitiva es lo que, en última instancia, explica el carácter elusivo de la consciencia.

Podemos ver que los fisicistas a posteriori y los misteriosistas hacen hincapié en la excepcionalidad de los enunciados de identidad psicofísica también compartido por los dualistas. La diferencia entre ambos estriba en que mientras el misteriosistas cree que hay una teoría capaz de explicar la necesidad y la transparencia de las identidades psicofísicas, como “dolor = estado cerebral p”, de modo similar a las identidades teóricas, como “agua = H₂O”—aunque mantiene que nuestras capacidades cognitivas son demasiado limitadas para que podamos llegar a conocerla—, el fisicista a posteriori rechaza tajantemente la creencia en una presunta teoría que explique la identidad de enunciados del primer tipo. En cambio, apoyándose en la naturaleza distinta de los conceptos físicos y fenoménicos que hemos visto arriba, el argumento del fisicista a posteriori es que no debemos esperar encontrar una teoría que explique a priori enunciados de identidad psicofísica del mismo modo que encontramos una teoría que explica a priori enunciados de identidad teórica, justamente porque los enunciados del primer tipo, al contrario de los enunciados teóricos, involucran conceptos de naturaleza muy distinta. Es esa naturaleza distinta que impide que se pueda inferir, a partir de los conceptos físicos, los conceptos fenoménicos.

A mi juicio, la ECF es más atractiva que las demás estrategias fisicistas por los siguientes motivos. Por una parte, respeta nuestras intuiciones preteóricas de que la riqueza de nuestra fenomenología no se captura con una explicación exhaustiva del funcionamiento del cerebro. Por consiguiente, esta estrategia elude las criticas frecuentes al fisicismo a priori de que no toma en serio el problema difícil de la consciencia e intenta eliminar el problema en lugar de explicarlo. Por otra parte, al sugerir que podemos explicar por qué motivo hay un problema difícil de la consciencia recurriendo a la diferente naturaleza de los conceptos involucrados en los enunciados de identidad psicofísica, esta estrategia elude igualmente las objeciones usuales al misteriosismo que sostienen que la complejidad del problema difícil de la consciencia no implica que este sea intratable a causa de nuestras limitaciones cognitivas. Es más, es conveniente recordar que la motivación de la ECF no es argumentar en favor de una metafísica fisicista por encima de otras tesis metafísicas. Más bien, lo que sus defensores buscan es demostrar que los estados fenoménicos pueden ser idénticos a los estados físicos, aunque su conexión no se pueda conocer a priori y, por ende, que una explicación de la consciencia es compatiblecon el fisicismo. Al alcanzar esta explicación, el fisicista habrá hecho todo lo que tenía que hacer para defender el fisicismo.

No todos los filósofos se han dejado convencer del éxito de la ECF. En los últimos años, la ECF ha enfrentado duras objeciones provenientes tanto de fisicistas como de dualistas. Antes de terminar este artículo, mencionaré en el siguiente apartado algunas de las más importantes.

4. Críticas a la estrategia de los conceptos fenoménicos

4.1. Dependencia de la experiencia y aislamiento conceptual

Pongamos por caso que, a causa de la radiación cósmica, una réplica molecularmente idéntica a mí misma surge ahora mismo de la nada y es inmediatamente aprisionada en una habitación blanca y negra sin acceso a experiencias de color. ¿Posee mi réplica el concepto fenoménico ROJO? Aunque mi réplica nunca ha tenido tales experiencias, nuestra intuición parece decirnos que posee el concepto fenoménico ROJO puesto que yo poseía ese mismo concepto en el exacto momento en que ella súbitamente surgió a partir de mi.

Dennett (2007) formuló un experimento mental parecido a fin de argumentar que, si nuestra intuición no falla, tendremos que aceptar la conclusión de que es posible para un individuo llegar a poseer un concepto fenoménico sin jamás haber tenido la experiencia relevante. En la misma línea, Tye (2000, p. 27) sugirió que los conceptos fenoménicos podrían ser implementados en los cerebros de los individuos por medio de la neurocirugía o como fruto de un milagro. Otros filósofos han planteado argumentos distintos basados en el externismo semántico que ponen en duda la tesis de la necesidad de la experiencia para la posesión de los conceptos fenoménicos. Ball (2009) y Tye (2009), por ejemplo, han aplicado los célebres argumentos de Burge (1979) en favor del externismo social a los conceptos fenoménicos y, en consecuencia, han defendido que los conceptos fenoménicos, al igual que muchos de nuestros conceptos comunes, son deferenciales. Dicho de modo muy sencillo, esto quiere decir que un individuo puede adquirir un dado concepto fenoménico P únicamente en virtud del intercambio lingüístico con otros hablantes sin haber tenido la experiencia relevante para P. En otras palabras, el individuo puede, por ejemplo, adquirir el concepto fenoménico Dolor tan solo en virtud del intercambio lingüístico con otros hablantes sin nunca haber tenido la experiencia de dolor. Estos escenarios ponen en jaque la tesis de la necesidad de la experiencia para la posesión de los conceptos fenoménicos.

Imaginemos ahora que un individuo se expone a un amplio rango de diferentes matices de azul, de modo que adquiere los conceptos fenoménicos correspondientes a cada uno de estos matices. No parece descabellado creer que ese individuo es capaz de inferir un concepto fenoménico de un matiz intermedio de azul a partir de otros matices más oscuros y más claros que haya observado previamente, aunque no haya tenido la experiencia visual de ese matiz en particular. Esta posibilidad fue planteada por David Hume en sus Tratado de la Naturaleza Humana y Investigación sobre el Conocimiento Humano y, a simple vista, nos invita a dudar de la necesidad de la experiencia para la posesión de los conceptos fenoménicos.

No obstante, hay que prestar atención al hecho de que el escenario planteado por Hume difiere de los anteriores, pues lo único que asume es que un individuo puede inferir nuevos conceptos fenoménicos a partir de otros conceptos fenoménicos que posee de antemano. Los últimos, a su vez, son adquiridos gracias a la experiencia, así que este escenario por sí mismo no representa una amenaza estricta a la tesis de la necesidad de la experiencia para la posesión de los conceptos fenoménicos.

En cualquier caso, podemos concluir que la tesis de la dependencia de la experiencia es un punto problemático de la ECF. Si una defensa del fisicismo depende realmente de esta tesis, no cabe duda de que necesitamos con urgencia una formulación más precisa del criterio de adquisición y posesión de los conceptos fenoménicos. De hecho, esto es así independientemente de si nos convencen o no los argumentos que he mencionado en este apartado. Algunos filósofos mantienen que, como sucede en el caso de los conceptos fenoménicos, es posible que la posesión de otro tipo de conceptos—por ejemplo, deícticos o perceptivos—requiera también la exposición del individuo a las características relevantes de su entorno y que, además, es igualmente posible que estos conceptos estén también conceptualmente aislados (p.ej., Loar, 1990,1997; Levine, 2001). Asimismo, no queda claro cuál es exactamente la especificidad de los conceptos fenoménicos frente a los conceptos físicos.

4.2. El dilema de Chalmers

Chalmers (2007) argumentó que el defensor de la ECF debe aceptar, simultáneamente, dos principios:

Los conceptos fenoménicos explican la relación epistémica de los individuos con sus estados fenoménicos.
Los conceptos fenoménicos son físicamente explicables.

Chalmers argumenta que ninguna versión de la ECF satisface ambos desiderata. Para desarrollar su argumento, nos invita a suponer que C es la tesis según la cual los humanos tenemos conceptos fenoménicos y P representa el conjunto de todas las verdades físicas del universo. Enseguida, plantea la pregunta: ¿es P & ~C concebible? El fisicista tiene dos salidas posibles:

Responder afirmativamente y aceptar que los conceptos fenoménicos están conceptualmente aislados de todas las verdades físicas.
Responder negativamente y aceptar que los conceptos fenoménicos no están conceptualmente aislados de todas las verdades físicas.

Chalmers argumenta que cualquiera de las opciones arriba conlleva consecuencias inaceptables para el fisicismo. Por una parte, si bien (a) acepta que los conceptos fenoménicos explican la relación epistémica de los individuos con sus estados fenoménicos, mantiene que los conceptos fenoménicos están conceptualmente aislados de las verdades físicas y, por tanto, no son físicamente explicables, de modo que la opción (a) no explica la premisa (ii) del dilema. Por otra parte, (b), al sostener que los conceptos fenoménicos no están conceptualmente aislados de todas las verdades físicas y, por consiguiente, son derivables a partir de ellas, sugiere que es concebible un escenario en el que los zombis—seres físicamente o funcionalmente idénticos a nosotros, pero que no tienen consciencia fenoménica—tienen conceptos fenoménicos. No obstante, los zombis no son concebibles de este modo, es decir, como seres epistémicamente relacionados con la consciencia fenoménica, así que la opción (b) no explica la premisa (i) del dilema. De aquí Chalmers concluye que el defensor de la ECF confronta un dilema: los conceptos fenoménicos o bien explican la relación epistémica de los individuos con sus estados fenoménicos, o bien pueden ser explicados físicamente.

Varios filósofos han respondido a este dilema. Diaz-León (2010), por ejemplo, ha argumentado que la conclusión de Chalmers, a pesar de ser verdadera, no representa ningún problema para la ECF, puesto que “la ECF no tiene por qué explicar nuestra situación epistémica completa, sino solamente que hay una desconexión inferencial entre las verdades físicas y las verdades fenoménicas, es decir, por qué no se puede inferir las últimas a partir de las primeras” (p. 944). Otros filósofos, entre ellos Balog (2012a), Carruthers & Veillet (2007), Papineau (2007) y Elpidorou (2013), también han ofrecido respuestas distintas a este dilema.

Un problema adicional para la ECF es explicar en un marco fisicista cómo puede la referencia a una propiedad objetiva ser determinada por conceptos fenoménicos subjetivos. Otro problema diferente aunque relacionado con el último surge con el criterio internista de posesión de los conceptos fenoménicos. Según este criterio, un sujeto adquiere un dado concepto fenoménico únicamente en virtud de un contacto directo con sus estados fenoménicos. El problema que se enfrentan quienes defienden este criterio es el de explicar la normatividad del lenguaje aceptado incluso por muchos de los defensores de la ECF. Estas son cuestiones que una caracterización satisfactoria de la naturaleza de los conceptos fenoménicos debe ser capaz de explicar. Sin dicha explicación, el uso de la ECF como respuesta a los retos dualistas se ve seriamente amenazada.

5. Conclusiones

Este artículo se centra en la ECF, una de las respuestas fisicistas más potentes a los retos dualistas que han sido formulados por lo menos a lo largo de las últimas tres décadas. Los defensores de esta estrategia recurren a la presunta naturaleza distinta de los conceptos fenoménicos y los conceptos físicos a fin de explicar por qué motivo las conclusiones metafísicas que los dualistas sacan de sus argumentos están equivocadas. Con el fin de explicar en qué consiste dicha estrategia, en §1 he empezado por describir la intuición fisicista básica que respalda la idea de que la naturaleza última del mundo es física, de ahí que, según el fisicista, no hay verdades más allá de las verdades de la física. En este apartado he introducido también uno de los argumentos epistemológicos que más ríos de tinta ha hecho correr en la literatura filosófica y al cual la ECF debe responder, el argumento del conocimiento, propuesto inicialmente por Jackson (1982, 1986). Después, en §2 he puesto de relieve la peculiaridad de los conceptos fenoménicos, he clarificado cuáles sus diferencias en relación con los conceptos físicos y he expuesto algunas de las caracterizaciones más comunes de la naturaleza de los conceptos fenoménicos. En §3 he explicado la motivación fundamental de la ECF, así como su aplicación como respuesta a los retos dualistas. Dentro de este apartado, he contrastado la ECF con otras estrategias fisicistas que buscan igualmente responder a los argumentos dualistas, lo cual ha permitido hacer hincapié en las ventajas de la ECF sobre las demás estrategias. Para terminar, en §4 he señalado algunas de las objeciones más fuertes que la ECF ha sufrido en años recientes y algunas respuestas a esas mismas objeciones.

A pesar de que la gran mayoría de los filósofos de la mente contemporáneos están de acuerdo que la clave para cerrar el debate metafísico en torno a la naturaleza de la consciencia consiste en encontrar una explicación adecuada de los conceptos fenoménicos, las objeciones a la ECF destacadas en este artículo demuestran más allá de cualquier duda que esta estrategia se enfrenta, a día de hoy, a problemas serios. Sus retos más comunes son sobre todo semánticos, epistemológicos y metafísicos y requieren un análisis puramente filosófico. La cuestión de si los avances en el campo de la psicología o de la neurociencia pueden contribuir al menos a una mejor comprensión de la consciencia fenoménica es todavía una cuestión por determinar.

Diana Couto
(Universitat de Barcelona)

Agradecimientos Estoy en deuda con Manuel García-Carpintero, Marta Jorba, Marc Artiga, Sofia Miguens, João Alberto Pinto y Andrea Rivadulla Duró por sus comentarios, sugerencias y correcciones lingüísticas a este artículo.

Referencias

Aydede, M. y G. Güzeldere (2005): “Cognitive Architecture, Concepts, and Introspection: An Information-Theoretic Solution to the Problem of Phenomenal Consciousness”, Noûs, 39, pp. 197-255.
Ball, D. (2009): “There are no Phenomenal Concepts”, Mind, 118, pp. 935-962.
Balog, K. (2009): “Phenomenal Concepts”, en McLaughlin, B., A. Beckermann, y S. Walter, eds., The Oxford Handbook of Philosophy of Mind, Oxford, Oxford University Press, pp. 292-312.
Balog, K. (2012a): “In Defense of Phenomenal Concept Strategy”, Philosophy and Phenomenological Research, 84, pp. 1-23.
——(2012b): “Acquaintance and The Mind-Body Problem”, en Gozzano, S. y C. Hill, eds., New Perspectives on Type-Identity: The Mental and The Physical, Cambridge, Cambridge University Press, pp. 16-42.
Block, N. (2007): “Max Black’s Objection to Mind-Body Identity”, en Alter, T. y S. Walter, eds., Phenomenal Concepts and Phenomenal Knowledge: New Essays on Consciousness and Physicalism, Oxford, Oxford University Press, pp. 249-306.
Braddon-Mitchell, D. (2003): “Qualia and Analytical Conditionals”, The Journal of Philosophy, pp. 111-135.
Burge, T. (1979): “Individualism and the Mental”, en Foundations of Mind, Oxford, Oxford University Press, pp. 110-150.
Carruthers, P. (2004): “Phenomenal Concepts and Higher-Order Experiences”, Philosophy and Phenomenological Research, 68, pp. 316-336.
Carruthers, P. y B. Veillet (2007): “The Phenomenal Concepts Strategy”, Journal of Consciousness Studies, 14, pp. 212-236.
Chalmers, D. (1996): The Conscious Mind: In Search of a Fundamental Theory, Oxford, Oxford University Press. [Chalmers, D. (1999): La Mente Consciente, trad. por José Ángel Álvarez, Barcelona, Gedisa].
——(2003): “The Content and Epistemology of Phenomenal Belief”, en Smith, Q. y A. Jokić, eds., Consciousness: New Philosophical Perspectives, Oxford, Clarendon Press, pp. 220-272.
——(2007): “Phenomenal Concepts and The Explanatory Gap”, en Torin, A. y S. Walter, edits., Phenomenal Concepts and Phenomenal Knowledge: New Essays on Consciousness and Physicalism, Oxford, Oxford University Press, pp. 167-194.
Davidson, D. (1970): “Mental Events”, en Foster, L. y J. Swanson, eds., Experience and Theory, New York, Humanities Press. [ Davidson, D. (1994): “Acontecimentos Mentales”, en Filosofía de la Psicología, trad. por Miguel Candel, Barcelona, Anthropos].
Dennett, D. (1991): Consciousness Explained, New York, Little Brown. [Dennett, D. (1995): La Consciencia Explicada, trad. por Sergio Balari Ravera, Barcelona, Paidós].
——(2007): “What Robot Mary Knows”, en Alter, T. y S. Walter, eds., Phenomenal Concepts and Phenomenal Knowledge: New Essays on Consciousness and Physicalism, Oxford, Oxford University Press, pp. 14-31.
Diaz-Leon, E. (2010): “Can Phenomenal Concepts Explain The Epistemic Gap”, Mind, 119, pp. 933-952.
Dretske, F. (1995): Naturalizing the Mind, Cambridge, MIT Press.
Elpidorou, A. (2013): “Having it Both Ways: Consciousness, Unique Not Otherworldly”, Philosophia, 41, pp. 1181-1203.
Fürst, M. (2014): “A Dualist Account of Phenomenal Concepts”, en Lavazza, A. y H. Robinson, eds., Contemporary Dualism. A Defense, London, Routledge, pp. 112-135.
Hawthorne, J. (2002): “Advice for Physicalists”, Philosophical Studies, 109, pp. 17-52.
Hill, C. (1997): “Imaginability, Conceivability, Possibility and The Mind-Body Problem”, Philosophical Studies, 87, pp. 61-85.
Ismael, J. (1999): “Science and the Phenomenal”, Philosophy of Science, 66(3), pp. 351-369.
Jackson, F. (1982): “Epiphenomenal Qualia”, Philosophical Quarterly, pp. 127-136. [Jackson, F. (2003), “Qualia epifenoménicos”, trad. por L. E. Enríquez, en Ezcurdia, M. y O. Hansberg, eds., La Naturaleza de la Experiencia, México, UNAM, pp. 95-110].
——(1986): “What Mary Didn’t Know”, Journal of Philosophy, 83, 291-295. [Jackson, F. (2003): “Lo que María no Sabía”, trad. por Laura. E. Manríquez, en Ezcurdia, M. y O. Hansberg, eds., La Naturaleza de la Experiencia, México, UNAM, pp. 111-118]
——(1995): “Postscript”, en Moser, P. K. y J. D. Trout, edits., Contemporary Materialism, New York, Routledge, pp. 184-189.
——(1998): “Postscript on Qualia”, en Mind, Method, and Conditionals: Selected Essays, London, Routledge, pp. 76-79.
Kripke, S. (1980): Naming and Necessity, Oxford, Blackwell. [Kripke, S. (1985): El Nombrar y la Necesidad, trad. por M. Valdés, México, UNAM].
Levin, J. (2007): “What is a Phenomenal Concept?”, en Alter, T. y S. Walter, eds., Phenomenal Concepts and Phenomenal Knowledge: New Essays on Consciousness and Physicalism, New York, Oxford, pp. 87-110.
Levine, J. (1983): “Materialism and Qualia: The Explanatory Gap”, Pacific Philosophical Quarterly, 64, pp. 254-261.
Levine, J. (2001): Purple Haze: The Puzzle of Consciousness, Oxford, Oxford University Press.
Lewis, D. (1983): “Postscript to ‘Mad Pain and Martian Pain’”, en Philosophical Papers, 1, Oxford, Oxford University Press, pp. 130-132.
——(1990): “What Experience Teaches”, en William G. Lycan, ed., Mind and Cognition, Malden, Blackwell, 13, pp. 29-57.
Loar, B. (1990): “Phenomenal States”, Philosophical Perspectives, 4, pp. 81-108.
——(1997): “Phenomenal States”, en Block, N., O. Flanagan y G. Güven, eds., The Nature of Consciousness: Philosophical Debates, Cambridge, MIT Press, pp. 597-616.
McGinn, C. (1989): “Can We Solve the Mind-Body Problem?”, Mind, 98, pp. 349-366.
Nagel, T. (1974): “What is it Like to Be a Bat?”, Philosophical Review, 83, pp. 435-450. [Nagel, T. (2003): “¿Cómo es ser un murciélago?”, trad. por Hector Islas, en Ezcurdia, M. y O. Hansberg, eds., La Naturaleza de la Experiencia, México, UNAM, pp. 45-63.)
——(1980): “Physicalism and the Cognitive Role of Acquaintance”, en William G. Lycan, ed., Mind and Cognition, Malden, Blackwell, pp. 29-57.
——(1980): “Review of Thomas Nagel, Mortal Questions”, Philosophical Review, 89, pp. 473-477.
——(2007): “So This is What it’s Like: A Defense of the Ability Hypothesis”, en Alter, T. y S. Walter, eds., Phenomenal Concepts and Phenomenal Knowledge, New Essays on Consciousness and Physicalism, Oxford, Oxford University Press, pp. 32-51.
O’dea, J. (2002): “The Indexical Nature of Sensory Concepts”, Philosophical Papers, 31(2), 169-181. doi: org/10.1080/05568640209485100
Papineau, D. (2002): Thinking About Consciousness, Oxford, Oxford University Press.
——(2007): “Phenomenal and Perceptual Concepts”, en Alter, T. y S. Walter, eds., Phenomenal Concepts and Phenomenal Knowledge, New Essays on Consciousness and Physicalism, New York, Oxford University Press, pp. 111-144.
Perry, J. (2001): Knowledge, Possibility, and Consciousness, Cambridge, MIT Press.
Place, U. T. (1956): “Is Consciousness a Brain Process?”, British Journal of Psychology, 47(1), pp. 44-50.
Putnam, H. (1975): “The Nature of Mental States”, en Philosophical Papers II – Mind, Language and Reality, Cambridge, Cambridge University Press. [Putnam, H. (1981): “La Naturaleza de los Estados Mentales”, trad. por Margarita M. Valdés, en Cuadernos de Crítica, 15, México, Instituto de Investigaciones Filosóficas].
Schröer, R. (2010): “Where’s the Beef? Phenomenal Concepts as Both Demonstrative and Substantial”, Australasian Journal of Philosophy, 88(3), pp. 505-522. doi: doi.org/10.1080/00048400903143861
Searle, J. (1984): Minds, Brains and Science, Cambridge, Harvard University Press. [Searle, J. (1996): Mentes, Cerebros y Ciencia, trad. por Luis Valdés, Madrid, Cátedra].
——: The Rediscovery of the Mind, Cambridge, MIT Press. [Searle, J. (1996): El Redescubrimiento de la Mente, trad. por Luis M. Valdés Villanueva Barcelona, Crítica].
——(1997): The Mystery of Consciousness, New York, New York Review. [Searle, J. (2000): El Misterio de la Consciencia, trad. por Antonio Domèch Figueras, Barcelona, Paidós].
Smart, J.J.C. (1959): “Sensations and Brain Processes”, Philosophical Review, 68(2), pp.141-156.
Sundström, P. (2011): “Phenomenal Concepts”, Philosophy Compass, 6(4), pp. 267-281.
Tye, M. (2000): Consciousness, Color and Content, Cambridge, MIT Press.
——(2009): Consciousness Revisited: Materialism without Phenomenal Concepts, Cambridge, MIT Press.

Entradas relacionadas

Cómo citar esta entrada

Couto, Diana (2020) «Conceptos fenoménicos», Enciclopedia de la Sociedad Española de Filosofía Analítica (URL: http://www.sefaweb.es/conceptos-fenomenicos).

Conexionismo

El conexionismo es una teoría sobre la arquitectura cognitiva—la forma de entender la estructura y el funcionamiento de los sistemas cognitivos—que apareció en los años 80. En cierto modo, el conexionismo supuso un desafío para la teoría dominante en las ciencias cognitivas y la inteligencia artificial de la época y ofreció nuevas herramientas para entender la forma en la que los procesos cognitivos (p.ej., percepción, atención, memoria, lenguaje) pueden estar implementados o pueden emerger de sistemas neuronales.

Los debates propiciados por la aparición del conexionismo siguen vigentes en la ciencia cognitiva contemporánea y en su filosofía. Además, la investigación más puntera en modelos de redes neuronales mantiene su inspiración en propuestas conexionistas y comparte muchos de sus principios básicos. El conexionismo es, por tanto, una teoría que ayuda a comprender tanto el desarrollo histórico de las ciencias cognitivas como su estado actual.

1. Breve Historia

Desde la revolución cognitiva a finales de los años 50 (Miller, 2003), tanto las ciencias cognitivas como la investigación en inteligencia artificial han estado dominadas por un paradigma basado en principios representacionalistas y computacionales que ha venido a ser llamado cognitivismo (Garnham, 2009). El cognitivismo se fundamenta en la metáfora computacional: el sistema mente-cerebro es una computadora. Más concretamente, la mente es el software que funciona sobre el hardware cerebral (Thagard, 2005).

Entre otros factores, el cognitivismo encontró su éxito gracias a que la metáfora computacional permitía el estudio de la mente desde coordenadas puramente físicas. Los estados mentales, antaño restringidos a la esfera privada que no era accesible desde los métodos de la ciencia contemporánea, podían ahora ser entendidos como estados de un sistema computacional mediante el uso de herramientas formales (Anderson, 1983, 2007; Newell, 1990; Russell y Norvig, 2003). Además, la metáfora computacional resolvía el problema mente-cerebro: los estados mentales son estados semánticos que se procesan en términos puramente sintácticos (formales) en los mecanismos cerebrales. De este modo, al igual que no hay problemas para reconciliar software y hardware en una computadora, no los hay para reconciliar mente y cerebro.

El cognitivismo enfrentaba y enfrenta serios problemas tanto teóricos como empíricos (McCarthy y Hayes, 1969; Searle, 1980). Sin embargo, pronto se convirtió en el paradigma dominante en las ciencias cognitivas. Una de las consecuencias de este hecho es que los detalles de implementación de los procesos cognitivos quedaron relativamente relegados en la investigación cognitiva. Las computadoras se pueden entender como sistemas formales que pueden implementarse físicamente de formas muy diversas. Del mismo modo, si el sistema mente-cerebro es una computadora, puede ser estudiado en términos formales y el hecho de que su implementación sea una compleja red neuronal no es, en principio, central para la explicación—la idea general tras esta afirmación se ha llamado realización múltiple en algunos círculos filosóficos (Polger y Shapiro, 2016): si la metáfora computacional típica del cognitivismo es cierta, entonces la mente es múltiplemente realizable y esto conlleva que la implementación de los estados mentales no es central para la explicación de la naturaleza de estos estados. En otras palabras, las computadoras son independientes de su medio de implementación y, por tanto, el sistema mente-cerebro también lo es.

A pesar de la poca atención que el cognitivismo, en general, presta a la implementación de los estados cognitivos, esta no ha sido la actitud general a lo largo de la historia de la psicología y de las ciencias cognitivas. Ya desde los años 40, arquitecturas que, hasta cierto punto, imitaban la estructura de red del cerebro se empezaron a desarrollar—por ejemplo, las pequeñas redes desarrolladas por McCulloch y Pitts (1943) o el pandemonium (Selfridge, 1959). Sin embargo, en pleno dominio cognitivista, no es hasta los años 80 que ideas sobre la relevancia de la implementación de los procesos cognitivos vuelven a la palestra, a través, por ejemplo, de los modelos de memoria asociativa en paralelo (Hinton y Anderson, 1981) o el propio conexionismo (Rumelhart y McClelland, 1986). Estos modelos buscaban desarrollar arquitecturas cognitivas inspiradas en redes neuronales biológicas que pudiesen dar cuenta de diversos procesos cognitivos. En este sentido, se convirtieron en desafíos e incluso alternativas al cognitivismo en tanto que perseguían la explicación de los mismos fenómenos desde asunciones teóricas distintas en lo que tiene que ver con su implementación o con las nociones de computación y representación, por ejemplo. De todas ellas, el conexionismo es la más rica y compleja. Y, sin duda, la que ha tenido una mayor influencia en la ciencia cognitiva.

2. Principios básicos

El elemento fundamental para entender el lugar del conexionismo en la ciencia cognitiva, así como sus principios básicos, es que es una arquitectura cognitiva que, como el cognitivismo, es computacional. Las redes conexionistas están vagamente inspiradas en las redes neuronales de los cerebros biológicos. En las redes conexionistas, las unidades que imitan las neuronas implementan algún tipo de función computacional. Así, estas redes se pueden entender como un sistema computacional en paralelo, es decir, en el que las unidades de computación actúan simultáneamente.

Con esta idea en mente, las redes conexionistas son modelos computacionales que se basan de una forma abstracta en lo que sabemos sobre el cerebro y las redes neuronales que lo constituyen. Se cree que el cerebro humano contiene entre 10¹⁰ y 10¹¹ neuronas y cada una de ellas puede llegar a tener 10⁵ conexiones con otras neuronas. Estas conexiones pueden ser excitatorias, las que fomentan la actividad de otras neuronas, o inhibitorias, las que frenan o bloquean la actividad de otras neuronas. Además, el aprendizaje de nuevas habilidades y contenidos se basa en la modificación de estas conexiones, usualmente entendida como el refuerzo o la debilitación de sus sinapsis.

Dados estos hechos sobre el cerebro humano, las redes conexionistas consisten en un número de elementos simples, llamados unidades o nodos, que actúan de manera similar a las neuronas biológicas y que están conectados a través de unas conexiones que les permiten transmitir señales simples. Estas conexiones, que pretenden ser análogas a las sinapsis y que pueden ser tanto excitatorias como inhibitorias, tienen un peso que determina la forma en la que el nodo conectado a uno de sus extremos puede influenciar al nodo conectado en el otro extremo. Los nodos (o unidades) están normalmente organizados en capas. Una capa de entrada, que lleva la información del exterior al sistema, una capa de salida que devuelve el resultado del procesamiento de la información y una o varias capas escondidas (que no están siempre presentes en las redes conexionistas), que se sitúan entre las capas de entrada y salida y que no tienen contacto con el entorno del sistema (Figura 1). En los modelos más básicos de redes conexionistas, las capas se conectan unidireccionalmente y las conexiones van de la capa de entrada a la de salida pasando por la capa escondida. En otros modelos mas avanzados, que incluyen retroalimentación, por ejemplo, las conexiones entre nodos pueden ser cíclicas o de otro tipo.

**Figura 1.** Ejemplo de red conexionista de tres capas (entrada, escondida y salida). Los nodos y las conexiones, junto con la dirección de procesamiento, están indicados.

En general, los nodos y las conexiones en redes conexionistas tienen habilidades muy limitadas. A través de sus conexiones de salida, los nodos solamente transmiten valores números que son una función de los valores numéricos que reciben a través de sus conexiones de entrada (o que reciben del entorno, en el caso de los nodos de la capa de entrada). Usualmente, cada nodo toma un grupo de valores de entrada y los transforma, mediante un proceso computacional, en un único valor de salida que es transmitido a los nodos de la siguiente capa. Estas transformaciones están normalmente limitadas a operaciones matemáticas muy simples, como diversos tipos de suma (para una explicación técnica de los aspectos básicos de las redes conexionistas, ver Rumelhart y McClelland, 1986, p. 45 y siguientes).

3. ¿Cómo funciona una red conexionista?

Teniendo en cuenta que tanto nodos como conexiones tienen un funcionamiento simple y limitado, la pregunta es: ¿Qué hacen las redes conexionistas para conseguir llevar a cabo procesos complejos? La respuesta ya ha sido anticipada: procesamiento paralelo. Los procesos computacionales llevados a cabo por la red conexionista ocurren en paralelo a lo largo de los nodos en lugar de ocurrir en serie, como es el caso en la computación tradicional. En este sentido, los nodos mismos, como unidades computacionales, no son individualmente responsables de solucionar un problema, sino que lo solucionan de forma colectiva.

De forma general, la información que llega a la red conexionista es distribuida por toda la red. En este sentido, las redes conexionistas instancian lo que se puede llamar representaciones distribuidas: patrones de activación simultánea de todos los nodos de la red. Así, por ejemplo, un patrón de activación en particular a través de los 15 nodos de la red conexionista de la Figura 1 puede ser la representación de “cebra”, mientras que otro patrón de activación a través de los mismos nodos puede ser la representación de “jirafa”. Por lo tanto, una red conexionista podría ser capaz de producir la palabra “cebra”, cuando la información de entrada fuese una fotografía de una cebra, alcanzando el patrón de activación de “cebra” en sus nodos y, de la misma forma, producir la palabra “jirafa”, cuando la información de entrada fuese la fotografía de una jirafa, alcanzando el patrón de activación de “jirafa” en sus nodos. Este ejemplo nos lleva a los dos aspectos fundamentales del funcionamiento de una red conexionista: la activación de los nodos y el algoritmo de retropropagación.

3.1 La activación de los nodos

Los nodos en una red conexionista implementan una función de transferencia que determina la forma en la que el valor de cada nodo se actualiza en función de la información de entrada que recibe desde el entorno (en el caso de los nodos de la capa de entrada) o desde los nodos de otra capa (en el caso de los nodos de la capa escondida y de la de salida). Normalmente, la función de transferencia trata computacionalmente la información que recibe y la aplica a una función de activación que es la que determina el valor de salida que va a entregar a la siguiente capa de la red (Figura 2).

**Figura 2.** Diagrama de un nodo o unidad de una red conexionista. **(A)** Diagrama de un nodo o unidad con todos sus componentes. Las entradas al nodo (E) que son resultado de la información entrante desde el entorno en el caso de la capa de entrada y de las activaciones de los nodos de las capas previas en el caso de la capa escondida y la capa de salida. **(B)** Ejemplos de diferentes funciones de activación: umbral, lineal, gaussiana y sigmoidal. La diferencia entre ellas es que el cambio en las entradas (eje X de las gráficas) afecta de forma distinta la activación de salida del nodo. Por ejemplo, en la activación lineal, los primeros valores de activación de entrada no cambian la activación de salida. Después, hay un grupo de valores que incrementan la activación de salida de forma lineal. Al final, el grupo de valores altos de activaciones de entrada vuelve a no provocar cambios en la activación de salida del nodo.

Un tipo de procesamiento habitual en la función de transferencia de un nodo dado es la multiplicación de las activaciones que recibe desde los nodos de la capa previa por los pesos de las conexiones por las que esas activaciones llegan (este proceso es a veces referido como función de entrada de red), para después sumar los resultados de esas multiplicaciones y enviarlas a la función de activación (Figura 2A). La función de activación, entonces, aplica algún tipo de computación a esa entrada, y de esa computación depende el perfil de activación del nodo (Figura 2B). Por ejemplo, la función de activación puede requerir un nivel de entrada mínimo para entonces provocar un aumento súbito en la activación del nodo y así enviar esa activación hacia la siguiente capa de la red. Esta función de activación se puede entender como un umbral de activación. En otros nodos, la función de activación puede simplemente requerir un valor específico de entrada para provocar la máxima activación del nodo y enviarla hacia la siguiente capa de la red. Esta función de activación se puede entender como una activación gaussiana.

3.2 El algoritmo de retropropagación

En las redes conexionistas, la activación de cualquier nodo depende de las activaciones de entrada que recibe desde las capas previas o desde el entorno de la red. Las funciones de transferencia de los nodos—que comprenden la función de entrada de red y la función de activación—suelen ser fijas y no cambian durante el funcionamiento de la red. Sin embargo, las conexiones entre nodos sí que pueden cambiar su peso y, por tanto, influir en la información que llega a los nodos. En este sentido, la clave de la evolución y el aprendizaje en las redes conexionistas tiene que ver con los cambios que se producen en los pesos de las conexiones entre nodos. La forma en la que estos cambios se producen suele estar basada en algoritmos de retropropagación.

El primer algoritmo de retro-propagación (“backpropagation” en inglés) en el contexto de redes conexionistas fue introducido por Rumelhart, Hinton y Williams (1986). Diferentes métodos de retropropagación se venían desarrollando desde los años 60 (Bryson, 1961; Kelley, 1960). Entre ellos, el conocido como regla delta ganó relevancia y, a mitad de los años 80, los mencionados fundadores del conexionismo generalizaron la regla delta para su propio modelo de red conexionista. Fundamentalmente, lo que la regla delta y los algoritmos de retroprogramación llevan a cabo es un cambio de los pesos de las conexiones entre los nodos usando como referencia la diferencia entre los resultados de las operaciones de la red y los resultados esperados si la red tuviese un comportamiento exitoso. La regla delta simple usa una tasa de error basada en esta diferencia para llevar a cabo los cambios en los pesos de las conexiones entre nodos. Por su parte, la regla delta generalizada lleva a cabo un proceso similar, pero tiene en cuenta las contribuciones de los nodos al error total y la forma en la que tal error se distribuye a través de las diferentes capas de la red. En este sentido, la señal de error se retropropaga a través de las capas de la red y guía las modificaciones de los pesos de sus conexiones.

Los principios básicos de la regla delta y de su generalización como algoritmo de retropropagación son el refuerzo sináptico y el aprendizaje supervisado. Por un lado, Donald Hebb (1949) demostró que las conexiones sinápticas entre neuronas en cerebros biológicos se refuerzan cuando las neuronas conectadas están activas simultáneamente. Se cree que este fenómeno es uno de los mecanismos fundamentales del aprendizaje y, en este sentido, inspira la idea del cambio de pesos de las conexiones entre nodos de las redes conexionistas como fundamento de los procesos de aprendizaje que en ellas se dan. Por otro lado, el aprendizaje supervisado es una forma básica de aprendizaje tanto en humanos como en animales. Madres y padres corrigen a sus hijas e hijos, profesoras y profesores a sus alumnas y alumnos, etc. Cuando un aprendiz comete un error, quien se encarga de la supervisión hace ese error explícito e intenta provocar un cambio en el aprendiz para que el error no se produzca y la tarea sea exitosa. En los algoritmos de retro-propagación, la tasa de error calculada al comparar los resultados obtenidos a los resultados esperados en la actividad de la red conexionista, cumple el papel de supervisión en su proceso de aprendizaje. En este sentido, el funcionamiento de las redes conexionistas, tanto al nivel nodos y conexiones individuales como a nivel general en términos de actividad y aprendizaje, está inspirado en aspectos conocidos de los sistemas cognitivos biológicos.

4. Algunos problemas del conexionismo

La viabilidad del conexionismo como paradigma para el desarrollo de la inteligencia artificial y, en general, como paradigma de las ciencias cognitivas ha sido puesta en cuestión desde diversas perspectivas. Por un lado, el hecho de que el conexionismo ponga en juego la idea de representaciones distribuidas—o, incluso, la eliminación del concepto de representación (Churchland, 1989)—ha sido visto como un problema para dar cuenta de uno de los aspectos esenciales de la psicología popular: la idea de que estados mentales funcionalmente discretos y semánticamente interpretables tienen poderes causales (Ramsey, Stich y Garon, 1990). La funcionalidad de una red conexionista está basada en la distribución de los pesos de las conexiones entre sus nodos tal que una sola distribución puede hacer que la red exhiba la funcionalidad deseada (p.ej., categorización o aprendizaje del tiempo pasado). En este sentido, los estados de las redes conexionistas no son funcionalmente discretos ni semánticamente interpretables, con lo que una de las intuiciones fundamentales de la psicología popular es abandonada.

Por otro lado, y sobre todo en los albores del conexionismo como paradigma, las redes conexionistas fueron puestas en cuestión en base a consideraciones biológicas. En particular, la plausibilidad biológica de las redes conexionistas fue altamente cuestionada. En estas redes, los nodos tenían un comportamiento similar, las capas de nodos eran capas discretas, y el flujo de información era unidireccional, por ejemplo. Ninguna de estas tres características da cuenta de las propiedades anatómicas y funcionales de los cerebros. Por tanto, las redes conexionistas eran consideradas poco realistas. Este hecho, entre otros, fue el que llevó a la evolución de las diversas generaciones de redes conexionistas que han surgido en las ultimas décadas y que se acercan más a una situación de realismo biológico.

Más allá de cuestiones de compatibilidad con la psicología popular o con la biología cerebral, el gran reto teórico que el conexionismo ha tenido que enfrentar es el reto de la sistematicidad propuesto por Jerry Fodor y Zenon Pylyshyn (1988). El reto de la sistematicidad se enmarca en el debate entre conexionismo y cognitivismo. El conexionismo se presenta como una alternativa al cognitivismo y, por ello, debe dar cuenta de los mismos fenómenos. O, al menos, esta es la idea de algunos defensores del cognitivismo, como lo eran Fodor y Pylyshyn. Para ellos, las redes conexionistas no pueden dar cuenta del pensamiento humano porque el pensamiento humano es sistemático y las redes conexionistas no lo son. Y, más aún, si las redes conexionistas pudiesen dar cuenta de la sistematicidad del pensamiento humano, se convertirían en meros modelos de implementación del cognitivismo.

La sistematicidad se fundamenta en otra propiedad: la composicionalidad. Un sistema es composicional cuando está constituido por elementos atómicos que pueden combinarse siguiendo unas determinadas reglas. Por ejemplo, la lengua castellana es composicional. La frase “Juan quiere a Lola” esta constituida por tres partes: “Juan”, “quiere a”, y “Lola”. Y el significado de la frase depende de las partes que la componen y la sintaxis del castellano. Algunos sistemas composicionales son también sistemáticos, es decir, son capaces de producir cualquier combinación legal de los átomos que los constituyen. De nuevo, el lenguaje castellano es sistemático: al igual que puede producir “Juan quiere a Lola”, puede producir “Lola quiere a Juan”.

De acuerdo con Fodor y Pylyshyn, el pensamiento humano es composicional y sistemático: está constituido por representaciones/conceptos y es capaz de producir cualquier combinación legal de ellos. Sin embargo, las redes conexionistas no son sistemáticas porque no son composicionales. Las representaciones distribuidas típicas de las redes conexionistas no son atómicas: la representación “Lola quiere a Juan” consiste en un patrón especifico de activaciones de todas las unidades de la red. Esta representación no puede cambiar a “Juan quiere a Lola” sin cambiar el patrón de activación de toda la red. En este sentido, no hay elementos atómicos que constituyan el sistema composicional, por lo que las redes conexionistas no son composicionales. Y al no ser composicionales, no pueden ser sistemáticas.

Los defensores del conexionismo han respondido al reto de la sistematicidad de muy diversas maneras (Calvo y Symons, 2014). Por un lado, los hay que han intentado argumentar que las redes conexionistas pueden ser sistemáticas. Por ejemplo, Smolensky (1987, 1988) defiende que la sistematicidad se puede basar en una noción de composicionalidad débil en la que los estados de una red conexionista se pueden entender como vectores definidos por las matrices de los pesos de las conexiones de la red y los componentes de esos estados (p.ej., “Juan” en “Juan quiere a Lola”) como los vectores individuales que componen el vector de la red. Estos vectores se pueden combinar siguiendo ciertas normas y dependiendo del contexto. En este sentido, la combinación de vectores individuales da cuenta de la composicionalidad sin necesidad de apelar a estados funcionalmente discretos y, por tanto, las redes conexionistas pueden ser sistemáticas.

Por otro lado, los hay que argumentan que el pensamiento humano no es sistemático y que, por tanto, las redes conexionistas no necesitan serlo. Este es el caso de Chemero (2014), que analiza la noción de sistematicidad usada por Fodor y Pylyshyn y que concluye que no hay sustento empírico para ella tras un recorrido por los usos de la palabra “sistematicidad” en las ciencias cognitivas. En este sentido, el reto de la sistematicidad es un argumento hegeliano: un argumento basado en pura especulación, pero sin respaldo en la ciencia cognitiva. Chemero (2009) considera que los argumentos hegelianos son poco convincentes, lo que va en contra del reto de la sistematicidad. A pesar de ello, es un hecho constatable que el reto de la sistematicidad sigue vigente en las disputas teóricas respecto al conexionismo.

5. Conexionismo hoy

Las redes conexionistas han sido aplicadas a tareas cognitivas muy diversas, tales como tareas lingüísticas, de percepción, o de toma de decisiones. Con su éxito, el conexionismo ha demostrado que ciertas asunciones del cognitivismo no son necesarias para comprender y explicar la forma en la que los sistemas cognitivos funcionan—por ejemplo, las redes conexionistas no precisan de una descripción formal o de reglas explícitas de procesamiento computacional. Este hecho diferenciador ha provocado un amplio desarrollo del paradigma conexionista desde que apareció en los años 80 y, hoy en día, podemos hablar de una segunda, una tercera, e incluso una cuarta generación del conexionismo (las generaciones son también conocidas como “olas del conexionismo”).

Un importante ejemplo de las redes conexionistas de segunda generación es el predictor de oraciones de Elman (1990). La mayor novedad de este predictor de segunda generación con respecto a las redes conexionistas de primera generación es que está basado en una red recurrente. Las redes recurrentes se distinguen por incluir una capa de nodos de contexto que actúan como una forma de memoria (Figura 3). Normalmente, la capa de contexto copia los estados de la capa escondida y los reintroduce en esa capa en el siguiente ciclo de activación. En este sentido, las redes recurrentes explotan las propiedades temporales de la actividad de las redes conexionistas para así proporcionar a la red mayor capacidad de procesamiento.

**Figura 3.** Ejemplo de red conexionista recurrente. Es una red conexionista estándar a la que se añade una capa extra, o capa de contexto. La capa escondida se copia en cada ciclo (flechas discontinuas azules). En el siguiente ciclo la capa de contexto es, junto a la capa de entrada, la que alimenta a la capa escondida.

La tercera generación de conexionismo, el conexionismo dinámico (McClelland et al., 2010), introduce en las redes conexionistas algunas características que aumentan su plausibilidad biológica. Por ejemplo, permitiendo diferencias entre los nodos para usar algunos de ellos con propósitos especiales, incluyendo una conectividad más compleja, retardos, procesamiento en tiempo continuo, entradas analógicas, ruido, etc. Y la cuarta generación, más actual si cabe, es la que introduce principios del procesamiento predictivo (Friston, 2010) en la arquitectura conexionista, permitiendo el procesamiento bidireccional basado en probabilidad bayesiana. En estas redes, el aprendizaje se consigue mediante la combinación de flujos informativos bidireccionales—esto es, de la capa de entrada a la de salida y viceversa.

El conexionismo, por tanto, sigue siendo un paradigma relevante dentro de las ciencias cognitivas y sigue proponiendo alternativas a los modelos clásicos tanto en psicología y neurociencia cognitiva como en inteligencia artificial. Además, es de esperar que el avance en el conocimiento de los sistemas neuronales biológicos repercuta en los modelos conexionistas y que estos sean cada vez más refinados y puedan seguir contribuyendo al avance del conocimiento de los procesos cognitivos.

Vicente Raja
(Rotman Institute of Philosophy,
Western University)

Referencias

Anderson, J. R. (1983): The Architecture of Cognition, Cambridge, Mass., Harvard University Press.
———— (2007): How Can the Human Mind Occur in the Physical Universe?, Oxford, Oxford University Press.
Bryson, A. E. (1961): “A gradient method for optimizing multi-stage allocation processes”, en Proceedings of the Harvard University Symposium on Digital Computers and their Applications, Cambridge, Mass., Harvard University.
Calvo, P. y J. Symons (2014): The Architecture of Cognition, Cambridge, Mass., MIT Press.
Chemero, A. (2009): Radical Embodied Cognitive Science, Cambridge, Mass., MIT Press.
———— (2014): “Systematicity and interaction dominance”, en Calvo, P. y J. Symons, eds., The Architecture of Cognition, Cambridge, Mass., MIT Press, pp. 353-369.
Churchland, P. M. (1989): A Neurocomputational Perspective: The Nature of Mind and the Structure of Science, Cambridge, Mass., MIT Press.
Elman, J. (1990): “Finding structure in time”, Cognitive Science, 14(2), pp. 179-211.
Fodor, J. y Z. Pylyshyn (1988): “Connectionism and cognitive architecture: A critical analysis”, Cognition, 28, pp. 3-71.
Friston, K. (2010): “The free-energy principle: A unified brain theory?”, Nature Reviews Neuroscience, 11(2), pp. 127-138.
Garnham, A. (2009): “Cognitivism”, en Symons, J. y P. Calvo, eds., The Routledge Companion to Philosophy of Psychology, Nueva York, Routledge, pp. 99-110.
Hebb, D.O. (1949): The Organization of Behavior, Nueva York, Wiley.
Hinton, G. y J. Anderson (1981): Parallel Models of Associative Memory, Hillsdale, Lawrence Erlbaum Assoc.
Kelley, H. J. (1960): “Gradient theory of optimal flight paths”, ARS Journal, 30(10), pp. 947-954.
McCarthy, J. y P. Hayes (1969): “Some philosophical problems from the standpoint of artificial intelligence”, en Meltzer, B. y D. Michie, eds., Machine Intelligence 4, Edimburgo, Escocia, Edinburgh University Press, pp. 463-502.
McClelland, J. L., M. M. Botvinick, D. C. Noelle, D. C. Plaut, T. T. Rogers, M. S. Seidenberg y L. B. Smith (2010): “Letting structure emerge: Connectionist and dynamical systems approaches to cognition”, TRENDS in Cognitive Sciences, 14(8), pp. 348-356.
McCulloch, W. y W. Pitts. (1943): “A logical calculus of the ideas immanent in nervous activity”, Bulletin of Mathematical Biophysics, 5, pp. 115-133.
Miller, G. A. (2003): “The cognitive revolution: A historical perspective”, TRENDS in Cognitive Sciences, 7(3), pp. 141-144.
Newell, A. (1990): Unified Theories of Cognition, Cambridge, Mass., Harvard University Press.
Polger, T. y L. Shaprio (2016): The Multiple Realization Book, Oxford, Oxford University Press.
Ramsey, W., S. Stich y J. Garon (1990): “Connectionism, eliminativism and the future of folk psychology”, Philosophical Perspectives, 4, pp. 499-533.
Rumelhart, D. E., G. E. Hinton y R. J. Williams (1986): “Learning internal representations by error propagation”, en Rumelhart, D. E. y J. L. McClelland, eds., Parallel Distributed Processing: Explorations in the Microstructure of Cognition. Vol. 1, Foundations, pp. 318-362, Cambridge, Mass., MIT Press.
Rumelhart, D. E., J. L. McClelland y PDP Research Group (1986): Parallel Distributed Processing, 1, 2, Cambridge, Mass., MIT Press.
Russell, S. J. y P. Norvig (2003): Artificial Intelligence: A Modern Approach, Upper Saddle River, Prentice Hall.
Searle, J. (1980): “Minds, brains, and programs”, Behavioral and Brain Sciences, 3, pp. 417-457.
Selfridge, O. G. (1959): “Pandemonium: A paradigm for learning”, en Blake, D. V. y A. M. Uttley, eds., Proceedings of the Symposium on Mechanisation of Thought Processes, pp. 511-529, Londres.
Smolensky, P. (1987): “The constituent structure of mental states: A reply to Fodor and Pylyshyn”, Southern Journal of Philosophy, 25, pp.137-460.
———— (1988): “On the proper treatment of connectionism”, Behavioral and Brain Sciences, 2, pp. l-23.
Thagard, P. (2005): Mind: Introduction to Cognitive Science, Cambridge, Mass., MIT Press.

Lecturas recomendadas en castellano

Campanario, J. M. (2004): “El enfoque conexionista en psicología cognitiva y algunas aplicaciones sencillas en didáctica de las ciencias”, Enseñanza de las Ciencias, 22(1), pp. 93-104.
Pineda, D. (2012): La Mente Humana: Introducción a la Filosofía de la Psicología, Madrid, España, Ediciones Cátedra.
Pons Parra, R. M. y J. M. Serrano Gonzalez-Tejero (2011): “Conexionismo e instrucción”, Educación y Humanismo, 13(21), pp. 51-82.

Entradas relacionadas

Cómo citar esta entrada

Raja, Vicente (2019) “Conexionismo”, Enciclopedia de la Sociedad Española de Filosofía Analítica (URL: http://www.sefaweb.es/conexionismo/).

Metacognición

La metacognición puede definirse de dos formas: 1) como la capacidad metarrepresentacional de adscribir estados mentales a otros sujetos y a sí mismo o 2) como la capacidad de monitorear y controlar los procesos cognitivos propios. Estas dos definiciones reflejan el debate que ha habido entre dos maneras diferentes de entender esta capacidad mental; un debate con diferentes implicaciones sobre la arquitectura cognitiva, diferentes predicciones sobre los seres que poseen esta capacidad y sobre su funcionamiento general.

En la primera parte de esta entrada reconstruiré y evaluaré el debate entre quienes defienden la definición metarrepresentacional (1) y quienes defienden la definición en términos de monitoreo y control (2). Luego, presentaré brevemente algunos estudios empíricos a favor de la teoría de monitoreo y control; en particular, los datos sobre la presencia de metacognición en los animales y los datos de la psicología cognitiva sobre los sentimientos metacognitivos. Finalmente, terminaré esta entrada presentando las teorías duales de la metacognición.

1. Teoría metarrepresentacional de la metacognición

La metacognición se ha definido clásicamente como el pensamiento sobre el pensamiento, esto es, como la capacidad de formar pensamientos de orden superior sobre pensamientos o estados mentales de primer orden (p.ej., creencias, deseos, sentimientos, etc.) (Nelson y Narens, 1990). De acuerdo con esta perspectiva, la metacognición consiste en dirigir nuestra capacidad de lectura de mentes (mindreading capacity) hacia nosotros mismos para producir autoadscripciones de estados mentales (Carruthers, 2009, 2011; Gopnik, 1993; Wilson, 2002). Esta perspectiva, se deriva de una visión social de la metacognición, ya que la capacidad de pensar sobre nuestros propios pensamientos surgiría a partir de nuestra capacidad de pensar sobre los pensamientos de los otros. Dicho esto, es importante señalar que la capacidad de lectura de mentes requiere la posesión de conceptos psicológicos o mentales para poder producir adscripciones de estados mentales. Los conceptos psicológicos son aquellos que se refieren a actitudes proposicionales tales como creer, saber, desear, esperar, entre otros. Algunos teóricos consideran que estos conceptos son adquiridos por los niños alrededor de los cuatro años cuando aprenden las palabras relacionadas con estos en el lenguaje. Según esto, la estructura metarrepresentacional de los juicios metacognitivos está compuesta por:

1) una proposición como “hay una flor roja sobre la mesa”,

2) un concepto psicológico (e.g., creer, saber, desear, esperar) que representa una actitud mental de primer orden dirigida a la proposición (A),

3) una actitud mental de orden superior dirigida al concepto psicológico de primer orden (2) y su contenido (1) (Proust, 2007).

Así, el juicio metacognitivo tiene la siguiente forma:

[3] Yo creo que [2] YO SÉ[1](o PERCIBO, O CREO, O SIENTO, etc.) que [1] hay una flor roja sobre la mesa.

(Uso mayúsculas para denotar los conceptos psicológicos que están en juego. Además de los conceptos psicológicos citados, también hay que advertir que el sujeto debe ser capaz de usar el concepto de YO, para representarse a sí mismo como poseedor de estos estados.)

Esta descripción esquemática de la estructura de los juicios metarrepresentacionales nos permite advertir la complejidad representacional de los mismos y los requisitos cognitivos para formarlos. Al respecto, Browne dice: “Hay metarrepresentación de la creencia que p solo si son representados tanto el contenido p y la actitud (la creencia) en un estado mental de orden superior” (Browne, 2004, p. 634). Por esta razón, la capacidad de lectura de mentes que genera este tipo de juicios se ha entendido como un mecanismo inferencial que toma como entradas (inputs) representaciones sensoriales de primer orden (sobre el entorno, las circunstancias y las metas, entre otros), y las combina con conceptos psicológicos para generar juicios metarrepresentacionales como salidas (outputs).

Así pues, según esta perspectiva, la arquitectura cognitiva de la metacognición requiere una estructura metarrepresentacional que los sujetos usan para reflexionar sobre sus propios estados mentales. Además, para poder funcionar, esta estructura requiere de la posesión de conceptos mentales y de capacidad inferencial. Es por ello que, según la teoría metarrepresentacional, sólo seres dotados de estas capacidades tendrían metacognición.

2. Teoría de monitoreo y control de la metacognición

En contraposición con la teoría clásica de la metacognición y las propuestas de Carruthers, una perspectiva diferente sobre la metacognición surgió inspirada principalmente por la psicología comparada y los estudios sobre el control cognitivo. Por un lado, los resultados de la psicología comparada sugieren que puede haber monitoreo y control de procesamiento cognitivo en algunos animales que carecen de la capacidad de metarrepresentación o de lectura de mentes; en otras palabras, algunos seres vivos pueden monitorear y controlar sus estados y capacidades mentales sin tener que producir representaciones de orden superior (Browne, 2004; Proust, 2007, 2012). Por otro lado, se han encontrado disociaciones funcionales importantes entre el monitoreo de los estados cognitivos propios y los estados mentales de otro sujeto (Koriat y Ackerman, 2010), algo que no se esperaría si se tratara de una sola capacidad mental implicada en estas actividades. Además, también se han encontrado diferencias importantes entre los correlatos neuronales de la capacidad de lectura de mentes y el monitoreo y control metacognitivo (Proust, 2012). Según ciertos estudios, los correlatos neuronales de la capacidad de lectura de mentes son: la juntura temporoparietal, la corteza prefrontal anteromedial y la corteza temporal anterior; mientras que los correlatos neuronales del monitoreo y control son: la corteza prefrontal dorsolateral y ventromedial derecha, y la corteza cingulada (Proust, 2012, 2013).

Esta nueva perspectiva propone entender la metacognición como la capacidad de monitorear y controlar nuestros procesos y disposiciones mentales. En palabras de Joëlle Proust: “El propósito de la metacognición es evaluar las disposiciones mentales presentes del individuo, aceptarlas o rechazarlas, y formar compromisos epistémicos y motivacionales” (Proust, 2010). La diferencia principal con la teoría metarrepresentacional, sin embargo, es que esta evaluación, monitoreo y control no requieren de metarrepresentación, capacidad de lectura de mentes o posesión de conceptos psicológicos. De acuerdo con Browne: “Este modelo psicológico de la metacognición es mucho más amplio que el modelo filosófico basado en el “ascenso intencional” [i.e. la formación de metarrepresentaciones]. Este modelo nuevo no requiere intencionalidad de nivel superior dado que no afirma que tanto el contenido como la actitud psicológica de primer orden deban ser representadas en un estado mental de orden superior” (Browne, 2004, p. 636). Según Proust, esta evaluación, monitoreo y control se dan a través de una simulación mental del proceso cognitivo en cuestión que permite predecir el procesamiento cognitivo, revisarlo y ajustarlo (Proust, 2007, 2009a, 2013), de un modo parecido a como ocurre con el monitoreo y control motor de nuestras acciones corporales como caminar, saltar o levantar un vaso.

Según esta teoría, la metacognición no se da entonces en términos de juicios metacognitivos de orden superior o metarrepresentaciones. Joëlle Proust, la principal representante de esta teoría, defiende que esta capacidad funciona basándose en sentimientos metacognitivos (Proust, 2013). Ejemplos de sentimientos metacognitivos son el sentimiento de tener algo en la punta de la lengua, el sentimiento de saber, la certeza, la incertidumbre y el sentimiento de error, entre otros. Estas experiencias de primer orden indican al sujeto los posibles cursos de acción mental y sobre la adecuación de sus propios estados y procesos cognitivos que le permiten, a su vez, controlarlos. Un sujeto, por ejemplo, al ser confrontado con un problema cognitivo como resolver una multiplicación (5 x 13), debe decidir qué estrategia usar para resolverlo; debe escoger entre intentar recordar la solución (en caso de que conozca el problema) o calcularlo. Al enfrentarse con este problema cognitivo, el sujeto tiene inmediatamente el sentimiento de no saber la respuesta y por ello escoge la estrategia de calcular el resultado en lugar de intentar recordarlo. Según estos teóricos, esta decisión está basada en un sentimiento metacognitivo y no en una metarrepresentación o un juicio de orden superior. La metacognición, desde esta perspectiva, es la capacidad de tener sentimientos metacognitivos y ser capaz de usarlos para monitorear y controlar sus propios procesos cognitivos.

A continuación, presentaré brevemente algunos datos de la psicología comparada y los datos de la psicología cognitiva a favor de la teoría de monitoreo y control.

2.1. Datos de la psicología comparada: metacognición en animales no-humanos

En los últimos años se han publicado una serie de artículos experimentales que sugieren que algunos animales tienen capacidades metacognitivas de monitoreo y control de los estados mentales propios. David Smith y colegas fueron los primeros en establecer un paradigma experimental para la investigación de esta capacidad en los animales (Smith et al., 1995). Sus primeros experimentos fueron sobre metacognición perceptual (también llamada metapercepción) con monos rhesus (Macaca mulatta) y delfines nariz de botella (Tursiops truncatus). Siguiendo esta línea de investigación, Robert Hampton (2001) desarrolló un paradigma para estudiar la metacognición de la memoria (también llamada metamemoria) en los monos rhesus. Foote y Crystal (2007), por su parte, adaptaron el paradigma de Hampton para estudiar la metacognición en ratas (Rattus norvegicus). A continuación, paso a describir algunos de estos experimentos.

En el estudio pionero de David Smith y colegas con monos rhesus, estos fueron entrenados para discriminar patrones visuales densos (alta cantidad de pixeles) o poco densos (baja cantidad de pixeles) (Smith, Shields, Schull, y Washburn, 1997). Luego de cada discriminación exitosa los monos recibían una porción de alimento como recompensa, y recibían un tiempo de espera (un castigo usual en estas pruebas) por cada una de sus respuestas incorrectas (p. 82). Una vez dominada la tarea de discriminación visual de primer orden, se introdujo otro botón que los monos podían usar para evitar tener que dar una respuesta y así pasar directamente a la prueba siguiente sin recibir recompensa ni castigo. A este botón se le llamó “respuesta de incertidumbre” y se le asoció con un estado mental de segundo orden. El resultado fundamental del experimento fue que los monos usaron la respuesta de incertidumbre particularmente en los casos donde era más difícil o imposible la discriminación visual, tal y como lo haría un sujeto humano para evitar equivocarse. De hecho, al comparar el comportamiento de los monos y de los seres humanos en este tipo de pruebas, se evidencia una gran similitud. Según la interpretación de Smith y colegas, estos resultados sugieren la presencia de metapercepción en monos rhesus puesto que estos se percatan de cuándo pueden y cuándo no pueden discriminar adecuadamente los patrones visuales (Smith, Shields, y Washburn, 2003).

Smith y colegas hicieron un experimento similar con un delfín nariz de botella (Tursiops truncatus) (Smith et al., 1995). Pero, en este caso, se adoptó como paradigma la discriminación auditiva entre señales sonoras agudas y graves. En primer lugar, se entrenó al delfín para reconocer un tono agudo (2100-Hz). En segundo lugar, se lo entrenó para que discriminara estas señales de otras señales acústicas graves (alrededor de 1200-Hz). Tal como en el experimento con monos, se dio la posibilidad al delfín de evitar pasar la prueba mediante una respuesta de incertidumbre. En este caso, los delfines también usaron la respuesta de incertidumbre cuando les era más difícil discriminar los estímulos (por ejemplo, en la discriminación entre 2,100 Hz y 2,085 Hz) y así lograron mejorar la corrección de sus respuestas (Smith et al., 2003).

Estos son algunos de los principales experimentos que se han usado para evaluar la capacidad de ciertos animales de monitorear sus propios estados perceptivos. Sin embargo, hay que anotar que la interpretación de estos resultados en términos metacognitivos no es unánime. Algunos autores, como Carruthers (2008, 2009), se han pronunciado en contra de la interpretación metacognitiva de los mismos. Él señala que no hay evidencia de que estos animales cuenten con la capacidad de lectura de mentes (Call y Tomasello, 2008) que les permita generar metarrepresentaciones sobre sus propios estados mentales asociados a estas tareas y por lo tanto se debería proveer de una explicación de estos datos en términos no-metacogntivos. Según Carruthers (2009, 2011), la capacidad de lectura de mentes es ontogenética y filogenéticamente anterior a la metacognición, pues esta última no es más que una derivación de la primera (Carruthers, 2009, 2011). Sin embargo, cabe señalar que la interpretación de los datos en términos no-metarrepresentacionales permitiría adscribir la capacidad metacognitiva a los animales en términos de capacidad de monitoreo y control de los propios estados cognitivos. En este sentido, Browne (2004) y Proust (2007, 2013) han formulado explicaciones del monitoreo y control en términos de primer orden y han dado buenos argumentos de por qué el monitoreo y control no requieren una estructura metarrepresentacional.

2.2. Datos de la psicología cognitiva: sentimientos metacognitivos

Otros datos a favor de la teoría de monitoreo y control vienen de la psicología cognitiva. Diferentes estudios han mostrado que hay disociaciones funcionales importantes entre el monitoreo de los estados cognitivos propios y los estados mentales de otro sujeto (Koriat y Ackerman, 2010). En el caso de los estados mentales propios, los sujetos frecuentemente atienden a sus sentimientos metacognitivos tales como el sentimiento de saber (Koriat, 2000; Paynter, Reder, y Kieffaber, 2009; Reder, 1987), el sentimiento de error (Fernández Cruz, Arango-Muñoz, y Volz, 2016) o el sentimiento de confianza (Kalnikaité y Whittaker, 2007), entre otros, para monitorear y controlar sus procesos cognitivos, mientras que en el caso del monitoreo de los procesos mentales de los otros los sujetos usan una teoría de la mente para inferir los estados mentales del otro (Koriat y Ackerman, 2010).

Para entender lo anterior pongamos un par de ejemplos. Al confrontar una pregunta sobre una información conocida (¿Quién descubrió la penicilina?), las personas seleccionan una estrategia cognitiva para resolverlo: la persona puede decidir recordar la solución usando su memoria o resolverlo usando una herramienta mnemotécnia externa como un cuaderno de notas, el internet o preguntando a un amigo (Kalnikaité y Whittaker, 2007). Frecuentemente, esta decisión está basada en un sentimiento metacognitivo (como el sentimiento de saber o el sentimiento de olvido) que informa al sujeto sobre su capacidad de resolver el problema usando sus capacidades cognitivas internas o si debe acudir a una ayuda externa de la memoria (Arango-Muñoz, 2013). Los sentimientos metacognitivos son experiencias que informan al sujeto sobre sus propios estados y procesos mentales sin necesidad de metarrepresentarlos. En cambio, para determinar si alguien sabe esta información tenemos que recurrir a otra estrategia. Podemos preguntarle y esperar su respuesta para determinar si lo sabe, o podemos intentar inferirlo a partir de los conocimientos previos que tengamos de esta persona: por ejemplo, a partir de la creencia que esta persona terminó la escuela básica y luego estudió medicina, puedo inferir que probablemente tiene la información requerida y, a partir de esto, construir el juicio metarrepresentacional “ella sabe que Fleming descubrió la penicilina”.

Koriat y Ackerman (2010) diseñaron un experimento que rastrea esta disociación entre el monitoreo de los procesos cognitivos propios y ajenos. En este estudio se compararon los juicios de aprendizaje (judgments of learning) relacionados con el aprendizaje propio y el aprendizaje ajeno. Para llevar a cabo esta comparación, en una condición, los participantes estudiaron durante el tiempo que consideraron necesario listas de pares de palabras asociadas que ellos debían memorizar y luego debían reportar un juicio de aprendizaje sobre cada par de palabras asociadas. En otra condición, los participantes debían juzgar el aprendizaje de otro sujeto luego de verlo cómo estudia los pares de palabras. El resultado más interesante de este estudio fue descubrir que, en el caso propio, a menor tiempo de estudio de cada par, se reportaba un juicio de aprendizaje más alto. Mientras que, en el caso ajeno, a menor tiempo de estudio, se reportó un juicio de aprendizaje más bajo. La explicación que dan los investigadores de estos resultados es que en cada caso el juicio tiene un fundamento diferente. En el caso propio, el juicio se basa en un sentimiento de saber causado por la heurística de fluidez (“si lo estudio poco, es porque lo sé”); mientras que, en el caso ajeno, el juicio se basa en un juicio metarrepresentacional basado en una teoría psicológica popular (folk psychology) según la cual a menos tiempo de estudio menos retención de información (“si se estudia poco, se aprende poco; en cambio, si se estudia mucho, se aprende mucho”).

3. Teoría dual de la metacognición

Una forma de zanjar el debate entre la teoría metarrepresentacional y la teoría de monitoreo y control ha sido proponer que la metacognición es un fenómeno dual que se compone de dos niveles, cada uno de una estructura diferente, con un contenido diferente y una función diferente en la arquitectura cognitiva (Arango-Muñoz, 2011). Siguiendo la idea de las teorías de procesamiento dual de la mente (Evans, 2010), por un lado, habría un “sistema 2 de metacognición” (Proust, 2013; Shea et al., 2014), también llamada “metacognición de nivel superior” (Arango-Muñoz, 2011) o “metacognición basada en teoría” (Koriat, 2000). Por otro lado, habría un “sistema 1 de metacognición” (Proust, 2013; Shea et al., 2014), “metacognición de bajo nivel” (Arango-Muñoz, 2011), o “metacognición basada en sentimientos (Koriat, 2000). El primer tipo de metacognición (sistema 2, de nivel superior, o basado en teoría) correspondería al uso de la capacidad de lectura de mentes dirigida hacia sí mismo, tal y como lo propuso Carruthers, mientras que el segundo tipo de metacognición (sistema 1, nivel bajo, o basado en sentimientos) correspondería a la forma como los seres humanos y algunos animales controlamos intuitivamente nuestros procesos cognitivos, tal y como lo propuso Proust. La disputa se zanja al mostrar que cada una de las teorías en disputa estarían tratando de explicar un nivel diferente de metacognición, y por lo tanto el conflicto se disuelve.

Si se acepta la idea según la cual la metacognición tiene dos niveles o dos formas de procesamiento, la pregunta general por la metacognición pierde su sentido y se abren nuevas preguntas: ¿Cómo funciona exactamente cada nivel de metacognición? ¿Cuál es su estructura y contenido? Los filósofos anteriormente citados han avanzado ya en algunas de las respuestas a estas preguntas. Pero quedan otras: ¿Interactúan los niveles o formas de metacognición? ¿Cómo interactúan? ¿Acaso hay influencia del nivel superior en el nivel inferior de metacognición y viceversa? En los adultos ambos niveles parecen interactuar en ciertos casos. Por un lado, parece haber casos de influencia del nivel inferior al superior: por ejemplo, un sentimiento de incertidumbre al caminar por las calles de una ciudad donde no resido me puede llevar a formar la creencia de orden superior de que no conozco bien esta ciudad y estoy perdido. Por otro lado, parece haber casos de influencia del nivel superior sobre el inferior: por ejemplo, después de estudiar ciertos datos de la psicología cognitiva y aprender sobre la falibilidad de la memoria, puedo inferir que mi memoria es falible, y experimentar un sentimiento de incertidumbre sobre mis recuerdos.

Además, la pregunta por la metacognición en animales se transforma en otra: ¿Qué nivel o forma de metacognicón tiene este o aquel animal? La respuesta que se podría dar desde esta perspectiva es que algunos animales tienen un nivel inferior o sistema 1 de metacognición que les permite monitorear y controlar algunos de sus procesos cognitivos, por ejemplo, los delfines o los monos rhesus, tal y como lo demuestran los datos de la psicología experimental (§2.1). Una explicación de cómo pueden lograr eso se da apelando a conceptos como el de sentimientos metacognitivos (Proust, 2009b). Es importante agregar aquí, sin embargo, que no todos los animales están provistos de metacognición de nivel inferior o sistema 1 de metacognición: los monos capuchinos y las palomas, por ejemplo, parecen no poseer esta capacidad, pues no logran pasar las pruebas de monitoreo y control de sus procesos cognitivos (Inman y Shettleworth, 1999; Smith, Shields y Washburn, 2003). Finalmente, como hasta la fecha no ha sido posible determinar la presencia de capacidad de lectura de mentes y el concepto de creencia en ningún animal (Call y Tomasello, 2008), no podemos afirmar que algún animal posea un nivel superior o sistema 2 de metacognición o que algún animal sea capaz de generar pensamientos de orden superior o metarrepresentaciones.

Conclusión

El estudio de la metacognición ha cautivado tanto a psicólogos como a neurocientíficos y filósofos y ha suscitado el debate sobre la manera en que se debe definir la metacognición: (1) como la capacidad metarrepresentacional de adscribir estados mentales a otros sujetos y a sí mismo o (2) como la capacidad de monitorear y controlar los procesos cognitivos propios. Aunque no todos los autores están convencidos, la conclusión de esta discusión es que la teoría dual de la metacognición, según la cual cada una de estas definiciones corresponde a un nivel diferente de la metacognición y a una teoría general de esta capacidad, parece resolver el debate y dar cuenta de ambos niveles (Arango-Muñoz, 2011; Proust, 2013; Shea et al., 2014).

(Este texto retoma algunos elementos del texto “Metacognión en animales” de mi autoría publicado en el libro Ética animal: fundamentos cognitivos y filosóficos para nuestra relación ética con otras especies animales. Bernardo Aguilera y Juan Alberto Lecaros (Eds.). Madrid, Universidad de Comillas).

Santiago Arango-Muñoz
(Universidad de Antioquia)

Referencias

Browne, D. (2004): “Do dolphins know their own minds?”, Biology and Philosophy, 19, pp. 633-653.
Call, J. y M. Tomasello (2008): “Does the Chimpanzee have a theory of mind? 30 years later”, Trends in Cognitive Sciences, 12, pp. 187-231.
Carruthers, P. (2009): “How we know our own minds: The relationship between mindreading and metacognition”, Behavioral and Brain Sciences, 32(2), pp. 121-138. https://doi.org/10.1017/s0140525x09000545
– – – (2011): The Opacity of Mind: An Integrative Theory of Self-Knowledge, Oxford, Oxford University Press.
Fernández Cruz, A. L., S. Arango-Muñoz y K. Volz (2016): “Oops, scratch that! Monitoring one’s own errors during mental calculation”, Cognition, 146, pp. 110-120. https://doi.org/10.1016/j.cognition.2015.09.005
Gopnik, A. (1993): “How we know our minds: The illusion of first-person knowledge of intentionality, Behavioral and Brain Sciences, 16, pp. 90-101.
Inman, A. y J. S. Shettleworth (1999): “Detecting metamemory in nonverbal subjects: A test with pigeons”, Journal of Experimental Psychology, Animal Behavioral Processes, 25, pp. 389-395.
Kalnikaité, V. y S. Whittaker (2007): “Software or wetware? Discovering when and why people use digital prosthetic memory”, en CHI 2007: Proceedings of the SIGCHI conference on Human factors in computing systems, New York, ACM Press, pp. 71-80.
Koriat, A. (2000): “The feeling of knowing: Some metatheoretical implications for consciousness and control”, Consciousness and Cognition, 9(2), pp. 149-171.
Koriat, A. y R. Ackerman (2010): “Metacognition and mindreading: Judgments of learning for Self and Other during self-paced study”, Consciousness and Cognition, 19(1), pp. 251-264.
Nelson, T. O. y L. Narens (1990): “Metamemory: A theoretical framework and new findings”, The Psychology of Learning and Motivation, 26, pp. 125-173.
Paynter, C. A., L. M. Reder y P. D. Kieffaber (2009): “Knowing we know before we know: ERP correlates of initial feeling-of-knowing”, Neuropsychologia, 47(3), pp. 796-803. https://doi.org/10.1016/j.neuropsychologia.2008.12.009
Proust, J. (2007): “Metacognition and metarepresentation: Is a self-directed theory of mind a precondition for metacognition?”, Synthese, 159, pp. 271-295.
– – – (2009a): “Is there a sense of agency of thought?”, en L. O’Brien y M. Soteriou, eds., Mental actions and agency, Oxford, Oxford University Press, pp. 253-279.
– – – (2009b): “The Representational Basis of Brute Metacognition: A Proposal”, en R. Lurz, ed., The Philosophy of Animal Minds, Cambridge, Cambridge University Press, pp. 165-183.
– – – (2012): “Metacognition and mindreading: One or two functions?”, en Beran, M., J. Brandl, J. Perner y J. Proust, eds., The foundations of metacognition, Oxford, Oxford University Press, pp. 234-250.
– – – (2013): The Philosophy of Metacognition: Mental Agency and Self-Awareness, Oxford, Oxford University Press.
Reder, L. M. (1987): “Strategy selection in question answering”, Cognitive Psychology, 19(1), pp. 90-138. https://doi.org/10.1016/0010-0285(87)90005-3
Shea, N., A. Boldt, D. Bang, N. Yeung, C. Heyes y C. D. Frith (2014): “Supra-personal cognitive control and metacognition”, Trends in Cognitive Sciences, 18(4), pp. 186-193. https://doi.org/10.1016/j.tics.2014.01.006
Smith, J. D., J. Schull, J. Strote, K. McGee, R. Egnor y L. Erb (1995): “The uncertain response in the bottlenosed dolphin (Tursiops truncatus)”, Journal of Experimental Psychology: General, 124, pp. 391-408.
Smith, J. D., W. E. Shields, J. Schull, y D. A. Washburn (1997): “The uncertain response in humans and animals”, Cognition, 62(1), pp. 75-97. https://psycnet.apa.org/doi/10.1016/S0010-0277(96)00726-3
Smith, J. D., W. Shields y D. Washburn (2003): “The comparative psychology of uncertainty monitoring and metacognition”, Behavioral and Brain Sciences, 26(3), pp. 317-339.
Wilson, T. D. (2002): Strangers to ourselves, Harvard University Press.

Cómo citar esta entrada

Arango-Muñoz, Santiago (2019) «Metacognición», Enciclopedia de la Sociedad Española de Filosofía Analítica (URL: http://www.sefaweb.es/metacognicion/).

Ética animal

La ética animal es el campo de estudio que examina la forma en la que deberíamos considerar a los animales no humanos y actuar hacia ellos. Existe una idea, extendida de forma general, según la cual los intereses de los miembros de la especie humana son los únicos que cuentan, o cuentan siempre más que los intereses de los miembros de las demás especies. Dicha idea tiene consecuencias importantes. En el caso de los animales no humanos bajo explotación humana, se les causa unos daños que la mayoría consideraría injustificado causar a seres humanos en circunstancias similares. En el caso de los animales que viven en el medio salvaje, se rehúsa darles ayuda en circunstancias en las que consideraríamos obligatorio hacerlo si fueran seres humanos en semejante situación de necesidad. Las posturas críticas con esta posición mantienen que hay fuertes razones para considerar que la gran mayoría de animales no humanos, tanto los que son empleados como recursos como los que viven en el medio salvaje, son individuos sintientes. De aquí se sigue que, al igual que los seres humanos, pueden ser afectados por lo que les ocurre de forma positiva o negativa. Por ello, estas posiciones sostienen que los intereses de los animales en no sufrir y en disfrutar de sus vidas deben ser considerados, independientemente de la especie a la que pertenecen. Ello supondría el rechazo a participar de todas aquellas prácticas que suponen causarles un daño, así como actuar para prevenir o reducir los daños que sufren por otras razones como, por ejemplo, por motivos naturales.

¿Qué argumentos hay a favor y en contra de cada una de estas posiciones? ¿Se encuentra justificada la diferencia de consideración y trato entre seres humanos y otros animales? Es decir, ¿es correcto favorecer los intereses humanos por encima de los intereses no humanos? Y si los intereses de los demás animales cuentan ¿qué implicaciones se derivan para la forma en que hoy en día actuamos hacia ellos? Por último, además de los animales no humanos, ¿podrá haber otras entidades moralmente considerables?

1. Antropocentrismo y especismo

En el ámbito de la ética animal la posición que sostiene que los intereses humanos cuentan más que los de los demás animales ha sido conocida como “antropocentrismo” (Steiner, 2005). El antropocentrismo defiende, así, que los seres humanos son los únicos seres moralmente considerables, o que lo son siempre en mayor medida que las restantes entidades no humanas (no ha de confundirse este sentido del término con otros que se da al término “antropocentrismo” en ámbitos diferentes, como ocurre cuando este se define como la posición que sostiene que los únicos valores son aquellos reconocidos por los seres humanos o que solo nos es posible conocer algo desde un punto de vista humano. Quienes se han opuesto el antropocentrismo han defendido que el criterio para considerar moralmente a alguien debería ser la sintiencia, esto es, la capacidad de tener experiencias, que pueden ser positivas o negativas (en ética aplicada el término “sintiencia” es usado comúnmente como sinónimo de lo que en filosofía de la mente se conoce como “consciencia”). Y han argumentado que una gran parte de los animales son sintientes. En contraste, han sostenido que ni la mera pertenencia a la especie ni ningún otro criterio vinculado a esta justifica dar a alguien un trato mejor o peor. En consecuencia, han concluido que el antropocentrismo constituye una forma de especismo (Ryder, [1970] 2010): la consideración o trato desfavorable injustificado de quienes no pertenecen a una cierta especie (Horta, 2010). La forma de especismo más común sería la que favorece a los seres humanos, el especismo antropocéntrico, pero podría ser también especista cualquier otra distinción entre otros animales ligada a su especie que resultase injustificada (Dunayer, 2004; O’Sullivan, 2011).

2. Defensas del antropocentrismo

Se ha intentado justificar el antropocentrismo de diferentes maneras. En algunas ocasiones, de forma definicional, simplemente asumiendo que la mera pertenencia a la especie humana es moralmente relevante (Diamond, 1978; Lynch y Wells, 1998). En otros casos, se ha defendido que solamente los seres humanos cumplen otros criterios moralmente relevantes que justifican un trato favorable. Estos pueden ser:

(i) Atributos intrínsecos cuya posesión es susceptible de comprobación, como ciertas capacidades intelectuales complejas (Frey, 1980; Paton, 1984).

(ii) Atributos intrínsecos de posesión no comprobable, como almas o un estatuto ontológico superior (Aristóteles, [ca. s. IV a.c], 2004, 1256b; Ballesteros, 2004).

(iii) Relaciones de existencia comprobable, como la solidaridad o el poder (Midgley, 1983; Petrinovich, 1999).

(iv) Relaciones de existencia no comprobable, como la consistente en ser la especie elegida por una divinidad (Harrison, 1989; Reichmann, 2000).

Esta sería una clasificación exhaustiva. Las diferentes defensas de esta posición o bien caerían dentro de uno de estos grupos, o bien serían combinaciones de posiciones de estos tipos. Algunas posiciones defienden que solo los seres humanos son moralmente considerables porque únicamente ellos pertenecen a la misma especie que quienes poseen ciertas capacidades especiales, o son relevantemente parecidos a ellos precisamente por pertenecer a su misma especie (Scruton, 1996; Kagan, 2016). Otras perspectivas llegan a la misma conclusión sosteniendo que solo los humanos cumplen el requisito de o bien poseer ciertas capacidades o bien tener ciertas relaciones especiales con otros sujetos agentes morales (Scanlon, [1998] 2003; Cortina, 2009).

3. Argumentos contra el antropocentrismo

Se han utilizado varios argumentos en contra del antropocentrismo, de los que se destacan los siguientes:

(i) El argumento de la petición de principio sostiene que las posiciones definicionales y las que apelan a criterios de satisfacción no comprobable no descansan en razones que las puedan justificar. Este argumento indica que estas posiciones simplemente asumen de partida como correcta la prioridad de los intereses humanos sin ofrecer un argumento ulterior que las respalde (Cavalieri, 2001).

(ii) El argumento de la superposición de especies, indica que ninguno de los criterios no definicionales de satisfacción comprobable es cumplido por todos y cada uno de los seres humanos y solo por ellos. Es decir, para cualquier criterio x, habrá seres humanos que no lo cumplan y animales no humanos que sí lo cumplan. Así, si consideramos por ejemplo las capacidades cognitivas complejas, nos encontramos con que hay seres humanos que carecen de estas, por motivos congénitos, por enfermedad o accidente. Esto puede ocurrir de forma temporal (infancia, vejez) o permanente (diversidad funcional intelectual). Por su parte, tampoco las relaciones de solidaridad o poder son mantenidas de manera universal entre los seres humanos. Ello supone que si cumplir tales condiciones fundamentara la consideración moral, estaría justificado no considerar o dar menos importancia a los intereses de todos aquellos seres humanos que no las cumplen, lo que a la mayoría nos parecería inaceptable (Porfirio, [ca. s. III] 1984, 3, 8, 8; Horta, 2014). (Este argumento se conoce también como “el argumento de los casos marginales”, si bien esta denominación es problemática, pues los seres humanos que no poseen ciertos atributos o que no mantienen cierto tipo de relaciones son plenamente humanos y no humanos marginales.)

(iv) El argumento de la relevancia descansa en la idea de que, para que un criterio justifique tratar de forma distinta a alguien, tal criterio debe basarse en una diferencia relevante para aquello que está en cuestión. Así, por ejemplo, lo relevante para recibir una pensión puede ser tener una cierta edad, lo cual en cambio no sería relevante para recibir un subsidio de desempleo. Sobre la base de esta idea, el argumento parte, en primer lugar, de que en nuestras decisiones acerca de si considerar moralmente a alguien lo que está en cuestión es si ese alguien puede sufrir daños o disfrutar de beneficios. Sostiene, por ello, que lo que deberíamos considerar relevante para considerar moralmente a alguien sería su capacidad de sufrir daños y/o disfrutar de beneficios. En segundo lugar, el argumento defiende que lo que determina esto es únicamente la sintiencia, y no los criterios de otros tipos en los que se basa la defensa del antropocentrismo. Es decir, la posesión de ciertas capacidades o de ciertas relaciones podría ser relevante para que alguien pueda sufrir ciertos tipos de daños o disfrutar de ciertos beneficios. Pero no sería lo que determina que los pueda sufrir o disfrutar como tal, de manera general. Por ello, iguales daños o beneficios deberían contar igual independientemente de a quién afecten, pues lo contrario significaría tener en cuenta criterios que no son relevantes. Así, el argumento concluiría que los intereses de humanos y no humanos deberían ser igualmente considerados (Sapontzis, 1987; Bernstein, 2015).

(v) Por último, el antropocentrismo puede ser rechazado desde toda una serie de argumentos relativos a distintas teorías normativas. Se ha sostenido que no dar plena consideración a los animales no humanos implica no obtener las mejores consecuencias, actuar de maneras inherentemente incorrectas o no obrar conforme a un carácter moral adecuado. Exponer de manera más concreta los argumentos que se han presentado apelando a las prescripciones defendidas por cada teoría en particular requeriría un espacio mucho más extenso que este. Pero valga decir que la consideración moral de los animales ha sido defendida desde posiciones utilitaristas (Singer, [1979] 2009; Matheny, 2006), igualitaristas y prioritaristas (Gompertz, [1824] 1997; Holtug, 2007; Faria, [2014] 2016; Horta, 2016), consecuencialistas negativas, (Leighton, 2011; Tomasik, 2018); kantianas y neokantianas (Pluhar, 1995; Francione, 2000; Franklin, 2005; Korsgaard, 2018), apelando a derechos prima facie (Regan, [1983] 2013), contractualistas (VanDeVeer, 1979; Rowlands, 1998), de las virtudes (Dombrowski, 1984; Nobis, 2002; Abbate, 2014); del cuidado (Clement, 2003; Donovan, 2006; Donovan y Adams, 2007), desde la perspectiva de las capacidades, (Nussbaum, 2006; Torres, 2016), desde el pragmatismo (McKenna y Light, 2004) y desde posturas pluralistas (Clark, 1977; Sapontzis, 1987).

4. Los intereses de los animales

Una forma de rechazar el argumento de la relevancia consiste en defender que los animales no humanos no tendrían intereses moralmente relevantes, dado que solo los seres humanos podrían tener experiencias. Aunque esta posición ha gozado de aceptación en distintos momentos históricos (Descartes, [1637] 2003; Carruthers, [1992] 1995), choca a día de hoy con la postura mantenida de forma más general en el ámbito científico (Low et al., [2012] 2017). Se acepta normalmente que los animales son seres sintientes apelando fundamentalmente a tres criterios: (i) las evidencias basadas en la observación de la conducta de los animales (Griffin, 1992; Allen y Bekoff, 1997; Allen y Trestman, 2017); (ii) las razones que apelan al papel de la sintiencia a lo largo del proceso evolutivo (Rollin, 1989; Ng, 1995; Denton et al., 2009); y (iii) las evidencias fisiológicas, al poseer no solo los vertebrados, sino también un gran número de invertebrados, sistemas nerviosos que procesarían información de forma coordinada (Mather, 2001; Gregory, 2004; Tye, 2017).

Otra posición más moderada ha sostenido que, aunque un gran número de animales puedan tener experiencias, los seres humanos pueden experimentar disfrutes y sufrimientos de carácter psicológico más intensos que los disfrutes y sufrimientos de los demás animales (Leahy, 1992). Un argumento en contra de ello señalaría que la intensidad de las experiencias no tiene por qué depender necesariamente de su complejidad. Además, se podría afirmar que ciertos disfrutes y sufrimientos físicos pueden tener una mayor intensidad que los de carácter psicológico (Primatt, 1776; Rollin, 1989).

Por último, se ha defendido también que los animales no humanos tendrían un interés en no sufrir pero no en vivir, sosteniendo que para poseer este último sería necesaria la capacidad de hacer planes a largo plazo, o la de concebirse a uno o una misma a lo largo del tiempo (Cigman, 1981; Ferré, 1986). Una posición opuesta a esta sostiene que la muerte es un daño por privación que nos afecta negativamente siempre que nos priva de bienes futuros (Nagel, 1970; Bradley, 2009). Si esto es así, entonces los animales dotados de la capacidad de tener experiencias positivas podrían ser dañados al morir. Ciertas posiciones han aceptado esto y mantenido, no obstante, que su interés en vivir sería significativamente menor que el de los seres humanos con capacidades cognitivas complejas, dada la menor conexión psicológica con su yo futuro (McMahan, 2002; Rowlands, 2002), mientras que otras han puesto en duda esta afirmación o su relevancia con respecto al interés en vivir (Cavalieri, 2001; Bernstein, 2015).

En suma, se ha argumentado que, si los intereses no humanos en no sufrir son moralmente relevantes, entonces tenemos fuertes razones para evitar su sufrimiento siempre que podamos hacerlo. Y se ha sostenido, además, que, si la muerte es un mal, entonces sería un mal también para los animales no humanos, al privarles de experiencias futuras positivas. Ello nos daría razones para no matarlos y para impedir que mueran por otros motivos. Esto sería así independientemente de si el interés en vivir de los animales no humanos pueda resultar, en ocasiones, comparativamente más débil que el interés humano. Si todo esto es correcto, ello tendrá importantes implicaciones prácticas, dada la multiplicidad de ámbitos en los que actualmente nos relacionamos con los animales no humanos y que suponen su sufrimiento y muerte. De ello tratarán las siguientes secciones.

5. El uso de animales no humanos

Uno de los ámbitos prácticos de los que se ocupa la ética animal consiste en el uso como recursos de los animales por parte de los seres humanos. Se estima que anualmente son matados más de 60.000 millones de mamíferos y aves (FAO, 2018), y unos dos billones de animales acuáticos fundamentalmente para la obtención de productos culinario-alimenticios (Mood y Brooke, 2010, 2012). Estas cifras no incluyen su empleo para otros fines, como la producción de ropa, el entretenimiento o la investigación. Se ha documentado extensamente que una parte muy importante de estos sufre terriblemente a lo largo de su vida, en particular, aunque no solamente, en las granjas industriales actuales (Harrison, 1964; Singer, [1975] 2011; Horta 2017). Ante esto, se ha sostenido que la oposición al especismo supondría la asunción del veganismo, nombre que recibe el rechazo a participar en cualquiera de las distintas formas de explotación animal (Gompertz, [1824] 1997; Davis, 1976). Esta posición ha sido también defendida, no obstante, sin apelar al cuestionamiento del especismo, argumentando que los animales no han dado su consentimiento a los daños que sufren y que la magnitud de estos sería muy superior a la de los beneficios que puede ocasionar a los seres humanos (Francione, 2000; Hooley y Nobis, 2015). Algunas de las defensas del uso de los animales han cuestionado esta última afirmación (Frey, 1983), si bien normalmente se han efectuado sosteniendo la justificación del antropocentrismo (Narveson, 1987; Cohen, en Cohen y Regan, 2001).

6. La situación de los animales en el mundo salvaje

Otro campo práctico del que se ocupa la ética animal es el de nuestra acción hacia los animales que viven en el mundo salvaje, o que no se encuentran recluidos. Tradicionalmente se ha entendido que no tenemos por qué preocuparnos por su suerte. Esto puede defenderse simplemente por motivos especistas. Pero también ha sido mantenido asumiendo que la situación de los animales en la naturaleza es fundamentalmente buena. A su vez, otras posiciones han sostenido que no tendríamos por qué (o incluso que no deberíamos) dar ayuda a los animales en el mundo salvaje, aunque efectivamente necesiten que acudamos en su auxilio y podamos hacerlo. Esto se ha defendido sobre la base de que solo tenemos motivos para preocuparnos de lo que les sucede a los animales con quienes tenemos una relación especial (Palmer, 2010), o sosteniendo que constituyen comunidades soberanas en las que solo deberíamos intervenir en situaciones catastróficas (Donaldson y Kymlicka, [2011] 2018).

Estas posiciones han sido cuestionadas señalando que en el mundo salvaje los animales se enfrentan a múltiples fuentes de sufrimiento, como enfermedades, condiciones climáticas hostiles, accidentes, parasitismo, ataques, etc. Esto no sucede de manera minoritaria, pues las estrategias reproductivas predominantes en la naturaleza hacen que gran parte de los animales mueran poco después de comenzar a existir, a menudo de formas muy dolorosas. Al morir tan temprano tiene pocas oportunidades de tener experiencias positivas. Se ha argumentado por ello que el sufrimiento y la muerte prematura prevalecerían en la naturaleza por encima del disfrute, y que ello nos daría razones para actuar en favor de tales animales (Ng, 1995; Tomasik, 2015; Faria y Páez, 2015; Dorado, 2015a; Faria, 2016; Horta, 2017). De hecho, existen en la actualidad diferentes formas en las que se proporciona ayuda a algunos animales en el mundo salvaje, incluyendo refugios para animales enfermos o heridos, así como programas de suministro de alimento o vacunación (Ética Animal, 2016). Asimismo, se ha propuesto desarrollar un nuevo campo de estudio, la biología del bienestar, que se ocupe del estudio de la situación de los animales en los distintos ecosistemas y de los factores que les afectan negativa y positivamente, y que podría proporcionar un conocimiento mucho más firme para actuar en su beneficio (Ng, 1995; Faria, 2016).

7. El conflicto entre las posiciones en ética animal y ética ambiental

Las posiciones que sostienen la plena consideración de los intereses de los animales en función de su sintiencia entran también en conflicto, además de con el antropocentrismo, con otro tipo de posturas acerca de qué entidades han de ser moralmente considerables. Estas han sido representativas en el ámbito de la ética ambiental, el campo de estudio que examina la forma en la que deberíamos considerar diferentes entidades naturales y actuar sobre ellas. Podemos distinguir fundamentalmente las dos siguientes.

Biocentrismo

El biocentrismo es la posición según la cual la consideración moral debe ser extendida de forma que incluya a todos los organismos vivos. Según las posiciones biocentristas que han logrado más aceptación, todo ser vivo tiene “un bienestar propio” que debe ser tenido en cuenta a la hora de decidir cómo debemos actuar (Schweitzer, [1923] 1962; Goodpaster, 1978; Taylor, 1986). En ocasiones se cree que existiría un conflicto entre el biocentrismo y el veganismo al aceptar este último el consumo de seres vivos como plantas u hongos, si bien este no es el caso, al suponer el consumo de animales un empleo de un número mucho mayor de plantas empleadas en la cría de estos. Pero el biocentrismo tiene otras implicaciones contrarias a los intereses de los animales. Ello puede ocurrir, por ejemplo, si un animal sintiente (sea un ser humano o algún otro) padece una infección bacteriana. El biocentrismo implicaría que cada bacteria sería merecedora de consideración moral, lo que nos daría como mínimo razones pro tanto para no promover un tratamiento de tal infección.

Esto constrastaría claramente con lo que defiende el criterio centrado en la sintiencia que hemos visto arriba. Este no identificaría el conjunto de los seres moralmente considerables con el de los seres vivos. De hecho, no lo haría tampoco con el del conjunto de los animales. Conforme a él, los animales que no fuesen sintientes (como pueden ser las esponjas, que no teniendo sistema nervioso no cumplen los criterios indicados en el apartado 4) no serían considerables, mientras que posibles entidades sintientes artificiales futuras sí lo serían.

Holismo

Por su parte, el holismo considera que la consideración moral debe ser asignada no a los individuos (sintientes o no sintientes), sino a los conjuntos biológicos, tal y como las especies, los ecosistemas, etc. (Leopold, [1949] 2000 ; Callicott, 1989; Johnson, 1993r). Así, esta posición podrá aceptar el uso de animales siempre y cuando no afecte negativamente a la conservación ambiental, y rechazará dar ayuda a los animales en situación de necesidad en el mundo salvaje en la medida en que ello suponga la transformación de algún ecosistema. Por otra parte, apoyará intervenciones en el medio natural dañinas para los animales sintientes, como el exterminio de aquellos cuya presencia en un determinado ecosistema se considera que afecta negativamente al equilibrio y la conservación de este (Shelton, 2004).

El biocentrismo y el holismo han sido criticados argumentando que cualquier concepción plausible de lo que es valioso para una entidad implica una condición afectiva que haga posible que un cierto estado o cambio de estado pueda ser recibido como positivo o negativo, y solo los seres sintientes cumplen este requisito (Faria, 2012). Esto es lo que explicaría nuestra intuición contraria a lo que pasa en el ejemplo de la infección, y también que no parece que tengamos un interés en continuar existiendo si se da el caso que perdamos irreversiblemente la consciencia. Por otra parte, es asimismo lo que nos proporcionaría razones para concluir que, aunque la eliminación de poblaciones humanas favoreciese la conservación de los ecosistemas, ello no resultaría una medida aceptable.

En relación con esta cuestión, se ha argumentado también que, en realidad, posiciones como el biocentrismo y el holismo raramente son sostenidas cuando existe un conflicto entre la conservación de conjuntos biológicos, o de entidades no sintientes vivas, e intereses humanos significativos. Solamente lo son cuando entran en conflicto con los intereses de animales no humanos (Attfield, 1987; Varner, 1991). Esto ha sido cuestionado como especista, sosteniéndose así que la única alternativa sólida al antropocentrismo sería la asunción del criterio de la sintiencia (Faria, 2012; Dorado, 2015b).

8. Conclusión

La ética animal es la reflexión acerca de la consideración y la forma de actuar hacia los animales no humanos. En las últimas décadas se ha asistido a una creciente concienciación social en términos de ampliación de la consideración moral a diferentes seres humanos, independientemente de factores irrelevantes como el género de los individuos, su color de piel, orientación sexual, procedencia geográfica, complejidad cognitiva, etc. Según una gran parte de quienes trabajan en el ámbito de la ética animal, esto debería ocurrir también en el caso de los individuos sintientes de las demás especies.

Esto entraría en contraste con lo que defenderían las posiciones antropocentristas. Desde estas se podría argumentar que los corolarios prácticos de considerar moralmente a los animales no humanos son en la práctica demasiado exigentes a la hora de orientar nuestra conducta. Quienes rechacen esta objeción aceptarán que en nuestra relación con los demás animales actuar de manera moralmente aceptable puede tener un coste, al igual que ocurre en el caso de los seres humanos. Pero sostendrán que a la hora de decidir cómo debemos actuar no somos los únicos individuos a quienes debemos tener en cuenta, y que los costes personales de actuar de forma justificada deben ser sopesados con los beneficios que se derivan de ello para todos los individuos afectados. En este caso particular, concluirán que el coste que pueda tener atender a los intereses de los animales no humanos (por ejemplo, al renunciar a un determinado sabor o al cambiar el modo en el que actuamos hacia los animales en el mundo salvaje) resulta mucho menor que los beneficios ocasionados en la mejora de su situación (al evitar su sufrimiento intenso y prolongado, así como su muerte).

Catia Faria

Universidade do Minho (Portugal)

Oscar Horta

Universidade de Santiago de Compostela

Referencias

Abbate, C. (2014): “Virtues and animals: A minimally decent ethic for practical living in a non-ideal world”, Journal of Agricultural and Environmental Ethics, 27, pp. 909-929.
Allen, C. y M. Bekoff (1997): Species of mind: The philosophy and biology of cognitive ethology, Cambridge, MIT Press.

Allen, C. y M. Trestman (2017): “Animal consciousness”, en Stanford Encyclopedia of Philosophy, E. N. Zalta, ed., disponible en https://plato.stanford.edu/archives/win2017/entries/consciousness-animal/ [Winter 2017 Edition].
Aristóteles ([ca. S. IV a.c.] 2004): Política, Madrid, Tecnos.
Attfield, R. (1987): “Biocentrism, moral standing and moral significance”, Philosophica, 39, pp. 47-58.
Ballesteros, J. (2004): “Exigencias de la dignidad humana en Biojurídica”, en Aparisi, A., J. Ballesteros, coords., Biotecnología, dignidad y derecho: bases para un diálogo, Pamplona, Ediciones Universidad de Navarra, pp. 43-77.
Bernstein, M. H. (2015): The moral equality of humans and animals, Basingstoke, Palgrave Macmillan.
Callicott, J. B. (1989): In defense of the land ethic: Essays in environmental philosophy, Albany, State University of New York Press.
Cavalieri, P. (2001): The animal question: Why nonhuman animals deserve human rights, Oxford, Oxford University Press.
Cigman, R. (1981): “Death, misfortune and species inequality”, Philosophy and Public Affairs, 10, pp. 47-54.
Clark, S. R. L. (1977): The moral status of animals, New York, Oxford University Press.
Clement, G. (2003): “The ethic of care and the problem of wild animals”, Between the Species, 10(3), pp. 1-12, https://digitalcommons.calpoly.edu/bts/vol13/iss3/2 [consulta: julio 2018].
Cohen, C. y T. Regan (2001): The animal rights debate, Lanham, Rowman & Littlefield.

Cortina, A. (2009): Las fronteras de la persona: el valor de los animales, la dignidad de los humanos, Madrid, Taurus.
Davis, W. H. (1976): “Man-eating aliens”, Journal of Value Inquiry, 10, pp. 178-185.
Denton, D. A., M. J., McKinley, M. Farrell y G. F. Egan (2009): “The role of primordial emotions in the evolutionary origin of consciousness”, Consciousness and Cognition, 18, pp. 500-514.
Descartes, R. ([1637] 2003): Discurso del método, Madrid, Tecnos.
Diamond, C. (1978): “Eating meat and eating people”, Philosophy,53, pp. 465-479.
Dombrowski, D. A. (1984): Vegetarianism: The philosophy behind the ethical diet, London, Thorsons.
Donaldson, S. y W. Kymlicka ([2011] 2018 ): Zoopolis: una revolución animalista, Madrid, Errata naturae.
Donovan, J. (2006): “Feminism and the treatment of animals: From care to dialogue”, Signs, 31, pp. 305-29.
Donovan, J. y C. J. Adams, eds., (2007): The feminist care tradition in animal ethics, New York, Columbia University Press.
Dorado, D. (2015a): “Una aproximación bibliográfica a la cuestión de la intervención en la naturaleza”, en Los retos de la Filosofía en el siglo XXI: Actas del I Congreso Internacional de la Red Española de Filosofía, València, Universitat de València, 17, pp. 37-42.
Dorado, D. (2015b): El conflicto entre la ética animal y la ética ambiental: bibliografía analítica, tesis doctoral, Madrid, Universidad Carlos III.
Dunayer, J. (2004): Speciesism, Derwood, Ryce Publishing.
Ética Animal (2016): “Ayudando a los animales en la naturaleza”, Animales en la naturaleza, http://www.animal-ethics.org/ayudando-a-los-animales-en-la-naturaleza [consulta: julio 2018]
FAO – Organización de las Naciones Unidas para la alimentación y la agricultura (2018) “Ganadería primaria”, FAOSTAT – Datos sobre alimentación y agricultura, http://fao.org/faostat/es/#data/QL [consulta: julio de 2018].
Faria, C. (2012): “Muerte entre las flores: el conflicto entre el ecologismo y la defensa de los animales no humanos”, Viento Sur, 125, pp. 67-76.
Faria, C. ( [2014] 2016 ): “Igualdad, prioridad y animales no humanos”, en Ávila Gaitán, I. D., comp., La cuestión animal(ista), Bogotá, Desde Abajo Ediciones, pp. 327-340.
Faria, C. (2016): Animal ethics goes wild: The problem of wild animal suffering and intervention in nature, tesis doctoral, Barcelona, Universitat Pompeu Fabra.
Ferré, F. (1986): “Moderation, morals and meat”, Inquiry, 29, pp. 391-406.
Francione, G. (2000): Introduction to animal rights: Your child or the dog?, Philadelphia, Temple University Press.
Franklin, J. (2005): Animal rights and moral philosophy, New York, Columbia University Press.
Frey, R.G. (1983): Rights, killing and suffering: Moral vegetarianism and applied ethics, Oxford, Basil Blackwell.
Frey, R.G. (1980): Interests and rights: The case against animals, Oxford, Clarendon.
Gompertz, L. ([1824]1997): Moral inquiries on the situation of man and of brutes, Lewiston, Edwin Mellen Press.
Goodpaster, K. E. (1978): “On being morally considerable”, Journal of Philosophy, 75, pp. 308-325.
Gregory, N. G. (2004): Physiology and behaviour of animal suffering, Ames, Blackwell.
Griffin, D. R. (1992): Animal minds: Beyond cognition to consciousness, Chicago, Chicago University Press.
Harrison, P. (1989): “Theodicy and animal pain”, Philosophy, 64, pp. 79-92.
Harrison, R. (1964): Animal machines: The new factory farming industry, London, Vincent Stuart.
Holtug, N. (2007): “Equality for animals.”, en Ryberg, J., T. S. Petersen y C. Wolf, eds., New Waves in Applied Ethics, Basingstoke, Palgrave Macmillan, pp. 1-24.
Hooley, D. y N. Nobis (2015): “A moral argument for veganism”, en Chignell, A., T. Cuneo y M. C. Halteman, eds., Philosophy comes to dinner: Arguments about the ethics of eating, Londres, Routledge, pp. 92-108.
Horta, O. (2010): “What is speciesism?”, Journal of Agricultural and Environmental Ethics, 23, pp. 243-266.
Horta, O. (2016): “Egalitarianism and animals”, Between the Species, 19, pp. 108-144.
Horta, O. (2014): “The scope of the argument from species overlap”, Journal of Applied Philosophy, 31, pp. 142-54.
Horta, O. (2017): Un paso adelante en defensa de los animales, Madrid, Plaza y Valdés.
Johnson, L. E. (1993): A morally deep world: An essay on moral significance and environmental ethics, Cambridge, Cambridge University Press.
Kagan, S. (2016): “What’s wrong with speciesism?”, Journal of Applied Philosophy, 33, pp. 1-21.
Kant, E. ([1785] 1996): Fundamentación de la metafísica de las costumbres, Barcelona, Ariel.
Korsgaard, C. M. (2018): Fellow creatures: Our obligations to the other animals, Oxford, Oxford University Press.
Leahy, M. P. T. (1991): Against liberation: Putting animals in perspective, London, Routledge.
Leighton, J. (2011): The battle for compassion: Ethics in an apathetic universe, New York, Algora.
Leopold, A. ([1949] 2000): Una ética de la tierra, Madrid, Los libros de la Catarata.
Low, P. et al. ([2012] 2017): “Declaración sobre la consciencia de Cambridge”, Ética Animal, http://www.animal-ethics.org/declaracion-consciencia-cambridge/ [consulta: julio 2018]
Lynch, T. y D. Wells (1998): “Non-anthropocentrism? A killing objection”, Environmental Values, 7, pp. 151-163.
Matheny, G. (2006): “Utilitarianism and animals”, en P. Singer, ed., In defense of animals: The second wave, Malden, Blackwell, pp. 13-25.
Mather, J. A. (2001): “Animal suffering: An invertebrate perspective”, Journal of Applied Animal Welfare Science, 4, pp. 151-156.
McKenna, E. y A. Light (2004): Animal pragmatism: Rethinking human-nonhuman relationships, Bloomington, Indiana University Press.
McMahan, J. (2002): The ethics of killing: Problems at the margins of life, Oxford, Oxford University Press.
Midgley, M. (1983): Animals and why they matter, Athens, University Georgia Press.
Mood, A. y P. Brooke (2010): “Estimating the number of fish caught in global fishing each year”, Fishcount.org.uk, http://fishcount.org.uk/published/std/fishcountstudy.pdf [consulta: julio 2018]
Mood, A. y P. Brooke (2012): “Estimating the number of farmed fish killed in global aquaculture each year”, Fishcount.org.uk, http://fishcount.org.uk/published/std/fishcountstudy2.pdf [consulta: julio 2018]
Nagel, T. (1970): “Death,” Noûs, 4, pp. 73-80.
Narveson, J. (1987): “On a case for animal rights”, The Monist, 70, pp. 31-49.
Ng, Y. K. (1995): “Towards welfare biology: Evolutionary economics of animal consciousness and suffering”, Biology and Philosophy, 10, pp. 255-285.
Nobis, N. (2002): “Vegetarianism and virtue: Does consequentialism demand too little?”, Social Theory and Practice, 28, pp. 135-56.
Noddings, N. (1984): Caring: A feminine approach to ethics and moral education, Berkeley, University of California Press.
Nussbaum, M. C. (2006): Las fronteras de la justicia, Barcelona, Paidós.
O’ Sullivan, S. (2011): Animals, equality and democracy, Basingstoke, Palgrave Macmillan.
Palmer, C. A. (2010): Animal ethics in context, New York, Columbia University Press.
Paton, W. (1984): Man and mouse, Oxford, Oxford University Press.
Petrinovich, L. (1999): Darwinian dominion: Animal welfare and human interests, Cambridge, MIT Press.
Pluhar, E. (1995): Beyond prejudice. The moral significance of human and nonhuman animals, Durham, Duke University Press.
Porfirio ([ca. s. III] 1984): Sobre la abstinencia, Madrid, Gredos.
Primatt, H. (1776): A Dissertation on the Duty of Mercy and the Sin of Cruelty to Brute Animals, London, T. Cadell, J. Dodsley y Co.
Regan, T. ([1983] 2013): En defensa de los derechos de los animales, Ciudad de México, Fondo de Cultura Económica.
Reichmann, J. (2000): Evolution, animal ‘rights’ and the environment, Washington, The Catholic University of America Press.
Rollin, B. (1989): The unheeded cry: Animal consciousness, animal pain and science, Oxford, Oxford University Press.
Rowlands, M. (2002): Animals like us, London, Verso.
Rowlands, M. (1998): Animal rights: A philosophical defence, London, MacMillan Press.
Ryder, R. D. ([1970] 2010): “Speciesism again: The original leaflet”, Critical Society, 2, pp. 1-2.
Sapontzis, S. F. (1987): Morals, reason, and animals, Philadelphia, Temple University Press.
Scanlon, T. M. ( [1998] 2003): Lo que nos debemos unos a otros: ¿Qué significa ser moral?, Barcelona, Paidós.
Schweitzer, A. ([1923]1962): Civilización y ética, Buenos Aires, Sur.
Scruton , R. (1996): Animal rights and wrongs, London, Demos.
Shelton, J. A. (2004): “Killing animals that don’t fit in: Moral dimensions of habitat restoration”, Between the Species, 13(4), pp. 1-21, http://digitalcommons.calpoly.edu/bts/vol13/iss4/3 [consulta: julio 2018]
Singer, P. ([1979] 2009): Ética práctica, Madrid, Akal.
Singer, P. ([1975] 2011): Liberación animal, Madrid, Taurus.
Steiner, G. (2005): Anthropocentrism and its discontents: The moral status of animals in the history of western philosophy, Pittsburgh, University of Pittsburgh Press.
Taylor, P. (1986): Respect for nature, Princeton, Princeton University Press.
Tomasik, B. (2015): “The importance of wild-animal suffering”, Relations: Beyond Anthropocentrism, 3, pp. 133-152.
Tomasik, B. (2018): “Reasons to promote suffering-focused ethics”, Essays on Reducing Suffering, https://reducing-suffering.org/the-case-for-promoting-suffering-focused-ethics/[consulta: julio 2018].
Torres, M. (2016): La teoría de los derechos de los animales de Martha Nussbaum en el contexto de la ética contemporánea, tesis doctoral, Donostia, Universidad del País Vasco.
Tye, M. (2017): Tense bees and shell-shocked crabs: Are animals conscious?, New York, Oxford University Press.
VanDeVeer, D. (1979): ‘On Beasts, persons and the original position’, The Monist, 62, pp. 368-377.
Varner, G. (1991): “No holism without pluralism”, Environmental Ethics, 13, pp. 175-179.

Lecturas recomendadas en castellano

Dorado, D. (2010): “La consideración moral de los animales no humanos en los últimos cuarenta años: una bibliografía anotada”, Télos, 17, pp. 47-63

Entradas relacionadas

Cómo citar esta entrada

Faria, C. y O. Horta (2019). «Ética animal», Enciclopedia de la Sociedad Española de Filosofía Analítica, http://www.sefaweb.es/etica-animal/

B

Belleza

No sería exagerado decir que la belleza ha sido la noción más importante de la que se ha ocupado la estética filosófica, ni tampoco que ha sido la más controvertida, pues pocas cosas como ella desafían tanto el espíritu teórico de la disciplina. Intentar dar cuenta de aquello que compartan todos los fenómenos que se consideren bellos nos devuelve a la advertencia que Platón hacía en el Hipias, a saber, que lo bello es difícil. Además, lo que sea la belleza ha captado el interés no sólo de filósofos sino, entre otros, de literatos, historiadores del arte, artistas, psicólogos, neurocientíficos, antropólogos, etc. Vista así, cualquier aproximación general al tema está avocada al fracaso, o al menos, a dejarse demasiados elementos en el tintero. Susan Sontag (2005) dijo que “la mejor teoría de la belleza es su historia”. Por lo que, a pesar de todo, se intentará dar cuenta aquí de lo que habrían sido los dos grandes “momentos en su historia” (Bozal, 1998a, p. 105) en el pensamiento filosófico occidental. Atenderemos pues a una primera época, pre-moderna, en la que la belleza que observamos en las cosas y que nos proporciona placer depende de una belleza que se sitúa al margen de nuestra percepción, es objetiva y aparece concebida como un valor fundamental en estrecho vínculo con otros como lo bueno y lo verdadero. A esto le sigue un segundo momento, moderno, en el cual la relación se invierte, situando el origen de la belleza en la respuesta placentera del sujeto a ciertas propiedades del objeto, lo que se llamará una experiencia estética. Lo estético (esto es, lo sensible o perceptible a los sentidos) modifica la consideración de la belleza situándola en el ámbito de la apariencia, ligada al gusto y al placer sensorial, y también de forma especial al arte y a su apreciación crítica. Ahora bien, precisamente la irrupción del concepto de lo estético acabará en gran medida desplazándola del lugar central que había tenido en la tradición estética y artística. En el siglo XIX se inicia un declive que se acentúa con las revoluciones artísticas que recorren el siglo XX y que parecía del todo consumado hasta que, llegando a su final, ha sido testigo de un renovado interés que para algunos estaría marcando su posible regreso.

1. Antes de la Modernidad

Remontándonos a los inicios de la cuestión en el mundo griego, la dificultad para determinar el significado del término kalón, normalmente traducido como “bello” muestra una compleja concepción, carente de una teoría o una estética en sentido propio. Kalón es lo que provoca admiración o amor, y atrae la mirada por su forma, agradable entonces a los sentidos. Pero kalón se dice de toda clase de objetos que además lo son no sólo por sus cualidades perceptibles, sino por otras no perceptibles, como ciertas cualidades de carácter o del alma. En ambos aspectos, la belleza aparece asociada al límite, a la forma, a la medida o lo exacto y el orden y es opuesta a lo deforme, caótico, excesivo e insolente. De hecho, el ideal griego de la perfección lo representaría la kalokagathía, que nace de la unión de kalón con agathós, término traducido asimismo normalmente como “bueno”, lo cual muestra la belleza como un bien y relaciona la belleza física con la moral (Eco, 2004, p. 45). De esta manera, la belleza se asocia igualmente a otras cualidades como lo justo, lo conveniente y proporcionado, o lo armónico. Y aunque en tanto que es un bien despierta deseo, nuestra relación con lo bello no sería primordialmente la de poseer el objeto bello por su utilidad o beneficio como la de admirar o contemplar su belleza.

Y es que el que la belleza, expresada en formas sensibles, sea perceptible pero no lo sea completamente, crea cierta incisión entre la apariencia física que solo agrada y seduce y la belleza ideal y espiritual y, por lo tanto, una tensión entre su cara visible y la que no lo es, la que la trasciende, pero que fundaría su belleza. Esta tensa dualidad presidirá desde entonces toda concepción de la belleza (Bozal, 1998a, p. 107) y aparece de forma clara en Platón para quien la belleza existe en el mundo de las ideas de forma autónoma a las cosas materiales que informa y en las que resplandece. La experiencia sensible de las cosas bellas encontraba pues su fuente en esa belleza ideal que es su ley y les presta unidad. De esta manera, Platón recoge el elemento fundamental de la relación entre forma y belleza presente en la que es probablemente la primera teoría de la belleza, elaborada por los pitagóricos, para quienes el principio de todo es el número, en tanto que la regla capaz de proporcionar al mundo orden e inteligibilidad (Eco, 2004, p. 61). A partir de una visión estético-matemática del universo, los pitagóricos sostenían que la naturaleza es bella porque está ordenada y es armoniosa; una armonía que responde a un sistema numérico de proporciones, como en la música. El placer que a nivel de la sensibilidad en nuestros oídos provoca la armonía traduce a nivel de los sentidos una serie de relaciones de naturaleza abstracta, y la idea se trasladará al resto de las prácticas artísticas configurando la determinación del canon escultórico, las reglas arquitectónicas, o los modelos matemáticos de composición pictórica. Para el arte y la estética de la era clásica “la belleza ideal es la idealización de las cosas que se ven” (Aumont, 1998, p. 155). Esta teoría de la belleza como proporción entre las partes y armonía marcará la búsqueda en el arte de la relación entre el mundo, lo bello y la Ideas, alcanzando su cima durante el humanismo Renacentista (basten como ejemplos los tratados de Andrea Palladio, Leone Battista Alberti, o Giovanni Paolo Lomazzo).

No obstante, la concepción de la belleza ideal clásica basada en la unidad armoniosa, proporcionada y coherente de las partes, con sus rasgos mensurables y matemáticos que desarrolla la visión pitagórica y que aparece fundamentalmente en el Timeo, no es la única faceta de la teoría de Platón. Al situar la belleza en el más allá de las Ideas, el filósofo griego acentúa, en marcado contraste con la noción de composición y unidad entre las partes, asimismo la revelación de la belleza por el esplendor o fulgor que resplandece en este mundo sensible (véase también su Fedro); enfoque que influirá en las Enéadas de Plotino y en los neoplatónicos medievales y renacentistas, como los de la Academia Florentina encabezada por Marsilio Ficino. Aquí de nuevo, el fundamento de las bellezas sensibles se encuentra en la Idea de belleza que es inteligible y que les presta unidad. Debido a que esa idea que se encuentra inserta en el alma humana, podemos juzgar las bellezas sensibles y compararlas con su modelo, de manera que, tanto Platón como Plotino, conciben tales bellezas como un primer paso para acceder a otras formas de belleza superiores, más nobles y espirituales. Tal y como se relata en El Banquete, en la belleza física se inicia un “ascenso” largo y lleno de esfuerzo, durante el cual, movidos por el eros, el amor y el deseo, se irán revelando las bellezas del mundo, del cuerpo y del alma, de lo concreto y de lo abstracto e intelectual, y que para satisfacerse plenamente habrá de jalonar los peldaños de la virtud y el conocimiento.

Pero si para Platón la belleza refleja la Idea universal, eterna e imperecedera, para Plotino es el triunfo del espíritu, del Uno original, que trasluce en la materia y la ilumina, lo que el neoplatonismo cristiano identificó con la luz o el rayo que emana de Dios. De esta manera, la Belleza pasa a ser atributo del Ser, en concreto del ser supremo, y la belleza sensible una teofanía. De la misma forma, como en la kalokagathía griega, la Belleza se mantiene conectada al Bien y a la Verdad, también atributos de Dios. En cualquier caso, así entendida, la Belleza, de la que la belleza sensible depende, gozaba de la objetividad propia de una realidad transcendente que no necesita del ser humano para existir.

2. Belleza y estética

Así entonces, al menos desde Platón encontramos tanto la concepción clásica de la belleza basada en la composición armoniosa de las partes, con sus rasgos mensurables y matemáticos, como la de una belleza cautivadora, simple como la luz, principio mismo de la unidad de todo lo material y diverso, que inspira amor y anhelo, y conduce a su contemplación a través de una especie de éxtasis místico. La belleza material ofrecía un puente para alcanzar la Idea, lo espiritual, lo abstracto, absoluto y eterno, cuyos ecos llegan hasta el idealismo hegeliano. No obstante, ambos enfoques que acabarán configurando la Gran Teoría de la belleza (Tatarkiewicz, 1976) encontrarán por tanto desarrollos diversos fundamentalmente hasta el Renacimiento siendo perfectamente compatibles sobre la base de la transcendencia de la belleza y, por consiguiente, en una era en la que razón e inspiración conviven en el delicado equilibrio que permite asimismo una metafísica que mantenía conectado lo individual y lo universal, lo natural y lo espiritual, en definitiva, el mundo humano y el divino o ideal. La desconexión se iniciará sin embargo con los profundos cambios en la comprensión del mundo que produjeron las revoluciones científicas y filosóficas de los siglos XVI y XVII.

Además, de gran importancia para alumbrar el giro decisivo que la Modernidad produjo en la concepción de la belleza fue la noción de cualidades secundarias manejada por autores como Galileo, Descartes, Locke, o Newton, y que modificaba la manera de aproximarnos al mundo de la sensibilidad. A diferencia de las cualidades o propiedades primarias de las cosas, tales como la extensión o el volumen, que eran objetivas, las secundarias, como las relativas al color, al sonido, al olor o al gusto no existían como tales propiedades en las cosas mismas sino que eran fruto de la respuesta del sujeto en contacto con el objeto. No eran cualidades totalmente subjetivas porque las cualidades físicas de los objetos disponían al sujeto a tener las sensaciones correspondientes, pero de alguna forma las cualidades secundarias eran aportadas por el sujeto en su encuentro o relación con el objeto. Serán sobre todo los filósofos empiristas británicos del siglo XVIII quienes extraigan las implicaciones de este enfoque y sitúen la belleza en la experiencia subjetiva que los seres humanos tienen de determinados objetos. De manera que la belleza pasa de ser el eco sensible de una cualidad supra-sensible, objetiva y eterna a ser una propiedad relacional, ontológicamente sustentada en un contenido en la conciencia del sujeto que la percibe. Es decir, pasamos de conectar la belleza con una experiencia metafísica del mundo a la sensibilización o “estetización de la belleza” (Talon-Hugon, 2014).

Desde esta nueva perspectiva, los juicios de belleza dan cuenta de una sensación o sentimiento que es de placer, lo cual lógicamente figuraba en las concepciones previas. Pero si antes, como famosamente afirmara San Agustín en De Veritate Religione, las cosas proporcionaban placer porque eran bellas y no al contrario, ahora lo son precisamente porque proporcionan placer. Se entiende que el placer no es el efecto, sino el origen de la belleza. La belleza se localiza en el sentimiento mismo que, a decir de Hume (1740), constituye “su propia esencia”. Al insistir en que se trata de un asunto de sentimiento, los empiristas británicos subrayaban la inmediatez de los juicios de lo bello y se oponían de esta forma al racionalismo, sobre todo francés y de inspiración cartesiana, que defendía el método o la aplicación de principios o reglas clásicos como si pudieran garantizar que la belleza acabara surgiendo de ellos y se juzgara asimismo como si de una argumentación racional se tratase. Así, y aunque otros teóricos franceses como Jean-Baptiste Du Bos (1719) apelaban igualmente al sentimiento para hacer ver que la belleza no es algo que se argumenta y se deduce dependiendo de su conformidad con las reglas del arte, sino que se percibe con la inmediatez de la sensación como a quien le sabe bien una comida sin “haberse planteado principios geométricos sobre el sabor”, fueron los empiristas británicos quienes desarrollaron de forma relevante la teoría del gusto (taste) para dar cuenta del sentido que nos permite captar la belleza.

Ahora bien, como Hume lo especifica, mientras una primera impresión bastaría para juzgar ciertas bellezas, como las naturales, sin que además el razonamiento pueda influir o modificar nuestra opinión y sentimiento, en otros órdenes de belleza, como particularmente ocurre en el de las artes, el razonamiento es preciso para poder tener el sentimiento adecuado. Es decir, que la analogía entre el juicio culinario y el artístico se rompe cuando apreciamos que el sentido de la belleza no es uno más que añadir a los otros cinco pues, además de contar con un órgano específico, se trata de un sentido “interno”, “reflexivo” o “secundario” (Hutcheson, 1725; Reid, 1785 ) que opera precedido de cierta concepción de la naturaleza y estructura del objeto proporcionada en especial por la vista, el oído y otras facultades mentales como la imaginación (Addison, 1712). Que la vista y el oído, digamos los sentidos más intelectuales o cognitivos, sean los que los filósofos tradicionalmente, y no sólo en este periodo, hayan vinculado a la experiencia de la belleza excluyendo el gusto, el tacto o el olfato, indica que esa experiencia se ha entendido siempre de forma más compleja que la mera sensación, como un placer que atiende más bien a cómo el objeto se nos presenta, y por tanto, un placer que a través de la sensibilidad se dirige asimismo a la mente (Scruton, 2011, p. 21). Por eso, también los teóricos del XVIII matizan el carácter intuitivo y sensorial de la belleza, ya que al fin y al cabo los juicios de lo bello, o del gusto, dan cuenta de una relación: están dirigidos por rasgos del objeto a los que el sujeto responde y no pretenden expresar por tanto una mera preferencia personal. De esta manera, y a pesar de que la subjetivización de la belleza abre definitivamente la puerta al relativismo, y a considerar que no es posible determinar la validez de unos juicios que únicamente expresarían la respuesta afectiva de un sujeto individual, los filósofos del XVIII consideraban, no obstante, que era posible distinguir entre gustos más o menos refinados, y enfatizaban las expectativas de consenso. Según propone paradigmáticamente Hume en La norma del gusto, la salida a esta antinomia que muestra al gusto como algo subjetivo y objetivo a la vez, pasa por entender que, aunque fundamentalmente subjetivo, las características del observador varían dependiendo de la delicadeza de su gusto y de otros aspectos personales, sociales y culturales que condicionan su buen juicio. De forma que, aunque no podamos contar con una regla que determine cuáles son los rasgos que constituyen la belleza, podemos identificar los rasgos de los buenos jueces, confiar en su criterio y en los acuerdos que estos jueces alcanzan y que el paso del tiempo corrobora como norma del gusto. Quizá así lleguemos a descubrir empíricamente los principios generales sobre los que el gusto opera.

En cualquier caso, dadas sus connotaciones fisiológicas y sociales, las virtudes con las que contaba el concepto de gusto a la hora de dar cuenta del giro subjetivo en la concepción de la belleza acabaron determinando su sustitución por el término más técnico de lo “estético”. Acuñado pronto por Baumgarten en 1735 para referirse a la teoría de la “sensación” (traducción del griego aisthesis), lo estético conservaba la idea de inmediatez señalada por el gusto y, además, designaba un modo especial de conocimiento que refería a lo bello y al trabajo conjunto de la sensación y de la imaginación en las artes (Shiner, 2001, p. 207). No obstante, fue Kant quien con su Crítica del juicio se aproximó de manera sistemática a los debates del gusto que habían protagonizado el siglo de las Luces, acabando por determinar asimismo el significado del propio concepto de lo estético que explicaría la experiencia de la belleza.

También Kant afronta la antinomia o dilema que plantea el juicio de lo bello como expresión de un sentimiento que pretende, sin embargo, acuerdo o validez intersubjetiva. Y su respuesta pasa por hacer ver que, aunque el juicio de lo bello se origine, de nuevo, en una experiencia personal que ningún argumento puede probar, el placer que se siente implica la intervención de las estructuras mentales del sujeto racional, y por consiguiente atribuye a dicho juicio una universalidad subjetiva. Es decir, que los juicios concretos sobre un objeto natural o artístico serán de carácter empírico, pero sólo son posibles gracias a una condición a priori. La originalidad de Kant estriba pues en plantear que lo bello no es un placer contingente sino necesario. De hecho, para Kant el placer responde a la conciencia reflexiva de sentir cómo nuestras facultades espirituales, en concreto la imaginación y el entendimiento, juegan armoniosa y libremente con motivo de la apariencia de ese objeto. Esa experiencia juzga el modo como nos representamos los objetos, obedece a su mera forma, y no a la materia o al contenido de esas representaciones; ni siquiera en el caso de la belleza “adherente” o dependiente de la clase de cosa que un objeto es y que por tanto “presupone un concepto y la perfección del objeto según éste” con lo que enturbia la pureza del gusto (1790, p. 129). Por eso es libre; porque la experiencia proporciona una exploración del mundo que no está determinada conceptualmente por lo que sean los objetos ni tampoco por su existencia, de manera que el placer de lo bello no obedece entonces a ningún beneficio o utilidad que éstos nos puedan reportar. La experiencia de lo bello es siempre valiosa por sí misma autónoma o desinteresadamente.

El concepto de desinterés es clave en Kant para explicar tanto la autonomía como la pretensión de universalidad del juicio de gusto o de lo bello que se diferencia así del de lo agradable, un juicio que es para Kant igualmente estético o inmediato, pero no normativo debido a que responde a los intereses individuales e idiosincrásicos del sujeto que lo siente. Lo interesado se satisface en la existencia de un objeto y se sitúa entonces siempre en relación con la facultad de desear, la cual atañe no sólo a lo agradable sino a lo bueno, necesitado asimismo de un interés, tanto cuando se trata de lo útil como del bien moral. De este modo, además, para identificarlo exclusivamente con el gozo meramente contemplativo de lo bello, Kant estrecha el significado de la noción de desinterés, al menos desde que Shaftesbury (1711) la introdujera en su filosofía neoplatónica para alentar a la contemplación racional de lo bello, lo bueno y lo verdadero. La nueva orientación que presta al concepto de desinterés aísla a la belleza de la utilidad y del conocimiento, pero particularmente de la moralidad, y con ello modifica igualmente la consideración del mismo sentido del gusto que hasta entonces figuraba como una capacidad a la vez ética y estética. No obstante, a partir de Kant, el uso del adjetivo estético se irá poco a poco expandiendo para asumir propiamente las funciones que tuviera el gusto en su identificación con el sentido para lo bello y su crítica.

3. Declive

Con todo, la belleza no es el único concepto del que da cuenta el ámbito de lo estético cuando se trata de expresar la cualidad que surge en ese tipo de relación entre el objeto y el sujeto. Categorías como “sublime” o “pintoresco” se popularizan asimismo durante “el siglo del gusto” (Dickie, 2003). Con ellos se pretende capturar tipos de belleza que no se ajustan al placer suscitado por la perfección armoniosa y proporcionada que la definen tradicionalmente desde los griegos hasta “la uniformidad en medio de la variedad”, según la fórmula de Hutcheson (1725). Pero estos otros “placeres de la imaginación” (como los denominara Addison, 1712) acabarán enunciando cualidades no sólo diferentes a la belleza, sino que la desplazarán de su lugar central en la estética. Se ha destacado en especial el papel de lo sublime en esta pérdida de hegemonía pues desde el primer momento irrumpe como una experiencia más seria, profunda y poderosa que la de la belleza. De hecho, lo sublime se iría erigiendo como categoría central de la Modernidad, y de las utopías con las que se responde al desencantamiento del mundo y las incertidumbres respecto de la relación del sujeto con la historia que el proceso moderno lleva consigo (Bozal, 1998b).

En esta línea, la angustia provocada tras el descentramiento del sujeto lleva asimismo al arte a no buscar más la transcendencia en favor de facetas de la experiencia más fugaces e insustanciales de manera que, para calificar los logros artísticos, otros valores distintos e incluso opuestos a lo bello, como lo grotesco, lo interesante, o lo extraño, se irán sumando durante el siglo XIX marcando un profundo y progresivo declive de lo bello como categoría estética central. Esto es así porque, además, durante este tiempo lo bello, o bien en su concepción clásica permanecía asociado al academicismo, o bien se lo identificaba con lo bonito y se confundía con los placeres de la cotidianidad, cuando no se aplicaba indiscriminadamente como sinónimo de excelencia estética en general. A este halo de indefinición, se sumará igualmente la crítica que Wittgenstein ejerció respecto a los adjetivos estéticos, y en particular respecto a lo “bello”. Para Wittgenstein, contrariamente a la relevancia gozada en la estética tradicional que pareciera deber ofrecernos su esencia, la belleza apenas si desempeña algún papel en los juicios estéticos, los cuales tienen más que ver con la mayor o menor comprensión de una pieza musical o de la entonación de unas palabras; siendo de hecho sustituible por interjecciones de admiración o gestos de aplauso. (Wittgenstein, 1938, pp. 61-77)

Por todo esto, a pesar de que su historia y su prestigio permitió, de Hegel a George Santayana, seguir usando la belleza para adjetivar el arte elevado, su valor, y la estética misma como su teoría, el declive no pudo frenarse. De manera que para los años 50 del pasado siglo, cuando se consumaron las implicaciones de la modernidad y de los movimientos artísticos anti-arte de principios del siglo XX, el término prácticamente había desparecido del discurso artístico y estético (Shiner, pp. 301-2).

En 1948, Barnett Newman resumió el proceso en una conocida frase: “el impulso del arte moderno fue destruir la belleza”. Alexander Nehamas interpreta este impulso como el que enfatiza la perspectiva crítica y el espíritu teórico en las artes, y que plasma el concepto de lo estético, en oposición a la vida cotidiana donde finalmente queda relegada la belleza (2007, pp. 12-3). De tal modo que, incluso los que aún insistirían en erigir la experiencia estética como la apropiada para valorar el arte debido a la diferenciada emoción que produce, abandonaban el término “belleza” para referirse a lo que la origina a favor de otros como el “diseño” (Roger Fry), “la forma significante” (Clive Bell), o la “sensación visual” (Clement Greenberg).

Ahora bien, probablemente la más decisiva contribución del arte moderno consistió en introducir la “política de la belleza” (Beech, 2009, p. 12). Y es que la pluralidad y diversidad, a menudo antagónica, de los movimientos artísticos que han protagonizado el siglo XX desde sus comienzos no evita que en efecto haya prevalecido entre ellos cierta sensibilidad normalmente calificada de “anti-estética” (Foster, 1983) pero que en buena medida constituía fundamentalmente un ataque a la belleza, o kalliphobia, como lo ha llamado Arthur Danto (2004). El modernismo, y en concreto la tradición duchampiana, se esfuerza por separar el valor del arte de su apariencia, y en especial de la belleza. El propósito es hacer un arte indiferente desde el punto de vista visual cuando no hacer gala directamente de la fealdad, pero en cualquier caso se trata de un arte que se dirigiera menos a los sentidos que a la mente. Frente a esto, el valor estético en su conjunto, por cuanto se mantendría autónomo, apartado del mundo y de los intereses prácticos, se percibe como faceta de una subjetividad situada pretendidamente al margen de la estructura social y de los procesos históricos. En este escenario, la belleza además no sólo se identifica con el placer ingenuo, kitsch, que gratifica fácilmente, que se asocia a lo decorativo y a la mercancía, sino que culturalmente arrastra connotaciones que la relacionan con la apelación a una trascendencia que garantice la verdad, la justicia y la armonía social, todo lo cual la vuelve especialmente sospechosa de constituir un placer escapista o reaccionario.

El declive de la belleza habría ido de la mano entonces del desarrollo de la conciencia moderna que practica la “hermenéutica de la sospecha” (de la que hablara Paul Ricoeur) para interpretar las relaciones entre la individualidad del sujeto y las estructuras sociales que la condicionan, y que habría animado la actitud socialmente crítica y políticamente activista de buena parte del arte moderno y contemporáneo que excluye la belleza.

4. Retorno

No obstante, conviviendo con la continuidad de la corriente anti-estética que protagoniza la teoría y la crítica del arte desde la segunda mitad del siglo XX hasta nuestros días, desde los años 90 se está produciendo un renovado interés por la estética e incluso un retorno a la belleza. El movimiento ha tenido su reflejo además en importantes exposiciones como Regarding Beauty: A view of the Late Twentieth Century con la que en 1999 el Hirschhorn Museum and Sculpture Garden celebró sus veinticinco años, o la que tuvo lugar en Avignon en el año 2000 con motivo de la celebración de la entrada del nuevo milenio titulada La Beauté. En 2005, un festival internacional «Sobre la Belleza» tuvo lugar en la Haus der Kulturen der Welt de Berlín y culminó en mayo de ese año con un congreso en el que distintos expertos fueron invitados a discutir el “Re-torno de la belleza”. La estética anglosajona ocupa aquí un lugar central y se suele señalar como manifiesto de salida del fenómeno el libro que Dave Hickey publicó en 1993, The invisible Dragon: Four Essays on Beauty; aunque también el estudio que unos años antes llevó a cabo Mary Mothersill (1984) replanteándose la antinomia del gusto de Kant merezca destacarse, por su propia entidad y por haberse publicado en un momento en que la belleza aún no parecía suscitar demasiado interés. Por su parte, Hickey asume la asociación de lo bello con la moda y la publicidad, que suele ser un motivo de rechazo de quienes la han denostado por no oponerse a la idolatría de la mercancía. Sin embargo, Hickey denuncia que, al tiempo que proclama la corrupción del mercado, este discurso un tanto iconoclasta se compadece con un arte contemporáneo institucionalizado y financieramente potente. Y protesta pues por el hecho de que sea desde esta nueva academia desde donde se nos niega cualquier apelación directa a la belleza, no vaya a ser que encontremos ahí un instrumento capaz de cuestionar asimismo las bases del actual mundo del arte. Con todo, la relevancia de Hickey no estriba tanto en la argumentación que ofrece como en el que con ella hubiese abierto por fin un escenario de reivindicación, si bien esto determina que el retorno de la belleza tenga mucho de cuestionamiento de su propia politización y en general de la cultura contemporánea que la ha acogido. Para Peter Schjeldahl (1998) hay algo enfermizo en una cultura en la que el valor de la belleza es un problema.

Elaine Scarry (1999) ha defendido que la belleza es inocente de los cargos que desde una perspectiva política y ética se le dirigen de hacernos insensibles y dañar nuestra capacidad para atender a las injusticias. Scarry apela a la simetría como su atributo más reconocido a lo largo de la historia, lo que, según la autora, demuestra que la belleza está ligada conceptualmente a la justicia y a la equidad que no es sino “una simetría de las relaciones de cada uno respecto a cada uno de los demás” (93). Así, Scarry reclama que la percepción de la belleza intensifica la presión que debemos sentir para intentar reparar esas injusticias, y no al contrario.

También relacionando la belleza con una experiencia de simpatía y de generosidad en el reconocimiento del otro, Wendy Steiner (2001) examina el rechazo de la belleza en el arte del siglo XX para detectar en este proceso una resistencia a lo femenino. Aunque también el feminismo ha identificado normalmente la belleza como fuente de opresión por cuanto parece reducir a las mujeres a meros objetos sexuales a ojos de los hombres y genera antagonismo entre ellas, Steiner advierte la necesidad de revisar el estereotipo y buscar sus causas. Interpreta así de forma relevante, el predominio de lo sublime en el arte moderno. Definido desde Burke como noble, heroico, poderoso, profundo, lo sublime se pretende superior frente a la belleza descrita con atributos “femeninos” (delicada, encantadora, sensible, débil). Consecuentemente para Steiner una restauración conveniente de la belleza combatirá la denigración patriarcal de lo femenino y contribuirá a su propia revalorización para el arte elevado.

No es de extrañar pues que el retorno haya sido calificado de ser profundamente antimodernista, y de constituirse en el patético esfuerzo por promover una estética humanista ajena a la comprensión de nuestra condición contemporánea, que justificadamente envió la belleza al exilio (Alberro, 2004). Pero junto a posiciones más conservadoras, que las hay, y que critican el culto a la fealdad que desmitifica la obra de arte contemporánea, encerrándola en el mundo de lo real tal cual es sin aspirar al ideal, (tal y lo como entiende Scruton, 2009), no todas responderían a un impulso nostálgico que impugna el devenir del mundo moderno y trata de trasladar al presente de forma a-histórica mitos pasados. Al contrario, defienden que la belleza sigue siendo un valor fundamental y que su rechazo perpetra cierta deshumanización. Alexander Nehamas (2007) realiza una apasionada reivindicación de la experiencia de la belleza como algo presente y central aún hoy, tanto en la vida como en arte, porque está ligada al amor, al eros. Se inspira por tanto en Platón, pero lógicamente no suscribe ninguna de las premisas metafísicas que llevaban al filósofo griego a asegurar que la belleza necesariamente converge con la verdad o con el bien moral. Para Nehamas, la experiencia de la belleza es como enamorarse y, cuando nos cruzamos con ella, promete felicidad, según reza la famosa fórmula de Stendhal, pero, aunque uno espera que sus expectativas no se vean frustradas, la incertidumbre y el riesgo de que no sea así son ineliminables; lo cual no resta nada a su valor pues siempre merecerá la pena ya que “sólo la promesa de felicidad es felicidad misma” (Nehamas, 2007, p. 138).

Por su parte, Arthur Danto se sumaba a este retorno tras constatar asimismo que la diferencia entre la belleza y las incontables otras cualidades estéticas, es que ésta es la única que se reivindica como un valor, como la verdad y la bondad. Tal es así que el filósofo norteamericano entendía que la belleza es “un atributo demasiado relevante desde el punto de vista humano para que desaparezca de la vida” (Danto, 2003, p. 60) ya que su aniquilación “nos dejaría con un mundo insoportable” hostil para el desarrollo de “una vida propiamente humana” (123). Ahora bien, que no parezca posible ni deseable que la belleza desaparezca del mundo no significa que el arte se deba ocupar necesariamente de ella. Desde luego no para Danto, que ha establecido con rotundidad que la belleza no pertenece a la definición del arte y, por tanto, que ni el arte ni el buen arte tienen por qué ser bellos. No obstante, en la época del pluralismo artístico y estético, Danto reivindica que la opción de la belleza quede abierta. El mayor obstáculo para que esa opción se amplíe, reconoció él mismo, seguía siendo el efecto de consuelo, sentido y reconciliación con el mundo que impide animar a la acción política, tal y como la cultura artística contemporánea seguiría demandado. A pesar de lo cual, Danto reconoció que la belleza podía prestar cierto servicio a la política, pero como forma de responder ante determinadas situaciones de dolor causadas por la pérdida, la muerte o la catástrofe política; es decir, a modo de elegía como, por ejemplo, las que Robert Motherwell dedicó a la República Española.

Las complejas causas que determinan el declive de la belleza reaparecen consiguientemente en las posiciones que estarían marcando su retorno. Y esto ocurre en el arte y más allá de él, pues no podemos olvidar tampoco cómo incluso antes de llegar al campo del arte, la belleza se habría rehabilitado en otros ámbitos como la moderna estética de la naturaleza, y no de manera abstracta sino particularmente contextualista (Carlson, 1979) y formando parte en ocasiones de movimientos en defensa del medio ambiente (Tafalla, 2005).

El paso del siglo XX al XXI concentra la reivindicación de un tema que parecía marginado en la teoría estética y artística, no sin dejar heridas abiertas por lo que, dada su relevancia cultural y humana, probablemente nunca se fue del todo pero que, en cualquier caso, parece haber vuelto para quedarse.

Matilde Carrasco Barranco
(Universidad de Murcia)

Referencias

Addison, J. (1712 [1991]): Los placeres de la imaginación y otros ensayos de “The Spectator”, Madrid, Visor.
Aumont, J. ([1998]2001): La estética hoy, Madrid, Cátedra.
Beech, D. (2009): “Introduction: Art and the Politics of Beauty”, en D. Beech, ed., Beauty, Cambridge, MIT Press.
Bozal, V. (1998a): Historia de las Ideas Estéticas vol. I, Madrid, Historia 16.
Bozal, V. (1998b): Historia de las Ideas Estéticas vol. II, Madrid, Historia 16.
Carlson, A. (1979): “Formal Qualities in the Natural Environment,” Journal of Aesthetic Education, 13(3), pp. 99-114.
Danto, A.C. ([2003]2005): El abuso de la belleza: la estética y el concepto de arte, Barcelona, Paidós.
Danto, A.C. (2004): “Kalliphobia in Contemporary Art”, Art Journal, 63(2), pp. 24-35.
Dickie, G. ([1996] 2003): El Siglo del Gusto: la Odisea Filosófica del Gusto en el Siglo XVIII. Madrid, Antonio Machado.
Du Bos, J.B. ([1719] 2007): Reflexiones críticas sobre la poesía y sobre la pintura, València, Universitat de València.
Eco, U. ([2004]2009): Historia de la Belleza, Barcelona, Lumen.
Ficino, M. (1994): De amore: comentario a “El Banquete” de Platón. Madrid, Tecnos.
Foster, H., ed., (1983): The Anti-Aesthetic: Essays on Post-modern Culture, Washington, Bay Press.
Hickey, D. (1993): The invisible Dragon: Four Essays on Beauty, Los Angeles, Art Issues Press.
Hume, D. ([1740] 2004): Investigación sobre el entendimiento humano, Madrid, Itsmo.
Hume, D. ([1757] 1989): La norma del gusto y otros ensayos, Barcelona, Península.
Hutcheson, F. ([1725] 1992): Una investigación sobre el origen de nuestras ideas de belleza, Madrid, Tecnos.
Kant, I. ([1790] 1981): Crítica del Juicio, Madrid, Espasa Calpe.
Mothersill, M. (1986): Beauty Restored, Oxford, Clarendon Press.
Nehamas, A. (2007): Only a Promise of Happiness. The Place of Beauty in a World of Art, Princeton and Oxford, Princeton University Press.
Platón. (2002-2004): Diálogos, Madrid, Gredos.
Plotino. (1985): Enéadas, Madrid, Gredos.
Reid, T. ([1785] 1969): Essays on the Intellectual Powers of Man, Cambridge, MA, The M.I.T. Press.
Santayana, G. (1999 [1896]): El Sentido de la Belleza: un Esbozo de Teoría Estética, Madrid, Tecnos.
Schjeldahl, P. (1998): “Notes on Beauty”, en Beckley, B. y D. Schapiro, ed., Uncontrollable Beauty: Towards a New Aesthetics, New York, Allworth Press, pp. 53-61.
Scruton, R. (2009): Beauty, Oxford, Oxford University Press.
Scruton, R. (2011): Beauty: A very short introduction, Nueva York, Oxford University Press.
Shaftesbury, A.A.C. Earl of ([1711] 1995): Characteristics of Men, Manners, Opinions, Times (Sensus Communis. Ensayo sobre la libertad de ingenio y humor, Valencia, Pre-textos.
Shiner, Larry ([2001] 2004): La invención del arte, Barcelona, Paidós.
Scarry, E. (1999): On Beauty and Being Just, Princeton NY, Princeton University Press.
Sontag, S. (2005): “An argument about beauty”, Daedalus 134(4), pp. 208-213.
Steiner, W. (2001): Venus in exile: The rejection of beauty in Twentieth Century Art, NY, The Free Press.
Tafalla, M. (2005): “Por una estética de la naturaleza: la belleza natural como argumento ecologista”, Isegoría, 32, pp. 99-14. doi10.3989/isegoria.2005.i32.445
Talon-Hugon, C. (2014): L’art victime de l’esthétique, Paris, Hermann.
Tatarkiewicz, W. ([1976] 2001): Historia de seis ideas: arte, belleza, forma, creatividad, mímesis, experiencia estética, Madrid, Tecnos.
Wittgentein, L. ([1938] 1992): “Lecciones sobre estética”, en Lecciones y conversaciones sobre estética, psicología y creencia religiosa, Barcelona, Paidós, pp. 63-108.

Entradas relacionadas

Estética wittgensteiniana

Experiencia Estética

Teoría del arte

Cómo citar esta entrada:

Carrasco Barranco, Matilde (2019) «Belleza», Enciclopedia de la Sociedad Española de Filosofía Analítica (URL: http://www.sefaweb.es/belleza/).

V

Verdad (El concepto de)

Consecuencia lógica

1. Modalidad, formalidad, y la relación de consecuencia lógica

Los lógicos han procedido a menudo bajo el supuesto implícito de que existe una relación natural especial que se da a veces entre las premisas y la conclusión de un argumento, la relación de consecuencia lógica. Las premisas de un argumento forman un conjunto de oraciones ∑ (en el sentido técnico de ‘conjunto’, que incluye al “conjunto” vacío, sin oraciones, y a los “conjuntos” de una sola oración) y la conclusión es una oración O. Los lógicos han pensado a menudo que, cuando la relación de consecuencia lógica es ejemplificada por un argumento ∑/O, debe darse una relación de implicación modal muy estricta entre las oraciones de ∑ y la oración O: en algún sentido especialmente exigente de ‘no podría’, no podría ser el caso que las oraciones de ∑ fueran verdaderas y la oración O falsa. Este es el rasgo de modalidad de la supuesta relación natural de consecuencia lógica. Además, se ha pensado a menudo que cuando se da la relación de consecuencia lógica entre un conjunto de oraciones ∑ y una oración O, la implicación correspondiente debe tener la cualidad de formalidad: si una oración O es consecuencia lógica de un conjunto de oraciones ∑, entonces si ∑’/O’ es un argumento con la misma forma lógica que ∑/O, O’ ha de ser consecuencia lógica de ∑’.

No siempre que hay implicación o consecuencia en un sentido intuitivo hay también una implicación modal apropiadamente estricta. Por ejemplo, del conjunto de oraciones integrado por la única oración ‘Los objetos físicos observados hasta ahora se rigen por las leyes de la mecánica cuántica’ se “sigue” en algún sentido la oración ‘Todos los objetos físicos se rigen por las leyes de la mecánica cuántica’. Pero no es un caso de consecuencia lógica, pues no es excesivamente difícil imaginar un objeto físico posible que no se rija por las leyes de la mecánica cuántica. El tipo de fuerza modal que conecta a ∑ y O cuando hay consecuencia lógica entre ellos es más bien, se ha solido pensar, la fuerza que conecta a ‘Juana es la nuera de Pedro’ con ‘Juana está casada con un hijo de Pedro’: esta última oración no puede ser falsa en ningún sentido sensato si la primera es verdadera. Se ha solido pensar, de manera más general y teórica, que la fuerza modal que conecta a ∑ y O cuando hay consecuencia lógica entre ellos es la de las implicaciones analíticas, y consiguientemente que una consecuencia lógica de un conjunto de oraciones puede extraerse a priori a partir de ellas.

Ahora bien, la implicación entre ‘Juana es la nuera de Pedro’ y ‘Juana está casada con un hijo de Pedro’ ilustra a su vez la idea habitual entre los lógicos de que hay implicaciones modalmente estrictas pero sin la cualidad de formalidad. Según la opinión más común entre los lógicos, el argumento {‘Pepa es la fontanera de Pablo’}/‘Pepa está divorciada de un contable de Pablo’ tiene la misma forma lógica que el argumento {‘Juana es la nuera de Pedro’}/‘Juana está casada con un hijo de Pedro’. Esa forma común vendría dada por algo parecido al esquema ‘{‘a está en la relación R con b’}/ ‘a está en la relación S con una cosa que está en la relación T con b’’. Pero ese último argumento ni siquiera ejemplifica una relación de implicación, menos aún la relación de consecuencia lógica.

Algunos ejemplos de argumentos que se ha pensado que ejemplifican la relación de consecuencia lógica, y que por tanto cuando menos parecen poseer las cualidades de modalidad y de formalidad, son los siguientes:

{‘Si Pedro viene a la fiesta, Juana se irá’, ‘Pedro viene a la fiesta’}/‘Juana se irá’;
{‘Todo hombre es mortal’, ‘Sócrates es hombre’}/‘Sócrates es mortal’;
{‘Todo griego es hombre’, ‘Todo hombre es mortal’}/‘Todo griego es mortal’.

En efecto, en cada uno de estos casos parece evidente que las premisas no podrían ser verdaderas sin que lo fuera la conclusión. Además, lo que normalmente se pensaría que son las formas lógicas de estos argumentos serían esquemas parecidos a los siguientes:

{‘Si a tiene la propiedad P, b tiene la propiedad Q’, ‘a tiene la propiedad P’}/‘b tiene la propiedad Q’;
{‘Toda cosa que tiene la propiedad P tiene la propiedad Q’, ‘a tiene la propiedad P’}/‘a tiene la propiedad Q’;
{‘Toda cosa que tiene la propiedad P tiene la propiedad Q’, ‘Toda cosa que tiene la propiedad Q tiene la propiedad R’}/‘Toda cosa que tiene la propiedad P tiene la propiedad R’.

Y cuando uno inspecciona estos esquemas no puede evitar sentir que cualquier argumento que proceda de ellos rellenando sus letras esquemáticas con palabras apropiadas (con las mismas letras siempre sustituidas por las mismas palabras) será un argumento que ejemplificará una implicación modalmente estricta, y que tendrá automáticamente la cualidad de formalidad.

El frecuente supuesto implícito de los lógicos de que existe una relación natural de consecuencia lógica ha quedado cuestionado, especialmente en tiempos recientes, por las discrepancias en cuanto a cuál ha de ser la modalidad apropiada en el rasgo de modalidad y cuál ha de ser la noción apropiada de forma lógica en el rasgo de formalidad. Algunos lógicos (v.g. Quine, 1970) han negado que la modalidad apropiada pueda ser la de implicación analítica e incluso que pueda ser la de implicación por necesidad metafísica, sugiriendo que debe ser alguna otra modalidad menos estricta correspondiente a una noción relativamente débil de validez (en el sentido de ‘validez’ que veremos más abajo). Otros lógicos se han mostrado escépticos acerca de la existencia de una noción de forma lógica que permita que dos argumentos con elementos léxicos diferentes tengan la misma forma lógica (v.g. Etchemendy, 1990). Otros, a veces con fundamento en esas discrepancias, han propuesto que no hay una sola relación que merezca el nombre ‘consecuencia lógica’; según ellos, es compatible con la comprensión preteórica del concepto de consecuencia lógica que la modalidad en cuestión sea la de implicación analítica, la de implicación por necesidad metafísica, e incluso varias modalidades correspondientes a nociones débiles de validez (v.g. Beall y Restall, 2006); y según otros, la comprensión preteórica del concepto de forma lógica no determina suficientemente que a cualquier argumento dado le corresponde exclusivamente un esquema privilegiado que revela su forma lógica, habiendo varias nociones de forma lógica igualmente aceptables (v.g. Varzi, 2002).

2. Derivabilidad, validez, y la caracterización de la relación de la consecuencia lógica

Sin embargo, todos los lógicos, tanto si cuestionan el supuesto tradicional de que hay una única relación natural de consecuencia lógica con los rasgos de modalidad y formalidad como si no, han buscado clarificar la relación o las relaciones de consecuencia lógica, y lo han hecho usando aproximaciones similares. Esas aproximaciones generalmente incluyen la propuesta de caracterizaciones de la o las relaciones de consecuencia lógica para argumentos de lenguajes formales que buscan modelar fragmentos del lenguaje natural, caracterizaciones que normalmente se dan en términos de conceptos matemáticos. Gran parte de la literatura sobre la filosofía de la consecuencia lógica se ha concentrado en examinar caracterizaciones de la o las relaciones de consecuencia lógica para determinar si o en qué medida capturan las relaciones preteóricas que se busca caracterizar. Hay dos grandes tipos de caracterizaciones: las basadas en nociones de derivabilidad y las basadas en nociones de validez.

Las caracterizaciones basadas en nociones de derivabilidad se asocian especialmente al nombre de Frege, fundador de la lógica moderna a finales del siglo XIX. Frege inventó un lenguaje formal (o una serie de lenguajes), diseñado especialmente para la formalización de argumentos matemáticos, dentro del cual siempre es enteramente claro cuál es la forma lógica de un argumento y si dos argumentos tienen la misma forma lógica o no. El lenguaje que inventó Frege es lo que hoy llamaríamos un lenguaje cuantificacional de orden superior, y contenía como fragmento lo que hoy llamaríamos un lenguaje cuantificacional de primer orden, un lenguaje como los que se presentan hoy en los cursos básicos de lógica. Para ese lenguaje, Frege ofreció un sistema formal como los que se estudian hoy en esos cursos, especificando con gran rigor un conjunto de formas axiomáticas básicas y un conjunto de reglas de inferencia básicas.

Una vez especificados estos elementos del sistema formal, es posible proponer una caracterización muy precisa del conjunto de argumentos del lenguaje formalizado del sistema que ejemplifican la relación deseada de consecuencia lógica, o que son lógicamente correctos: podemos proponer que la relación de consecuencia lógica se da entre un conjunto de premisas {P₁, P₂, P₃, …} y una conclusión C (del lenguaje del sistema) exactamente cuando existe una serie de aplicaciones de las reglas de inferencia que, partiendo de {P₁, P₂, P₃, …} y posiblemente también de oraciones de las formas axiomáticas básicas, acaba en C. Cuando una serie tal existe se dice que C es derivable en el sistema formal a partir de {P₁, P₂, P₃, …}. Y ciertamente, como subrayaremos después, si el sistema formal se construye con esmero, al concluir uno quedará convencido al menos de que todos los argumentos cuya conclusión es derivable de sus premisas (en el sistema) son argumentos lógicamente correctos en el sentido deseado, es decir, uno quedará convencido de que la derivabilidad de la conclusión a partir de las premisas (en el sistema) es una condición suficiente para que un argumento sea un ejemplo de consecuencia lógica. La cuestión de si podemos convencernos de que es también una condición necesaria la trataremos más adelante.

Nuestra comprensión de la relación de derivabilidad en un sistema como el de Frege es sin duda mejor y más clara que nuestra comprensión del concepto de consecuencia lógica. El acercamiento a la noción de consecuencia lógica en términos de la de derivabilidad en ciertos sistemas goza por tanto de un gran atractivo metodológico y explicativo. En gran parte por estos motivos, este acercamiento proporcionó la concepción dominante de la consecuencia lógica entre los lógicos durante largo tiempo después de la obra de Frege. Pero en la lógica ha existido también, ya desde Aristóteles, un tipo de aproximación alternativo, y en cierto modo complementario, a la caracterización de la relación o las relaciones de consecuencia lógica. Este tipo de aproximación se basa plenamente en los dos rasgos intuitivos de la noción de consecuencia lógica. Recordemos que el segundo rasgo consiste en que todo argumento con la misma forma lógica que uno lógicamente correcto es también lógicamente correcto. Como señalamos, esto proporciona una condición necesaria de los argumentos lógicamente correctos, aunque en términos de la noción de consecuencia lógica. Pero también sugiere una condición necesaria en términos de la noción de verdad. Observemos que si un argumento es lógicamente correcto entonces no tiene premisas verdaderas y conclusión falsa; pues si así fuera las premisas no implicarían modalmente a la conclusión (bajo ninguna comprensión plausible de la idea de modalidad) y entonces, por el primer rasgo de la noción de consecuencia lógica, el argumento no sería lógicamente correcto después de todo. Por tanto, por el segundo rasgo de la noción de consecuencia lógica, un argumento es lógicamente correcto sólo si ningún argumento con la misma forma lógica tiene premisas verdaderas y conclusión falsa. Esta es la condición necesaria en términos de la noción de verdad a la que me refería antes; llamémosla ‘(Φ)’.

La aproximación alternativa a la caracterización de la consecuencia lógica usa siempre alguna variante de la condición (Φ), proponiéndola en cada caso como necesaria y suficiente. La caracterización de Tarski es la representante paradigmática de este tipo de aproximación. Tarski (1936) ofreció su caracterización para los lenguajes formales fregeanos, aceptando la noción de forma lógica para argumentos de estos lenguajes implícita en Frege. Sin embargo, el método abstracto de Tarski se puede usar, y se ha usado, para dar caracterizaciones similares incluso para lenguajes que extienden los lenguajes de Frege, o que son simplemente diferentes de ellos.

La propuesta de Tarski consiste en extender el requisito expresado por la condición (Φ) con el objeto de incorporar, al menos parcialmente, la idea de que las letras esquemáticas en la forma lógica de un argumento lógicamente correcto no pueden ser reinterpretadas de tal manera que las premisas se vuelvan verdaderas y la conclusión falsa (y no meramente la idea expresada en (Φ), de que un argumento lógicamente correcto no puede convertirse en uno con premisas verdaderas y conclusión falsa reemplazando las letras esquemáticas de su forma lógica por expresiones en un lenguaje fijado). En otras palabras, Tarski busca incorporar la idea de que una oración O es una consecuencia lógica de un conjunto de oraciones ∑ cuando toda interpretación de las letras esquemáticas en la forma lógica de ∑/O según la cual todas las oraciones de ∑ son verdaderas es una interpretación según la cual O es verdadera. O, como se dice a veces, cuando toda interpretación preserva la verdad de las premisas en la conclusión. Cuando toda interpretación preserva la verdad se dice también que el argumento es válido. Si un argumento es válido, entonces, incluso si no es lógicamente correcto, la conclusión se puede inferir de las premisas sin miedo de que sea falsa si las premisas son verdaderas. De manera que todos los argumentos válidos son correctos al menos en este sentido.

Tarski propuso una versión matemáticamente manejable de la noción de validez usando el aparato desarrollado por él para dar definiciones matemáticas de conceptos “semánticos”, como los de satisfacción, definibilidad y verdad. El método de Tarski se basa en definir, de una manera análoga a la manera como él mismo define verdad para un lenguaje en Tarski (1935), la noción de verdad en una estructura conjuntista. Para una oración de un lenguaje fregeano, una estructura es un objeto conjuntista que incluye una asignación de denotaciones a las letras esquemáticas de su forma lógica, además de un conjunto de objetos del que se extraen esas denotaciones y que proporciona el rango o recorrido de las variables de primer orden e induce recorridos para las variables de órdenes superiores. Por ejemplo, un ejemplo de estructura para el lenguaje que consta de las letras ‘a’, ‘P’ y ‘Q’ es el objeto conjuntista <{Aristóteles, Frege, Tarski}, ‘a’→Frege, ‘P’→{Aristóteles, Frege}, ‘Q’→{Tarski}>; en esta estructura, el conjunto {Aristóteles, Frege, Tarski} es el recorrido de las variables, Frege es la denotación de ‘a’, el conjunto {Aristóteles, Frege} es la denotación de ‘P’, y el conjunto {Tarski} es la denotación de ‘Q’.

La condición por medio de la cual se caracteriza la consecuencia lógica para el lenguaje relevante es entonces la siguiente:

(VT) Toda estructura en la que todas las oraciones del conjunto ∑ son verdaderas es también una estructura en la que la oración O es verdadera. (Abreviemos esta condición por medio de la notación ‘Val_T(∑,O)’.)

‘VT’ significa “validez tarskiana”. El subíndice ‘T’ se usa para subrayar que ‘Val_T(∑,O)’ denota la validez tarskiana y que esta es posiblemente diferente de otras nociones de validez, basadas en otras nociones de interpretación. Tal como uso aquí la noción de interpretación que aparece en la caracterización de la validez, esta es una noción imprecisa e intuitiva, mientras que la noción de estructura que aparece en una caracterización de la validez tarskiana es una noción técnica bastante precisa. A todo lenguaje formal fregeano se le puede proporcionar una condición de validez tarskiana usando el método de Tarski. Lo mismo es verdad de muchos lenguajes diferentes de los fregeanos, y para los cuales se han dado nociones razonables de estructura. (Un ejemplo estándar lo proporcionan los lenguajes de las lógicas modales; véase, v.g., Hughes y Cresswell, 1996.) Cuando una noción de estructura es razonable, está claro que toda estructura modela la capacidad de una o varias interpretaciones de hacer verdaderas las premisas y falsa la conclusión de algún argumento.

3. Las relaciones entre derivabilidad y validez

3.1. Corrección y compleción

Como señalamos antes, si uno construye un sistema formal con cuidado, uno podrá convencerse de que todos los argumentos cuya conclusión es derivable de sus premisas son argumentos lógicamente correctos en el sentido deseado. La razón de esto es que uno puede usar su intuición de un modo muy sistemático para obtener ese convencimiento: uno puede incluir en su sistema axiomas que le parezcan a uno consecuencias lógicas de cualquier conjunto de premisas; y uno puede incluir como reglas de derivación de su sistema reglas que le parezca a uno que producen oraciones que se siguen lógicamente de las oraciones a las que se aplican. Entonces, dada la definición de derivabilidad para el sistema formal que vimos más arriba, es inmediatamente claro para uno que no se podrá derivar de un conjunto de oraciones ninguna oración que no se siga lógicamente de ese conjunto de oraciones. Empleando otra terminología, que se explica a sí misma, podemos decir que si uno construye su sistema formal con cuidado, la caracterización correspondiente en términos de derivabilidad (en ese sistema) es correcta con respecto a la noción deseada de consecuencia lógica—o, simplemente, que la derivabilidad es correcta con respecto a la consecuencia lógica.

De igual modo, es intuitivamente obvio que si uno tiene a mano una noción tarskiana de validez para un lenguaje dado, entonces todos los argumentos lógicamente correctos (del lenguaje) serán argumentos válidos en el sentido tarskiano. La razón es simple: si un argumento no es válido en el sentido tarskiano entonces hay una estructura, y por tanto una interpretación, que hace verdaderas sus premisas y falsa su conclusión. Por tanto sería en principio posible construir un argumento de la misma forma lógica, cuyos términos tendrían denotaciones lógicamente posibles, y que tendría premisas verdaderas y conclusión falsa. Pero el segundo rasgo intuitivo de la noción de consecuencia lógica implica que si el argumento original era lógicamente correcto entonces no hay ningún argumento de la misma forma lógica con premisas verdaderas y conclusión falsa. Habiendo concluido que todos los argumentos lógicamente correctos son válidos en el sentido tarskiano, podemos decir, empleando otra terminología, que la caracterización en términos de validez tarskiana es completa con respecto a la noción de consecuencia lógica—o, simplemente, que la validez tarskiana es completa con respecto a la consecuencia lógica.

Usemos las siguientes dos abreviaturas: ‘Der_S(∑,O)’ para ‘O es derivable de ∑ en el sistema formal S’, y ‘CL(∑,O)’ para ‘O es consecuencia lógica (en el sentido preteórico en juego) de ∑’. Entonces, si S es un sistema formal construido con cuidado, la situación a la que hemos llegado se resume en el siguiente diagrama:

(1) Der_S(∑,O) ⇒ CL(∑,O) ⇒ Val_T(∑,O).

La primera implicación es la corrección de la derivabilidad con respecto a la consecuencia lógica; la segunda implicación es la compleción de la validez tarskiana con respecto a la consecuencia lógica. Ahora bien, para convencernos de que las caracterizaciones de la consecuencia lógica en términos de Der_S(∑,O) y Val_T(∑,O) son apropiadas tendríamos que convencernos también de las implicaciones conversas:

(2) Val_T(∑,O) ⇒^? CL(∑,O) ⇒^? Der_S(∑,O),

o sea de que la validez tarskiana es correcta con respecto a la consecuencia lógica, y de que la derivabilidad es completa con respecto a la consecuencia lógica. Convencerse de que esto es el caso, o de que no es el caso, resulta ser una tarea difícil (quizá sorprendentemente difícil) para un buen número de lenguajes. Hay sin embargo una manera de convencerse en algunos casos de que las implicaciones con interrogante se dan de hecho. Esa manera de convencerse se basa en una observación sencilla pero profunda de Kreisel (1967).

3.2. La observación de Kreisel

Hay una cantidad considerable de lenguajes formales para los que existen nociones de validez tarskiana y de derivabilidad en un sistema S. Entre estos, hay un buen número para los que la validez tarskiana es intuitivamente completa y la derivabilidad correcta con respecto a la noción deseada de consecuencia lógica. En estos últimos casos se dan las implicaciones de (1). Y a su vez, entre estos últimos lenguajes, hay muchos para los que es posible dar una demostración matemática de que la derivabilidad es completa con respecto a la validez tarskiana, o sea una demostración de esta otra implicación:

(3) Val_T(∑,O) ⇒ Der_S(∑,O).

Kreisel llamó la atención sobre el hecho de que (3) (junto con (1)) implica que la validez tarskiana es correcta con respecto a la consecuencia lógica, o sea que se da la primera implicación de (2). Esto quiere decir que cuando se da (3) la noción de validez tarskiana ofrece una caracterización apropiada de la de consecuencia lógica. Puede añadirse a lo subrayado por Kreisel que (3) (junto con (1)) implica que la derivabilidad en S es completa con respecto a la consecuencia lógica, o sea que se da la segunda implicación de (2). Esto quiere decir que cuando se da (3) la noción de derivabilidad en un cierto sistema ofrece también una caracterización apropiada de la noción deseada de consecuencia lógica.

Un caso especialmente significativo en el que, bajo ciertos supuestos razonables acerca de la idea preteórica de consecuencia lógica, se da la implicación (3) (para ciertos sistemas formales S) y las implicaciones (1), y por tanto se dan las implicaciones (2), es el de los lenguajes cuantificacionales de primer orden. Eso quiere decir que uno puede convencerse de que tanto la noción de derivabilidad como la de validez tarskiana (definidas de un modo apropiado para esos lenguajes) son caracterizaciones apropiadas de una cierta noción preteórica razonable de consecuencia lógica para los lenguajes de primer orden.

3.3. Incompleción

La situación no es tan clara en otros lenguajes especialmente significativos para la tradición lógica: los cuantificacionales de órdenes superiores a 1. Es posible demostrar que ya para un lenguaje de segundo orden no hay un sistema formal S que haga verdadero (3) cuando la derivabilidad en S es correcta con respecto a la validez tarskiana—para la noción de validez tarskiana como se define usualmente para un lenguaje tal. Podemos llamar a este resultado la incompleción de los sistemas formales de segundo orden con respecto a la validez tarskiana. De hecho vale un resultado más fuerte: no hay un conjunto de oraciones de segundo orden para el cual un sistema formal correcto con respecto a la validez tarskiana permita la derivación de todas las consecuencias tarskianas del conjunto; dicho de otra manera: para todo conjunto de oraciones ∏ y todo sistema formal S correcto con respecto a la validez tarskiana hay una oración O tal que Val_T(∏,O) pero no es el caso que Der_S(∏,O). Podemos llamar a este resultado la incompleción fuerte de los sistemas formales de segundo orden con respecto a la validez tarskiana.

En esta situación no es posible aplicar el argumento de Kreisel para concluir (2). De hecho, la incompleción de los sistemas formales de segundo orden muestra que, dado cualquier sistema formal S que satisfaga (1), una de las implicaciones de (2) es falsa (o ambas lo son): o la derivabilidad en S es incompleta con respecto a la consecuencia lógica o la validez tarskiana es incorrecta con respecto a la consecuencia lógica. Una conclusión similar vale para la incompleción de los sistemas formales para lenguajes clásicos de órdenes superiores y para otros lenguajes que incluyan a estos. Diferentes autores han extraído moralejas diferentes de la incompleción. Una reacción común (v.g. la de Etchemendy (1990)) es pensar que la validez tarskiana debe ser incorrecta con respecto a cualquier noción razonable de consecuencia lógica, pero en general no hay argumentos plenamente satisfactorios en defensa de esta tesis o de la tesis alternativa (defendida, v.g., por Tarski) de que la derivabilidad (en cualquier sistema correcto para la validez tarskiana) es incompleta con respecto a una noción razonable de consecuencia lógica. (Sobre esta cuestión puede verse Gómez Torrente (1998/9).

Mario Gómez Torrente
(Instituto de Investigaciones Filosóficas, UNAM)

Referencias

Beall, J.C. y G. Restall (2006): Logical Pluralism, Clarendon Press, Oxford.
Etchemendy, J. (1990): The Concept of Logical Consequence, Cambridge Mass., Harvard University Press,
Gómez Torrente, M. (1998/9): “Logical Truth and Tarskian Logical Truth”, Synthèse, 117, pp. 375-408.
Hughes, G. E. y M. J. Cresswell (1996): A New Introduction to Modal Logic, Routledge, Londres.
Kreisel, G. (1967): “Informal Rigour and Completeness Proofs”, en I. Lakatos, comp., Problems in the Philosophy of Mathematics, North-Holland, Ámsterdam, pp.138-171.
Quine, W. V. (1970): Philosophy of Logic, Prentice-Hall, Englewood Cliffs, N.J.
Tarski, A. (1935): “The Concept of Truth in Formalized Languages”, en Tarski, A. (1983): Logic, Semantics, Metamathematics, 2ª ed., Hackett, Indianápolis, pp. 152-278.
Tarski, A. (1936): “On the Concept of Logical Consequence”, en Tarski (1983), pp. 409-420. [Tarski, A. (1984): “Sobre el concepto de consecuencia lógica”, trad. por L. Vega Reñón, en Vega Reñón L. y P. Castrillo, comps., Lecturas de Lógica II, UNED, Madrid,pp. 178-192.
Tarski, A. (1983): Logic, Semantics, Metamathematics, 2^a ed., Hackett, Indianápolis.
Varzi, A. (2002): “On Logical Relativity”, Philosophical Issues, 12, pp. 197-219.

Lecturas recomendadas en castellano

Badesa, C., I. Jané y R. Jansana (1998): Elementos de lógica formal, Ariel, Barcelona.
Frápolli, M. J., coord., (2007): Filosofía de la lógica, Tecnos, Madrid.
Gómez Torrente, M. (2000): Forma y modalidad. Una introducción al concepto de consecuencia lógica, Buenos Aires, Eudeba.
Haack, S. (2001): Filosofía de las lógicas, Cátedra, Madrid.
Kneale, W. y M. Kneale (1972): El desarrollo de la lógica, Tecnos, Madrid.
Manzano, M. (1996): Extensions of First-Order Logic, Cambridge, Cambridge University Press.
Sagüillo, J. M. (2007): “Validez y consecuencia lógica. La concepción clásica”, en Frápolli, M. J., (2007): Filosofía de la Lógica, Tecnos, Madrid, pp.55-81.
Sainsbury, M. (2001): Logical Forms: An Introduction to Philosophical Logic, 2^a ed., Blackwell, Oxford.

Entradas relacionadas

Pluralismo lógico

Silogística

Cómo citar esta entrada

Gómez-Torrente, Mario (2018) «Consecuencia lógica», Enciclopedia de la Sociedad Española de Filosofía Analítica (URL:http://www.sefaweb.es/consecuencia-logica).

Q

Química (Filosofía de la)