Archivo de la categoría: Filosofía lógica y matemáticas

Semántica de mundos posibles (semántica intensional)

1. Introducción. Las ideas elementales

Un principio universalmente aceptado en filosofía del lenguaje es el postulado de acuerdo con el cual el significado de una expresión determina su referencia. Es decir, el significado determina aquello a lo que correctamente se aplica la expresión en cuestión. Por ejemplo, ‘tigre’ se aplica correctamente en virtud de su significado, a todos aquellos animales que son tigres, por lo que resulta natural decir que el significado de ‘tigre’ determina como referencia o extensión, el conjunto de todos los tigres.  De forma similar, la descripción definida ‘el tutor de Alejandro Magno’ refiere, o designa, en virtud de su significado, a Aristóteles. Es evidente, sin embargo, que el principio, tal como está formulado, es incompleto. No es únicamente el significado de ‘el tutor de Alejandro’ lo que hace que esa expresión designe a Aristóteles; los hechos juegan un papel también, pues si Aristóteles no hubiese aceptado la petición de Filipo de Macedonia de convertirse en el tutor de su hijo Alejandro, esa descripción no designaría a Aristóteles. La conexión entre una expresión y aquello a lo que la expresión refiere es el resultado de la colaboración del significado con los hechos que constituyen el mundo. Lo que sí determina el significado por sí solo son las condiciones que deben darse para que una expresión tenga un cierto referente. ‘El tutor de Alejandro Magno’ refiere a quienquiera que sea el individuo que satisface las condiciones que el término expresa: haber sido el tutor de Alejandro Magno. Si es un hecho que Aristóteles satisface esa condición, Aristóteles es el referente de la expresión. Pero si los hechos no hubiesen sido los que son, si el mundo fuese distinto y hubiese sido el cocinero de palacio quien recibió la oferta de Filipo y aceptó tutorizar a su hijo Alejandro, ese sería el referente de ‘el tutor de Alejandro Magno’.

En el caso de las oraciones, el significado, por sí solo, no determina el valor de verdad, es decir, no determina si la oración es verdadera o falsa. Lo que sí determina el significado son las condiciones que deben darse para que una oración tenga un cierto valor de verdad. El significado de una oración determina sus condiciones de verdad, las condiciones que deben darse para que la oración sea verdadera. Dado que Aristóteles era filósofo, y también el tutor de Alejandro Magno, ‘el tutor de Alejandro Magno era filósofo’ es verdadera; si el tutor de Alejandro Magno hubiese sido el cocinero de palacio, ‘el tutor de Alejandro Magno era filósofo’ sería falsa. Es decir, dado cómo es el mundo, el significado de la oración determina el valor de verdad ‘Verdadera’. Si el mundo hubiese sido distinto, si el cocinero hubiese sido el tutor, ese mismo significado determinaría el valor de verdad ‘Falsa’.

Estas ideas básicas son las que explota la semántica de mundos posibles para representar el significado de los términos y las oraciones, y como éste determina la referencia y el valor de verdad.

2. Conceptos básicos: intensión, extensión y mundos posibles

Fue Rudolf Carnap quien en su obra Meaning and Necessity (1947) introdujo la distinción entre la extensión y la intensión de las expresiones del lenguaje. La extensión de un término singular, es decir un término que se aplica a un individuo y que típicamente ejerce de sujeto gramatical, como, por ejemplo un nombre propio o una descripción definida, es el individuo u objeto que el término designa. Así pues, ‘Aristóteles’ y ‘el tutor de Alejandro Magno’ ambas tienen la misma extensión, Aristóteles.

La extensión de un predicado o de un término general es el conjunto de cosas a las que la expresión se aplica correctamente. La extensión de ‘ballena’ es el conjunto que contiene todas las ballenas, la de ‘agua’ el conjunto de muestras de agua, y la de ‘filósofo’ el conjunto de todos aquellos individuos que son filósofos.

Los términos que expresan una relación entre dos individuos (‘es la madre de’, ‘es más alto que’) se interpretan usualmente en lógica de primer orden como conjuntos de pares ordenados, en los que el primer miembro del par se halla relacionado con el segundo (es decir, el primer miembro es la madre del segundo, etc.). En general una relación que se dé entre n individuos se representa como un conjunto de n-tuplas.

Tradicionalmente se considera la extensión de una oración su valor de verdad (verdadera o falsa, V o F). Así pues, la extensión de la oración ‘Aristóteles era filósofo’ es el valor de verdad V.

La noción de intensión capta la idea de que el significado de una expresión determina su extensión, dado como es el mundo, y determinaría su, posiblemente distinta, extensión si el mundo fuese distinto. Por ejemplo, la intensión de  ‘el tutor de Alejandro Magno’, dado como es el mundo, determina a Aristóteles, pero si el cocinero de palacio, llamémosle Dionisio, hubiese recibido y aceptado la oferta de Filipo de Macedonia, Dionisio sería la extensión de ‘el tutor de Alejandro Magno’. De forma similar Aristóteles, dado cómo es el mundo, se encuentra en la extensión del predicado ‘filósofo’; pero si Aristóteles hubiese decidido dedicarse exclusivamente a esculpir, Aristóteles no estaría en la extensión de ‘filósofo’.

Cada una de esas formas en que el mundo podría ser, se puede representar como lo que los filósofos denominamos un “mundo posible”. Los mundos posibles filosóficos son, sencillamente, representaciones de las distintas formas en las que el mundo real puede ser o podría haber sido. En semántica, los mundos posibles se pueden representar usando simplemente un conjunto de índices. A su vez, la intensión de una expresión se representa como una función que a cada uno de esos índices, o mundos posibles, le asigna la extensión de la expresión en ese mundo posible, o en otras palabras, la extensión que la expresión tendría si el mundo fuese de esa manera.

Lo podemos ver fácilmente con un ejemplo muy sencillo. Consideremos las expresiones ‘el tutor de Alejandro Magno’ y ‘filósofo’. Representaremos a Aristóteles con la letra a y a Dionisio con la letra b. Hay otros individuos en el mundo que representamos con las letras c y d. Digamos que el mundo puede ser de tres formas distintas que representaremos con los índices @ (el mundo tal como es), w1 y w2. Las intensiones de esas expresiones, funciones que asignan una extensión a cada mundo posible, nos proporcionan una representación de esos tres mundos posibles:

INT (‘el tutor de Alejandro Magno’):

@  →  a
w1  → b
w2  →  a

INT (‘filósofo’):

@ →  {a, c}
w1 → {a, c}
w2 →  {d}

El mundo tal como es, @, es un mundo en que Aristóteles es filósofo, Dionisio no lo es, y Aristóteles es también tutor de Alejandro.  w1 es un mundo en que Aristóteles no ha aceptado la oferta de Filipo, para dedicarse de lleno a la filosofía, como indican los valores de las intensiones de las expresiones en cuestión en w1. En ese mundo (o, mejor dicho, en esa representación de cómo puede ser el mundo) Dionisio, que no es filósofo, pues no se encuentra en la extensión de ‘filósofo’ en ese índice, es el tutor de Alejandro. Por su parte, w2 representa la posibilidad de que Aristóteles aun siendo tutor de Alejandro, no fuese filósofo. Quizá en ese mundo a se encuentra en el conjunto que constituye la extensión de ‘escultor’ aunque eso en nuestro ejemplo no lo hemos representado y tampoco hemos representado, por ejemplo, que Dionisio era cocinero. Para ello deberíamos asignar una intensión al predicado ‘cocinero’. En un modelo menos simple podríamos continuar representando todos esos aspectos del mundo.

La intensión de la oración ‘el tutor de Alejandro Magno era filósofo’ en M1 viene determinada, pues, por las intensiones de las expresiones que la constituyen:

INT (‘el tutor de Alejandro Magno era filósofo’):

@ → T
w1 → F
w2 → F

Lo que hemos presentado aquí es un modelo muy simple, llamémosle M1, con un dominio de cuatro individuos D = {a, b, c, d}, un conjunto de tres mundos posibles W = {@, w1, w2} y una función, INT, que asigna a cada mundo posible la extensión de las expresiones consideradas, individuos del dominio en el caso del término singular y conjuntos de individuos del dominio en el caso del predicado.

La intensión de una descripción definida es una función que a cada índice le asigna un individuo, posiblemente distintos individuos en distintos mundos posibles, dependiendo de qué posibilidades se representan en ese mundo. La intensión de un término general es una función que a cada mundo posible le asigna un conjunto de individuos (o n-tuplas, si el término expresa una relación entre n individuos).

Hasta ahora no hemos considerado qué intensión deberíamos atribuir a un nombre propio como ‘Aristóteles’. En principio, nada impide que una función le asigne distintos individuos en distintos índices. En nuestro pequeño ejemplo la intensión de ‘Aristóteles’, que le asigna a, el representante de Aristóteles, en @, podría asignarle c en w2:

INT (‘Aristóteles’):

@  →  a
w1  → a
w2  →  c

Un momento de reflexión nos permite vislumbrar que, aunque permisible formalmente, esa opción no es deseable. Cuando consideramos la posibilidad de que Aristóteles (a en nuestro pequeño modelo) no fuese filósofo y pensamos en la gran pérdida para la filosofía que eso hubiese significado, no estamos considerando una posibilidad en la que alguien distinto de Aristóteles hubiese decidido no dedicarse a la filosofía. El hecho de que c no se encuentre bajo la extensión de ‘filósofo’ en w2 es totalmente irrelevante para lo que estamos considerando. Lo que queremos representar es la triste posibilidad de que Aristóteles, nuestro a, no fuese filósofo. w2 es efectivamente, ese triste mundo, pues a no se encuentra en la extensión de ‘filósofo’ en w2. Que c no sea filósofo en w2 no representa la posibilidad que la oración  ‘Aristóteles no era filósofo’ expresa.

Este tipo de consideraciones llevaron a Saul Kripke, a argumentar que los nombres propios son designadores rígidos, es decir tienen la misma extensión en todos los mundos posibles. Así pues, Kripke nos insiste, la intensión de ‘Aristóteles’ debería representarse así:

INT (‘Aristóteles’):

@  →  a
w1  → a
w2  → a

como una intensión que asigna a todos los mundos posibles el mismo valor que asigna en @, y ahora sí podemos decir que w2 es, efectivamente, una representación del mundo en la cual Aristóteles no es filósofo.

3. Cuestiones semánticas, lógicas y metafísicas sobre la existencia

Algunas cuestiones interesantes que surgen en la semántica de mundos posibles tienen que ver con la existencia de los individuos que conforman el dominio. Los  modelos de la semántica de mundos posibles nos permiten representar que algunos individuos que existen podrían no haber existido. Marie Curie no existiría si sus padres nunca se hubiesen encontrado. E igualmente, los modelos permiten representar que podrían haber existido cosas que no existen; por ejemplo, Wittgenstein hubiese podido tener una hija. En el modelo simple que hemos considerado más arriba, hemos asumido que los cuatro individuos que constituyen el dominio del modelo y que existen en el mundo real, no dejan de existir en las sucesivas representaciones de la forma en que puede ser ese pequeño mundo que el modelo representa. Por decirlo de otra manera, los cuatro individuos del dominio existen en todos los mundos posibles.  Representar que algunos individuos que existen podrían no haber existido, o que podrían haber existido individuos que no existen, involucra simplemente asociar a cada índice (a cada mundo posible) un dominio de individuos. Así pues, el siguiente modelo, M2, representa que Aristóteles hubiese podido no existir, y que un individuo que no existe en el mundo real, hubiese podido existir. Donde W constituye el conjunto de índices o mundos posibles, y D es una función que asigna a cada índice un conjunto de individuos (intuitivamente, los individuos que existirían si el mundo fuese así) podemos obtener la siguiente representación de cómo es y cómo podría ser el mundo real, que, recordemos, se halla representado por el índice @:

W =  {@, w1, w2}

D (@) = {a, b, c}

D (w1) = {b, c}

D (w2) = {a, c, d}

Esta es una representación del hecho de que a, un individuo que existe, podría no haber existido (a no se encuentra en el dominio de w1) y, también de que d, algo que no existe, pues no se encuentra en el dominio de @, podría haber existido.

Contemplar este tipo de representaciones que incorporan la existencia contingente o posible de individuos lleva inevitablemente a una discusión de cuestiones fundamentales de naturaleza metafísica; pero aquí nos concentraremos exclusivamente en un par de cuestiones de carácter puramente semántico, pues al aceptar dominios variables, es decir, dominios que se encogen para representar la existencia contingente de algunos individuos, o que se amplían para representar la existencia posible de otros, hay que tomar algunas decisiones a la hora de asignar intensiones a las expresiones. Por ejemplo, si Aristóteles (que continuamos representando como a) no existe en w1  ¿cuál debería ser la intensión de ‘Aristóteles’? ¿Debería ser INT o INT’?

INT (‘Aristóteles’):

@  →  a
w1  → a
w2  → a

INT’ (‘Aristóteles’):

@  →  a
w1  →  ☓
w2  → a

Es decir, ¿debería asignársele una referencia a ‘Aristóteles’ en w1 cuando, de hecho, w1 representa cómo sería el mundo si Aristóteles no existiese? Por otro lado, está claro que a no debería hallarse incluido en la extensión de ‘filósofo’ ni en la de ningún otro predicado en w1. Al fin y al cabo, si Aristóteles no existiese, no podría ser filósofo. ¿Significa eso que la oración ‘Aristóteles era filósofo’ debería tener la extensión F con respecto al índice w1? ¿O deberíamos decir más bien que la oración no tiene un valor de verdad en w1 y asignar a la oración un tercer valor de verdad, ‘Indeterminado’?

Todas estas cuestiones se pueden decidir, desde un punto de vista puramente formal, en uno u otro sentido, pero cualquier decisión involucra compromisos sustanciales de carácter lógico o metafísico. Si decidimos que la oración ‘Aristóteles era filósofo’ tiene un valor de verdad indeterminado en un índice en el que a, el representante de Aristóteles, no existe, debemos modificar la lógica clásica bivalente, añadiendo un tercer valor de verdad. Si por el contrario decidimos asignar el valor de verdad F a esa oración con respecto al índice w1, parece que deberíamos decir que ‘Aristóteles no era filósofo’ es verdadera en w1 y debemos preguntarnos si eso nos compromete a afirmar que si Aristóteles no existiese se encontraría en la lista de personas que no son filósofas. Es fácil ver, pues, que estos temas afectan por igual la semántica, la lógica y la metafísica.

4. El operador Realmente

Un operador de la lógica modal tradicional (la lógica de la necesidad y la posibilidad) tiene especial interés para la semántica de mundos posibles. Es el término del lenguaje formal Realmente (Actual o Actually, en inglés). La función de ese operador es la de fijar la referencia de la expresión bajo su alcance, de manera que dada una expresión e, para todo índice w la extensión de Realmente(e) es la extensión de e en @.

Consideremos de nuevo el modelo M1. Dado que la extensión de la oración ‘Aristóteles era filósofo’ en @ es el valor de verdad V, la extensión de ‘Realmente (Aristóteles era filósofo)’ es V en todos los índices. Eso significa que cuando representamos la posibilidad de que Aristóteles no fuese filósofo (w2 en M1, ya que a no se encuentra en la extensión de ‘filósofo’), el valor de verdad de ‘Aristóteles no era filósofo’ en w2 es F, pero el valor de verdad de ‘Realmente Aristóteles era filósofo’ en w2 continúa siendo V. De forma similar la extensión de ‘el tutor de Alejandro Magno’ en w1 es b (Dionisio) pero dado que la extensión de ‘el tutor de Alejandro Magno’ en w1 en @ es a, el representante de Aristóteles, la extensión de la descripción definida ‘el que fue realmente tutor de Alejandro Magno’ en w1 continúa siendo a. Por este motivo se ha considerado (aunque esto no es completamente cierto por motivos complejos que tienen que ver con la incorporación de dominios variables como los del modelo M2) que el operador Realmente es un rigidificador: aunque, por ejemplo, una descripción como ‘el tutor de Alejandro Magno’ tiene una extensión que varía en índices o mundos distintos, ‘el que fue realmente tutor de Alejandro Magno’ tiene la misma extensión en todos los mundos posibles.

5. Representación de la necesidad y la posibilidad

La semántica de mundos posibles es una herramienta poderosa. Permite, entre otras cosas, representar de forma perspicua la diferencia entre enunciados necesarios y no necesarios, posibles e imposibles. No es sorprendente, ya que la semántica de mundos posibles toma las herramientas de la lógica modal tradicional, específicamente diseñada para captar las modalidades (necesidad, posibilidad, contingencia). Un enunciado como ‘8 es un número natural par’ es un enunciado necesario. El mundo no podría ser tal que 8 no fuese par. En semántica de mundos posibles ‘8’ es claramente un designador rígido; la intensión de ‘8’ es una función constante que a cada índice le asigna el número 8 (o quienquiera que sea el objeto que representa al número 8 en el modelo; para simplificar, aquí lo representaremos con el número ‘8’). Y la intensión de ‘número natural par’ asigna a cada índice el conjunto de todos los números naturales pares. Consideremos un nuevo modelo M3 que es exactamente como M1, excepto que añadimos al dominio el conjunto de los número naturales.  La intensión de las expresiones ‘8’ y ‘número par’ se representaría como sigue:

INT (‘8’):

@  →  8
w1  → 8
w2  → 8

INT (‘número par’):

@  →  {2, 4, 6, 8, 10, . . .}
w1  →  {2, 4, 6, 8, 10, . . .}
w2  →  {2, 4, 6, 8, 10, . . .}

Y, naturalmente, la intensión de ‘8 es un número par’ es una función constante que asigna el valor de verdad V a cada índice. Es decir ‘8 es un número par’ es verdadera y no podría ser falsa; es necesaria. En este mismo modelo vemos que ‘8 no es un número par’ es un enunciado imposible, falso en todos los índices.

En cambio, ‘Aristóteles era filósofo’ podría ser falsa. Y eso queda representado porque la oración es falsa en el índice w2. Eso significa que el enunciado ‘Aristóteles era filósofo’ no es necesario, sino contingente. Es fácil comprobar también que el enunciado ‘Aristóteles no era filósofo’ aun siendo falso dado como es el mundo (falso en @), podría haber sido verdadero (es verdadero en w2) y por tanto es falso, pero posible, que Aristóteles no fuese filósofo.

6. Algunos de los límites de la semántica de mundos posibles

6.1. Una complicación: los deícticos

En el desarrollo de la semántica intensional no se prestó atención inicialmente a los deícticos, expresiones como (‘yo’, ‘aquí’, ‘ahora’, ‘ella’, ‘esto’, ‘hoy’…), términos singulares cuya referencia depende de factores contextuales. Tratar estas expresiones dentro de la semántica intensional introduce algunas complicaciones.

Las expresiones deícticas son sensibles al contexto. Una proferencia de ‘hoy’ el día de Navidad de 2023, refiere al 25 de Diciembre 2023. Pero una proferencia de ‘hoy’ efectuada al día siguiente ya no refiere al 25 de Diciembre. Así pues, la oración ‘hoy hace sol’ proferida en un contexto en el que el día de la proferencia es el 25 de Diciembre puede ser verdadera, en tanto que una proferencia de la misma oración al día siguiente bien puede ser falsa.

La semántica de mundos posibles, en principio, no incorpora ningún parámetro que permita captar esa sensibilidad al contexto. Para poder representarla sería preciso añadir un nuevo tipo de índice, junto a los índices que representan distintos mundos posibles. Los modelos deberían, pues, incluir un conjunto de índices para representar los distintos contextos. En su trabajo ‘Demonstratives’, David Kaplan ofrece una serie de importantes consideraciones sobre las condiciones de verdad de las oraciones que contienen deícticos, y presenta un sistema formal que extiende la semántica intensional tradicional para incorporar contextos.

6.2. Actitudes proposicionales

Tradicionalmente, las actitudes proposicionales, por ejemplo, los enunciados de creencia, se tratan en semántica como una relación entre un sujeto y la proposición expresada por una oración, su significado. Dado que la intensión de una oración se podría concebir como una representación de su significado, parecería que una oración de creencia como ‘María cree que Aristóteles era filósofo’ expresaría una relación entre el referente del sujeto y la intensión de la oración subordinada. Sin embargo, eso no parece ser una buena forma de representar la semántica de enunciados de creencia. Supongamos, por ejemplo, que la oración ‘María cree que 5 es un número impar’ es verdadera. La intensión de ‘5 es un número impar’ es una función constante que para cada índice asigna el valor de verdad V, ya que es una verdad necesaria que 5 es un número impar. La intensión de ‘la raíz cuadrada positiva de 49 es 7’ es también una función constante que asigna a cada índice el valor de verdad V. No hay ninguna diferencia entre las intensiones de ‘5 es un número par’ y ‘la raíz cuadrada positiva de 49 es 7’, y en general ninguna diferencia entre las intensiones de todas las oraciones necesarias (ni tampoco ninguna diferencia entre las intensiones de todas las oraciones imposibles, como ‘5 es par’). Si la creencia se representa en términos de la relación de un sujeto con una intensión, dado que ‘María cree que 5 es un número impar’ es verdadera parece que nos vemos abocados a la conclusión de que ‘María cree que la raíz cuadrada positiva de 49 es 7’ es también verdadera, pero María puede bien ser una muy joven estudiante de primaria que todavía no ha aprendido lo que es una raíz cuadrada, y por tanto, resulta chocante atribuirle esa creencia. Esto ciertamente es una limitación de la semántica de mundos posibles.

Una solución, parcial, consiste en apelar a la estructura interna de las oraciones subordinadas, una idea que debemos a Rudolf Carnap. Carnap observa que aunque ‘5 es un número impar’ y ‘la raíz cuadrada positiva de 49 es 7’ tienen la misma intensión, las intensiones de los términos constituyentes son distintas. La ‘intensión de ‘5’ es una función constante que asigna el número 5 a cada índice, la intensión de ‘7’ asigna a cada índice el número 7, etc. Según Carnap, el hecho de que esas oraciones tengan constituyentes con distintas intensiones, según su terminología, el hecho de que esas oraciones tengan una estructura intensional distinta, significa que  las dos atribuciones de creencia no tienen por qué coincidir en valores de verdad, ya que los enunciados de creencia son sensibles a la estructura intensional de las oraciones subordinadas.

La propuesta de Carnap, en cualquier caso es solo una solución parcial. Si tenemos en cuenta los argumentos que llevan a Kripke a postular que los nombres propios son designadores rígidos, la intensión de oraciones que se diferencian únicamente en la presencia de nombres propios co-referenciales, tienen la misma intensión. Así pues dado que ‘Amantine Dupin’ y ‘George Sand’ tienen la misma referencia, ‘Amantine Dupin es una famosa novelista’ y ‘George Sand es una famosa novelista’ tienen no solo la misma intensión sino también la misma estructura intensional, por lo que apelar a la estructura intensional no nos permite explicar por qué parece obvio que ‘Juan cree que George Sand es una famosa novelista’ puede ser verdadera en tanto que  ‘Juan cree que Amantine Dupin es una famosa novelista’ puede ser falsa.

Genoveva Martí
(ICREA y Universitat de Barcelona)

Referencias

  • Carnap, R. (1947), Meaning and Necessity. Chicago: University of Chicago Press.
  • Kaplan, D. (1982), «Demonstratives». J. Almog, J. Perry y H. Wettstein (eds.), Themes from Kaplan. Oxford: Oxford University Press.
  • Kripke, S. (1980), Naming and Necessity. Harvard: Harvard University Press.

Lecturas recomendadas en castellano

  • Carnap, R. (2004), Significado y necesidad. México: Instituto de Investigaciones Filosóficas.
  • Kripke, S. (2017), El nombrar y la necesidad. México: Instituto de Investigaciones Filosóficas.

Cómo citar esta entrada

Martí, G. (2023). Semántica de mundos posibles. Enciclopedia de la Sociedad Española de Filosofía Analítica. http://www.sefaweb.es/semantica-de-mundos-posibles-semantica-intensional/

 

La paradoja Sorites

1. Contexto histórico

La paradoja Sorites es una de las paradojas más antiguas, venerables y complejas del panorama filosófico contemporáneo. Según la tradición historiográfica, la paradoja fue formulada por primera vez por Eubúlides de Mileto (fl. s. IV a.C.), un importante miembro de la Escuela Megárica, contemporáneo de Aristóteles y famoso por su afán polemista. Según Diógenes Laercio, Eubúlides “redactó muchos argumentos dialécticos” (2007, II. 108, p. 135), entre los cuales destacan, sobre todo, la paradoja Sorites y la paradoja del Mentiroso. La palabra ‘sorites’ proviene de la palabra griega ‘soros’, que significa ‘montón’. La paradoja Sorites recibe este nombre debido a que, según Cicerón y Galeno, las primeras versiones usaban esta expresión en su formulación.

No conocemos cuáles eran las motivaciones que llevaron a Eubúlides a formular dichos argumentos; según una tradición historiográfica, Eubúlides y la Escuela Megárica se caracterizaron por producir argumentos “áridos y erísticos”, los cuales, aunque “inteligentes”, eran inútiles y sin interés (Zeller 1931, p. 107). Este punto de vista se remonta, por lo menos, a Cicerón, quien consideraba la paradoja Sorites como “un género vicioso y capcioso” (1990, II.XVI 49, p. 44) y, los argumentos megáricos en general, como “sofismas […] intricados y picantes” (II. XXIV 75, p. 57).

Sin embargo, otra tradición historiográfica mantiene que es poco creíble suponer que Eubúlides propusiera sus argumentos como meros acertijos sin interés y que, muy probablemente, estaba intentando ilustrar y justificar algunas tesis de la escuela megárica (Kneale y Kneale 1971, p. 108). Una de las hipótesis, entre otras, que dicha tradición historiográfica baraja es que Eubúlides podría haber estado polemizando con Aristóteles, tal vez criticando, por ejemplo, su teoría del infinito en potencia (Beth 1954), o tal vez alguna de sus propuestas en el campo de la ética (Moline 1969). (Para más discusión alrededor del papel de la paradoja en la antigüedad véase, por ejemplo, Barnes 1982, Burnyeat 1982 y Wheeler 1983. Para una panorámica de la historia de la paradoja Sorites des de la Grecia antigua hasta Leibniz véase Santos 2019; véase también Williamson 1994, cap. 1.)

2. La paradoja Sorites

La paradoja Sorites aparece en el marco del fenómeno, más general, de la vaguedad. La vaguedad puede afectar a diversos tipos de expresiones lingüísticas (predicados, sustantivos, verbos, preposiciones, etc.) y también, seguramente, a representaciones mentales, como los conceptos. Para simplificar, nos centraremos en la vaguedad que se da en predicados; a saber, expresiones que denotan una propiedad, como ‘calvo’, ‘alto’, ‘joven’, ‘rojo’, etc. La principal característica de los predicados vagos es que, aunque se aplican de forma clara en algunos casos (por ejemplo, alguien con 0 cabellos es calvo) y no se aplican, también de forma clara, en otros (por ejemplo, alguien con 100.000 cabellos no es calvo), existen otros casos en los que la aplicación del predicado es dudosa. Dudosa en el sentido de que somos reacios a aplicar el predicado, pero también somos reacios a no aplicarlo y, crucialmente, nos parece que ninguna investigación (ni conceptual ni empírica) puede ayudar a esclarecer la duda en cuestión. Así, por ejemplo, hay ciertos individuos de los cuáles no sabríamos decir si son calvos o no y no nos parece que esta indecisión se pueda resolver analizando más el significado de ‘calvo’ o contando con exactitud la cantidad de cabellos del individuo en cuestión. Éstos serían, entonces, casos dudosos (borderline cases) del predicado ‘calvo’. La existencia de casos dudosos constituye, pues, un importante rasgo de las expresiones vagas (la caracterización de la vaguedad en términos de casos dudosos se puede encontrar ya en Pierce 1902, p. 748, donde se caracteriza la vaguedad en términos de incerteza intrínseca).

La existencia de casos dudosos pone de manifiesto otra de las principales características de los predicados vagos; a saber, la aparente inexistencia de límites precisos entre los casos en los que el predicado se aplica y los casos en los que no. Así, no parece que haya un límite preciso de cabellos que separe los individuos calvos de los que no lo son; es decir, por lo que parece, no hay ninguna cantidad de cabellos n, tal que alguien con n cabellos sea calvo, pero alguien con n+1 cabellos no lo sea; es decir, que ser calvo no parece depender de un cabello más o menos.

Esta característica de los predicados vagos es la que, precisamente, se pone de manifiesto en la paradoja Sorites. La idea detrás de la paradoja es la siguiente. Dado que alguien con 0 cabellos es, claramente, calvo y dado que ser calvo no depende de un cabello más o menos (porque no hay ningún límite preciso entre los que son calvos y los que no), alguien con 1 cabello también es calvo. Pero si alguien con 1 cabello es calvo, por la misma razón anterior, alguien con 2 cabellos también es calvo. Así, esta pequeña línea de argumentación puede repetirse tantas veces como sea necesario para concluir, finalmente, que alguien con 100.000 cabellos también es calvo. Parece, pues, que, partiendo de premisas que parecen verdaderas, hemos podido concluir (siguiendo patrones de argumentación que parecen correctos) algo que parece falso. Estamos, pues, delante de los signos distintivos de una paradoja; un argumento aparentemente válido con premisas aparentemente verdaderas y conclusión aparentemente falsa.

De forma un poco más precisa, la paradoja Sorites se puede enunciar, en una de sus formas más simples, de la siguiente forma, dado un predicado vago cualquiera F y una serie de objetos a1, a2, …, an:

  • Fa1
  • Si Fa1, entonces Fa2
  • Si Fa2, entonces Fa3
  • Si Fan-1, entonces Fan
  • ———————————
  • Por tanto, Fan

Para que un argumento con esta forma sea una paradoja es suficiente con que se den las siguientes condiciones (sobre la suficiencia de estas condiciones véase Barnes 1982, sobre su no necesidad, véase Oms y Zardini 2019, n. 14, Zardini 2021, p. 501 y Oms 2022, p. 5)

  1. El predicado F tiene que ser verdadero (al menos aparentemente) del objeto a1; por ejemplo, si F es el predicado ‘calvo’, a1 puede ser un individuo con 0 cabellos.
  2. El predicado F tiene que ser falso (al menos aparentemente) del objeto an; por ejemplo, si F es el predicado ‘calvo’, an puede ser un individuo con 100.000 cabellos. 
  3. La serie de objetos a1, a2, …, an tiene que ser lo que normalmente se llama una serie sorítica; a saber, una serie tal que todas las parejas de objetos contiguos son indiscriminables respecto a la aplicación del predicado F; es decir, que, para cualquier i, 1 ≤ i > n, Fai si, y solo si, Fai+1. Así, por ejemplo, la serie a1, a2, …, anpuede consistir en individuos tales que, si ai tiene n cabellos, ai+1 tiene n+1 cabellos, de tal forma que ai es calvo si, i sólo si, también lo es ai+1 (porque, recordemos, ser calvo no depende de un cabello más o menos).

La paradoja Sorites puede adoptar otras formas. Así, por ejemplo, las premisas en forma de condicional se pueden expresar con una sola premisa de la forma: para cada i, si Fai, entonces Fai+1 (para un análisis de las diferentes versiones de la paradoja véase, por ejemplo, Hyde y Raffman 2018, sec. 2 y Oms y Zardini 2019, pp. 6-7 ).

Ahora podemos observar porque la paradoja Sorites es un problema filosófico especialmente acuciante y profundo. Por una parte, especialmente en sus formulaciones más simples como la anterior, los recursos lógicos que usa son mínimos; en este caso, modus ponens (el patrón de argumentación según el cual de A y de si A entonces B, se sigue B) y la transitividad de la consecuencia lógica. Por otra parte, la paradoja parece afectar la gran mayoría de las expresiones y los conceptos que usamos para describir, conceptualizar y categorizar el mundo que nos rodea: expresiones como ’calvo’, ‘alto’, ‘joven’, ‘rojo’, ‘bueno’, ‘simpático’, ‘bello’, etc.

La paradoja señala, pues, una fuerte tensión que impregna profundamente todo nuestro aparato conceptual y expresivo.

3. Soluciones a la paradoja Sorites

A continuación, veremos tres de las principales soluciones que se han propuesto para lidiar con la paradoja Sorites. En primer lugar, veremos dos ejemplos de soluciones que intentan preservar la lógica clásica: el superevaluacionismo y el epistemicismo. Dejaremos de lado, por razones de espacio, algunas de las soluciones que, típicamente, se enmarcan también en este tipo de propuestas; principalmente, las contextualistas y las incoherentistas (para las primeras, véase, por ejemplo, Fara 2000, Raffman 1994, 2014 y Bones y Raffman 2019; para las segundas, véase, por ejemplo, Dummet 1975, Horgan 1994 y Eklund 2002, 2005, 2019).

En segundo lugar, veremos un ejemplo de solución que propone revisar la lógica clásica: la propuesta gradualista. Dejaremos de lado, otra vez por razones de espacio, algunas de las soluciones que típicamente se enmarcan en este tipo de propuestas; principalmente, las intuicionistas, las dialetheistas y las subestructurales (para las primeras, véase, por ejemplo, Wright 2019, 2021; para las segundas, véase, por ejemplo, Priest 2010, 2019 y Oms y Zardini 2021; para las terceras, véase, por ejemplo, Zardini 2008, 2019 y Slaney 2011).

3.1. Superevaluacionismo

De acuerdo con el superevaluacionismo, la vaguedad es un fenómeno lingüístico: si a es un caso dudoso de cierto predicado vago F, entonces la aplicación de F al objeto a es indeterminada y la aplicación de la negación de F al objeto a también. Esto se suele traducir en una falta de valor de verdad de los enunciados que resultan de la aplicación de un predicado vago a un caso dudoso de dicho predicado; dichos enunciados no son ni verdaderos ni falsos. Típicamente, los superevaluacionistas defienden que no atribuir valor de verdad a este tipo de oraciones captura parte de la fenomenología que asociamos a los predicados vagos en situaciones en las que dudamos si el predicado se aplica o no se aplica y, en consecuencia, no estamos dispuestos a afirmar que se aplica, pero tampoco estamos dispuestos a negar que se aplica (véase, por ejemplo, Cobreros y Tranchini 2019, p. 38).

El hecho de que el superevaluacionismo afirme que hay enunciados que no tienen valor de verdad (podríamos decir: que son indeterminados), significa que, según esta propuesta, el Principio de Bivalencia, según el cual todo enunciado es o bien verdadero, o bien falso (y no las dos cosas a la vez), falla. Sorprendentemente, aunque el superevaluacionismo pueda ofrecer contraejemplos al Principio de Bivalencia (a saber, los enunciados indeterminados), sí permite preservar uno de los principios constitutivos de la lógica clásica: el Principio del Tercio Excluso. Según este principio, todo enunciado de la forma A o no A es necesariamente verdadero. De hecho, el superevaluacionismo no solamente consigue preservar el Principio del Tercio Excluso, sino, hasta cierto punto, la noción clásica de consecuencia lógica en su totalidad. Para entender por qué esto es así, es necesario ver cuál es la semántica que el superevaluacionismo propone.

La semántica superevaluacionista debe su nombre a Bas van Fraassen (1966), quien la usó para lidiar con casos de indeterminación causados por términos sin denotación. Su aplicación a la vaguedad se remonta a Mehlberg (1956), aunque el locus classicus de aplicación de las ideas superevaluacionistas al caso de la vaguedad y la paradoja Sorites es Kit Fine (1975). Una de sus defensas más detalladas y extensas hasta el momento es Keefe (2000).

La estrategia que sigue el superevaluacionismo para enfrentare al fenómeno de la vaguedad y la paradoja Sorites se basa en el uso de formas razonables de hacer los predicados vagos precisos. Pensemos, por ejemplo, en el predicado vago ‘alto’. Hay muchas formas de hacer este predicado preciso; así, podemos decidir que, dado un caso dudoso de ‘alto’, digamos una persona que mide 180 cm, esta sea considerada como alta en algunas de estas formas de precisar el predicado y sea considerada como no-alta en otras. La idea es que no tenemos ninguna razón para preferir una opción sobre la otra. Llamaremos precisiones a dichas formas de hacer los predicados vagos precisos. En una de las formulaciones más habituales del superevaluacionismo, dichas precisiones deben ser completas y admisibles (defendida, con detalle, en Keefe 2000).

Que las precisiones sean completas significa que deciden todos los casos de aplicación del predicado; es decir, que, si F es un predicado vago y a es un caso dudoso de la aplicación de dicho predicado, que una precisión sea completa significa que o bien a es F o bien no lo es y, por tanto, la aplicación de F al objeto a es o bien verdadera (en el primer caso) o bien falsa (en el segundo caso). Así, en una precisión completa no falla el Principio de Bivalencia.

Que las precisiones sean admisibles significa que no contradicen las intuiciones básicas que tenemos respecto a los predicados a los que hacen precisos. Pensemos otra vez en el predicado ‘calvo’. Hay seres humanos que, claramente, son calvos (los que tienen, por ejemplo, 0 cabellos) y otros que, claramente, no lo son (los que tienen, por ejemplo, 100.000 cabellos). Toda precisión admisible debe contar a los primeros como calvos y a los segundos no; es decir, para ser admisibles, las precisiones deben respetar los casos claros de aplicación y los de no-aplicación del predicado vago al que hacen preciso. Hay otras intuiciones que las precisiones deben respetar para ser admisibles, intuiciones que capturan relaciones de comparación y conexiones analíticas entre predicados diferentes (Fine 1975 llamó a estas relaciones y conexiones, conexiones de penumbra); así, por ejemplo, volviendo al predicado ‘alto’, si Guillem es más alto que Alicia, ninguna precisión admisible puede considerar a la segunda alta sin considerar alto al primero; así, en la situación descrita, en la que Guillem es más alto que Alicia, el enunciado ‘si Alicia es alta, Guillem también’ tiene que ser verdadero en toda precisión admisible del predicado ‘alto’.

En la semántica superevaluacionista, un enunciado es verdadero cuando es verdadero en todas la precisiones completas y admisibles de los predicados vagos que aparecen en el enunciado. Y es falso cuando no es verdadero en ninguna de ellas (es decir, cuando es falso en todas ellas). La idea es que los enunciados que son verdaderos lo son independientemente de cómo hagamos precisos los predicados vagos que contienen; pongamos donde pongamos los límites que separan los casos de aplicación del predicado de los casos de no-aplicación del predicado, el enunciado es verdadero. Dicho de otra manera, la verdad solo nos compromete con aquello que no depende de donde pongamos los límites de los predicados vagos.

Es importante notar que hay una diferencia entre la noción de verdad en una precisión y la noción de verdad, digamos, simpliciter (ser verdadero en todas las precisiones). A menudo, se llama a la segunda super-verdad. Así, resumiendo, según el superevaluacionismo un enunciado es super-verdadero cuando es verdadero en toda precisión y super-falso cuando es falso en toda precisión.

Veamos algunos ejemplos. Supongamos que Alicia es un caso dudoso del predicado vago ‘alto’. Esto significa que, dado que no es ni un caso claro de aplicación de ‘alto’, ni tampoco un caso claro de su no-aplicación, la admisibilidad de las precisiones deja abierta la posibilidad de que, en algunas de ellas, Alicia cuente como alta, y en otras, no. Así, el enunciado ‘Alicia es alta’ es verdadero en algunas de las precisiones y falso en otras. Por tanto, el enunciado ‘Alicia es alta’ no es ni super-verdadero ni super-falso; ya que no es el caso que el enunciado sea verdadero en todas las precisiones completas y admisibles de ‘alto’ (que es lo que debería de pasar para que fuera super-verdadero) pero tampoco es el caso que no lo sea en ninguna (que es lo que debería de pasar para que fuera super-falso). Falla, pues, como hemos dicho, el Principio de Bivalencia. Por otra parte, si nos fijamos en el enunciado ‘Alicia es alta o no lo es’, dado que las precisiones son completas (es decir, cuentan a Alicia o bien como alta o bien como no-alta), dicho enunciado es verdadero en toda precisión completa y admisible de ‘alto’; ya sea porque Alicia cuenta como alta en dicha precisión (y, entonces, es verdadero el primer componente de la disyunción), o ya sea porque Alicia no cuenta como alta en dicha precisión (en cuyo caso es verdadero el segundo componente de la disyunción). En consecuencia, el enunciado ‘Alicia es alta o no lo es’ es super-verdadero. Se pude ver, así, por qué se satisface la Ley del tercio Excluso.

Vamos a ver ahora como el superevaluacionismo soluciona la paradoja Sorites. Recordemos que la paradoja Sorites es problemática porque parece ser un argumento válido que, a partir de premisas que parecen verdaderas nos permita concluir algo que parece falso. La estrategia superevaluacionista consiste en negar que las premisas sean super-verdaderas. Tomemos, por ejemplo, la formulación de la paradoja que usa condicionales de la forma ‘Si Fai, entonces Fai+1’, donde, recordemos, F es un predicado vago y ai y ai+1 son objetos contiguos en la serie sorítica que genera la paradoja. En algunos de estos condicionales se dará el caso que tanto ai como ai+1 sean casos dudosos de F. Así, ambos contaran como F en algunas precisiones y como no-F en otras. En las precisiones en las que los dos cuentan como F, el condicional ‘Si Fai, entonces Fai+1’ es verdadero; en las precisiones en las que a1 cuenta como no-F (independientemente de cómo quede clasificado a2), el condicional también es verdadero; pero en la precisión en la que ai cuenta como F y ai+1 no, el condicional es falso. Por tanto, el condicional es verdadero en algunas precisiones y falso en otras; es decir, que no es ni super-verdadero ni super-falso. Si, como hemos visto, identificamos ahora la super-verdad con la verdad simpliciter, vemos que no es el caso que las premisas de la Sorites sean verdaderas; al menos algunas de ellas no lo son (aunque tampoco sean falsas). Así, la Sorites, según el superevaluacionista, ya no hace que tengamos que comprometernos con su conclusión, ya que el argumento ya no es correcto; es decir, aunque sea lógicamente válido, no todas sus premisas son verdaderas y, en consecuencia, ya no implica la verdad de su conclusión.

Es importante notar que la premisa ‘para cada i, si Fai, entonces Fai+1’, que, como hemos dicho, se usa en otras formulaciones de la paradoja no es solamente no-verdadera, sino que es simplemente falsa (identificando, como antes, la super-verdad y la super-falsedad con la verdad y la falsedad simpliciter). Esto es así porque en toda precisión hay un i tal que es el caso que Fai pero no es el caso que Fai+1; es decir, en toda precisión hay dos objetos contiguos en la serie sorítica tales que el primero es F pero el segundo no (dado que la precisión es completa). Por tanto, en cada precisión, el enunciado ‘para cada i, si Fai, entonces Fai+1’ es falso y, así, el enunciado es falso. Cabe notar que, si este enunciado es falso, su negación es verdadera; es decir, que el enunciado ‘existe un i tal que Fai y no-Fai+1’ es verdadero (al menos en lógica clásica, donde ¬∀xφ es lógicamente equivalente a ∃x¬φ). Pero este último enunciado expresa la existencia de un límite exacto en la serie sorítica entre los objetos que son F y los que no. Así, vemos que el superevaluacionismo acepta que los predicados vagos tienen límites precisos; hay un pelo de diferencia entre los individuos que son calvos y los que no. Aun así, dicha aceptación es solamente nominal, en el sentido de que, aunque el superevaluacionista acepta que los predicados vagos tienen límites precisos, no hay ningún lugar en particular donde podamos ubicar dichos límites. Esta consecuencia del superevaluacionismo ha sido criticada como un fallo a la hora de capturar el significado habitual de las afirmaciones existenciales (véase, por ejemplo, Williamson 1994, pp. 153-154); así, el superevaluacionismo no conseguir´ía capturar la idea, que parece perfectamente natural, según la cual que sea verdad que existe un objeto que tal y cual implica que efectivamente hay un objeto que tal y cual (es decir, que las afirmaciones existenciales verdaderas tienen ejemplificaciones verdaderas). El superevaluacionismo parece aceptar lo primero sin aceptar lo segundo. (Para una discusión más detallada de las ventajas y los inconvenientes de las propuestas superevaluacionistas véase Cobreros y Tranchini 2019.)

3.2. Epistemicismo

Según el epistemicismo, la vaguedad es una forma de ignorancia; los predicados vagos tienen límites precisos entre los objetos a los que se aplican y los objetos a los que no se aplican, pero dichos límites nos resultan incognoscibles. Además, según el epistemicismo, tendemos a tomar esta ignorancia, equivocadamente, como evidencia de que dichos límites precisos no existen; la idea es que, como no podemos saber dónde están, nos parece que no existen.

A diferencia del superevaluacionismo, el epistemicismo no defiende la existencia de dichos límites solo nominalmente, sino que defiende la existencia de una cantidad concreta en particular de, digamos, cabellos, que hacen que alguien sea o deje de ser calvo. Por tanto, según el epistemicismo, un cabello sí importa para ser calvo o no ser calvo, aunque qué cantidad exacta de cabellos es la que marca la diferencia es algo que nos resulta epistémicamente inaccesible. La solución a la paradoja Sorites es, entonces, inmediata: uno de los condicionales de la forma ‘Si Fai, entonces Fai+1’ es falso; a saber, el condicional que menciona los objetos que quedan a ambos lados del límite preciso de F, de tal forma que, aunque ai y ai+1 sean indiscriminables respecto de la aplicación de F, el primero es F y el segundo no. Análogamente, la premisa ‘para cada i, si Fai, entonces Fai+1‘ también es, simplemente, falsa, ya que, precisamente, dicha premisa niega la existencia de límites precisos. Y el epistemicismo, como hemos dicho, afirma la existencia de límites precisos. Se preservan, pues, el Principio de Bivalencia y la lógica clásica en su totalidad; no es necesaria ninguna revisión ni de la lógica clásica ni tampoco de la semántica clásica.

La principal dificultad de las posturas epistemicistas consiste en explicar cuál es la naturaleza y cuáles son las razones de la mencionada inaccesibilidad epistémica a los límites precisos de los predicados vagos.

En la discusión contemporánea, las ideas epistemicistas aplicadas a la vaguedad y a la paradoja Sorites aparecen ya mencionadas en Cargile (1969) y han sido defendidas, por ejemplo, por Sorensen (1988, 2001), Williamson (1994) Horwich (1997) y Kearns y Magidor (2008). De todas estas propuestas, la más completa y detallada es la de Williamson, así que nos centraremos en ella.

Para explicar la naturaleza de la ignorancia que afecta a los predicados vagos, Williamson usa la idea según la cual para que una creencia A constituya conocimiento es necesario que dicha creencia no se hubiese podido formar fácilmente en una situación donde A fuera falsa. Por ejemplo, supongamos que observo el árbol que se ve desde mi ventana y me pregunto cuál debe de ser su altura. Supongamos que, basándome solamente en una suposición a primera vista (con una estimación a ojo), adquiero la creencia de que el árbol mide 3 m y 34 cm. Y supongamos que, de hecho, el árbol mide efectivamente 3 m y 34 cm. En esta situación no diríamos que que el árbol mide 3 m y 34 cm. La idea es que, mi creencia de que el árbol mide 3 m y 34 cm no constituye conocimiento porque, si el árbol hubiera medido 3 m y 33 cm yo igualmente hubiera adquirido la creencia de que mide 3 m y 34 cm. Digamos que, mi creencia, era verdadera por casualidad, o por suerte, y no era lo bastante segura; no era segura en el sentido de que existe una situación posible semejante a la descrita donde la creencia es falsa, pero en la que yo adquiero la creencia igualmente. Comparemos esta situación con otra en la que cojo una escalera, un metro y bajo al jardín a medir cuidadosamente el árbol. En esta segunda situación, si adquiero la creencia de que el árbol mide 3 m y 34 cm en base a mis mediciones, no hubiera adquirido dicha creencia en una situación en la que el árbol hubiera medido 3 m y 33 cm, ya que mis mediciones, en esta segunda situación, habrían dado como resultado 3 m y 33 cm y no 3 m y 34 cm. Por tanto, en esta segunda situación sí podemos obtener conocimiento, ya que la creencia es segura, en el sentido ya mencionado.

A partir de esta idea Williamson razona de la siguiente forma. Williamson mantiene que el significado de las palabras (ya sean vagas o no) está determinado por el uso que los miembros de una comunidad lingüística hacen de ellas. Así, si en dos situaciones posibles la palabra ‘alto’ se usa exactamente de la misma forma, su significado (y con él, el límite preciso entre los individuos altos y los no-altos) es el mismo. Además, dice Williamson, la relación que hay entre el uso de una expresión y su significado es muy frágil y compleja, de tal forma que pequeños cambios en el uso de, por ejemplo, la expresión ‘alto’ provocan cambios en su significado y, por tanto, cambios en cuáles son los objetos que son altos y cuáles no. Pero estos pequeños cambios, según Williamson, son muchas veces indetectables y, además, la función que determina el significado a partir de su uso es demasiado compleja, lo cual nos pone en una situación similar a la del árbol anterior. Es decir, supongamos que adquiero la creencia de que el límite preciso de ‘alto’ es, exactamente, 1 m y 76 cm. Supongamos que, de hecho, el uso que en este momento se hace de la expresión ‘alto’ determina que, efectivamente, el límite preciso entre los altos y los no-altos es 1 m y 76 cm. Dicha creencia no puede constituir conocimiento por la misma razón que mi estimación a ojo de la altura del árbol tampoco lo podía constituir: a saber, en una situación en la que el uso de ‘alto’ fuera ligeramente diferente (estableciendo el límite preciso, por ejemplo, en 1 m y 75 cm) yo igualmente me hubiera formado la creencia de que el límite está situado en 1 m y 76 cm, ya que no habría podido detectar los cambios relevantes que causan los cambios en el significado de ‘alto’. Así, en general, mis creencias sobre los límites precisos de los predicados vagos nunca pueden constituir conocimiento, que es lo que Williamson quería concluir.

El Epistemicismo tiene como ventaja que soluciona la paradoja Sorites de forma simple y elegante y que no involucra ninguna revisión de la lógica y la semántica clásicas. Por otra parte, algunas de las objeciones que ha recibido son las siguientes. Rosana Keefe (2000, pp. 71-72), por ejemplo, ha acusado al epistemicismo de ser una propuesta demasiado contraintuitiva, en el sentido que no puede explicar ni tan siquiera porque no nos formamos creencias sobre la localización de los presuntos límites precisos de los predicados vagos; así, lo relevante a explicar (y lo que el epistemicismo no puede explicar, dice Keefe) no es que no conozcamos dichos límites, sino que ni tan siquiera tengamos creencias sobre ellos. Según Graham Priest (2019, pp. 147), por ejemplo, las propuestas epistemicistas no pueden concluir tan fácilmente como pretenden que tomemos la ignorancia de los límites precisos de los predicados vagos como evidencia de que estos no existan, ya que, dice Priest, hay muchas cosas que no conocemos y de cuya existencia no dudamos. (Para una discusión más detallada de las ventajas y los inconvenientes de las propuestas epistemicistas véase Magidor 2019.)

3.3. Propuestas gradualistas

Una reacción que surge de forma muy natural cuando pensamos en predicados vagos es que su aplicación es una cuestión de grado; los individuos son más calvos o menos calvos que otros individuos; las personas son más altas o menos altas que otras personas; los objetos son más rojos o menos rojos que otros objetos …

Las propuestas gradualistas intentan precisar esta idea. Y lo hacen, típicamente, capturando los grados de aplicación de los predicados vagos con el intervalo cerrado de números reales o racionales [0,1], donde 0 representa la falsedad, 1 la verdad y el resto de los números representan los valores de verdad intermedios que capturan la naturaleza gradual de los predicados vagos. Así, por ejemplo, si Alicia y Guillem son casos dudosos del predicado ‘alto’ y Guillem es más alto que Alicia, tal vez el enunciado ‘Alicia es alta’ tiene el valor de verdad de 0.5 y el enunciado ‘Guillem es alto’ tiene el valor de verdad de 0.7. La verdad es, pues, una cuestión de grado.

Algunas de las ideas que acabarían incorporándose en las propuestas gradualistas se encuentran ya en Łukasiewicz y Tarski (1930) y Black (1937). Pero la primera propuesta gradualista plenamente desarrollada la introdujo Joseph Goguen (1969). Diferentes propuestas gradualistas se pueden encontrar defendidas, por ejemplo, en Lakoff (1973), Machina (1976), Forbes (1983), Edgington (1997), Smith (2008) y Paoli (2003, 2019).

Aunque no hay consenso entre las diferentes propuestas gradualistas, seguiremos a Paoli (2019) y presentaremos sucintamente lo que él llama la Propuesta Difusa Estándar (PDE). La PDE, si bien se distancia en algunos aspectos importantes de las principales propuestas gradualistas, nos permitirá hacernos una idea suficientemente precisa de cuál es la respuesta gradualista a la paradoja Sorites.

La PDE usa el intervalo cerrado de números racionales [0,1] como conjunto de valores de verdad y la lógica de infinitos valores de Łukasiewicz. Dicha lógica usa una semántica veritativo-funcional; es decir, que el valor de verdad de las expresiones complejas construidas con las conectivas lógicas depende unívocamente del valor de verdad de sus partes menos complejas. Las condiciones de verdad para las conectivas lógicas son las siguientes, donde |φ| denota el valor de verdad numérico de la expresión φ (es decir, |φ|∈ [0, 1]):

|¬φ| = 1 – |φ|,
|φ & ψ| = min(|φ|, |ψ|); es decir, el mínimo de los dos valores |φ| y |ψ|,
|φ ∨ ψ| = max(|φ|, |ψ|); es decir, el máximo de los dos valores|φ| y |ψ|,
|φ → ψ| = 1, si |φ| ≤ |ψ|;
  1 – (|φ|-|ψ|) (o, alternativamente, 1 – |φ| + |ψ|), si |φ| >|ψ|

La noción de consecuencia lógica se define en términos de preservación necesaria del valor de verdad 1; es decir, un argumento es lógicamente válido según la PDE cuando, si todas sus premisas tienen valor de verdad 1, su conclusión también tiene valor de verdad 1.

Para ver como la PDE puede responder a la paradoja Sorites es importante que nos fijemos en el comportamiento del condicional, que, como veremos a continuación, intenta capturar la pérdida de verdad, por así decirlo, que puede darse del antecedente al consecuente. Como se ve en sus condiciones de verdad, un condicional toma el valor de verdad máximo cuando el valor de verdad del antecedente es menor o igual que el valor de verdad del consecuente; es decir, un condicional toma el valor de verdad máximo cuando no hay pérdida de verdad del antecedente al consecuente. ¿Qué pasa cuándo sí hay pérdida de verdad del antecedente al consecuente? Como se puede observar en las condiciones de verdad del condicional, la pérdida de verdad (es decir la diferencia de valor de verdad que hay entre el antecedente y el consecuente) se resta del valor de verdad máximo (es decir, de 1). Por ejemplo, volviendo al ejemplo anterior, supongamos que el enunciado ‘Alicia es alta’ tiene valor de verdad de 0.5 y el enunciado ‘Guillem es alto’ tiene valor verdad de 0.7. Entonces, el enunciado ‘Si Guillem es alto, entonces Alicia es alta’ tendrá valor de verdad 1 – (|‘Guillem es alto’|- |‘Alicia es alta’ |) = 1 – (0.7 – 0.5) = 1 – 0.2 = 0.8. Es decir, primero calculamos la pérdida de verdad del antecedente al consecuente (que en este caso es de 0.2) y restamos esta cantidad del valor máximo de verdad que el condicional podría tener.

Vamos a ver ahora como la PDE propone solucionar la paradoja Sorites. La primera premisa, Fa1, tendrá valor 1, ya que hemos supuesto que a1 era un caso claro de aplicación de F. Tal vez alguno de los condicionales que siguen a la primera premisa también tendrán valor 1, pero, tarde o temprano, nos adentraremos en la zona de casos dudosos de aplicación de F. Es decir, que, tarde o temprano llegaremos a un i tal que el valor de verdad de Fai+1 será menor que el valor de verdad de Fai y, por tanto, el valor de verdad del condicional ‘Si Fai, entonces Fai+1’ será 1 menos la diferencia de verdad entre Fai y Fai+1. Esta diferencia, tal como hemos caracterizado la serie sorítica a1, a2, …, an, será muy pequeña, pero suficiente para que el valor de la premisa ‘Si Fai, entonces Fai+1’ sea menor que 1. Y a partir de este punto, las premisas, aunque mantienen un valor de verdad siempre cercano a 1, empiezan, por así decirlo, a “gotear” verdad, de tal forma que el valor de verdad de sus consecuentes va disminuyendo gradualmente, hasta llegar a la conclusión falsa (con valor 0) Fan. Por tanto, como en el caso del supervaluacionismo y del epistemicismo, según la PDE, el argumento de la paradoja Sorites no es un argumento correcto, ya que no es verdad que todas sus premisas tengan valor de verdad 1, y, por tanto, aunque sea lógicamente válido, no implica que la conclusión tenga valor 1.

Además, la PDE puede explicar por qué nos parece que el argumento de la Sorites es correcto, ya que, aunque sus premisas no tengan valor 1, sí tienen valores muy cercanos a 1, lo cual puede hacernos pensar, equivocadamente, que son verdaderas.

Una de las principales objeciones que han recibido las propuestas gradualistas como la PDE tiene que ver con la asignación de los valores de verdad a los enunciados simples como ‘Alicia es alta’. El problema es que no parece que haya ningún hecho que pueda determinar que el valor de verdad de dicho enunciado sea, digamos, 0.456, y no 0.457 (véase, por ejemplo, Keefe 1998, p. 571). (Para una discusión más amplia de las críticas que las teorías gradualistas han recibido y las respuestas y revisiones que dichas críticas han provocado, véase, por ejemplo, Smith 2008 y Paoli 2019.)

Sergi Oms
(Universitat de Barcelona, Logos Group, BIAP)

Referencias

  • Barnes, J. (1982), “Medicine, Experience, and Logic”, en J. Barnes, J. Brunschwig, M. F. Burnyeat y M. Schofield (eds.), Science and Speculation, Cambridge: Cambridge University Press, 24-68.
  • Beth, E. W. (1954), “Le paradoxe du “sorite” d’Eubulide de Mégare”, en La vie, la pensée: Actes du VIIe Congrés des sociétés de philosophie de langue française, Paris: Presses Universitaires de France, 237-241.
  • Bones, I. y Raffman, D. (2019), “Contextualism and the Sorites Paradox”, en S. Oms y E. Zardini (eds.), The Sorites Paradox, Cambridge: Cambridge University Press, 63-77.
  • Burnyeat, M. F. (1982), “Gods and Heaps”, en M. Schofield y M. C. Nussbaum (eds.), Language and Logos, Cambridge: Cambridge University Press, 315-338.
  • Cicerón, Marco Tulio (1990), Cuestiones académicas, Traducción de J. Pimentel Álvarez, México D. F.: UNAM.
  • Cobreros, P. y Tranchini, L. (2019), “Supervaluationism, Subvaluationism, and the Sorites Paradox”, en S. Oms y E. Zardini (eds.), The Sorites Paradox, Cambridge: Cambridge University Press, 38-62.
  • Diógenes Laercio (2007), Vidas de los filósofos ilustres, Traducción, introducción y notas de C. García Gual, Madrid: Alianza Editorial.
  • Dummett, M. A. E.  (1975), “Wang’s Paradox”, Synthese, vol. 30, 301-324.
  • Edgington, D. (1997), “Vagueness by Degrees”, en R. Keefe y P. Smith (eds.), Vagueness: A Reader, Cambridge, Ma.: MIT Press, 294–316.
  • Eklund, M. (2002), “Inconsistent Languages”, Philosophy and Phenomenological Research, vol. 64, 251-275.
  • Eklund, M. (2005), “What Vagueness Consists in”, Philosophical Studies, vol. 125, 27-60.
  • Fara, D. G. (2000), “Shifting Sands: An Interest-Relative Theory of Vagueness”, Philosophical Topics, vol. 28, 45-81.
  • Fine, Kit (1975), “Vagueness, Truth and Logic”, Synthese, vol. 30, 265-300.
  • Goguen, J. A. (1969), “The Logic of Inexact Concepts”, Synthese, vol. 19, 325-373.
  • Horgan, T. (1994), “Robust Vagueness and the Forced-March Sorites Paradox”, Philosophical Perspectives, vol. 8, 159-188.
  • Horwich, P. (1997), “The Nature of Vagueness”, Philosophy and Phenomenological Research, vol. 57, 929-936.
  • Hyde, D. y Raffman, D. (2018), «Sorites Paradox», en Edward N. Zalta (ed.), The Stanford Encyclopedia of Philosophy (Summer 2018 Edition), <https://plato.stanford.edu/archives/sum2018/entries/sorites-paradox/>.
  • Kearns, S. y Magidor, O. (2008), “Epistemicism about Vagueness and Meta-Linguistic Safety”, Philosophical Perspectives, vol. 22, 277-304.
  • Keefe, R. (1998), “Vagueness by Numbers”, Mind, vol. 107, 427-441.
  • Keefe, R. (2000), Theories of Vagueness, Cambridge: Cambridge University Press.
  • Keefe, R. y Smith, P. (eds.) (1996), Vagueness: A Reader, Cambridge Ma.: MIT Press.
  • Kneale, W. y Kneale, M. (1971). The Development of Logic, Oxford: Oxford University Press. (Traducido por J. Muguerza, El desarrollo de la lógica, Madrid: Tecnos, 1972. Las referencias son a la traducción.)
  • Lakoff, G. (1973), “Hedges: A Study on Meaning Criteria and the Logic of Fuzzy Concepts”, Journal of Philosophical Logic, vol. 2, 458-508.
  • Łukasiewicz, J. y Tarski, A. (1930), “Untersuchungen über den Aussagenkalkül”, Comptes rendus des séances de la Société des Sciences et des Lettres de Varsovie, vol. 23, 30-50.
  • Machina, K. F. (1976), “Truth, Belief, and Vagueness”, Journal of Philosophical Logic, vol. 5, 47-78.
  • Magidor, O. (2019), “Epistemicism and the Sorites Paradox”, en S. Oms y E. Zardini (eds.), The Sorites Paradox, Cambridge: Cambridge University Press, 21-37.
  • Mehlberg, H. (1958), The Reach of Science, Toronto: University of Toronto Press.
  • Moline, J. (1969), “Aristotle, Eubulides and the Sorites”, Mind, vol. 78, 393-407.
  • Oms, S. (2022), “Some Remarks on the Notion of Paradox”, Acta Analytica, publicado en línea.
  • Oms, S. y Zardini, E. (2019), The Sorites Paradox, Cambridge: Cambridge University Press.
  • Oms, S. y Zardini, E. (2021), “Inclosure and Intolerance”, Notre Dame Journal of Formal Logic, vol. 62, 201-220.
  • Paoli, F. (2003), “A Really Fuzzy Approach to the Sorites Paradox”, Synthese, vol. 134, 363-387.
  • Paoli, F. (2019), “Degree Theory and the Sorites Paradox”, en S. Oms y E. Zardini (eds.), The Sorites Paradox, Cambridge: Cambridge University Press, 151-167.
  • Peirce, C.S. (1902), “Vague”, en J. M. Baldwin (ed.), Dictionary of Philosophy and Psychology, New York: MacMillan, 748.
  • Priest, G. (2010), “Inclosures, Vagueness, and Self-Reference”, Notre Dame Journal of Formal Logic, vol. 51, 69-84.
  • Priest, G. (2019), “Dialetheism and the Sorites Paradox”, en S. Oms y E. Zardini (eds.), The Sorites Paradox, Cambridge: Cambridge University Press, 135-150.
  • Raffman, D. (1994), “Vagueness without Paradox”, The Philosophical Review, vol. 103, 41-74.
  • Raffman, D. (2014), Unruly Words: A Study of Vague Language, Oxford: Oxford University Press.
  • Santos, R. (2019), “The Pre-Analytic History of the Sorites Paradox”, en S. Oms y E. Zardini (eds.), The Sorites Paradox, Cambridge: Cambridge University Press, 289-306.
  • Slaney, J. (2011), “A Logic for Vagueness”, The Australasian Journal of Logic, vol. 8, 100-134.
  • Smith, N. J. J. (2008), Vagueness and Degrees of Truth, Oxford: Oxford University Press.
  • Sorensen, R. A. (1988), Blindspots, Oxford: Oxford University Press.
  • Sorensen, R. A. (2001), Vagueness and Contradiction, Oxford: Oxford University Press.
  • van Fraassen, B. C. (1966), “Singular Terms, Truth-Value Gaps, and Free Logic”, The Journal of Philosophy, vol. 63, 481-495.
  • Wheeler, S. C. (1983), “Megarian Paradoxes as Eleatic Arguments”, American Philosophical Quarterly, vol. 20, 287-295.
  • Williamson, T. (1994), Vagueness, London: Routledge.
  • Wright, C. (2019), “Intuitionism and the Sorites Paradox”, en S. Oms y E. Zardini (eds.), The Sorites Paradox, Cambridge: Cambridge University Press, 95-117.
  • Wright, C. (2021), The Riddle of Vagueness. Selected Essays 1975-2020, Oxford: Oxford University Press.
  • Zardini, E. (2008), “A Model of Tolerance”, Studia Logica, vol. 90, 337-368.
  • Zardini, E. (2019), “Non-Transitivism and the Sorites Paradox”, en S. Oms y E. Zardini (eds.), The Sorites Paradox, Cambridge: Cambridge University Press, 168-186.
  • Zardini, E. (2021), “Substructural Approaches to Paradox: An Introduction to the Special Issue”, Synthese, vol. 199, 493-525.
  • Zeller, E. (1931), Outlines of the History of Greek Philosophy. 13th Edition, revised by Wilhelm Nestle and translated by L. R. Palmer, London: Routledge & Kegan Paul Limited.

Lecturas recomendadas en castellano

  • Barrio, E (ed.) (2014), Paradojas, paradojas y más paradojas. Cuadernos de lógica, epistemología y lenguaje 7. College Publications.
  • Kneale, W. y Kneale, M. (1908), El desarrollo de la lógica. Madrid: Tecnos.
  • Sorensen, R. (2007), Breve historia de la paradoja. Barcelona: Tusquets editores.

Cómo citar esta entrada

Oms, S. (2022). La paradoja Sorites.  Enciclopedia de la Sociedad Española de Filosofía Analítica. http://www.sefaweb.es/la-paradoja-sorites

 

Pluralismo lógico

El pluralismo lógico afirma que hay más de una lógica correcta. Esto es, resuelve las afirmaciones aparentemente rivales del tipo ‘∆ se sigue de Γ’ y ‘∆ no se sigue de Γ’. Hay muchas formas de resolver este desacuerdo, que dependen de ciertos presupuestos sobre qué es la lógica y de cuál es el origen de la rivalidad. En cierto modo, el pluralismo lógico puede verse como un proyecto: el estudio de cómo se pueden aceptar dos o más lógicas, o sobre los límites razonables de nuestra tolerancia con distintas lógicas rivales.

1. Niveles de pluralismo

En el debate sobre el pluralismo lógico no sólo encontramos propuestas a favor y en contra de algunas tesis pluralistas, sino también clasificaciones de estas mismas tesis (véase Priest, 2006; Field, 2009; Cook, 2010; Eklund, 2012). Y junto con las clasificaciones, algunos autores han propuesto distintos niveles de pluralismo lógico.

Así pues, distinguimos niveles de versiones de pluralismo lógico. Los niveles de pluralismo lógico corresponden a las diversas concepciones de qué es la lógica: desde la lógica concebida como pura estructura matemática hasta la lógica como formalización del razonamiento correcto. Las versiones de pluralismo son las distintas teorías que hacen compatibles más de una lógica en un determinado nivel.

Priest (2006) distingue tres niveles principales en los que se puede situar la tesis pluralista:

  1. Pluralismo lógico puro (PLP): hay una pluralidad de lógicas puras.
  2. Pluralismo lógico aplicado (PLA): hay una pluralidad de lógicas que pueden aplicarse a distintos fenómenos.
  3. Pluralismo lógico del razonamiento (PLR): hay una pluralidad de lógicas para analizar el razonamiento correcto.

Es importante tener en cuenta que cada versión del pluralismo implica una presuposición sobre un determinado nivel donde se sitúa la lógica. Lo que uno define como lógica determina qué tipo de pluralismo puede respaldar. Por lo tanto, dado un nivel concreto, hay dos posibilidades con respecto al debate pluralista: defender que hay más de una lógica en ese nivel o defender que sólo hay una.

1.1. Pluralismo lógico puro

Si uno revisa la bibliografía especializada en lógica, puede ver que en cierto sentido hay o existen diversas lógicas: clásica, relevante, lineal, trivalente, intuicionista… Una posible tesis pluralista es la afirmación de que estas lógicas son igualmente legítimas en tanto que sistemas de símbolos y reglas sin interpretar. Llamaremos a la tesis pluralista en este nivel pluralismo lógico puro (PLP), tal como hace Priest (2006) (otras denominaciones para este nivel son las de Cook, 2010: Pluralismo lógico Matemático, y Eklund, 2012: pluralismo de mapeo).

La aceptación de PLP parece trivial. Aceptar que hay distintos sistemas lógicos correctos en tanto que simples estructuras no resulta controvertido. Tampoco excluye ni presupone la tesis que la lógica correcta (en un sentido que veremos a continuación) es única. Como afirman Priest (2006), Cook (2010) y Eklund (2020), no parece que esta pluralidad implique una tesis filosófica sustancial, ya que no consideramos que la lógica sea simplemente una estructura matemática: consideramos que la lógica es algo más que eso.

1.2. Pluralismo lógico aplicado

Cuando hablamos de la validez de un argumento podemos hacerlo de forma interna, refiriéndonos a la validez del argumento dadas las reglas de la lógica en la que razonamos, o de una forma externa, interpretando el vocabulario lógico y preguntándonos si dada esa interpretación la conclusión se sigue de las premisas. En este sentido podemos determinar un segundo nivel de pluralismo: la pluralidad de lógicas aplicadas a distintos dominios. En este segundo nivel la lógica no es solo una estructura matemática, sino que es la aplicación de esa estructura a un dominio del discurso, interpretando así el vocabulario lógico. Llamamos a esta tesis Pluralismo Lógico aplicado (PLA), siguiendo a Priest (2006) (Cook, 2010 incluye en este nivel el ‘pluralismo matemático aplicado’ y el ‘pluralismo lógico filosófico’, mientras que Eklund, 2012 se refiere a este nivel como ‘pluralismo de propósitos’).

Podemos distinguir dos versiones de PLA. La primera versión afirma que dado un dominio hay una sola lógica correcta para ese dominio. Es decir, el pluralismo es un fenómeno externo para cada aplicación específica. Según la segunda versión se pueden aplicar distintas lógicas a un único dominio, siendo así el pluralismo un fenómeno interno para ese dominio.

Aunque el pluralismo en este nivel no es tan sencillo y evidente como el PLP, puede defenderse como verdadero sin respaldar aún el pluralismo lógico. Se puede estar de acuerdo con el hecho de que diferentes lenguajes formales pueden ser teorías sobre diferentes fenómenos sin aceptar una pluralidad de lógicas en un sentido más fuerte. Para rechazar que el pluralismo lógico se reduce a la pluralidad de lógicas correctamente aplicadas a distintos campos se debe asumir al menos uno de los dos puntos siguientes: (i) el vocabulario lógico se interpreta técnicamente en cada dominio y no corresponde al significado genuino de las conectivas lógicas, (ii) la conexión entre premisas y conclusiones en los dominios en los que se aplican las distintas lógicas no está determinado por la consecuencia lógica, sino por alguna otra conexión técnica determinada por los fenómenos formalizados. En definitiva, si se acepta PLA pero se defiende una tesis monista sobre la lógica, se considera que la lógica se identifica con una aplicación particular: el razonamiento correcto.

1.3. Pluralismo lógico del razonamiento

Estas últimas consideraciones nos llevan al último nivel en el que podemos situar la tesis pluralista, y que hemos nombrado Pluralismo lógico aplicado al razonamiento (PLR) siguiendo a Priest (2006) (Cook, 2010 lo denomina ‘pluralismo de consecuencia lógica’ o ‘pluralismo lógico substancial’ y Eklund, 2012, ‘buen pluralismo’). En este nivel nos centramos en la formalización de la consecuencia lógica genuina o canónica, que no es otra que el análisis del razonamiento correcto (Priest, 2006, p. 196).

De acuerdo con Haack (1982, p. 223) y Priest (2006, p. 174), podemos establecer una distinción interesante en PLR. Por un lado, se puede argumentar a favor del localismo, afirmando que dominios distintos requieren lógicas distintas para razonar sobre ellos, es decir, la consecuencia lógica cambia según el dominio (es importante observar que esta visión es similar pero no equivalente a PLA externo: la aplicación de una lógica a un dominio es distinta a la consecuencia lógica genuina para razonar sobre un dominio). Por otro lado, el globalismo defiende que hay más de una lógica correcta para razonar, con independencia del dominio o del discurso al que se aplique.

Las tesis que encontramos en este último nivel no parecen tan triviales o fáciles de demostrar como las examinadas en niveles anteriores. Que haya más de una lógica correcta que captura el razonamiento correcto no parece evidente, dada la formalidad, normatividad y universalidad que se le atribuye a la lógica. Veamos las distintas propuestas para defenderlo.

2. Versiones del pluralismo lógico

Una vez hemos visto que el interés del pluralismo lógico es hacer compatibles dos o más afirmaciones aparentemente incompatibles sobre la consecuencia lógica nos centraremos en los distintos intentos para defender esta tesis. Las versiones interesantes del pluralismo deben (a) respaldar más de una lógica en el nivel PLR, o (b) defender que PLR no se corresponde con lo que entendemos por lógica, y respaldar una versión de pluralismo en un nivel inferior.

Consideremos la aparente rivalidad acerca de la validez de un argumento Γ ⇒ ∆. Dicha rivalidad puede tener dos orígenes distintos: la divergencia sobre lo que expresan Γ y ∆ (generalmente defendido por una divergencia sobre las constantes lógicas que aparecen en Γ y ∆, pero no necesariamente) o la divergencia sobre lo que expresa ⇒. En otras palabras, dadas dos lógicas L y L′, tenemos las siguientes dos posibilidades que explican su rivalidad (Haack, 1982 y Hjortland, 2013):

  • Divergencia sobre el lenguaje: Γl ⇒ ∆l y Γl ⇏ ∆l
  • Divergencia sobre la consecuencia: Γ ⇒l ∆ y Γ ⇏l

Tengamos en cuenta que no es posible trazar una línea que separe nítidamente los dos tipos de pluralismo, ya que el comportamiento de la noción de consecuencia tiene efectos en el comportamiento de las conectivas, y viceversa (véase el fenómeno de la internalización de la validez en Hjortland, 2014 y Dicher, 2016). Por lo tanto, aunque solemos hablar de versiones de pluralismo lógico, también pueden entenderse como distintas presentaciones del pluralismo lógico.

2.1. Pluralismo del lenguaje

La defensa del pluralismo lógico basada en la pluralidad de lenguajes legítimos diversos se ha defendido a partir de la adopción de más de una codificación legítima de las constantes lógicas. Veamos las distintas formas que esta idea ha tomado en la bibliografía sobre el pluralismo.

2.1.1. Tolerancia

Carnap es considerado un pionero en el debate pluralista (Beall y Restall, 2006 y Restall, 2002), siendo su Principio de Tolerancia (Carnap, 1937, p.xv) la motivación de su visión pluralista sobre la lógica.

Podemos identificar dos principios que sustentan el pluralismo carnapiano (Kouri Kissel, 2019): en primer lugar, Carnap identifica la lógica con el lenguaje formal, afirmando que un lenguaje queda determinado en tanto se definan las reglas sintácticas que lo rigen (Carnap, 1937, p. 52), lo que supone que un cambio de lógica es un cambio de lenguaje.

En segundo lugar, Carnap defiende el Principio de Tolerancia, que acepta más de un lenguaje formal. Este principio se sustenta en la idea que las preguntas acerca de la corrección de un lenguaje se responden por principios pragmáticos o de conveniencia respecto a la aplicación del mismo. Según este punto de vista, es imposible o un sinsentido determinar cuál es la formalización correcta o el rol inferencial de ‘y’, ‘o’, o ‘si … entonces’ en sentido absoluto. Solo después de que se haya especificado la aplicación sobre la que se está teorizando, se puede determinar la mejor formalización de la conjunción, disyunción o condicional.

Y dado que puede haber distintos contextos que requieran distintas formalizaciones de las constantes lógicas (como hemos visto al presentar el PLA), el pluralismo lógico es correcto.

2.1.2. Modelos

Cook (2002) y Shapiro (2006) defienden una versión del pluralismo que se sustenta en una visión particular sobre la lógica y su conexión con el lenguaje. Shapiro y Cook afirman que el objeto de la lógica es modelar el lenguaje natural, donde los modelos son estructuras que capturan e idealizan ciertas características de un fenómeno, el lenguaje en este caso, mientras que ignoran otras. Dada la riqueza del fenómeno a modelar y la simplificación que del mismo hace de modelo, puede haber modelos rivales pero igualmente correctos de un mismo fenómeno, dependiendo de los aspectos que se realcen o simplifiquen.

Podemos ver esta versión como un pluralismo de dos dimensiones: por un lado, cada contexto que se pretenda modelar aceptará unas reglas distintas en función de su utilidad para el caso concreto; por otro lado, en función de la complejidad que se quiera capturar en cada contexto se aceptará una lógica más o menos idealizada que ignore o refleje su estructura.

2.1.3. Polisemia

Otra versión del pluralismo lógico es la de Kouri Kissel (2018), quien también defiende una pluralidad de lenguajes formales que pueden capturar el vocabulario lógico. Kouri Kissel (2018) defiende una visión polisémica sobre el significado de las constantes lógicas. Según
su punto de vista, las conectivas cambian su significado según el contexto, pero están conectadas entre ellas con una noción pre-teórica de cada conectiva de una manera polisémica.

Consideremos, por ejemplo, el ‘no’ en lenguaje natural y sus distintas formalizaciones en lógicas rivales como la lógica clásica o la intuicionista. Según Kouri Kissel, hay una negación pre-teórica (2018, p. 7) que está relacionada con cada negación formal del mismo modo que están relacionados entre sí los distintos significados de algunas palabras polisémicas. Así pues, la negación solo se puede precisar en relación con un contexto del discurso determinado (por ejemplo, el razonamiento clásico o intuicionista sobre las matemáticas).

2.1.4. Lógica de la ambigüedad

Otra forma de pluralismo basado en la multiplicidad de lenguajes formales legítimos es la de Allo (2013). Este pluralismo está motivado por el hecho de que las conectivas lógicas de la lógica clásica son defectuosas para codificar las conectivas del lenguaje natural, pues estas son conectivas ambiguas, mientras que en la lógica clásica son unívocas.

En general, las lógicas subestructurales codifican dos sentidos de las conectivas lógicas mediante la distinción entre conectivas multiplicativas y aditivas. Allo afirma que las conectivas del lenguaje natural son ambiguas, y que alguna lógica subestructural es una lógica correcta para capturar dicha ambigüedad.

2.1.5. Realitividad lógica

Varzi distingue lo que él denomina relativismo tarskiano del relativismo carnapiano. Primero, y siguiendo a Tarski, Varzi defiende una versión del pluralismo lógico basada en una pluralidad de modelos válidos, que a su vez se basa en la pluralidad de demarcaciones de vocabulario lógico (Varzi, 2002). Esto genera una versión de pluralismo lógico dada la noción tarskiana de consecuencia lógica:


Un argumento es válido si su conclusión es verdadera en todos los modelos en los que las premisas son verdaderas.

Varzi defiende la pluralidad de interpretaciones de la noción de modelo como resultado de una pluralidad de demarcaciones del vocabulario lógico, de modo que el límite entre el vocabulario lógico y el vocabulario extra-lógico es variable. Esto permite generar distintos modelos para la consecuencia lógica, lo que genera más de una lógica correcta.

En segundo lugar, siguiendo a Carnap, Varzi afirma que una vez que se ha establecido una demarcación específica del vocabulario lógico, uno puede ser pluralista en el sentido carnapiano visto anteriormente.

2.1.6. Pluralidad de los portadores de valores de verdad

Otra versión del pluralismo, defendida por Gillian Russell (2008), surge de una pluralidad de interpretaciones de los portadores de valores de verdad codificados en Γ y ∆ en una inferencia Γ ⇒ ∆.

Russell afirma que podemos encontrar ambigüedades en la noción de argumento (Russell, 2008, p. 596): las premisas y la conclusión de un argumento son portadores de valores de verdad, pero esta caracterización abre una pluralidad de posibilidades, ya que los portadores de valores de verdad pueden ser ‘oraciones, proposiciones, símbolos, declaraciones, expresiones, ocurrencias de oraciones, creencias y juicios’ (Russell, 2008, p . 596). El pluralismo lógico surge de la ambigüedad de los argumentos dependiendo de qué portadores elijamos.

Para ver cómo esta ambigüedad nos conduce al pluralismo lógico, distingamos primero las proposiciones, como portadores primarios de valores de verdad, del resto, que son utilizados para expresar una proposición, y cuyas condiciones de verdad dependen de la proposición que expresan.

Sea Bi un portador de valores de verdad que expresa la proposición Pi: Russell muestra que el bicondicional ‘B1, …, Bn Bm si y solo si P1, …Pn Pm’ falla en ambas direcciones. Primero, consideremos el siguiente contraejemplo del condicional ‘si B1, …, Bn Bm entonces P1, …, Pn Pm ’:

⇒ Estoy aquí ahora.

Aunque esta expresión siempre expresa algo verdadero, la proposición que expresa en cada caso no es una verdad lógica. Por lo tanto, hay derivaciones válidas de una lógica que formaliza portadores de valores de verdad no proposicionales que no son válidas en una lógica que formalice contenidos proposicionales.

Segundo, el siguiente contraejemplo muestra la invalidez del condicional ‘si P1, … Pn Pm entonces B1, …, Bn Bm’,

Héspero es Héspero ⇒ Héspero es Fósforo.

Ambas oraciones expresan la misma proposición, pero un portador de valores de verdad no proposicional no establece una conexión lógica entre la premisa y la conclusión. Por lo tanto, hay derivaciones válidas en lógicas que formalizan contenidos proposicionales que no son válidas si la lógica captura portadores de valores de verdad no proposicionales.

En definitiva, hay más de una respuesta a la pregunta sobre la validez de un argumento, y el pluralismo lógico surge como consecuencia de la ambigüedad que la autora atribuye a la noción de argumento.

2.2. Pluralismo de la consecuencia

Otras versiones de pluralismo lógico emergen de la pluralidad de relaciones de consecuencia lógica defendidas como válidas en un mismo lenguaje. Por lo tanto, en contraposición a los pluralismos del lenguaje, que defienden variaciones en Γ y ∆ en la expresión ‘∆ se sigue de Γ’, veremos versiones que defienden que la expresión ‘se sigue de’ puede formalizarse de distintas formas, todas ellas legítimas.

2.2.1. Pluralismo lógico de Beall y Restall

Beall y Restall (2001, 2006) definen su pluralismo como ‘la tesis de que hay más de una relación de consecuencia deductiva genuina’ dado que ‘la noción pre-teórica de consecuencia lógica no está formalmente definida y no tiene límites nítidos’ (2006).

El pluralismo lógico de Beall y Restall se sustenta en la siguiente reformulación de la noción tarskiana de la validez, TTG:


Tesis Tarskiana Generalizada (TTG): un argumento es válidox si y solo si, en todos los casosx en los que las premisas son verdaderas, también lo es la conclusión. (Beall y Restall, 2006, p.29)

Observemos que el subíndice x en válido y en casos muestra que la validez es relativa a la especificación de casos. Fijémonos también que la consecuencia es definida como preservación de la verdad en los distintos casos. Por lo tanto, cada especificación de casos posible determinará una relación de consecuencia lógica distinta, pues la posibilidad de encontrar un contraejemplo para un argumento en concreto variará en función de los casos admitidos.

Beall y Restall aceptan que hay al menos cuatro especificaciones distintas de casos (mundos posibles, modelos tarskianos, situaciones y construcciones), que dan lugar a tres lógicas válidas (lógica clásica, relevante e intuicionista): primero, si consideramos los casos como tarskianos, o bien como mundos posibles, completos y coherentes, la lógica obtenida es clásica; segundo, si los casos son considerados como situaciones posiblemente incompletas e incoherentes, pueden modelar la lógica relevante; y si los casos son construcciones, posiblemente incompletas pero coherentes, la lógica resultante es la lógica intuicionista.

Consideremos como ilustración el silogismo disyuntivo, A B, ¬A B. Si razonamos sobre casos completos y coherentes, siguiendo la lógica clásica, no encontraremos ningún contraejemplo al argumento, y por lo tanto, lo consideramos clásicamente válido. Sin embargo, si aceptamos que pueden haber casos incoherentes, un contraejemplo será aquella situación en que A es falso y B es verdadero y falso. Por lo tanto, el argumento es inválido en lógica relevante.

Finalmente, Beall y Restall restringen las instancias de TTG a aquellas que generan nociones de consecuencia lógica que sean necesarias, normativas y formales, un criterio que cumplen tanto la lógica clásica, como la relevante y la intuicionista.

2.2.2. Modalismo

Bueno y Shalkowski (2009) defienden una tesis pluralista denominada ‘modalismo’, que se basa, al igual que para Beall y Restall, en una definición de consecuencia lógica que puede especificarse de diversos modos. Sin embargo, a diferencia de Beall y Restall, Bueno y Shalkowski (2009) definen la consecuencia lógica evitando una cuantificación sobre los casos posibles. Su pluralismo emerge de la siguiente definición de validez:


Un argumento es válido si, y solo si, la conjunción de sus premisas con la negación de su conclusión es imposible. (Bueno y Shalkowski, 2009, p. 295).

Con esta definición de consecuencia, emerge una pluralidad de lógicas si se puede expandir el ‘dominio de lo posible’. Y así es, según Bueno y Shalkowski, ya que, por ejemplo las contradicciones son posibles en ciertos dominios del discurso (p. 309), pero imposibles en otros, lo que da lugar a distintas nociones de validez.

2.2.3. Ruta dialógica

French (2019) defiende una versión del pluralismo basada en la noción de ‘explicación’, que a su vez surge de una concepción dialógica de la lógica.

Consideremos un argumento Γ ⇒ ∆, y dos sujetos, el ‘argumentador’ y el ‘escéptico’. El papel del argumentador es convencer al escéptico de la validez del argumento, y este segundo busca razones para rechazar la conclusión dadas las premisas. La validez del argumento se reflejará en la existencia de una estrategia del argumentador para convencer a su interlocutor, por muy escéptico que este sea.

El pluralismo surge como consecuencia de observar que hay distintos estándares para aceptar un argumento, y aquello que en ciertos contextos puede ser un argumento bueno o convincente, en otros contextos con distintos estándares se puede rechazar por ser un argumento inválido.

2.2.4. Cáculo de secuentes

La siguiente versión de pluralismo lógico utiliza la lógica de secuentes para defender la pluralidad de lógicas admisibles. Los secuentes del cálculo tienen la siguiente forma:

A, Γ ⊢ ∆, B

Ahora podemos introducir reglas que nos permitan pasar de unos secuentes a otros: estas reglas pueden afectar a una conectiva lógica (reglas operativas), o pueden afectar a la coma (reglas estructurales). Como ilustración, veamos la derivación del silogismo disyuntivo en la lógica clásica:

La derivación comienza con axiomas, A A y B B, y luego aplica reglas que afectan tanto a las conectivas lógicas (⋁L y ¬L) como a las comas (WR, ER, EL). El resultado es el secuente A B, ¬A B, es decir, B se deduce de A B y ¬A suponiendo que las reglas y los axiomas también son válidos.

Estas reglas se pueden modificar: se pueden presentar reglas alternativas para codificar alguna conectiva, o se puede rechazar alguna regla estructural, lo que afecta a las comas y también a ⊢.

Restall (2014) sugiere una versión del pluralismo distinta (pero compatible) con su propia teoría (juntamente con Beall) presentada anteriormente. La idea de Restall es adoptar distintas nociones de consecuencia lógica para un mismo lenguaje. Para defender esta posibilidad considera que el significado de las constantes lógicas queda determinado por las reglas operacionales, mientras que las reglas estructurales afectan la noción de consecuencia. Así, podemos tener dos nociones de consecuencia distintas en un mismo lenguaje.

Consideremos la negación. En la lógica clásica e intuicionista, la negación tiene las siguientes reglas:

Sin embargo, su comportamiento en lógica clásica e intuicionista difiere: en la lógica clásica pueden aparecer más de una fórmula como conclusión, mientras que en la lógica intuicionista sólo puede aparecer una. Por lo tanto, ¬R en lógica intuicionista solo se puede aplicar cuando ∆ es vacío. Esta diferencia en las reglas estructurales para ⊢ invalida la siguiente inferencia en la lógica intuicionista:

Si convenimos con Restall en que las reglas operacionales determinan el significado de ¬, y en que las formalizaciones clásica e intuicionista de ⊢ son admisibles, entonces debemos aceptar la lógica clásica y la lógica intuicionista como dos nociones de validez en un mismo lenguaje.

3. Principales objeciones contra el pluralismo

Desde la publicación de los trabajos de Beall y Restall se han formulado numerosas objeciones al proyecto. Dos de ellas merecen especial atención, por su carácter transversal, que afecta a cualquier versión del pluralismo lógico.

3.1. Colapso

El problema del colapso ha sido presentado y estudiado por Keefe (2014), Priest (2006), Read (2006) y Stei (2020).

La objeción al pluralismo se plantea como sigue: consideremos dos lógicas distintas, L1 y L2, que el pluralista acepta, y que difieren en la validez del argumento Γ ⇒ ∆, que L1 considera válido y L2 inválido. Supongamos también que el pluralista tiene razones para aceptar Γ. Debe el pluralista aceptar ∆?

Tanto si damos una respuesta positiva como negativa a la pregunta sobre si debemos aceptar ∆, el pluralismo parece colapsar en una única lógica, es decir, en monismo: supongamos que en la situación descrita debemos aceptar ∆. En este caso, L2 parece fallar, pues su noción de consecuencia no da todas las claves para determinar qué conclusiones aceptar dadas ciertas premisas. Si por el contrario debemos rechazar ∆, la noción de consecuencia que codifica L1 parece inducirnos a error, al afirmar que dado Γ se deriva ∆.

3.2. Cambio de significado

El argumento del cambio de significado es una objeción formulada no solo en contra del pluralismo lógico sino también en contra de la divergencia respecto a la lógica aceptada.

La objeción tiene su origen en Quine (1998, p.81), donde el autor defiende que la divergencia con respecto a la lógica clásica puede interpretarse como un cambio de significado del vocabulario lógico, lo que transforma dicha divergencia en una simple confusión, y reduce la lógica rival a un equívoco del lenguaje.

El argumento tiene las siguientes tres premisas:

  1. (a) Un cambio de lógica es un cambio de lenguaje formal, entendido como lenguaje interpretado,
  2. (b) El significado de una constante lógica está determinado por su rol inferencial o sus condiciones de verdad,
  3. (c) El lenguaje formal clásico captura el rol inferencial o las condiciones de verdad del vocabulario lógico.

La conclusión de (a) y (b) es que un cambio de lógica es un cambio del significado del vocabulario lógico. Si añadimos (c) al argumento se concluye además que la lógica clásica es la lógica que captura el significado genuino del vocabulario lógico (nótese que (c) podría sustituirse por alguna lógica no clásica, sin que esto varíe la objeción al pluralismo lógico). Por lo tanto, una desviación de la lógica clásica es una desviación del significado genuino de las constantes lógicas, esto es, un equívoco.

Pilar Terrés Villalonga
(Universitat de Barcelona)

Referencias

  • Allo, P. (2013), «Noisy vs. Merely Equivocal Logics», en K. Tanaka, F. Berto, E. Mares y F. Paoli (eds.), Paraconsistency: Logic and Applications, Dordrecht, Springer, 57-79.
  • Beall, JC y Restall, G. (2001), «Defending Logical Pluralism», en J. Woods y B. Brown (eds.), Logical ConsequenceRival Approaches Proceedings of the 1999 Conference of the Society of Exact Philosophy, Stanmore, Hermes, 1-22.
  • Beall, JC y Restall, G. (2006), Logical Pluralism, Oxford, Oxford University Press.
  • Bueno, O. y Shalkowski, S. (2009), «Modalism and Logical Pluralism», Mind, vol. 118, 295-321.
  • Carnap, R. (1937), The Logical Syntax of Language (traducido por Amethe Smeaton), London, Routledge.
  • Cook, R. T. (2002), «Vagueness and Mathematical Precision», Mind, vol. 111, 225-248.
  • Cook, R. T. (2010), «Let a Thousand Flowers Bloom: A Tour of Logical Pluralism», Philosophy Compass, vol. 5, 492-504.
  • Dicher, B. (2016), «A Proof-theoretic Defence of Meaning-Invariant Logical Pluralism», Mind, vol. 125, 727-57.
  • Eklund, M. (2012). «The Multitude View on Logic», en G. Restall y G. Russell, New Waves in Philosophical Logic, Basingstoke, Palgrave Macmillan, 217-40.
  • Eklund, M. (2020), «Making Sense of Logical Pluralism», Inquiry, vol. 63, 433-54.
  • Field, H. (2009), «Pluralism in Logic», Review of Symbolic Logic, vol. 2, 342-59.
  • French, R. (2019), «A Dialogical Route to Logical Pluralism», Synthese, vol. 198, 4969-89.
  • Haack, S. (1982), Filosofía de las lógicas (traducido por A. Amador y T. Orduña), Madrid, Ediciones Cátedra.
  • Hjortland, O. T. (2013), «Logical Pluralism, Meaning-Variance, and Verbal Disputes», Australasian Journal of Philosophy, vol. 91, 355-73.
  • Hjortland, O. T. (2014), «Verbal Disputes in Logic: Against Minimalism for Logical Connectives», Logique et Analyse, vol. 57, 463-86.
  • Keefe, R. (2014), «What Logical Pluralism Cannot Be», Synthese, vol. 191, 1375-90.
  • Kouri Kissel, T. (2018), «Logical Pluralism from a Pragmatic Perspective», Australasian Journal of Philosophy, vol. 96, 578-91.
  • Kouri Kissel, T. (2019), «A New Interpretation of Carnap’s Logical Pluralism», Topoi, vol. 38, 305-14.
  • Priest, G. (2006), Doubt Truth to be a Liar. Oxford, Clarendon Press.
  • Quine, W. V. O. (1998), Filosofía de la lógica (traducción de M. Sacristán), Madrid, Alianza Editorial.
  • Read, S. (2006). «Monism: The One True Logic», en D. de Vidi y T. Kenyon (eds.), A Logical Approach to Philosophy: Essays in Memory of Graham Solomon, Dordrecht, Springer, 193-209.
  • Restall, G. (2002), «Carnap’s Tolerance, Meaning, and Logical Pluralism», The Journal of Philosophy, vol. 99, 426–443.
  • Restall, G. (2014), «Pluralism and Proofs», Erkenntnis, vol. 79, 279-91.
  • Russell, G. (2008), «One True logic?», Journal of Philosophical Logic, vol. 37, 593-611.
  • Shapiro, S. (2006), Vagueness in Context, Oxford, Oxford University Press.
  • Stei, E. (2020), «Rivalry, Normativity, and the Collapse of Logical Pluralism», Inquiry, vol. 63, pages 411-32.
  • Varzi, A. C. (2002), «On Logical Relativity», Noûs, vol. 36, 197-219.

Entradas relacionadas

Consecuencia lógica

Cómo citar esta entrada

Terrés Villalonga, P. (2022). Pluralismo lógico. Enciclopedia de la Sociedad Española de Filosofía Analítica. http://www.sefaweb.es/pluralismo-logico

 

Silogística

1. Introducción

 

La silogística fue desarrollada por Aristóteles entre los años 335 y 322 a. C. (el periodo en que se supone que escribió los libros de Lógica) y se encuentra en su totalidad en dos obras. La clasificación de los diferentes tipos de enunciados y la formulación de las leyes lógicas sobre las que sustenta toda la teoría se encuentran en Sobre la Interpretación. El estudio de los diversos tipos de silogismos (categóricos, hipotéticos y modales) se encuentra en los Primeros Analíticos. Cuando no va acompañado de ninguna cualificación, el término «silogística» suele ser usado para referirse exclusivamente a la teoría de los silogismos categóricos, y así es cómo lo vamos a usar en esta exposición.

En ocasiones se habla de silogística aristotélica para referirse a la teoría tal como la expuso Aristóteles y de silogística tradicional para referirse a la silogística tal como se expone a partir de la Edad Media. No hay ninguna diferencia esencial entre ellas, hasta el punto de que puede decirse que Aristóteles es el creador único de la teoría, pero la existencia de alguna pequeña diferencia técnica y el hecho de que las exposiciones habituales sigan básicamente la terminología medieval, justifican la distinción. Lo que expondré a continuación es la silogística tradicional, pero indicaré en lo posible las peculiaridades aristotélicas.

2. Enunciados categóricos

En lógica tradicional se llama término a la expresión que puede desempeñar la función de sujeto o de predicado en un oración predicativa de la forma

sujeto+verbo ser+predicado

Términos singulares son aquellos que pueden desempeñar la función de sujeto, pero no de predicado. Los nombres propios y, en general, las expresiones que nombran un objeto individual son términos singulares. Términos generales son aquellos que pueden desempeñar tanto la función sujeto como la de predicado. Los nombres comunes y los adjetivos son ejemplos paradigmáticos de términos generales, pero también son consideradas como un único término general expresiones compuestas como, por ejemplo, «descendiente de Eneas».

Supongamos que a es un término singular, y S y P son términos generales. Los enunciados predicativos básicos de la lógica tradicional son los que tienen alguna de las siguientes estructuras:

Singulares: a es P, a no es P.
Indefinidos: S es P, S no es P.
Universal afirmativo (A): Todo S es P.
Universal negativo (E): Ningún S es P.
Particular afirmativo (I): Algún S es P.
Particular negativo (O): No todo S es P, Algún S no es P.

En su presentación de la silogística, Aristóteles prefiere formular los enunciados predicativos mencionando en primer lugar el predicado y con este propósito usa expresiones tales como «P se predica de» o «P pertenece a». Así, los enunciados predicativos cuantificados toman las siguientes formas: P se predica de todo S, P no se predica de ningún S, P se predica de algún S y P no se predica de todo S (o P no se predica de algún S).

En la Edad Media se llamó categóricos a los enunciados predicativos y se introdujeron las letras que figuran entre paréntesis para referirse abreviadamente a los distintos tipos de enunciados cuantificados. Para designar a los afirmativos se usan las dos primeras vocales de «affirmo» y para designar a los negativos las dos vocales de «nego«. Así, un enunciado de tipo A es un universal afirmativo, uno de tipo I es un particular afirmativo, uno de tipo E es un universal negativo y uno de tipo O es un particular negativo. Las dos formas de los enunciados particulares negativos se consideran lógicamente equivalentes (aunque, por el motivo que se explica más adelante, algún lógico medieval cuestionó que lo fueran).

3. Leyes básicas

En la presentación de las leyes básicas y de los modos silogísticos usaré las siguientes abreviaturas para referirme a los enunciados categóricos cuantificados: Asp (todo S es P), Isp (algún S es P), Esp (ningún S es P) y Osp (no todo S es P). Formuladas con estas abreviaturas, las leyes lógicas básicas de la silogística son las siguientes:

Oposición

  1. Asp y Osp son contradictorios (Asp es verdadero si y sólo si Osp es falso).
  2. Esp e Isp son contradictorios (Esp es verdadero si y sólo si Isp es falso).
  3. Asp y Esp son contrarios (Asp y Esp no pueden ser ambos verdaderos, pero sí ambos falsos).
  4. Isp y Osp son subcontrarios (Isp y Osp no pueden ser ambos falsos, pero sí ambos verdaderos).

Conversión simple

  1. Isp es lógicamente equivalente a Ips.
  2. Esp es lógicamente equivalente a Eps.

Conversión per accidens

  1. Asp implica Ips.
  2. Esp implica Ops.

Subalternación

  1. Asp implica Isp.
  2. Esp implica Osp.

La oposición entre Isp y Osp es una consecuencia inmediata de las otras tres leyes. El término «subcontrarios» no es aristotélico, se introdujo en la Edad Media. Aristóteles no menciona la segunda ley de conversión per accidens, pero es una consecuencia de la primera y de las leyes de oposición y, de hecho, reconoce su validez en varias ocasiones. Los lógicos medievales llamaron a los enunciados particulares subalternos de los universales correspondientes; esto es, Isp es el subalterno de Asp y Osp el subalterno de Esp. Las leyes de subalternación son consecuencia inmediata de las leyes de conversión per accidens y de las de conversión simple, pero tiene interés hacerlas explícitas para enfatizar el hecho de que en la lógica aristotélica (y por tanto en la tradicional) los enunciados universales implican a los particulares correspondientes.

Las leyes básicas de la silogística se acostumbran a representar mediante un diagrama que adoptaron los lógicos medievales y que se conoce como cuadrado de la oposición:

4. Silogismos

4.1 Un silogismo, según Aristóteles (Pr. An. 24b19), es un argumento en el que la conclusión se sigue necesariamente de las premisas (esto es, un argumento lógicamente válido) y que tiene como conclusión «algo distinto» de «las cosas supuestas» (las premisas). Así, un argumento que tiene como conclusión una de las premisas no es un silogismo en sentido aristotélico aunque sea lógicamente válido. Una demostración es un silogismo con premisas verdaderas.

En la exposición sistemática de la silogística, Aristóteles usa una noción de silogismo más restringida que la introducida en la definición. En el sentido que podríamos llamar «técnico», un silogismo es un argumento lógicamente válido con sólo dos premisas categóricas que pueden ser universales, particulares o indefinidas y tres términos distintos distribuidos de modo que uno figura en las dos premisas pero no en la conclusión, y los dos restantes aparecen uno en cada premisa y también en la conclusión. Aristóteles usa la palabra «silogismo» tanto en este sentido técnico, como en el sentido que tiene en la definición, y sólo por el contexto se puede saber en qué sentido la está utilizando. En lo que sigue es usada siempre en sentido técnico.

Aunque los enunciados indefinidos pueden ser premisas de un silogismo, Aristóteles no les presta ninguna atención en particular porque considera que a efectos silogísticos equivalen a los particulares correspondientes (esto es, «S es P» equivale a «algún S es P”, y «S no es P» a «algún S no es P”). Aristóteles no incluye a los enunciados singulares entre las premisas posibles y tampoco hay ejemplos de silogismos que tengan este tipo premisas en su exposición sistemática de la silogística. Estos hechos han sido considerados por la mayor parte de los comentaristas como una prueba de que Aristóteles excluye a los argumentos con enunciados singulares de la silogística y concluyen que argumentos como, por ejemplo, «todos los hombres son mortales; Calias es hombre; por tanto, Calias es mortal» no es un silogismo en sentido aristotélico. A pesar de la aparente evidencia, algunos autores como, por ejemplo, W. y M. Kneale (1970, cap. II, §6) y Englebretsen (1980) han puesto en duda que Aristóteles ignorara a los enunciados singulares. En cualquier caso, al menos a partir del s. XVII (véase, por ejemplo, La Lógica o el arte de pensar, p. 286) estos enunciados fueron asimilados a efectos silogísticos a los enunciados universales correspondientes, esto es, «a es P» a «(todo) a es P» y «a no es P» a «(ningún) a es P”. Por este motivo se dice en ocasiones que los argumentos con enunciados singulares como el del ejemplo anterior son silogismos en sentido tradicional, pero no en sentido aristotélico.

 

4.2 Los tres términos que aparecen en un silogismo reciben los nombres de mayor, menor y medio. El sujeto de la conclusión es el término menor; el término común a las dos premisas es el término medio; y el predicado de la conclusión el término mayor. Esta terminología fue introducida por Aristóteles, pero no definió los términos de esta manera. Las definiciones anteriores se deben al filósofo bizantino Juan Filópono que vivió en el s. VI. La premisa que contiene el término mayor es la premisa mayor y la que contiene el término menor es la premisa menor.

Se llama figura a cada una de las posibles disposiciones en que pueden estar los tres términos de un silogismo. Las figuras quedan determinadas por la posición del término medio. Hay cuatro figuras:

  • Primera: El término medio desempeña la función de sujeto en la premisa mayor y la de predicado en la menor.
  • Segunda: El término medio desempeña la función de predicado en las dos premisas.
  • Tercera: El término medio desempeña la función de sujeto en las dos premisas.
  • Cuarta: El término medio desempeña la función de predicado en la premisa mayor y la de sujeto en la menor.

Si representamos mediante «XY» la disposición de los términos en un enunciado categórico cuyo sujeto es X y cuyo predicado es Y, las cuatro figuras pueden esquematizarse de la siguiente manera:

Primera
M — P
S — M
S — P
Segunda
P — M
S — M
S — P
Tercera
M — P
M — S
S — P
Cuarta
P — M
M — S
S — P

Convencionalmente, se escribe en primer lugar la premisa mayor y debajo de ella (o a continuación) la premisa menor. No hay que olvidar, sin embargo, que no es el orden el que determina cuál es la premisa mayor y cuál la menor.

Dos silogismos de una misma figura pueden diferir en la forma concreta de sus premisas y su conclusión. Con posterioridad a Aristóteles, los distintos esquemas a que da lugar una figura recibieron el nombre de modos. No todos los modos silogísticos son válidos (esto es, lógicamente válidos).

Los lógicos medievales crearon un ingenioso modo de enumerar los principales modos válidos que no sólo permitía memorizarlos con facilidad, sino que además informaban en clave de cómo demostrar todos los modos válidos a partir de los de la primera figura. Los nombres medievales por los que se conocen los modos son:

  • Primera: Barbara, Celarent, Darii y Ferio.
  • Segunda: Cesare, Camestres, Festino y Baroco.
  • Tercera: Darapti, Felapton, Disamis, Datisi, Bocardo y Ferison.
  • Cuarta: Bramantip, Camenes, Dimaris, Fesapo y Fresison.

La primera vocal del nombre indica el tipo de la premisa mayor, la segunda vocal el tipo de la premisa menor y la tercera el tipo de la conclusión. Veamos un ejemplo de cada figura formulado con ayuda de las abreviaturas introducidas en la sección 3 (obsérvese que en cada caso los términos están dispuestos tal como indica el esquema de la figura):

Barbara
Amp
Asm
Asp
Festino
Epm
Ism
Osp
Felapton
Emp
Ams
Osp
Dimaris
Ipm
Ams
Isp

Una consecuencia de las leyes de subalternación es que para cada modo válido cuya conclusión es un enunciado universal, hay otro modo válido que se obtiene sustituyendo la conclusión universal por su enunciado subalterno (esto es, substituyendo Asp por Isp y Esp por Osp). A los modos válidos obtenidos de esta manera se les llama también subalternos. La primera figura tiene dos modos subalternos (Barbari y Celaront), la segunda tiene otros dos (Cesaro y Camestrop) y la cuarta tiene un único modo subalterno (Camenop).

Cada silogismo está compuesto por tres enunciados y hay cuatro tipos de enunciados categóricos cuantificados, por tanto existen 64 (4 × 4 × 4) modos posibles en cada figura y 256 (64 × 4) modos posibles en total. Puesto que en cada figura hay 6 modos válidos (contando los modos subalternos), hay 24 modos válidos en total.

Aristóteles no reconoció la cuarta figura en su exposición sistemática de la silogística, pero a lo largo de los Primeros Analíticos se encuentran ejemplos de todos los modos válidos de la cuarta figura (Pr. An. 29a19–29 y Pr. An. 53a3–14). En este sentido puede decirse que Aristóteles reconoció la totalidad de los modos válidos.

Teofrasto, el sucesor de Aristóteles en el Liceo, y los lógicos medievales sólo reconocieron tres figuras, pero, con el propósito de que la primera incluyera los modos que Aristóteles había omitido en su exposición sistemática, la redefinieron como aquella en que el término medio ocupa la posición de sujeto en una premisa y la de predicado en otra. Los modos válidos de esta nueva primera figura se dividieron entonces en directos (los de la primera figura aristotélica) e indirectos (los que antes hemos incluido en la cuarta figura). Cuando los modos de la cuarta figura se ven como silogismos indirectos de la nueva primera figura reciben los siguientes nombres: Baralipton, Celantes, Dabitis, Fapesmo y Fresisomorum.

5. La silogística como sistema deductivo

5.1 Aristóteles distingue entre silogismos perfectos e imperfectos. Los silogismos perfectos son aquellos en los que es evidente que la conclusión se sigue de las premisas, es decir, aquellos cuya corrección lógica es evidente. Sólo los silogismos de la primera figura son perfectos. Los silogismos válidos de las restantes figuras son imperfectos porque su validez no se considera evidente y, por tanto, debe ser demostrada con la única ayuda de principios cuya validez lógica se considera evidente: los silogismos perfectos y las leyes lógicas previamente establecidas. En este contexto, la distinción entre silogismos perfectos e imperfectos se aplica también a los modos silogísticos.

Tal como la presenta Aristóteles, la silogística es esencialmente un sistema formal que tiene como lenguaje los enunciados categóricos cuantificados tal como los he presentado en la sección 2 y cuyo aparato deductivo está constituido por las leyes de contradictoriedad entre estos enunciados, los modos de la primera figura y las leyes de conversión (simple o per accidens) usadas como reglas de transformación (o de derivación). Naturalmente, este sistema deductivo puede usarse para derivar la conclusión de argumentos con más de dos premisas categóricas (los llamados sorites). Puede verse una presentación técnica de la silogística como sistema deductivo en Smiley (1973), Corcoran (1974; 2009).

La demostración de la validez de un modo imperfecto puede ser directa o por reducción al absurdo (per impossibile, en terminología medieval). En una demostración directa se suponen las premisas del modo que se quiere justificar y se deriva la conclusión con la única ayuda de las reglas de conversión y los modos de la primera figura. En una demostración por reducción al absurdo se suponen tanto las premisas del modo que se quiere justificar como el contradictorio de la conclusión y se deriva el contradictorio de una de las premisas con la única ayuda de las leyes de conversión y de los modos perfectos. Las leyes de contradictoriedad son necesarias en este tipo de demostraciones porque son las que determinan cuál es el contradictorio de cada enunciado.

Para demostrar la validez de un modo imperfecto basta con aplicar una vez un único modo de la primera figura, concretamente, el modo cuyo nombre comienza con la misma consonante con la que comienza el nombre del modo imperfecto. Por este motivo, la demostración de la validez de un silogismo imperfecto fue llamada reducción a la primera figura por los lógicos medievales. Así, en terminología medieval puede decirse que cada modo imperfecto se reduce al modo de la primera figura cuyo nombre comienza con la misma letra. Los nombres medievales de los modos válidos de las figuras segunda, tercera y cuarta indican en clave una forma de efectuar la reducción (que no tiene por qué ser la misma que usa Aristóteles).

Además de usar las reglas mencionadas y los modos de la primera figura, Aristóteles justificó ocasionalmente la reducción a la primera figura usando un paso deductivo llamado «éctesis». Las reducciones que hacen uso de este paso se dice que son demostraciones por éctesis, pero en rigor no se trata de un tipo nuevo de demostración, sino cierto modo de argumentar que puede encontrarse tanto en una demostración directa como en una por reducción al absurdo. Dicho en términos actuales, la éctesis consiste esencialmente en la instanciación de un enunciado universal como la que se efectúa, por ejemplo, cuando se argumenta del siguiente modo: «si P se predica de todo M, entonces P se predica de alguno, por ejemplo N”. Todos los modos pueden reducirse a los de la primera figura sin hacer uso de ella y, de hecho, Aristóteles sólo considera la éctesis como una forma alternativa de argumentar.

5.2 Además de presentar un sistema deductivo que permite demostrar la validez de los silogismos imperfectos, Aristóteles expone un procedimiento para mostrar la invalidez de los modos no válidos. El procedimiento aristotélico se basa en el siguiente principio (cuya formulación no se encuentra en Aristóteles):

Si un modo es válido, entonces no existe ningún argumento silogístico cuya estructura sea la propia del modo y tenga premisas verdaderas y conclusión falsa.

Así, para mostrar que un modo dado no es válido basta con hallar un silogismo que tenga la estructura del modo y que tenga premisas verdaderas y conclusión falsa. Aristóteles examina de modo sistemático todos los pares de premisas de las que no se deriva ninguna conclusión y demuestra mediante ejemplos que el par de premisas en cuestión no puede tener una conclusión ni afirmativa ni negativa.

6. Validez de las leyes y modos silogísticos

En esta sección supondremos que los términos generales se interpretan en un universo dado, y que si T es un término general, entonces la extensión de T, que denotaremos con T es el conjunto de los objetos del universo que tienen la propiedad que expresamos con T.

Si los enunciados categóricos cuantificados se interpretan tal como lo hace la lógica actual de primer orden, sólo se cumplen las leyes de oposición entre contradictorios y las leyes de conversión simple. Para ver por qué, supongamos que S es un término cuya extensién es vacía (esto es, no existen objetos en el universo que sean S) y consideremos la verdad o falsedad de los enunciados categóricos cuantificados cuyo sujeto es S y cuyo predicado es P. De acuerdo con la semántica de la lógica de primer orden, si la extensión de S es vacía, entonces «todo S es P» y «ningún S es P» son verdaderos y, por tanto, sus contradictorios «algún S no es P» y «algún S es P» son falsos. Esta atribución de valores de verdad muestra que en lógica de primer orden no se cumplen ninguna de las siguentes leyes que son características de la lógica tradicional: la de contrariedad (pues Asp y Esp pueden ser ambos verdaderos), la de subcontrariedad (pues Isp y Osp pueden ser ambos falsos), las de subalternación (pues Asp no implica Isp y Esp no implica Osp) y las de conversión per accidens (pues equivalen a las de subalternación). Por supuesto, todos los modos silogísticos cuya validez depende de la de estas leyes resultan ser inválidos desde el punto de vista actual. Concretamente, ni los modos subalternos ni los modos cuya validez depende de las reglas de conversión per accidens (los que llevan la letra «p» en el nombre) son lógicamente válidos de acuerdo con la semántica de la lógica de primer orden.

Si suponemos que ningún término tiene extensión vacía, entonces todas las leyes aristotélicas son válidas y todos los silogismos son lógicamente válidos con la semántica que la lógica de primer orden atribuye a los enunciados categóricos cuantificados. Este es uno de los argumentos (junto a otros de naturaleza filosófica) que se dan en favor de la tesis de que Aristóteles presupone que la extensión de los términos generales es distinta del vacío. Sin embargo, no es necesario hacer esta presuposición existencial para preservar la validez de todas las leyes y modos silogísticos. En efecto, todas las leyes aristotélicas son válidas sin necesidad de suponer que todos los términos tienen extensión no vacía cuando los enunciados categóricos cuantificados se interpretan del siguiente modo («syss» es una abreviatura de «si y sólo si»):

  • «todo S es P» es verdadero syss S es no vacía y está inculida en P,
  • «algún S es P» es verdadero syss existen objetos que pertenecen tanto a S como a P,
  • «no todo S es P» es verdadero syss S es vacía o no está incluida en P,
  • «ningún S es P» es verdadero syss no existen objetos que pertenecen a S y también a P.

 

Fuera ésta o no la semántica implícita en la silogística aristotélica, es, en lo esencial, la que adoptaron la mayoría de lógicos medievales. Una característica importante de ella es que atribuye alcance existencial a los enunciados afirmativos, pero no a los negativos. En otras palabras, para que un enunciado afirmativo (universal o particular) sea verdadero es necesario que la extensión de su sujeto sea no vacía; en cambio, los dos enunciados negativos son verdaderos cuando la extensión del sujeto es vacía. La adopción de esa semántica planteó a los lógicos medievales un dilema relativo a la interpretación de «algún S no es P”: o aceptar que es equivalente a «no todo S es P» con lo cual se le atribuye la semántica propia de un enunciado negativo (esto es, verdadero cuando la extensión de S es vacía) o mantener que se trata de un enunciado afirmativo (esto es, falso cuando la extensión de S es no vacía) y, en consecuencia, rechazar la equivalencia con «no todo S es P”. El filósofo del s. XII Abelardo se inclinó por la segunda opción, pero la mayoría de lógicos medievales consideraron que ambos enunciados eran equivalentes.

7. Conclusión

La enorme distancia que separa la lógica tradicional de la lógica de primer orden actual resulta evidente cuando observamos tres características de la primera. En primer lugar, la silogística medieval no tiene el carácter formal que tienen tanto la lógica actual como la silogística aristotélica. Tal como la presenta Aristóteles, la silogística es una teoría formal, entendiendo por ello que tanto los enunciados categóricos como los modos silogísticos son presentados como esquemas. Concretamente, Aristóteles formula los enunciados categóricos con ayuda de variables para términos generales (tal como los he formulado en la sección 2) y gracias a ello sus presentaciones de las relaciones lógicas entre los enunciados categóricos y de la silogística tienen el máximo nivel de rigor y generalidad. Según B. Mates (1970, p. 253) se trata de la primera vez que se hace un uso claro de variables en la historia de la ciencia. Desafortunadamente, el uso de variables se perdió con posterioridad a Aristóteles. Toda la silogística medieval es presentada con ayuda de enunciados y argumentos concretos que son tomados como modelos perdiendo así el carácter formal que le confiere el uso de variables.

En segundo lugar, en la lógica tradicional todos los enunciados categóricos (incluidos los singulares negativos y los cuantificados) son considerados lógicamente simples. Dicho en términos aristotélicos, los actos lógicos más simples consisten en afirmar o negar una cosa de una cosa y se entiende que esto es precisamente lo que expresan los enunciados categóricos. Desde el punto de vista de la lógica de primer orden, los enunciados categóricos cuantificados son enunciados complejos que se simbolizan con ayuda de conectivas, lo cual dificulta la comprensión del punto de vista tradicional y por este motivo no se recurre a ella en los comentarios o análisis de tipo histórico.

En tercer lugar, la silogística tradicional (cuando no se toman en consideración los silogismos hipotéticos) se limita exclusivamente a los enunciados categóricos y a los argumentos que tienen como premisas enunciados de este tipo. Tanto los enunciados con más de un cuantificador como los enunciados relacionales quedan fuera de la silogística tradicional.

El desarrollo de un sistema lógico limitado a los enunciados categóricos, la consideración de todos ellos como enunciados lógicamente simples, el uso de variables para términos y, finalmente, el sistema deductivo son aportaciones que debemos por completo a Aristóteles. Todo este sistema lógico permaneció vigente sin cambios sustanciales y sin que ningún lógico consiguiera mejorarlo hasta la segunda mitad del s. XIX cuando lógicos como Boole, De Morgan, Frege y Peirce pusieron los cimientos de la lógica actual.

Calixto Badesa
(Universitat de Barcelona)

Referencias

  • Aristóteles (1988), Tratados de Lógica II: Sobre la interpretación, Analíticos primeros, Analíticos segundos, Gredos, Madrid (Introducción, traducción y notas de Miguel Candel).
  • Aristotle (1989), Prior Analytics, Hackett, Indianapolis (Translated, with introduction, notes, and commentary by Robin Smith).
  • Arnauld, A., y Nicole, P. (1987), La lógica o el arte de pensar, Alfaguara, Madrid (Prólogo, traducción y notas de G. Quintás Alonso).
  • Corcoran, J. (1974), Aristotle Natural Deduction System, en J. Corcoran,(ed.) Ancient Logic and its Modern Interpretations, Reidel, Boston, 1974, pp. 85-131.
  • Corcoran, J. (2009), «Aristotle’s Demonstrative Logic», History and Philosophy of Logic, vol. 30, 1-20.
  • Englebretsen, G. (1980), «Singular Terms and the Syllogistic», The New Scholasticism, vol. 54, 68-74.
  • Kneale, W. y Kneale, M. (1972), El desarrollo de la lógica, Madrid, Tecnos, (Traducido por Javier Muguerza de la primera edición de The Developement of Logic, Clarendon Press, Oxford, 1961).
  • Lagerlund, H. (2017), «Medieval Theories of the Syllogism», en E. N. Zalta (ed.), The Stanford Encyclopedia of Philosophy (http://plato.stanford.edu/archives/win2017/entries/medieval-syllogism).
  • Mates, B. (1970), Lógica matemática elemental, Tecnos, Madrid.
  • Parsons, T. (2017), «The Traditional Square of Opposition», en E. N. Zalta (ed.), The Stanford Encyclopedia of Philosophy (http://plato.stanford.edu/archives/sum2017/entries/square).
  • Smiley, T. J. (1973), «What is a Syllogism?», Journal of Philosophical Logic, vol. 2, 136-54.
  • Smith, R. (2018), «Aristotle’s Logic», en E. N. Zalta (ed.), The Stanford Encyclopedia of Philosophy (https://plato.stanford.edu/entries/aristotle-logic)

Entradas relacionadas

Consecuencia lógica

Cómo citar esta entrada

Badesa, Calixto (2021) “Silogística”,  Enciclopedia de la Sociedad Española de Filosofía Analítica (URL: http://www.sefaweb.es/silogistica).

 

Consecuencia lógica

1. Modalidad, formalidad, y la relación de consecuencia lógica

Los lógicos han procedido a menudo bajo el supuesto implícito de que existe una relación natural especial que se da a veces entre las premisas y la conclusión de un argumento, la relación de consecuencia lógica. Las premisas de un argumento forman un conjunto de oraciones ∑ (en el sentido técnico de ‘conjunto’, que incluye al “conjunto” vacío, sin oraciones, y a los “conjuntos” de una sola oración) y la conclusión es una oración O. Los lógicos han pensado a menudo que, cuando la relación de consecuencia lógica es ejemplificada por un argumento ∑/O, debe darse una relación de implicación modal muy estricta entre las oraciones de ∑ y la oración O: en algún sentido especialmente exigente de ‘no podría’, no podría ser el caso que las oraciones de ∑ fueran verdaderas y la oración O falsa. Este es el rasgo de modalidad de la supuesta relación natural de consecuencia lógica. Además, se ha pensado a menudo que cuando se da la relación de consecuencia lógica entre un conjunto de oraciones ∑ y una oración O, la implicación correspondiente debe tener la cualidad de formalidad: si una oración O es consecuencia lógica de un conjunto de oraciones ∑, entonces si ∑’/O’ es un argumento con la misma forma lógica que ∑/O, O ha de ser consecuencia lógica de ∑.

No siempre que hay implicación o consecuencia en un sentido intuitivo hay también una implicación modal apropiadamente estricta. Por ejemplo, del conjunto de oraciones integrado por la única oración ‘Los objetos físicos observados hasta ahora se rigen por las leyes de la mecánica cuántica’ se “sigue” en algún sentido la oración ‘Todos los objetos físicos se rigen por las leyes de la mecánica cuántica’. Pero no es un caso de consecuencia lógica, pues no es excesivamente difícil imaginar un objeto físico posible que no se rija por las leyes de la mecánica cuántica. El tipo de fuerza modal que conecta a ∑ y O cuando hay consecuencia lógica entre ellos es más bien, se ha solido pensar, la fuerza que conecta a ‘Juana es la nuera de Pedro’ con ‘Juana está casada con un hijo de Pedro’: esta última oración no puede ser falsa en ningún sentido sensato si la primera es verdadera. Se ha solido pensar, de manera más general y teórica, que la fuerza modal que conecta a ∑ y O cuando hay consecuencia lógica entre ellos es la de las implicaciones analíticas, y consiguientemente que una consecuencia lógica de un conjunto de oraciones puede extraerse a priori a partir de ellas.

Ahora bien, la implicación entre ‘Juana es la nuera de Pedro’ y ‘Juana está casada con un hijo de Pedro’ ilustra a su vez la idea habitual entre los lógicos de que hay implicaciones modalmente estrictas pero sin la cualidad de formalidad. Según la opinión más común entre los lógicos, el argumento {‘Pepa es la fontanera de Pablo’}/‘Pepa está divorciada de un contable de Pablo’ tiene la misma forma lógica que el argumento {‘Juana es la nuera de Pedro’}/‘Juana está casada con un hijo de Pedro’. Esa forma común vendría dada por algo parecido al esquema ‘{‘a está en la relación R con b’}/ ‘a está en la relación S con una cosa que está en la relación T con b’’. Pero ese último argumento ni siquiera ejemplifica una relación de implicación, menos aún la relación de consecuencia lógica.

Algunos ejemplos de argumentos que se ha pensado que ejemplifican la relación de consecuencia lógica, y que por tanto cuando menos parecen poseer las cualidades de modalidad y de formalidad, son los siguientes:

{‘Si Pedro viene a la fiesta, Juana se irá’, ‘Pedro viene a la fiesta’}/‘Juana se irá’;
{‘Todo hombre es mortal’, ‘Sócrates es hombre’}/‘Sócrates es mortal’;
{‘Todo griego es hombre’, ‘Todo hombre es mortal’}/‘Todo griego es mortal’.

En efecto, en cada uno de estos casos parece evidente que las premisas no podrían ser verdaderas sin que lo fuera la conclusión. Además, lo que normalmente se pensaría que son las formas lógicas de estos argumentos serían esquemas parecidos a los siguientes:

{‘Si a tiene la propiedad P, b tiene la propiedad Q’, ‘a tiene la propiedad P’}/‘b tiene la propiedad Q’;
{‘Toda cosa que tiene la propiedad P tiene la propiedad Q’, ‘a tiene la propiedad P’}/‘a tiene la propiedad Q’;
{‘Toda cosa que tiene la propiedad P tiene la propiedad Q’, ‘Toda cosa que tiene la propiedad Q tiene la propiedad R’}/‘Toda cosa que tiene la propiedad P tiene la propiedad R’.

Y cuando uno inspecciona estos esquemas no puede evitar sentir que cualquier argumento que proceda de ellos rellenando sus letras esquemáticas con palabras apropiadas (con las mismas letras siempre sustituidas por las mismas palabras) será un argumento que ejemplificará una implicación modalmente estricta, y que tendrá automáticamente la cualidad de formalidad.

El frecuente supuesto implícito de los lógicos de que existe una relación natural de consecuencia lógica ha quedado cuestionado, especialmente en tiempos recientes, por las discrepancias en cuanto a cuál ha de ser la modalidad apropiada en el rasgo de modalidad y cuál ha de ser la noción apropiada de forma lógica en el rasgo de formalidad. Algunos lógicos (v.g. Quine, 1970) han negado que la modalidad apropiada pueda ser la de implicación analítica e incluso que pueda ser la de implicación por necesidad metafísica, sugiriendo que debe ser alguna otra modalidad menos estricta correspondiente a una noción relativamente débil de validez (en el sentido de ‘validez’ que veremos más abajo). Otros lógicos se han mostrado escépticos acerca de la existencia de una noción de forma lógica que permita que dos argumentos con elementos léxicos diferentes tengan la misma forma lógica (v.g. Etchemendy, 1990). Otros, a veces con fundamento en esas discrepancias, han propuesto que no hay una sola relación que merezca el nombre ‘consecuencia lógica’; según ellos, es compatible con la comprensión preteórica del concepto de consecuencia lógica que la modalidad en cuestión sea la de implicación analítica, la de implicación por necesidad metafísica, e incluso varias modalidades correspondientes a nociones débiles de validez (v.g. Beall y Restall, 2006); y según otros, la comprensión preteórica del concepto de forma lógica no determina suficientemente que a cualquier argumento dado le corresponde exclusivamente un esquema privilegiado que revela su forma lógica, habiendo varias nociones de forma lógica igualmente aceptables (v.g. Varzi, 2002).

2. Derivabilidad, validez, y la caracterización de la relación de la consecuencia lógica

Sin embargo, todos los lógicos, tanto si cuestionan el supuesto tradicional de que hay una única relación natural de consecuencia lógica con los rasgos de modalidad y formalidad como si no, han buscado clarificar la relación o las relaciones de consecuencia lógica, y lo han hecho usando aproximaciones similares. Esas aproximaciones generalmente incluyen la propuesta de caracterizaciones de la o las relaciones de consecuencia lógica para argumentos de lenguajes formales que buscan modelar fragmentos del lenguaje natural, caracterizaciones que normalmente se dan en términos de conceptos matemáticos. Gran parte de la literatura sobre la filosofía de la consecuencia lógica se ha concentrado en examinar caracterizaciones de la o las relaciones de consecuencia lógica para determinar si o en qué medida capturan las relaciones preteóricas que se busca caracterizar. Hay dos grandes tipos de caracterizaciones: las basadas en nociones de derivabilidad y las basadas en nociones de validez.

Las caracterizaciones basadas en nociones de derivabilidad se asocian especialmente al nombre de Frege, fundador de la lógica moderna a finales del siglo XIX. Frege inventó un lenguaje formal (o una serie de lenguajes), diseñado especialmente para la formalización de argumentos matemáticos, dentro del cual siempre es enteramente claro cuál es la forma lógica de un argumento y si dos argumentos tienen la misma forma lógica o no. El lenguaje que inventó Frege es lo que hoy llamaríamos un lenguaje cuantificacional de orden superior, y contenía como fragmento lo que hoy llamaríamos un lenguaje cuantificacional de primer orden, un lenguaje como los que se presentan hoy en los cursos básicos de lógica. Para ese lenguaje, Frege ofreció un sistema formal como los que se estudian hoy en esos cursos, especificando con gran rigor un conjunto de formas axiomáticas básicas y un conjunto de reglas de inferencia básicas.

Una vez especificados estos elementos del sistema formal, es posible proponer una caracterización muy precisa del conjunto de argumentos del lenguaje formalizado del sistema que ejemplifican la relación deseada de consecuencia lógica, o que son lógicamente correctos: podemos proponer que la relación de consecuencia lógica se da entre un conjunto de premisas {P1, P2, P3, …} y una conclusión C (del lenguaje del sistema) exactamente cuando existe una serie de aplicaciones de las reglas de inferencia que, partiendo de {P1, P2, P3, …} y posiblemente también de oraciones de las formas axiomáticas básicas, acaba en C. Cuando una serie tal existe se dice que C es derivable en el sistema formal a partir de {P1, P2, P3, …}. Y ciertamente, como subrayaremos después, si el sistema formal se construye con esmero, al concluir uno quedará convencido al menos de que todos los argumentos cuya conclusión es derivable de sus premisas (en el sistema) son argumentos lógicamente correctos en el sentido deseado, es decir, uno quedará convencido de que la derivabilidad de la conclusión a partir de las premisas (en el sistema) es una condición suficiente para que un argumento sea un ejemplo de consecuencia lógica. La cuestión de si podemos convencernos de que es también una condición necesaria la trataremos más adelante.

Nuestra comprensión de la relación de derivabilidad en un sistema como el de Frege es sin duda mejor y más clara que nuestra comprensión del concepto de consecuencia lógica. El acercamiento a la noción de consecuencia lógica en términos de la de derivabilidad en ciertos sistemas goza por tanto de un gran atractivo metodológico y explicativo. En gran parte por estos motivos, este acercamiento proporcionó la concepción dominante de la consecuencia lógica entre los lógicos durante largo tiempo después de la obra de Frege. Pero en la lógica ha existido también, ya desde Aristóteles, un tipo de aproximación alternativo, y en cierto modo complementario, a la caracterización de la relación o las relaciones de consecuencia lógica. Este tipo de aproximación se basa plenamente en los dos rasgos intuitivos de la noción de consecuencia lógica. Recordemos que el segundo rasgo consiste en que todo argumento con la misma forma lógica que uno lógicamente correcto es también lógicamente correcto. Como señalamos, esto proporciona una condición necesaria de los argumentos lógicamente correctos, aunque en términos de la noción de consecuencia lógica. Pero también sugiere una condición necesaria en términos de la noción de verdad. Observemos que si un argumento es lógicamente correcto entonces no tiene premisas verdaderas y conclusión falsa; pues si así fuera las premisas no implicarían modalmente a la conclusión (bajo ninguna comprensión plausible de la idea de modalidad) y entonces, por el primer rasgo de la noción de consecuencia lógica, el argumento no sería lógicamente correcto después de todo. Por tanto, por el segundo rasgo de la noción de consecuencia lógica, un argumento es lógicamente correcto sólo si ningún argumento con la misma forma lógica tiene premisas verdaderas y conclusión falsa. Esta es la condición necesaria en términos de la noción de verdad a la que me refería antes; llamémosla ‘(Φ)’.

La aproximación alternativa a la caracterización de la consecuencia lógica usa siempre alguna variante de la condición (Φ), proponiéndola en cada caso como necesaria y suficiente. La caracterización de Tarski es la representante paradigmática de este tipo de aproximación. Tarski (1936) ofreció su caracterización para los lenguajes formales fregeanos, aceptando la noción de forma lógica para argumentos de estos lenguajes implícita en Frege. Sin embargo, el método abstracto de Tarski se puede usar, y se ha usado, para dar caracterizaciones similares incluso para lenguajes que extienden los lenguajes de Frege, o que son simplemente diferentes de ellos.

La propuesta de Tarski consiste en extender el requisito expresado por la condición (Φ) con el objeto de incorporar, al menos parcialmente, la idea de que las letras esquemáticas en la forma lógica de un argumento lógicamente correcto no pueden ser reinterpretadas de tal manera que las premisas se vuelvan verdaderas y la conclusión falsa (y no meramente la idea expresada en (Φ), de que un argumento lógicamente correcto no puede convertirse en uno con premisas verdaderas y conclusión falsa reemplazando las letras esquemáticas de su forma lógica por expresiones en un lenguaje fijado). En otras palabras, Tarski busca incorporar la idea de que una oración O es una consecuencia lógica de un conjunto de oraciones ∑ cuando toda interpretación de las letras esquemáticas en la forma lógica de ∑/O según la cual todas las oraciones de ∑ son verdaderas es una interpretación según la cual O es verdadera. O, como se dice a veces, cuando toda interpretación preserva la verdad de las premisas en la conclusión. Cuando toda interpretación preserva la verdad se dice también que el argumento es válido. Si un argumento es válido, entonces, incluso si no es lógicamente correcto, la conclusión se puede inferir de las premisas sin miedo de que sea falsa si las premisas son verdaderas. De manera que todos los argumentos válidos son correctos al menos en este sentido.

Tarski propuso una versión matemáticamente manejable de la noción de validez usando el aparato desarrollado por él para dar definiciones matemáticas de conceptos “semánticos”, como los de satisfacción, definibilidad y verdad. El método de Tarski se basa en definir, de una manera análoga a la manera como él mismo define verdad para un lenguaje en Tarski (1935), la noción de verdad en una estructura conjuntista. Para una oración de un lenguaje fregeano, una estructura es un objeto conjuntista que incluye una asignación de denotaciones a las letras esquemáticas de su forma lógica, además de un conjunto de objetos del que se extraen esas denotaciones y que proporciona el rango o recorrido de las variables de primer orden e induce recorridos para las variables de órdenes superiores. Por ejemplo, un ejemplo de estructura para el lenguaje que consta de las letras ‘a’, ‘P’ y ‘Q’ es el objeto conjuntista <{Aristóteles, Frege, Tarski}, ‘a’→Frege, ‘P’→{Aristóteles, Frege}, ‘Q’→{Tarski}>; en esta estructura, el conjunto {Aristóteles, Frege, Tarski} es el recorrido de las variables, Frege es la denotación de ‘a’, el conjunto {Aristóteles, Frege} es la denotación de ‘P’, y el conjunto {Tarski} es la denotación de ‘Q’.

La condición por medio de la cual se caracteriza la consecuencia lógica para el lenguaje relevante es entonces la siguiente:

(VT) Toda estructura en la que todas las oraciones del conjunto ∑ son verdaderas es también una estructura en la que la oración O es verdadera. (Abreviemos esta condición por medio de la notación ‘ValT(∑,O)’.)

‘VT’ significa “validez tarskiana”. El subíndice ‘T’ se usa para subrayar que ‘ValT(∑,O)’ denota la validez tarskiana y que esta es posiblemente diferente de otras nociones de validez, basadas en otras nociones de interpretación. Tal como uso aquí la noción de interpretación que aparece en la caracterización de la validez, esta es una noción imprecisa e intuitiva, mientras que la noción de estructura que aparece en una caracterización de la validez tarskiana es una noción técnica bastante precisa. A todo lenguaje formal fregeano se le puede proporcionar una condición de validez tarskiana usando el método de Tarski. Lo mismo es verdad de muchos lenguajes diferentes de los fregeanos, y para los cuales se han dado nociones razonables de estructura. (Un ejemplo estándar lo proporcionan los lenguajes de las lógicas modales; véase, v.g., Hughes y Cresswell, 1996.) Cuando una noción de estructura es razonable, está claro que toda estructura modela la capacidad de una o varias interpretaciones de hacer verdaderas las premisas y falsa la conclusión de algún argumento.

3. Las relaciones entre derivabilidad y validez

3.1. Corrección y compleción

Como señalamos antes, si uno construye un sistema formal con cuidado, uno podrá convencerse de que todos los argumentos cuya conclusión es derivable de sus premisas son argumentos lógicamente correctos en el sentido deseado. La razón de esto es que uno puede usar su intuición de un modo muy sistemático para obtener ese convencimiento: uno puede incluir en su sistema axiomas que le parezcan a uno consecuencias lógicas de cualquier conjunto de premisas; y uno puede incluir como reglas de derivación de su sistema reglas que le parezca a uno que producen oraciones que se siguen lógicamente de las oraciones a las que se aplican. Entonces, dada la definición de derivabilidad para el sistema formal que vimos más arriba, es inmediatamente claro para uno que no se podrá derivar de un conjunto de oraciones ninguna oración que no se siga lógicamente de ese conjunto de oraciones. Empleando otra terminología, que se explica a sí misma, podemos decir que si uno construye su sistema formal con cuidado, la caracterización correspondiente en términos de derivabilidad (en ese sistema) es correcta con respecto a la noción deseada de consecuencia lógica—o, simplemente, que la derivabilidad es correcta con respecto a la consecuencia lógica.

De igual modo, es intuitivamente obvio que si uno tiene a mano una noción tarskiana de validez para un lenguaje dado, entonces todos los argumentos lógicamente correctos (del lenguaje) serán argumentos válidos en el sentido tarskiano. La razón es simple: si un argumento no es válido en el sentido tarskiano entonces hay una estructura, y por tanto una interpretación, que hace verdaderas sus premisas y falsa su conclusión. Por tanto sería en principio posible construir un argumento de la misma forma lógica, cuyos términos tendrían denotaciones lógicamente posibles, y que tendría premisas verdaderas y conclusión falsa. Pero el segundo rasgo intuitivo de la noción de consecuencia lógica implica que si el argumento original era lógicamente correcto entonces no hay ningún argumento de la misma forma lógica con premisas verdaderas y conclusión falsa. Habiendo concluido que todos los argumentos lógicamente correctos son válidos en el sentido tarskiano, podemos decir, empleando otra terminología, que la caracterización en términos de validez tarskiana es completa con respecto a la noción de consecuencia lógica—o, simplemente, que la validez tarskiana es completa con respecto a la consecuencia lógica.

Usemos las siguientes dos abreviaturas: ‘DerS(∑,O)’ para ‘O es derivable de ∑ en el sistema formal S’, y  ‘CL(∑,O)’ para ‘O es consecuencia lógica (en el sentido preteórico en juego) de ∑’. Entonces, si S es un sistema formal construido con cuidado, la situación a la que hemos llegado se resume en el siguiente diagrama:

(1)  DerS(∑,O)  ⇒  CL(∑,O)  ⇒  ValT(∑,O).

La primera implicación es la corrección de la derivabilidad con respecto a la consecuencia lógica; la segunda implicación es la compleción de la validez tarskiana con respecto a la consecuencia lógica. Ahora bien, para convencernos de que las caracterizaciones de la consecuencia lógica en términos de DerS(∑,O) y ValT(∑,O) son apropiadas tendríamos que convencernos también de las implicaciones conversas:

(2)  ValT(∑,O)  ⇒?  CL(∑,O)  ⇒?  DerS(∑,O),

o sea de que la validez tarskiana es correcta con respecto a la consecuencia lógica, y de que la derivabilidad es completa con respecto a la consecuencia lógica. Convencerse de que esto es el caso, o de que no es el caso, resulta ser una tarea difícil (quizá sorprendentemente difícil) para un buen número de lenguajes. Hay sin embargo una manera de convencerse en algunos casos de que las implicaciones con interrogante se dan de hecho. Esa manera de convencerse se basa en una observación sencilla pero profunda de Kreisel (1967).

3.2. La observación de Kreisel

Hay una cantidad considerable de lenguajes formales para los que existen nociones de validez tarskiana y de derivabilidad en un sistema S. Entre estos, hay un buen número para los que la validez tarskiana es intuitivamente completa y la derivabilidad correcta con respecto a la noción deseada de consecuencia lógica. En estos últimos casos se dan las implicaciones de (1). Y a su vez, entre estos últimos lenguajes, hay muchos para los que es posible dar una demostración matemática de que la derivabilidad es completa con respecto a la validez tarskiana, o sea una demostración de esta otra implicación:

(3)  ValT(∑,O)  ⇒  DerS(∑,O).

Kreisel llamó la atención sobre el hecho de que (3) (junto con (1)) implica que la validez tarskiana es correcta con respecto a la consecuencia lógica, o sea que se da la primera implicación de (2). Esto quiere decir que cuando se da (3) la noción de validez tarskiana ofrece una caracterización apropiada de la de consecuencia lógica. Puede añadirse a lo subrayado por Kreisel que (3) (junto con (1)) implica que la derivabilidad en S es completa con respecto a la consecuencia lógica, o sea que se da la segunda implicación de (2). Esto quiere decir que cuando se da (3) la noción de derivabilidad en un cierto sistema ofrece también una caracterización apropiada de la noción deseada de consecuencia lógica.

Un caso especialmente significativo en el que, bajo ciertos supuestos razonables acerca de la idea preteórica de consecuencia lógica, se da la implicación (3) (para ciertos sistemas formales S) y las implicaciones (1), y por tanto se dan las implicaciones (2), es el de los lenguajes cuantificacionales de primer orden. Eso quiere decir que uno puede convencerse de que tanto la noción de derivabilidad como la de validez tarskiana (definidas de un modo apropiado para esos lenguajes) son caracterizaciones apropiadas de una cierta noción preteórica razonable de consecuencia lógica para los lenguajes de primer orden.

3.3. Incompleción

La situación no es tan clara en otros lenguajes especialmente significativos para la tradición lógica: los cuantificacionales de órdenes superiores a 1. Es posible demostrar que ya para un lenguaje de segundo orden no hay un sistema formal S que haga verdadero (3) cuando la derivabilidad en S es correcta con respecto a la validez tarskiana—para la noción de validez tarskiana como se define usualmente para un lenguaje tal. Podemos llamar a este resultado la incompleción de los sistemas formales de segundo orden con respecto a la validez tarskiana. De hecho vale un resultado más fuerte: no hay un conjunto de oraciones de segundo orden para el cual un sistema formal correcto con respecto a la validez tarskiana permita la derivación de todas las consecuencias tarskianas del conjunto; dicho de otra manera: para todo conjunto de oraciones ∏ y todo sistema formal S correcto con respecto a la validez tarskiana hay una oración O tal que ValT(∏,O) pero no es el caso que DerS(∏,O). Podemos llamar a este resultado la incompleción fuerte de los sistemas formales de segundo orden con respecto a la validez tarskiana.

En esta situación no es posible aplicar el argumento de Kreisel para concluir (2). De hecho, la incompleción de los sistemas formales de segundo orden muestra que, dado cualquier sistema formal S que satisfaga (1), una de las implicaciones de (2) es falsa (o ambas lo son): o la derivabilidad en S es incompleta con respecto a la consecuencia lógica o la validez tarskiana es incorrecta con respecto a la consecuencia lógica. Una conclusión similar vale para la incompleción de los sistemas formales para lenguajes clásicos de órdenes superiores y para otros lenguajes que incluyan a estos. Diferentes autores han extraído moralejas diferentes de la incompleción. Una reacción común (v.g. la de Etchemendy (1990)) es pensar que la validez tarskiana debe ser incorrecta con respecto a cualquier noción razonable de consecuencia lógica, pero en general no hay argumentos plenamente satisfactorios en defensa de esta tesis o de la tesis alternativa (defendida, v.g., por Tarski) de que la derivabilidad (en cualquier sistema correcto para la validez tarskiana) es incompleta con respecto a una noción razonable de consecuencia lógica. (Sobre esta cuestión puede verse Gómez Torrente (1998/9).

Mario Gómez Torrente
(Instituto de Investigaciones Filosóficas, UNAM)

Referencias

  • Beall, J.C. y G. Restall (2006): Logical Pluralism, Clarendon Press, Oxford.
  • Etchemendy, J. (1990): The Concept of Logical Consequence, Cambridge Mass., Harvard University Press,
  • Gómez Torrente, M. (1998/9): “Logical Truth and Tarskian Logical Truth”, Synthèse, 117, pp. 375-408.
  • Hughes, G. E. y M. J. Cresswell (1996): A New Introduction to Modal Logic, Routledge, Londres.
  • Kreisel, G. (1967): “Informal Rigour and Completeness Proofs”, en I. Lakatos, comp., Problems in the Philosophy of Mathematics, North-Holland, Ámsterdam, pp.138-171.
  • Quine, W. V. (1970): Philosophy of Logic, Prentice-Hall, Englewood Cliffs, N.J.
  • Tarski, A. (1935): “The Concept of Truth in Formalized Languages”, en Tarski, A. (1983): Logic, Semantics, Metamathematics, 2ª ed., Hackett, Indianápolis, pp. 152-278.
  • Tarski, A. (1936): “On the Concept of Logical Consequence”, en Tarski (1983), pp. 409-420. [Tarski, A. (1984): “Sobre el concepto de consecuencia lógica”, trad. por L. Vega Reñón, en Vega Reñón L. y P. Castrillo, comps., Lecturas de Lógica II, UNED, Madrid,pp. 178-192.
  • Tarski, A. (1983): Logic, Semantics, Metamathematics, 2a ed., Hackett, Indianápolis.
  • Varzi, A. (2002): “On Logical Relativity”, Philosophical Issues, 12, pp. 197-219.

Lecturas recomendadas en castellano

  • Badesa, C., I. Jané y R. Jansana (1998): Elementos de lógica formal, Ariel, Barcelona.
  • Frápolli, M. J., coord., (2007): Filosofía de la lógica, Tecnos, Madrid.
  • Gómez Torrente, M. (2000): Forma y modalidad. Una introducción al concepto de consecuencia lógica, Buenos Aires, Eudeba.
  • Haack, S. (2001): Filosofía de las lógicas, Cátedra, Madrid.
  • Kneale, W. y M. Kneale (1972): El desarrollo de la lógica, Tecnos, Madrid.
  • Manzano, M. (1996): Extensions of First-Order Logic, Cambridge, Cambridge University Press.
  • Sagüillo, J. M. (2007): “Validez y consecuencia lógica. La concepción clásica”, en Frápolli, M. J., (2007): Filosofía de la Lógica, Tecnos, Madrid, pp.55-81.
  • Sainsbury, M. (2001): Logical Forms: An Introduction to Philosophical Logic, 2a ed., Blackwell, Oxford.

Entradas relacionadas

Pluralismo lógico

Silogística

Cómo citar esta entrada

Gómez-Torrente, Mario (2018) «Consecuencia lógica»,  Enciclopedia de la Sociedad Española de Filosofía Analítica (URL:http://www.sefaweb.es/consecuencia-logica).