L’analyse mathématique de la logique
Introduction
Ceux1 qui sont au courant de l’état présent de la théorie de l’algèbre symbolique savent que la validité des démarches de l’analyse ne dépend pas de l’interprétation des symboles utilisés mais seulement des lois de leur combinaison. Tout système d’interprétation qui n’affecte pas la vérité des relations posées comme principes est également acceptable. C’est ainsi que le même procédé peut, selon tel schéma interprétatif, représenter la solution d’un problème portant sur les propriétés des nombres, selon un autre, celle d’un problème géométrique, selon un troisième, celle d’un problème de dynamique ou d’optique. Ce principe est évidemment d’une importance fondamentale, et l’on peut affirmer sans risque que les développements récents de l’analyse pure ont été beaucoup favorisés par l’influence qu’il a exercée en orientant le courant de la recherche.
Mais la pleine reconnaissance des conséquences de cette importante théorie a été, dans une certaine mesure, retardée par des circonstances accidentelles. En chaque forme connue de l’analyse, il s’est trouvé que les éléments à déterminer ont été conçus comme mesurables par rapport à une unité fixe. L’idée prédominante était celle de grandeur ou, plus précisément, de proportion numérique. L’expression de la grandeur ou d’opérations sur la grandeur a été l’objet exprès pour lequel les symboles de l’analyse ont été inventés et pour lequel leurs lois ont été recherchées. Ainsi les abstractions de l’analyse moderne non moins que les schémas ostensifs de la géométrie antique, ont renforcé l’idée que les mathématiques sont, aussi bien en leur essence que de fait, la science de la grandeur.
La prise en considération de ce que nous avons déjà affirmé comme le véritable principe de l’algèbre symbolique devrait, d’une manière ou d’une autre, nous amener à penser que cette conclusion n’est en rien nécessaire. Si toutes les interprétations existantes s’avèrent envelopper l’idée de grandeur, ce n’est que sur la base d’une induction que nous pouvons affirmer qu’il n’y a pas d’autre interprétation possible. Aussi bien peut-on douter que notre expérience soit assez vaste pour la légitimer. L’histoire de l’analyse pure est, on peut le dire, trop récente pour nous permettre de délimiter le domaine de ses applications. Nous serait-il possible de nous fier, avec un haut degré de probabilité, à cette inférence que [28] nous pourrions encore, et avec raison, maintenir que la définition, à laquelle le principe déjà établi peut nous conduire, est suffisante. Nous pourrions avec rigueur établir le caractère définitif d’un véritable calcul en disant qu’il est une méthode reposant sur l’emploi de symboles dont les lois de combinaison sont connues dans leur généralité et dont les résultats admettent une interprétation consistante. Que l’on donne des formes existantes de l’analyse une interprétation quantitative n’est que le résultat des circonstances dans lesquelles elles furent établies et ne doit pas être érigé en condition universelle de l’analyse. C’est sur le fondement de ce principe général que je me propose d’établir le calcul logique et que je lui réclame une place parmi les formes reconnues de l’analyse mathématique, sans égard au fait qu’en son objet comme en ses instruments il doive actuellement demeurer en dehors d’elle.
Ce qui rend la logique possible, c’est l’existence en nos esprits de notions générales, notre faculté de concevoir une classe et de désigner les individus qui en sont membres par un même nom. La théorie de la logique est ainsi intimement liée à celle du langage. Une entreprise qui réussirait à exprimer des propositions logiques par des symboles, dont les lois de combinaison seraient fondées sur les lois des opérations mentales qu’elles représentent, serait, du même coup, un pas vers un langage philosophique. Mais c’est là une vue que nous n’avons pas ici à pousser plus avant dans le détail. [Note en bas de page omise.] Supposons le concept d’une classe: nous sommes à même, à partir de n’importe quelle collection concevable d’objets, de séparer mentalement ceux qui lui appartiennent et de les envisager à part de tout le reste. Nous pouvons concevoir la répétition d’un tel choix ou d’un acte similaire. Le groupe des individus qui reste ainsi soumis à notre considération peut, à son tour, être limité si nous distinguons mentalement ceux d’entre eux qui appartiennent à la fois à une autre classe reconnue et à la première classe considérée. Cette opération peut être répétée avec d’autres éléments de distinction jusqu’à ce que nous parvenions à un individu possédant tous les caractères distinctifs pris en considération, individu qui appartient en même temps à toutes les classes que nous avons énumérées. C’est en fait une semblable méthode que nous employons dans le langage commun toutes les fois que nous accumulons les épithètes descriptives pour obtenir une définition précise.
Or les différentes opérations que nous avons supposées réalisées dans ce cas sont justiciables de lois particulières. On peut déterminer des relations entre elles, que ce soit en ce qui concerne la répétition d’une opération, la succession d’opérations différentes ou le fait que certaines ne soient jamais enfreintes. Il est, par exemple, vrai que le résultat de deux opérations successives n’est pas affecté par l’ordre d’effectuation. On verra aussi en lieu propre deux autres lois. A certains peut-être ces lois paraîtront si évidentes qu’on doit les ranger parmi les vérités nécessaires - et si peu importantes qu’elles ne méritent pas une mention particulière. De fait, elles trouvent peut-être leur première mention en cet Essai. On peut toutefois assurer, sans risque d’erreur, que si elles étaient autres qu’elles ne sont, le mécanisme entier du raisonnement, que dis-je, les lois et la constitution même de l’esprit humain en serait radicalement modifiées. Il pourrait certes y avoir une logique; ce ne serait plus celle que nous possédons.
Telles sont les lois élémentaires, sur l’existence et sur la possibilité d’expression symbolique exacte desquelles est fondée la méthode de l’Essai qui suit. Et nous présumons que l’on estimera très parfaitement atteint l’objet qu’il se propose. Toute proposition logique, catégorique ou hypothétique, peut être exprimée exactement et rigoureusement, on le montrera. Non seulement on en peut déduire [29] les lois de la conversion et du syllogisme mais aussi la résolution des systèmes de propositions les plus complexes, l’expression de la valeur de n’importe quel élément séparé dans les termes des éléments restants, avec toutes les relations connexes qui sont impliquées. Chaque opération représentera une déduction, chaque conséquence mathématique une inférence logique. La généralité de cette méthode nous permettra même d’exprimer des opérations arbitraires de l’esprit et conduira ainsi à la démonstration en logique de théorèmes généraux analogues à beaucoup d’égards à ceux des mathématiques habituelles. Une grande part du plaisir que nous trouvons dans l’application de l’analyse à l’interprétation de la nature extérieure naît des idées qu’elle nous permet de concevoir sur l’universalité du règne de la loi. Les formules générales auxquelles nous sommes conduits semblent lui conférer une présence visible et la multiplicité des cas particuliers auxquels elles s’appliquent démontre l’étendue de son domaine. Même la symétrie de leur expression analytique peut, sans interprétation chimérique, être jugée indicative de son harmonie et de son unité. Pour le présent, je ne m’aventure pas à dire jusqu’à quel point les mêmes sources de plaisir sont dévoilées dans l’Essai qui suit. La mesure de ce domaine peut être laissée à l’estimation de ceux qui trouveront le sujet digne de leur étude. Mais je puis m’avancer jusqu’à dire que de telles occasions de satisfaction intellectuelle ne manquent pas ici. Les lois que nous avons à examiner sont celles d’une des plus importantes de nos facultés intellectuelles. Les mathématiques qu’il nous faut construire sont celles de l’esprit humain. La forme et le caractère de cette méthode, quant à eux, en dehors de toute préoccupation d’interprétation ne sont pas sans mériter l’attention. Il y a même, en ses théorèmes généraux, un remarquable exemple de cette sorte d’excellence qu’est l’absence d’exceptions. Bien plus, on peut l’observer là où, dans les cas correspondants des mathématiques habituelles, ce n’est en rien apparent. Ceux qui, en petit nombre, pensent qu’il y a dans l’analyse de quoi la rendre digne d’intérêt en elle-même, peuvent trouver intéressant de l’étudier sous une forme où toute équation peut être résolue et toute solution interprétée. On ne diminuera pas non plus l’intérêt de cette étude à réfléchir au fait que chaque particularité qui se présente dans le calcul représente un trait correspondant dans la même constitution de l’esprit lui-même.
Il serait prématuré de parler de la valeur que cette méthode peut avoir comme instrument de recherche dans la science. Je pense ici à la théorie du raisonnement et au principe d’une vraie classification des formes et des cas de la logique considérée comme une science. [Note en bas de page omise.] Le propos de ces recherches était primitivement restreint à l’expression de la logique traditionnelle et à la présentation qu’en a donnée Aristote; mais il apparut bientôt que l’on introduisait ainsi des restrictions purement arbitraires et non fondées dans la nature des choses. On les a notées au fur et à mesure et on en discutera en lieu propre. Quand il devint nécessaire de considérer le problème des propositions hypothétiques (sur lesquelles, comparativement, moins de travail a été réalisé) et plus encore quand fut nécessaire une interprétation des théorèmes généraux de calcul, il s’avéra impératif d’abandonner tout souci de précédence et d’autorité et d’interroger la méthode elle-même pour exprimer les justes limites de son application. Là encore toutefois on ne chercha pas, à toute force, à obtenir des résultats inédits. Mais parmi ceux qui, lors de leur découverte, parurent tels, il peut être bon de remarquer les suivants.
Conformément à la méthode de cet Essai, une proposition logique peut être exprimée par une équation dont la forme détermine les règles de conversion et [30] de transformation auxquelles la proposition est soumise. Ainsi la loi de ce que les logiciens appellent conversion simple est déterminée par le fait que les équations correspondantes sont symétriques, ne sont pas affectées par un changement mutuel de place des symboles qui correspondent aux classes convertibles. On détermina ainsi les lois traditionnelles de la conversion, puis un autre système, qu’on estime plus élémentaire et plus général. Voir le chapitre: ‘De la conversion des propositions’.
Les prémisses d’un syllogisme étant exprimées par des équations, l’élimination d’un symbole commun conduit à une troisième équation qui exprime la conclusion, cette conclusion étant toujours la plus générale, qu’elle soit aristotélicienne ou non. Parmi les cas où aucune inférence n’est possible, on découvrit qu’il y avait deux formes distinctes de l’équation finale. Cette découverte précéda de beaucoup l’explication. On vit à la longue que tout dépendait de la présence ou de l’absence d’un véritable intermédiaire de comparaison entre les prémisses. Cette distinction que l’on estime nouvelle est mise en évidence dans le chapitre: ‘Des syllogismes.’
Le caractère non exclusif de la conclusion disjonctive d’un syllogisme hypothétique est très clairement mis en relief dans les exemples donnés de cette sorte d’argument.
L’ensemble des problèmes logiques traités dans le chapitre: ‘De la solution des équations de choix’ apparaît comme neuf et l’on estime que la méthode de ce chapitre donne les moyens d’une analyse exhaustive de n’importe quel système de proposition, but dont les règles de conversion d’une seule proposition catégorique ne sont qu’une première approche.
De toute manière, quant à l’originalité globale ou partielle de ces vues, je n’ignore pas que j’ai une connaissance trop peu étendue de la littérature consacrée à la logique et particulièrement de l’ancienne pour me permettre de trancher avec assurance.
Il n’est peut-être pas déplacé, avant de conclure, de présenter quelques remarques sur la question générale de l’usage du langage symbolique en mathématiques. On a élevé, récemment, avec beaucoup de force, des objections à l’encontre de cette pratique, en prétendant qu’en se déchargeant de l’obligation de penser et en substituant à l’effort personnel un renvoi à des formules générales, on tend à affaiblir les facultés de raisonnement.
En fait, le problème de l’usage des symboles peut être considéré sous deux points de vue distincts. Par rapport au progrès de la découverte scientifique d’une part, à sa portée sur la discipline de l’esprit d’autre part.
En ce qui concerne le premier point de vue, on peut observer que tel usage est le résultat d’un travail élaboré, qu’il nous libère pour des tâches plus difficiles. C’est un résultat inévitable d’un état avancé de la science que nous ayons liberté, voire obligation de passer à des problèmes plus élevés que ceux dont nous nous préoccupons d’abord. La conséquence pratique est évidente. Si, en usant de la force des méthodes scientifiques, nous trouvons que les recherches où nous étions d’abord engagés ne procurent plus un champ assez vaste à l’effort intellectuel, le remède est de passer à de plus hautes recherches et par des voies nouvelles de porter l’effort sur des difficultés encore non maîtrisées. Tel est évidemment l’impératif présent du progrès scientifique. Nous devons être heureux d’avoir à choisir entre l’abandon de l’espoir de conquêtes ultérieures et l’emploi d’adjuvants comme le langage symbolique, appropriés au moment de la progression où nous sommes arrivés. Nous n’avons pas à craindre de nous confier à un tel chemin. [31] Nous ne sommes pas encore arrivés si près des frontières du savoir possible pour appréhender que l’espace vienne à manquer pour l’exercice des facultés inventives.
Pour discuter la seconde question, à peine moins importante, de l’influence de l’usage de symboles sur la discipline de l’esprit, il faudrait faire une importante distinction. Il est de la plus extrême importance de savoir si ces symboles sont utilisés en pleine connaissance de leur signification, avec une pleine compréhension de ce qui rend leur utilisation légitime et favorable à l’extension des formules de raisonnement ainsi obtenues jusqu’à leur plein développement syllogistique; ou bien si elles ne sont que des lettres sans signification, dont l’usage n’est admis que par autorité.
La réponse à donner à la question posée doit différer selon que l’une ou autre de ces suppositions est admise. Dans le premier cas on fournit ainsi à la raison une discipline intellectuelle d’un ordre élevé, un exercice non seulement de la raison mais de la faculté de généralisation. Dans l’autre il n’y a aucune discipline mentale d’aucune sorte. Ce serait, peut-être, la meilleure assurance contre les dangers d’une confiance irraisonnée dans les symboles et aussi bien contre un oubli de leurs justes prétentions, que chaque sujet de mathématiques appliquées dût être traité dans l’esprit des méthodes connues au moment où l’application fut faite et aussi dans la forme la plus achevée de ces méthodes. L’ordre d’acquisition par l’individu aurait ainsi quelque relation à l’ordre réel de la découverte scientifique et les méthodes les plus abstraites de l’analyse la plus élaborée seraient offertes aux seuls esprits, qui seraient préparés à les recevoir.
La relation directe qu’entretient cet Essai à la fois avec la logique et les mathématiques peut en outre justifier la mention de la question, qui a été récemment ravivée, de la valeur relative de ces deux disciplines dans une bonne éducation. Une des objections principales élevée contre l’étude des mathématiques en général n’est qu’une autre forme de celle qui a été, plus particulièrement, envisagée à propos de l’usage des symboles. Aussi n’y a-t-il pas à en traiter plus que pour noter que, si elle a la moindre valeur, elle vaut tout autant contre l’étude de la logique. Les formes canoniques du syllogisme aristotélicien sont, en fait, de nature symbolique; seulement les symboles en sont moins parfaits en leur genre que ceux des mathématiques. Si l’on en use pour éprouver un argument, elles prennent tout autant la place de l’exercice de la raison que le renvoi à une formule de l’analyse. Que les hommes, aujourd’hui, utilisent ces canons aristotéliciens hormis comme illustration toute désignée des règles de la logique, on en peut douter. On ne peut toutefois mettre en doute que, à l’époque où l’autorité d’Aristote dominait en Europe les écoles, de telles applications étaient courantes. Aussi bien notre argumentation demande-t-elle seulement que l’on admette une telle possibilité. [Fin de l’introduction omise.]
1.Premiers principes
Nous utiliserons le symbole 1 ou unité pour représenter la classe universelle. Nous l’entendons comme enveloppant toute classe concevable d’objets, qu’elle ait une existence actuelle ou non, en posant comme principe que le même individu peut se retrouver en plus d’une classe, tout de même qu’il peut avoir en commun plus d’une qualité avec d’autres. Nous emploierons les lettres X, Y, Z, pour représenter les individus appartenant à la classe; X s’appliquant à chaque individu d’une [32] classe en tant qu’il appartient à cette classe, Y à chaque individu d’une autre classe en tant qu’il lui appartient et ainsi de suite, selon le langage habituel des traités de logique.
Concevons ensuite une classe de symboles x, yz, ayant le caractère suivant: le symbole x opérant sur un domaine donné comprenant des individus ou des classes sera supposé distinguer dans ce domaine tous les X qu’il contient. De la même manière, le symbole y opérant sur un domaine sera supposé distinguer en lui tous les individus de la classe Y qui y sont contenus, et ainsi de suite.
Quand aucun domaine n’est explicitement posé, nous supposerons que 1 (la classe universelle) est le domaine entendu, de telle sorte que nous aurons:
x = x (1),
chaque terme signifiant que l’on choisit dans la classe universelle tous les X qu’elle contient; le résultat de l’opération sera, dans le langage courant, la classe X, c’est-à-dire la classe dont chaque membre est un X.
De ces principes, il s’ensuit que le produit x . y représentera à son tour la sélection de la classe Y et la sélection dans cette classe Y de tous les individus de la classe X qui y sont contenus, le résultat étant la classe dont les membres sont à la fois des X et des Y. De la même manière, le produit xyz représentera une opération composée dont les éléments successifs sont la sélection de la classe Z, celle en elle des individus de la classe Y qui lui appartiennent, et la sélection, dans le résultat ainsi obtenu, de tous les individus de la classe X qu’il contient; le résultat final étant la classe commune à X, Y, Z.
D’après la nature de l’opération que les symboles x, yz, sont conçus représenter, nous les appellerons symboles de choix. Une expression où ils sont impliqués sera appelée une fonction de choix, et une équation dont les membres seront des fonctions de choix sera appelée une équation de choix.
Il ne sera pas nécessaire d’entrer ici dans l’analyse de l’opération mentale que nous avons représentée par le symbole de choix. D’après l’acception commune du terme, ce n’est pas un acte d’abstraction, parce que nous ne perdons jamais de vue le concret, mais on peut probablement la rattacher à un exercice des facultés de comparaison et d’attention. Notre souci présent est plutôt celui des lois de combinaison et de succession, qui gouvernent ses résultats, et parmi elles, il suffira de noter les suivantes:
I° le résultat d’un acte de choix est indépendant du groupement et de la classification qu’on fait du domaine.
Ainsi, il est indifférent que d’un groupe d’objets considéré comme un tout nous sélectionnions la classe X ou que nous divisions ce groupe en deux parties, sélectionnions en elles séparément les X, puis groupions les résultats en un résultat d’ensemble.
Nous pouvons exprimer cette loi mathématiquement par l’équation:
x (u +v) = xu + xv,
u + v représentant le domaine non divisé et uet v les parties composantes.
2° l’ordre d’effectuation de deux actes de choix successifs est indifférent. Que nous sélectionnions dans la classe des animaux les moutons, puis parmi les moutons ceux qui ont des cornes, ou de la classe des animaux ceux qui ont des cornes, puis, parmi eux, ceux qui sont des moutons, le résultat ne change pas: dans les deux cas, nous arrivons à la classe des moutons à cornes.
L’expression symbolique de cette loi est:
xy = yx,
[33]3° le résultat d’un acte de choix donné effectué deux fois (ou n’importe quel autre nombre de fois à la suite) est le résultat du même acte effectué une seule fois.
Si d’un groupe d’objets nous sélectionnons les X, nous obtenons une classe dont tous les membres sont des X. Si nous répétons l’opération sur cette classe, il ne s’ensuivra aucun autre changement: en sélectionnant les X, nous prenons la totalité d’entre eux.
Ainsi nous avons:
xx = x
ou:
x2 = x
et en supposant la même opération effectuée n fois, nous avons
xn = x
qui est l’expression mathématique de la loi énoncée ci-dessus.2
Les lois que nous avons établies sous forme symbolique:
(1) x(u + v) = xu + xv
(2) xy = yx
(3) xn = x
sont suffisantes comme base du calcul. D’après la première d’entre elles, il apparaît que les symboles de choix sont distributifs; d’après la seconde, qu’ils sont commutatifs; propriétés qu’ils possèdent en commun avec les symboles de la quantité et en vertu desquelles toutes les opérations de l’algèbre ordinaire sont applicables au présent système. Un seul axiome est enveloppé dans cette application, et il est suffisant, à savoir, que les opérations équivalentes effectuées sur des domaines équivalents produisent des résultats équivalents.3
La troisième loi (3), nous l’appellerons loi de fabulation. Elle est propre à ces symboles de choix, et s’avérera de grande importance en ce qu’elle nous permet de réduire nos résultats à des formes susceptibles d’interprétation.
De ce que les opérations de l’algèbre peuvent être appliquées au présent système, on ne doit pas inférer que l’interprétation d’une équation de choix restera non affectée par de telles opérations. L’expression d’une vérité ne peut être détruite par une opération légitime, elle en peut être restreinte. L’équation y = z implique que les classes Y et Z sont équivalentes terme à terme. Multiplions-la par un facteur x et nous avons
xy = xz
qui exprime que les individus communs aux classes X et Y sont aussi communs à X et Z, et vice-versa. L’inférence est parfaitement légitime, mais ce qu’elle affirme est moins général que ce qui était affirmé dans la proposition d’origine.
Notes
1. The Mathematical Analysis of Logic by George Boole, Cambridge, Macmillan, 1847. Nous reprenons une partie de l’introduction (p. 3-11) et le 1er chapitre in extenso. Traduction de Y. Michaud. ↵
2. La fonction du symbole de choix x est de sélectionner les individus compris dans la classe X. Si nous supposons la classe X embrasser l’univers, alors, quelle que soit la classe Y, nous avons
xy = y.
La fonction que x remplit est alors équivalente au symbole +, dans une au moins de ses interprétations, et la loi de tabulation (3) donne
+n = +
qui est la propriété connue de ce symbole. ↵
3. Ceux qui écrivent sur la logique affirment en général que tout raisonnement repose finalement sur le dictum aristotélicien de omni et nullo: “Tout ce qui est affirmé universellement d’une classe quelconque de choses peut être dit aussi bien de n’importe quel élément de cette classe.” Mais on s’accorde à reconnaltre que ce dictum n’est pas immédiatement applicable dans tous les cas, et que le plus souvent une certaine opération préalable de réduction est nécessaire. Quels sont les éléments enveloppés dans cette démarche de réduction? De toute évidence, ils font tout autant partie de l’acte général de raisonner que le dictum lui-même.
Une autre façon de considérer le problème réduit tout raisonnement à l’application de l’un ou l’autre des canons suivants:
1) si deux termes s’accordent avec un même troisième, ils s’accordent entre eux;
2) si un terme s’accorde et un autre non, avec un même troisième, ils ne s’accordent pas entre eux.
Mais l’application de ces canons dépend d’actes mentaux qui sont équivalents à ceux enveloppés dans la démarche de réduction nommée ci-dessus. Il nous faut choisir les individus dans deux classes, convertir les propositions, etc., avant de pouvoir nous en servir. Une explication de la démarche du raisonnement est insuffisante si elle ne présente pas aussi bien les lois de l’opération accomplie par l’esprit durant ce processus que les vérités de base qu’il reconnaît et applique.
L’auteur estime que les lois en questions sont adéquatement représentées par les équations fondamentales du calcul exposé ici. On en trouvera la preuve en ce qu’il peut et exprimer les propositions et exhiber dans les résultats de ses opérations tous ceux auxquels on peut arriver par le raisonnement ordinaire. ↵