GRAMMAIRES SYNTAGMATIQUES

(Jeudi 23 février 1995)

 

 

 

I. UNE PRATIQUE D'ANALYSE SYNTAXIQUE: Les linguistes américains ont élaboré une méthode d'analyse syntaxique qui s'appuie sur l'analyse grammaticale traditionnelle, mais qui entend être à la fois plus rigoureuse et plus systématique. C'est ce qu'on a appelé l'analyse en constituants immédiats.

 

C'est Bloomfield qui a lancé l'expression de "constituants immédiats" (immediats constituents). Ayant observé que pour comprendre la "forme complexe" qu'est l'énoncé:

Poor John ran away "Le pauvre Jean s'est enfui"

il ne suffisait pas de reconnaître ses "constituants fondamentaux" que sont les "cinq morphèmes: poor, John, ran, a- (forme liée apparaissant également dans aground, ashore, aloft, around ) et -way " (Bloomfield, 1970, 153), il a précisé qu'il fallait aussi savoir "que les constituants immédiats de Poor John ran away  sont les deux formes Poor John  et ran away, chacune d'elles constituant à son tour une forme complexe; que les constituants immédiats de ran away  sont ran, morphème, et away, forme complexe dont les constituants sont les morphèmes a-  et -way ; et que les constituants de Poor John  sont les morphèmes poor  et John . Ce n'est que cette façon,  poursuit Bloomfield (1970, 153) qu'une analyse appropriée (c'est-à-dire une analyse qui tienne compte du sens) conduira aux morphèmes fondamentalement constituants".

 

                        1. LES CONCEPTS DE BASE:

            (cf. transparents)

 

                        2. UNE MÉTHODE SYNTHÉTIQUE D'ANALYSE:  Elle consiste, comme le dit Gleason, à noter, pour commencer, "les paires de mots"  —il serait plus juste de dire les paires de morphèmes— qui, dans une phrase donnée, nous paraissent entretenir la relation syntaxique la plus étroite, puis à "supposer que ces paires de <morphèmes> fonctionnent dans l'énoncé comme des unités" syntaxiques et forment par conséquent une construction. On confirmera cette supposition en faisant commuter avec un seul morphème les deux morphèmes en question, commutation qui prouvera que lesdits deux morphèmes forment bien une unité, puisqu'ils commutent avec un seul morphème.

            (cf. transparents)

 

                        3. REPRÉSENTATIONS GRAPHIQUES DES RÉSULTATS:

            (cf. transparents)

 

                        II. théorie des grammaire formelle: Les mathéma-ticiens, dont l'activité est essentiellement ludique, se sont dotés de nouveaux jouets intellectuels dont ils ont cherché à découvrir toutes les propriétés logiques. C'est ce qu'on a appelé la théorie des grammaires formelles et la théorie des automates abstraits.

 

1. NOTION DE GRAMMAIRE FORMELLE:

On appelle grammaire formelle un mécanisme abstrait qui, à partir d'un vocabulaire fini et à l'aide d'un ensemble fini de règles est  susceptible d'énumérer mécaniquement toutes les phrases, c'est-à-dire toutes les combinaisons de mots, qu'il est possible de réaliser.

 

Plus techniquement, les mathématiciens disent que c'est un quadruplet formé

.d'un vocabulaire dit auxiliaire VA, formé, comme son nom l'indique, de mots qui servent à énumérer les phrases, mais qui n'apparaîtront pas dans ces phrases 

.d'un axiome (ou symbole distingué), appartenant à ce vocabulaire auxiliaire, qui permet d'enclencher le processus d'énumération d'une phrase,

.d'un vocabulaire terminal VT, formé lui des mots dont les combinaisons constitueront les phrases

.et d'un ensemble fini de règles, dites règles de dérivation ou de formation, qui permettent d'énumérer ces phrases et qui sont de la forme S Æ T, où S et T représentent des suites combinant des mots qui appartiennent à l'union du vocabulaire auxiliaire et du vocabulaire terminal, et où la flèche note une opération qui remplace la suite S par la suite T. En réalité, S appartiendra au vocabulaire auxiliaire, puisqu'étant remplacé par T, il ne saurait être terminal. Et pour des raisons de décidabilité, on limitera S à n'être qu'un seul élément du vocabulaire auxiliaire (cf. A. V. Gladkii, Leçons de linguistique mathématique, p. 49-50; N. Chomsky & G. A. Miller, L'analyse formelle des langues naturelles, 1968, trad. de Ph. Richard et N. Ruwet, Paris, Gauthier-Villars, p. 25; M. Gross et A. Lentin, Notions sur les grammaires formelles, 1967, Paris, Gauthier-Villars, p. 44-45).

Les différentes grammaires formelles se distingueront entre elles par la nature de leurs règles de formation. C'est ainsi que les théoriciens des grammaires formelles se sont particulièrement intéressés à deux sortes de grammaires, les grammaires indépendantes du contexte et les grammaires contextuelles, les secondes mettant en oeuvre des règles de formation qui tiennent compte du contexte, les premières des règles de formation qui n'en tiennent pas compte.

 

2. GRAMMAIRE INDÉPENDANTE DU CONTEXTE:

"Une grammaire de Chomsky est définie par la donnée:

.d'un vocabulaire terminal fini VT,

.d'un vocabulaire auxiliaire VA,

.d'un axiome S Œ VA,

.d'un nombre fini de règles <dites>  «context-free» <—c'est-à-dire indépendantes du contexte—> de la forme: A Æ f, avec A Œ VA et f Œ {VA » VT}*" (Gross et Lentin, 1967, 79), A étant "un symbole non-terminal" et f "une chaîne non-vide", pour bien préciser les choses à la suite de Gladkii, p. 54, et où {VA » VT}* est le monoïde libre, c'est-à-dire l'ensemble des combinaisons possibles à partir de l'alphabet que forme l'union du vocabulaire terminal et du vocabulaire auxiliaire.

 

3. GRAMMAIRE CONTEXTUELLE:

"Une grammaire à règles contextuelles est définie par:

.un alphabet fini V union de deux alphabets disjoints VA (auxiliaire) et VT (terminal);

.un axiome S Œ VA;

.des productions de la forme: f1Af2 Æ f1wf2" (Gross et Lentin, 1967, 131)

où A Œ VA, et f1, f2, w Œ V* et où w est non vide. Ces règles de production s'interprètent de la façon suivante: "dans le contexte que forment f1 à gauche et f2 à droite, le symbole non terminal A est réécrit w" (Gross et Lentin, 1967, 131), et reçoivent ordinairement chez les linguistes la présentation plus suggestive:

A Æ w / f1f2

où la barre oblique signifie: "dans le contexte de", et où le tiret représente l'endroit où se trouve le terme A que réécrit la règle de formation, ce qui veut donc dire que f1 est le contexte antérieur de ce terme réécrit, puisqu'il est devant le tiret, et f2 son contexte postérieur, puisqu'il se trouve après le tiret.

 

Il apparaît tout de suite que les grammaires indépendantes du contexte ne sont qu'un cas particulier de grammaire contextuelle. Ce sont en effet les grammaires contextuelles où f1 et f2 sont vides. Et il est intéressant de noter que les différentes grammaires étudiées dans la théorie des grammaires formelles sont ainsi incluses successivement les unes dans les autres. Si la grammaire indépendante du contexte est incluse dans la grammaire contextuelle, la grammaire dite de Kleene, qui correspond à un automate à états finis (c'est-à-dire en fait à nombre fini d'états), et est plus pauvre que la grammaire indépendante du contexte était elle-même un cas particulier de grammaire indépendante du contexte, et la grammaire contextuelle sera un cas particulier de ce que l'on peut appelé la grammaire discontinue, et ainsi de suite jusqu'à ce qu'on arrive à la machine dite de Turing, qui formalise le concept de calculabilité.

 

4. UN EXEMPLE LINGUISTIQUE:

a. Le vieil homme qui habite ici est allé au marché

            vocabulaire auxiliaire (cf. transparent: Gram. formelle Turku 1985 )

            vocabulaire terminal

            règles de formation

                        b. L'application des règles produire une dérivation, à laquelle il est possible d'associer un graphe, dont les sommets seront les éléments des vocabulaires auxiliaire et terminal, et donc les arcs relieront chaque unité d'une suite de la dérivation soit à celle qui est identique dans la séquence qui suit immédiatement, soit à celle ou à celles de la séquence suivante qui la remplacent en vertu de la règle de formation qui fait passer à la ligne suivante de la dérivation. Un tel graphe correspondra exactement à la dérivation, dont il donnera en quelque sorte une représentation graphique.

            (cf. transparent : Gram. formelle Turku 1985 )

                        c. Plusieurs dérivations étant possibles, suivant l'ordre dans lequel on applique les règles, il est possible de neutraliser cet ordre d'application des règles en ne gardant dans le graphe que le premier sommet des chemins entre sommets identiques. Ceci donne un graphe simplifié qu'on appelle indicateur syntagmatique, et qui représente la structure en constituants de la phrase engendrée.

            (cf. transparent: )

 

5. GRAMMAIRE SYNTAGMATIQUE: Les linguistes appellent "grammaire syntagmatique" une forme particulière de grammaire contextuelle qui leur semble être la formalisation de l'analyse en constituants immédiats, parce qu'elle se caractérise par des règles de production qui sont susceptibles d'engendrer des suites de mots anamlysées en constituants immédiats, et qui sont de ce fait qualifiées de "règles syntagmatiques". La première définition que Nicolas Ruwet donne de la grammaire dite syntagmatique est en effet la suivante:

"Nous appellerons désormais grammaire syntagmatique le type de grammaire générative qui correspond à une grammaire de constituants immédiats" (Ruwet, 1968, 115).

 

                       L'expression "grammaire syntagmatique" est la traduction que Nicolas Ruwet a proposée pour rendre en français l'un des termes couramment utilisés par les linguistes chomskyens pour désigner la grammaire qui, selon eux, correspond à l'analyse linguistique en constituants immédiats. Ces deux termes anglais sont phrase structure grammar  (en abrégé PSG) et constituent structure grammar  (en abrégé CSG). Nicolas Ruwet traduit la seconde expression par grammaire de constituants , et se fonde sur le fait que "l'équivalent de phrase , en français, est «syntagme»" (Ruwet, 1968, 384) pour rendre la première expression par "grammaire syntagmatique". Et il précise alors que "le terme «syntagmatique» est employé ici avec un sens évidemment différent de celui qu'il a chez Saussure, quoiqu'il ne soit pas sans rapport (cf. Saussure, 1916, p. 170, p. 177)" (Ruwet, 1968, 384).

 

                       La "grammaire syntagmatique" présente deux différences notables d'avec la grammaire contextuelle. La première n'est nullement importante. Nicolas Ruwet, qui note les règles syntagmatiques par la formule:

X A Y ® X Z Y

ou

A  ® Z  / X — Y

précise les trois contraintes qui s'appliquent à ces règles:

"(a): X, Y, Z, représentent des suites de symboles, où X et Y peuvent, éventuellement être nuls <...>; quant à A, il représente un symbole unique non-nul;

(b): Z est non-nul;

(c): A est différent de Z.

Ces trois conditions reviennent à dire, précise Nicolas Ruwet, que «chaque règle de réécriture [syntagmatique, N.R.] remplace un symbole unique par une suite non-nulle distincte de l'original» (Postal, 1964, Constituent Structure , p. 10). Autrement dit, les règles syntagmatiques sont des règles d'expansion, qui réécrivent chaque fois un élément sous la forme d'au moins un élément différent, et qui ne tolèrent pas les suppressions" (Ruwet, 1968, 121). Rien n'empêche, en théorie, de considérer que le mot vide est un mot du vocabulaire terminal d'une grammaire indépendante du contexte ou d'une grammaire contextuelle. Mais la grammaire syntagmatique se l'interdit pour des raisons, semble-t-il, techniques. Cette restriction ne change pas la nature de la grammaire; car on peut dire de la grammaire contextuelle ce que Maurice Gross et André Lentin ont dit de la grammaire indépendante du contexte:

"On démontre <...> qu'étant donné une C-grammaire qui engendre un langage L contenant le mot vide <qu'ils notent E>, on peut lui associer une C-grammaire très «voisine» qui engendre L - {E}" (Gross et Lentin, 1967, 81).

La différence entre grammaire syntagmatique et grammaire contextuelle n'est donc pas décisive.

 

                       Plus importante par contre est la restriction qui interdit les permutations, sous prétexte qu'elles correspondraient à un non-sens au point de vue linguistique. De fait, "dans une grammaire qui admet des règles dépendante du contexte, il est possible de procéder à des permutations, d'une manière indirecte" (Ruwet, 1968, 127-128). Si à une petite grammaire contenant les règles suivantes:

P ® SN + SV; SN ® ProSN; SV ® V + SPrép; SPrép ® Adv; ProSN ® tu ; V ® habite s; Adv ® ici

on ajoute les eux règles contextuelles:

ProSN Æ V / — V  et  V Æ ProSN / V —

on peut engendrer les deux suites suivantes:

 

Mais l'indicateur syntagmatique de habites-tu ici  contient des informations qui n'ont pas de sens au point de vue linguistique et qui font, comme le dit Nicolas Ruwet, "violence à l'intuition linguistique la plus élémentaire" (Ruwet, 1968, 129). Car les deux règles contextuelles ajoutées reviennent à dire que le V est une forme particulière de ProSN, et que le ProSN est une forme particulière de V, ce qui semble bien être un non-sens.

 

III. INTERPRÉTATION LINGUISTIQUE

des grammaires syntagmatiques

Contrairement à ce que croient et prétendent les chomskyens, les grammaires syntagmatiques formalisent à la fois plus et moins que l'analyse en C.I.

 

                        1. PLUS:

                        a. D'abord il y a deux sortes de règles syntagmatiques: les règles terminales et les règles non terminales. Elles ne peuvent avoir la même interprétation linguistique.

                        b. Les règles syntagmatiques catégorielles reçoivent deux interprétations linguistiques différentes, suivant qu'elles contiennent à droite de la flêche un ou deux mots du vocabulaire auxiliaire

            La grammaire syntagmatique formalise donc les deux concepts de syntagmatique et de paradigmatique de la linguistique moderne. Cela dépasse donc la simple analyse, c'est-à-dire décomposition en C.I. des structures syntaxiques; mais cela n'est pas étranger du tout à l'esprit de la linguistique dite structuraliste.

                        c. Dans la mesure où la grammaire syntagmatique ne distingue pas expressément ces deux sortes de règles, la seule interprétation unitaire qu'il soit possible de donner aux règles dites syntagmatiques est de formaliser l'appartenance à un même paradigme: un Dét et un N ou un Det, un Adj et un N, ou bien un Npr appartiennent au même paradigme du SN. Et c'est uniquement lorsque la série est formée de plus d'un mot que l'on peut dire que la relation paradigmatique entre cette série et son modèle est en même temps une une relation de décomposition en C.I. La grammaire dite syntagmatique est donc en fait fondamentalement paradigmatique. Est-ce étranger à l'esprit de l'analyse en C.I.? Par vraiment.

 

                        Par contre les phénomènes d'accord, dont on rend compte à l'aide de règles contextuelles, n'ont rien à voir avec l'analyse syntaxique, en C.I. ou non. Ce sont en réalité des phénomènes morphologiques, même si les grammaires sont tentées d'y voir, à tort, un problème syntaxique.

 

                        2. MOINS: La grammaire syntagmatique ne peut pas rendre compte de certains phénomènes syntaxiques, par exemple de la description de la coordination telle que l'ont  décrite quasiment tous les linguistes qui ont pratiqué l'analyse en C.I.

 

 

                        CONCLUSION: Les linguistes ont eu tort de croire que la grammaire syntagmatique était une formalisation de toute et de rien que la linguistique structuraliste.

            Les linguistes ont eu tort d'abandonner plus ou moins l'analyse en C.I., qui était plus une esquisse de méthode rigoureuse d'analyse syntaxique qu'une théorie de la description syntaxique, sous prétexte qu'on démontrait que le modèle dit syntagmatique ne pouvait pas rendre compte de toutes les possibilités du langage. Le modèle syntagmatique ne peut rendre certes pas compte de toutes les particularités du langage; mais cela ne disqualifie en rien la pratique de l'analyse en C.I. pour une bonne description et une bonne théorie de l'analyse syntaxique des langues naturelles.

 

 


 

 

Notion de grammaire formelle

 

 

On appelle grammaire formelle un mécanisme abstrait qui, à partir d'un vocabulaire fini et à l'aide d'un ensemble fini de règles est  susceptible d'énumérer mécaniquement toutes les phrases, c'est-à-dire toutes les combinaisons de mots, qu'il est possible de réaliser.

 

Plus techniquement, les mathématiciens disent que c'est un quadruplet formé

.d'un vocabulaire dit auxiliaire VA, formé, comme son nom l'indique, de mots qui servent à énumérer les phrases, mais qui n'apparaîtront pas dans ces phrases 

.d'un axiome (ou symbole distingué), appartenant à ce vocabulaire auxiliaire, qui permet d'enclencher le processus d'énumération d'une phrase,

.d'un vocabulaire terminal VT, formé lui des mots dont les combinaisons constitueront les phrases

.et d'un ensemble fini de règles, dites règles de dérivation ou de formation, qui permettent d'énumérer ces phrases et qui sont de la forme S Æ T, où S et T représentent des suites combinant des mots qui appartiennent à l'union du vocabulaire auxiliaire et du vocabulaire terminal, et où la flèche note une opération qui remplace la suite S par la suite T. En réalité, S appartiendra au vocabulaire auxiliaire, puisqu'étant remplacé par T, il ne saurait être terminal. Et pour des raisons de décidabilité, on limitera S à n'être qu'un seul élément du vocabulaire auxiliaire (cf. A. V. Gladkii, Leçons de linguistique mathématique, p. 49-50; N. Chomsky & G. A. Miller, L'analyse formelle des langues naturelles, 1968, trad. de Ph. Richard et N. Ruwet, Paris, Gauthier-Villars, p. 25; M. Gross et A. Lentin, Notions sur les grammaires formelles, 1967, Paris, Gauthier-Villars, p. 44-45).

 


 

 

GRAMMAIRE INDEPENDANTE DU CONTEXTE

 

 

 

"Une grammaire de Chomsky est définie par la donnée:

.d'un vocabulaire terminal fini VT,

.d'un vocabulaire auxiliaire VA,

.d'un axiome S Œ VA,

.d'un nombre fini de règles <dites>  «context-free» <—c'est-à-dire indépendantes du contexte—> de la forme: A Æ f, avec A Œ VA et f Œ {VA » VT}*" (Gross et Lentin, 1967, 79), A étant "un symbole non-terminal" et f "une chaîne non-vide", pour bien préciser les choses à la suite de Gladkii, p. 54, et où {VA » VT}* est le monoïde libre, c'est-à-dire l'ensemble des combinaisons possibles à partir de l'alphabet que forme l'union du vocabulaire terminal et du vocabulaire auxiliaire.

 


 

 

GRAMMAIRE CONTEXTUELLE

 

 

 

"Une grammaire à règles contextuelles est définie par:

.un alphabet fini V union de deux alphabets disjoints VA (auxiliaire) et VT (terminal);

.un axiome S Œ VA;

.des productions de la forme: f1Af2 Æ f1wf2" (Gross et Lentin, 1967, 131)

où A Œ VA, et f1, f2, w Œ V* et où w est non vide. Ces règles de production s'interprètent de la façon suivante: "dans le contexte que forment f1 à gauche et f2 à droite, le symbole non terminal A est réécrit w" (Gross et Lentin, 1967, 131), et reçoivent ordinairement chez les linguistes la présentation plus suggestive:

A Æ w / f1f2

où la barre oblique signifie: "dans le contexte de", et où le tiret représente l'endroit où se trouve le terme A que réécrit la règle de formation, ce qui veut donc dire que f1 est le contexte antérieur de ce terme réécrit, puisqu'il est devant le tiret, et f2 son contexte postérieur, puisqu'il se trouve après le tiret.


 

PERMUTATION

 

 

                       Si à une petite grammaire contenant les règles suivantes:

P Æ SN + SV

SN Æ ProSN

SV Æ V + SPrép

SPrép Æ Adv

ProSN Æ tu

V Æ habite s

Adv Æ ici

on ajoute les deux règles contextuelles:

ProSN Æ V / — V  

V Æ ProSN / V —

on peut engendrer les deux suites suivantes: