GRAMMAIRES
SYNTAGMATIQUES
(Jeudi
23 février 1995)
I. UNE PRATIQUE D'ANALYSE SYNTAXIQUE: Les linguistes américains ont élaboré une méthode d'analyse syntaxique qui s'appuie sur l'analyse grammaticale traditionnelle, mais qui entend être à la fois plus rigoureuse et plus systématique. C'est ce qu'on a appelé l'analyse en constituants immédiats.
C'est Bloomfield qui a lancé l'expression de
"constituants immédiats" (immediats constituents). Ayant
observé que pour comprendre la "forme complexe" qu'est l'énoncé:
Poor
John ran away "Le pauvre Jean s'est enfui"
il ne suffisait pas de reconnaître ses "constituants
fondamentaux" que sont les "cinq morphèmes: poor, John,
ran, a- (forme liée apparaissant également dans aground,
ashore, aloft, around ) et -way " (Bloomfield, 1970, 153), il a
précisé qu'il fallait aussi savoir "que les constituants immédiats de Poor
John ran away sont les deux formes Poor
John et ran away, chacune
d'elles constituant à son tour une forme complexe; que les constituants
immédiats de ran away sont ran,
morphème, et away, forme complexe dont les constituants sont les
morphèmes a- et -way ; et
que les constituants de Poor John
sont les morphèmes poor et
John . Ce n'est que cette façon,
poursuit Bloomfield (1970, 153) qu'une analyse appropriée (c'est-à-dire
une analyse qui tienne compte du sens) conduira aux morphèmes fondamentalement
constituants".
1.
LES CONCEPTS DE BASE:
(cf.
transparents)
2.
UNE MÉTHODE SYNTHÉTIQUE D'ANALYSE:
Elle consiste, comme le dit Gleason, à noter, pour commencer, "les
paires de mots" —il serait plus
juste de dire les paires de morphèmes— qui, dans une phrase donnée, nous
paraissent entretenir la relation syntaxique la plus étroite, puis à
"supposer que ces paires de <morphèmes> fonctionnent dans l'énoncé
comme des unités" syntaxiques et forment par conséquent une construction.
On confirmera cette supposition en faisant commuter avec un seul morphème les deux
morphèmes en question, commutation qui prouvera que lesdits deux morphèmes
forment bien une unité, puisqu'ils commutent avec un seul morphème.
(cf.
transparents)
3.
REPRÉSENTATIONS GRAPHIQUES DES RÉSULTATS:
(cf. transparents)
II. théorie des grammaire formelle: Les mathéma-ticiens, dont l'activité est essentiellement ludique, se sont dotés de nouveaux jouets intellectuels dont ils ont cherché à découvrir toutes les propriétés logiques. C'est ce qu'on a appelé la théorie des grammaires formelles et la théorie des automates abstraits.
1. NOTION DE GRAMMAIRE FORMELLE:
On appelle grammaire formelle un mécanisme abstrait qui, à
partir d'un vocabulaire fini et à l'aide d'un ensemble fini de règles est susceptible d'énumérer mécaniquement toutes
les phrases, c'est-à-dire toutes les combinaisons de mots, qu'il est possible
de réaliser.
Plus techniquement, les mathématiciens disent que c'est un
quadruplet formé
.d'un
vocabulaire dit auxiliaire VA, formé, comme son nom l'indique, de
mots qui servent à énumérer les phrases, mais qui n'apparaîtront pas dans ces
phrases
.d'un
axiome (ou symbole distingué), appartenant à ce vocabulaire auxiliaire, qui
permet d'enclencher le processus d'énumération d'une phrase,
.d'un
vocabulaire terminal VT, formé lui des mots dont les combinaisons
constitueront les phrases
.et d'un
ensemble fini de règles, dites règles de dérivation ou de formation, qui
permettent d'énumérer ces phrases et qui sont de la forme S Æ T, où S et T représentent des suites combinant des
mots qui appartiennent à l'union du vocabulaire auxiliaire et du vocabulaire
terminal, et où la flèche note une opération qui remplace la suite S par la
suite T. En réalité, S appartiendra au vocabulaire auxiliaire, puisqu'étant
remplacé par T, il ne saurait être terminal. Et pour des raisons de
décidabilité, on limitera S à n'être qu'un seul élément du vocabulaire
auxiliaire (cf. A. V. Gladkii, Leçons de linguistique mathématique, p.
49-50; N. Chomsky & G. A. Miller, L'analyse formelle des langues
naturelles, 1968, trad. de Ph. Richard et N. Ruwet, Paris,
Gauthier-Villars, p. 25; M. Gross et A. Lentin, Notions sur les grammaires
formelles, 1967, Paris, Gauthier-Villars, p. 44-45).
Les différentes grammaires formelles se distingueront entre
elles par la nature de leurs règles de formation. C'est ainsi que les
théoriciens des grammaires formelles se sont particulièrement intéressés à deux
sortes de grammaires, les grammaires indépendantes du contexte et les
grammaires contextuelles, les secondes mettant en oeuvre des règles de formation
qui tiennent compte du contexte, les premières des règles de formation qui n'en
tiennent pas compte.
2. GRAMMAIRE INDÉPENDANTE DU CONTEXTE:
"Une grammaire de Chomsky est définie par la donnée:
.d'un
vocabulaire terminal fini VT,
.d'un
vocabulaire auxiliaire VA,
.d'un
axiome S VA,
.d'un
nombre fini de règles <dites>
«context-free» <—c'est-à-dire indépendantes du contexte—> de la
forme: A Æ f, avec A VA et f {VA » VT}*"
(Gross et Lentin, 1967, 79), A étant "un symbole non-terminal" et f "une chaîne non-vide", pour bien préciser
les choses à la suite de Gladkii, p. 54, et où {VA » VT}* est le monoïde libre,
c'est-à-dire l'ensemble des combinaisons possibles à partir de l'alphabet que
forme l'union du vocabulaire terminal et du vocabulaire auxiliaire.
3. GRAMMAIRE CONTEXTUELLE:
"Une grammaire à règles contextuelles est définie par:
.un
alphabet fini V union de deux alphabets disjoints VA (auxiliaire) et
VT (terminal);
.un
axiome S VA;
.des
productions de la forme: f1Af2 Æ f1wf2" (Gross et Lentin, 1967, 131)
où A VA,
et f1, f2, w V* et où w est non vide.
Ces règles de production s'interprètent de la façon suivante: "dans le
contexte que forment f1 à gauche et f2 à droite, le symbole non terminal A
est réécrit w" (Gross et Lentin, 1967, 131),
et reçoivent ordinairement chez les linguistes la présentation plus suggestive:
A Æ w / f1 — f2
où la barre oblique signifie: "dans le contexte
de", et où le tiret représente l'endroit où se trouve le terme A que
réécrit la règle de formation, ce qui veut donc dire que f1 est le contexte antérieur de ce terme réécrit, puisqu'il
est devant le tiret, et f2 son contexte postérieur, puisqu'il
se trouve après le tiret.
Il apparaît tout de suite que les
grammaires indépendantes du contexte ne sont qu'un cas particulier de grammaire
contextuelle. Ce sont en effet les grammaires contextuelles où f1 et f2 sont vides. Et il est intéressant
de noter que les différentes grammaires étudiées dans la théorie des grammaires
formelles sont ainsi incluses successivement les unes dans les autres. Si la
grammaire indépendante du contexte est incluse dans la grammaire contextuelle,
la grammaire dite de Kleene, qui correspond à un automate à états finis
(c'est-à-dire en fait à nombre fini d'états), et est plus pauvre que la
grammaire indépendante du contexte était elle-même un cas particulier de
grammaire indépendante du contexte, et la grammaire contextuelle sera un cas
particulier de ce que l'on peut appelé la grammaire discontinue, et ainsi de suite
jusqu'à ce qu'on arrive à la machine dite de Turing, qui formalise le concept
de calculabilité.
4. UN EXEMPLE LINGUISTIQUE:
a. Le vieil homme qui habite ici est allé au marché
vocabulaire auxiliaire (cf. transparent: Gram. formelle Turku 1985 )
vocabulaire terminal
règles de formation
b. L'application des règles produire une dérivation, à laquelle il est possible d'associer un graphe, dont les sommets seront les éléments des vocabulaires auxiliaire et terminal, et donc les arcs relieront chaque unité d'une suite de la dérivation soit à celle qui est identique dans la séquence qui suit immédiatement, soit à celle ou à celles de la séquence suivante qui la remplacent en vertu de la règle de formation qui fait passer à la ligne suivante de la dérivation. Un tel graphe correspondra exactement à la dérivation, dont il donnera en quelque sorte une représentation graphique.
(cf. transparent : Gram. formelle Turku 1985 )
c. Plusieurs dérivations étant possibles, suivant l'ordre dans lequel on applique les règles, il est possible de neutraliser cet ordre d'application des règles en ne gardant dans le graphe que le premier sommet des chemins entre sommets identiques. Ceci donne un graphe simplifié qu'on appelle indicateur syntagmatique, et qui représente la structure en constituants de la phrase engendrée.
(cf. transparent: )
5. GRAMMAIRE SYNTAGMATIQUE: Les linguistes appellent "grammaire syntagmatique" une forme particulière de grammaire contextuelle qui leur semble être la formalisation de l'analyse en constituants immédiats, parce qu'elle se caractérise par des règles de production qui sont susceptibles d'engendrer des suites de mots anamlysées en constituants immédiats, et qui sont de ce fait qualifiées de "règles syntagmatiques". La première définition que Nicolas Ruwet donne de la grammaire dite syntagmatique est en effet la suivante:
"Nous appellerons désormais grammaire syntagmatique le type de grammaire générative qui correspond à une grammaire de constituants immédiats" (Ruwet, 1968, 115).
L'expression "grammaire syntagmatique" est la traduction que Nicolas Ruwet a proposée pour rendre en français l'un des termes couramment utilisés par les linguistes chomskyens pour désigner la grammaire qui, selon eux, correspond à l'analyse linguistique en constituants immédiats. Ces deux termes anglais sont phrase structure grammar (en abrégé PSG) et constituent structure grammar (en abrégé CSG). Nicolas Ruwet traduit la seconde expression par grammaire de constituants , et se fonde sur le fait que "l'équivalent de phrase , en français, est «syntagme»" (Ruwet, 1968, 384) pour rendre la première expression par "grammaire syntagmatique". Et il précise alors que "le terme «syntagmatique» est employé ici avec un sens évidemment différent de celui qu'il a chez Saussure, quoiqu'il ne soit pas sans rapport (cf. Saussure, 1916, p. 170, p. 177)" (Ruwet, 1968, 384).
La "grammaire syntagmatique" présente deux différences notables d'avec la grammaire contextuelle. La première n'est nullement importante. Nicolas Ruwet, qui note les règles syntagmatiques par la formule:
X A Y ® X Z Y
ou
A ® Z / X — Y
précise les trois contraintes qui s'appliquent à ces règles:
"(a): X, Y, Z, représentent des suites de symboles, où X et Y peuvent, éventuellement être nuls <...>; quant à A, il représente un symbole unique non-nul;
(b): Z est non-nul;
(c): A est différent de Z.
Ces trois conditions reviennent à dire, précise Nicolas Ruwet, que «chaque règle de réécriture [syntagmatique, N.R.] remplace un symbole unique par une suite non-nulle distincte de l'original» (Postal, 1964, Constituent Structure , p. 10). Autrement dit, les règles syntagmatiques sont des règles d'expansion, qui réécrivent chaque fois un élément sous la forme d'au moins un élément différent, et qui ne tolèrent pas les suppressions" (Ruwet, 1968, 121). Rien n'empêche, en théorie, de considérer que le mot vide est un mot du vocabulaire terminal d'une grammaire indépendante du contexte ou d'une grammaire contextuelle. Mais la grammaire syntagmatique se l'interdit pour des raisons, semble-t-il, techniques. Cette restriction ne change pas la nature de la grammaire; car on peut dire de la grammaire contextuelle ce que Maurice Gross et André Lentin ont dit de la grammaire indépendante du contexte:
"On démontre <...> qu'étant donné une C-grammaire qui engendre un langage L contenant le mot vide <qu'ils notent E>, on peut lui associer une C-grammaire très «voisine» qui engendre L - {E}" (Gross et Lentin, 1967, 81).
La différence entre grammaire syntagmatique et grammaire contextuelle n'est donc pas décisive.
Plus importante par contre est la restriction qui interdit les permutations, sous prétexte qu'elles correspondraient à un non-sens au point de vue linguistique. De fait, "dans une grammaire qui admet des règles dépendante du contexte, il est possible de procéder à des permutations, d'une manière indirecte" (Ruwet, 1968, 127-128). Si à une petite grammaire contenant les règles suivantes:
P ® SN + SV; SN ® ProSN; SV ® V + SPrép; SPrép ® Adv; ProSN ® tu ; V ® habite s; Adv ® ici
on ajoute les eux règles contextuelles:
ProSN Æ V / — V et V Æ ProSN / V —
on peut engendrer les deux suites suivantes:
Mais l'indicateur syntagmatique de habites-tu ici contient des informations qui n'ont pas de sens au point de vue linguistique et qui font, comme le dit Nicolas Ruwet, "violence à l'intuition linguistique la plus élémentaire" (Ruwet, 1968, 129). Car les deux règles contextuelles ajoutées reviennent à dire que le V est une forme particulière de ProSN, et que le ProSN est une forme particulière de V, ce qui semble bien être un non-sens.
III. INTERPRÉTATION LINGUISTIQUE
des grammaires syntagmatiques
Contrairement à ce que croient et prétendent les chomskyens, les grammaires syntagmatiques formalisent à la fois plus et moins que l'analyse en C.I.
1. PLUS:
a. D'abord il y a deux sortes de règles syntagmatiques: les règles terminales et les règles non terminales. Elles ne peuvent avoir la même interprétation linguistique.
b. Les règles syntagmatiques catégorielles reçoivent deux interprétations linguistiques différentes, suivant qu'elles contiennent à droite de la flêche un ou deux mots du vocabulaire auxiliaire
La grammaire syntagmatique formalise donc les deux concepts de syntagmatique et de paradigmatique de la linguistique moderne. Cela dépasse donc la simple analyse, c'est-à-dire décomposition en C.I. des structures syntaxiques; mais cela n'est pas étranger du tout à l'esprit de la linguistique dite structuraliste.
c. Dans la mesure où la grammaire syntagmatique ne distingue pas expressément ces deux sortes de règles, la seule interprétation unitaire qu'il soit possible de donner aux règles dites syntagmatiques est de formaliser l'appartenance à un même paradigme: un Dét et un N ou un Det, un Adj et un N, ou bien un Npr appartiennent au même paradigme du SN. Et c'est uniquement lorsque la série est formée de plus d'un mot que l'on peut dire que la relation paradigmatique entre cette série et son modèle est en même temps une une relation de décomposition en C.I. La grammaire dite syntagmatique est donc en fait fondamentalement paradigmatique. Est-ce étranger à l'esprit de l'analyse en C.I.? Par vraiment.
Par contre les phénomènes d'accord, dont on rend compte à l'aide de règles contextuelles, n'ont rien à voir avec l'analyse syntaxique, en C.I. ou non. Ce sont en réalité des phénomènes morphologiques, même si les grammaires sont tentées d'y voir, à tort, un problème syntaxique.
2. MOINS: La grammaire syntagmatique ne peut pas rendre compte de certains phénomènes syntaxiques, par exemple de la description de la coordination telle que l'ont décrite quasiment tous les linguistes qui ont pratiqué l'analyse en C.I.
CONCLUSION: Les linguistes ont eu tort de croire que la grammaire syntagmatique était une formalisation de toute et de rien que la linguistique structuraliste.
Les linguistes ont eu tort d'abandonner plus ou moins l'analyse en C.I., qui était plus une esquisse de méthode rigoureuse d'analyse syntaxique qu'une théorie de la description syntaxique, sous prétexte qu'on démontrait que le modèle dit syntagmatique ne pouvait pas rendre compte de toutes les possibilités du langage. Le modèle syntagmatique ne peut rendre certes pas compte de toutes les particularités du langage; mais cela ne disqualifie en rien la pratique de l'analyse en C.I. pour une bonne description et une bonne théorie de l'analyse syntaxique des langues naturelles.
Notion de grammaire formelle
On appelle grammaire formelle un mécanisme abstrait qui, à
partir d'un vocabulaire fini et à l'aide d'un ensemble fini de règles est susceptible d'énumérer mécaniquement toutes
les phrases, c'est-à-dire toutes les combinaisons de mots, qu'il est possible
de réaliser.
Plus techniquement, les mathématiciens disent que c'est un
quadruplet formé
.d'un
vocabulaire dit auxiliaire VA, formé, comme son nom l'indique, de
mots qui servent à énumérer les phrases, mais qui n'apparaîtront pas dans ces
phrases
.d'un
axiome (ou symbole distingué), appartenant à ce vocabulaire auxiliaire, qui
permet d'enclencher le processus d'énumération d'une phrase,
.d'un
vocabulaire terminal VT, formé lui des mots dont les combinaisons
constitueront les phrases
.et d'un
ensemble fini de règles, dites règles de dérivation ou de formation, qui
permettent d'énumérer ces phrases et qui sont de la forme S Æ T, où S et T représentent des suites combinant des
mots qui appartiennent à l'union du vocabulaire auxiliaire et du vocabulaire
terminal, et où la flèche note une opération qui remplace la suite S par la
suite T. En réalité, S appartiendra au vocabulaire auxiliaire, puisqu'étant
remplacé par T, il ne saurait être terminal. Et pour des raisons de décidabilité,
on limitera S à n'être qu'un seul élément du vocabulaire auxiliaire (cf. A. V.
Gladkii, Leçons de linguistique mathématique, p. 49-50; N. Chomsky &
G. A. Miller, L'analyse formelle des langues naturelles, 1968, trad. de
Ph. Richard et N. Ruwet, Paris, Gauthier-Villars, p. 25; M. Gross et A. Lentin,
Notions sur les grammaires formelles, 1967, Paris, Gauthier-Villars, p.
44-45).
GRAMMAIRE
INDEPENDANTE DU CONTEXTE
"Une grammaire de Chomsky est définie par la donnée:
.d'un
vocabulaire terminal fini VT,
.d'un
vocabulaire auxiliaire VA,
.d'un
axiome S VA,
.d'un
nombre fini de règles <dites>
«context-free» <—c'est-à-dire indépendantes du contexte—> de la
forme: A Æ f, avec A VA et f {VA » VT}*"
(Gross et Lentin, 1967, 79), A étant "un symbole non-terminal" et f "une chaîne non-vide", pour bien préciser
les choses à la suite de Gladkii, p. 54, et où {VA » VT}* est le monoïde libre,
c'est-à-dire l'ensemble des combinaisons possibles à partir de l'alphabet que
forme l'union du vocabulaire terminal et du vocabulaire auxiliaire.
GRAMMAIRE
CONTEXTUELLE
"Une grammaire à règles contextuelles est définie par:
.un
alphabet fini V union de deux alphabets disjoints VA (auxiliaire) et
VT (terminal);
.un
axiome S VA;
.des
productions de la forme: f1Af2 Æ f1wf2" (Gross et Lentin, 1967, 131)
où A VA,
et f1, f2, w V* et où w est non vide.
Ces règles de production s'interprètent de la façon suivante: "dans le
contexte que forment f1 à gauche et f2 à droite, le symbole non terminal A
est réécrit w" (Gross et Lentin, 1967, 131),
et reçoivent ordinairement chez les linguistes la présentation plus suggestive:
A Æ w / f1 — f2
où la barre oblique signifie: "dans le contexte
de", et où le tiret représente l'endroit où se trouve le terme A que
réécrit la règle de formation, ce qui veut donc dire que f1 est le contexte antérieur de ce terme réécrit, puisqu'il
est devant le tiret, et f2 son contexte postérieur, puisqu'il
se trouve après le tiret.
PERMUTATION
Si à une petite grammaire contenant les règles suivantes:
P Æ SN + SV
SN Æ ProSN
SV Æ V + SPrép
SPrép Æ Adv
ProSN Æ tu
V Æ habite s
Adv Æ ici
on ajoute les deux règles contextuelles:
ProSN Æ V / — V
V Æ ProSN / V —
on peut engendrer les deux suites suivantes: