III
La mise en scène de
l’entretien
Interviews, entretiens,
débats, talk-shows constituent une part importante
des programmes de télévision [21].
Ils se proposent pour la plupart comme des moments
et des lieux d’échanges, neutres et non partisans,
dont la vocation est de faciliter la diffusion des
idées afin de favoriser la formation, voire
l’expression, de l’opinion publique. Mais quelles
sont les contraintes réelles inhérentes aux dispositifs
de mise en scène et jusqu’à quel point la procédure
énonciative peut-elle inférer sur le déroulement des
débats, d’une part, sur leur interprétation par le
spectateur d’autre part ? Le présent travail
se propose d’établir les bases d’une théorie pragmatique
de l’entretien qui puisse faciliter l’interprétation
des processus interactifs propres à la représentation
audiovisuelle.
Tout
acte de communication se développe dans deux champs
complémentaires : le champ référentiel, informatif
ou constatif, et le champ relationnel, que
l’on peut encore qualifier de performatif ou d’énonciatif.
Ces deux champs correspondent aux deux fonctions
canoniques du langage, la fonction de représentation
ou de constat d’une part, la fonction pragmatique
discursive, d’autre part. Le langage sert à la fois
à décrire et à agir.
Plus qu’opposées, ces deux
fonctions sont complémentaires, voire indissociables.
Il n’y a pas de récit sans discours, d’histoire sans
narrateur, ni non plus de discours sans récit, de
message sans contenu, de relation sans contexte. L’interpénétration
du discours et du récit, du sémantique et du sémiotique,
a été décrite par Émile Benveniste (1969 et 1974)
à partir d’une analyse de la subjectivité dans le
langage qui met en évidence le caractère intentionnel
de la production du sens.
Le sens n’est pas confiné
dans les lexiques virtuels des langues naturelles
– comme l’or des États-Unis dans les caves de Fort
Knox – mais se retrempe et se métamorphose continuellement
à l’usage infini du discours quotidien intersubjectif
qui constitue le jeu social. C’est ainsi que les énoncés
portent toujours deux valeurs de signification, un
sens dénotatif, cristallisé, lexicalisé, sémiotique,
qui renvoie au système de la langue, et un sens projectif,
sous contexte, sémantique, qui rend compte
ou qui organise l’échange intersubjectif. Cette valeur
sémantique de l’énoncé n’est pas soumise à une simple
intelligence de l’interlocuteur mais bien à une interprétation
dont il est en fin de compte le seul juge.
Tout
énoncé mêle une fonction informative, référentielle,
à une fonction relationnelle, pragmatique, mais on
peut distinguer les énoncés discursifs, à vocation
pragmatique dominante, des énoncés narratifs qui
manifestent une plus ou moins grande autonomie par
rapport au contexte de leur énonciation. La conversation
et l’entretien se déroulent dans le hic
et nunc d’un échange intersubjectif actuel,
tandis que le récit se déploie dans un jeu
intersubjectif dissocié, à l’intention d’un public
passif ou virtuel. La chaîne verbale, constitutive
du discours, se caractérise par l’alternance des points
de vue propres aux locuteurs, alors que la chaîne
verbale constitutive du récit se caractérise par la
permanence et l’unicité du point de vue énonciatif
– quelle que soit au demeurant la variété des artifices
narratifs.
Le discours est une concaténation
de segments qui se caractérisent chacun par le locuteur
qu’ils manifestent, l’information qu’ils donnent et
l’intention qu’ils véhiculent, mais l’alternance des
propos ne peut s’organiser et se perpétuer que si
les acteurs s’accordent a minimo sur l’enjeu
implicite de l’échange. Ils se doivent donc d’élaborer
un même point de vue sur le sens de ce qui se joue.
Autrement dit, l’isotopie sémantique de la conversation
n’est concevable que du point de vue abstrait d’un
tiers virtuel auquel chacun des interlocuteurs accepte
de s’identifier.
Ce processus d’élaboration
d’une cohérence sémantique se situe de façon privilégiée
dans l’organisation de l’alternance des propos. Chevauchements,
silences, interruptions, dénégations, etc. sont –
paradoxalement – autant de procédures qui visent à
pérenniser le contact dans l’assentiment de l’autre.
Ces artifices, qui ordonnent et réduisent l’expression
des subjectivités, sont tout à fait comparables aux
procédés de narration. Les règles qui organisent le
"tour de parole" sont les règles mêmes qui
président à la construction de tout récit.
Les segments narratifs,
constitutifs du récit, rendent compte dans leur concaténation
et dans leur syntaxe du processus de ponctuation
propre au discours. Ils décrivent d’une part le contenu
brut du discours – on parlera en ce cas de segments
référentiels – et ils proposent d’autre part une interprétation
de la signification implicite de l’échange – et on
peut parler alors de segments énonciatifs.
Segments énonciatifs et
segments référentiels se mêlent plus ou moins intimement
dans le déroulement du récit, non sans manifester
le point de vue qui leur est propre et la fonction
qu’ils assument. Les segments référentiels rendent
compte des points de vue internes à la diégèse, alors
que les segments énonciatifs rendent compte du point
de vue du narrateur, voire de celui du lecteur ou
du spectateur. Le mouvement même du récit est une
oscillation permanente entre le champ de la diégèse
et l’univers de l’énonciation, de même que la dynamique
du discours se règle dans l’alternance des propos.
La tension narrative qui entretient l’intérêt du lecteur
ou du spectateur est fondamentalement de même nature
que la tension discursive qui entretient ou pérennise
l’échange verbal.
Nous avons précédemment
formulé l’hypothèse (Desgoutte, 1997, pp. 97-109)
que le récit audiovisuel peut être analysé, à l’instar
du récit verbal, comme une concaténation de propositions
– usuellement appelées plans – qui se rapportent chacune
à un point de vue interne ou externe à l’histoire
racontée. En ce sens, la narration audiovisuelle est
constituée d’un enchaînement de segments diégétiques
ou énonciatifs, qui alternent les points de vue simulés
des acteurs de l’histoire racontée et les points de
vue externes du narrateur et/ou du spectateur.
Cette formulation nous permet
de mieux comprendre ce qui se joue dans l’enregistrement
d’un débat ou d’un événement. Le contenu de l’émission
enregistrée adresse au spectateur un certain nombre
d’éléments référentiels, directement puisé dans l’événement,
et un certain nombre d’éléments énonciatifs qui sont
le fait du metteur en scène et visent soit à rendre
explicites le sens de ce qui s’échange, soit à manifester
le point de vue du narrateur quant à ce qui s’échange.
L’entretien et le débat
audiovisuels ont à vrai dire un statut un peu particulier
par rapport au récit audiovisuel « canonique »,
en ce sens que les acteurs y ont une véritable autonomie
de comportement. Ils sont là pour débattre et inventent
ensemble le déroulement du propos. Ils règlent entre
eux, avec la participation éventuelle d’un animateur,
l’enchaînement des tours de parole. La structure de
la « narration » (la syntaxe du programme)
est donc le résultat d’une interaction ou d’un compromis
entre la logique du discours de référence et la rhétorique
de la mise en scène ou de la mise en image.
Si le réalisateur n’a pas
de maîtrise directe sur le contenu de l’échange ni
sur la ponctuation des propos, il a en revanche une
grande liberté de traitement de l’image puisqu’il
peut choisir le contenu, la valeur du plan et les
mouvements de caméra, et contrôler également l’usage
des micros et l’enregistrement du son.
Cette position particulière
du réalisateur n’est pas sans influence sur l’évolution
du débat dont elle peut tendre à accentuer ou au contraire
à effacer certains aspects. Le réalisateur est en
position d’analyste par rapport à la « chorégraphie »
du débat dont il peut anticiper ou retarder la représentation,
quant au tour de parole en particulier.
Si le discours ou l’entretien
se fondent prioritairement sur un échange de paroles,
ils donnent lieu également à un échange de regards
et d’expressions, de comportements et de postures
qui ajoutent à la signification du « dit »
une signification du « montré ». La restitution
du jeu des regards, des expressions et des comportements
exige un dispositif particulier d’enregistrement qui
prenne en compte la spécificité visuelle de l’échange.
Le point de vue de la caméra
rend compte de l’angle de narration (J.-P. Desgoutte,
1997, p. 125), c’est-à-dire de la position du narrateur
dans le dispositif énonciatif, soit qu’il adopte le
regard (intradiégétique) de l’un ou l’autre des acteurs,
soit qu’il reste extérieur à la scène référentielle.
La dissociation du son et de l’image permet de sophistiquer
le jeu énonciatif en séparant le (ou les) point d’écoute
du (ou des) point de vue. De même que l’enregistrement
du son simule par l’usage d’un ou de plusieurs micros
une position d’écoute du spectateur, de même
l’enregistrement de l’image simule par l’usage d’une
ou de plusieurs caméras un point de vue du
spectateur. Mais alors que le contexte sonore d’un
événement est peu ou prou commun à l’ensemble de ses
acteurs (chacun entend plus ou moins la même chose
que les autres), la restitution du contexte visuel
nécessite l’identification des divers points de vue
à l’œuvre.
Le discours est à la fois
un échange de propos et de comportements. Le sujet
se manifeste simultanément par ce qu’il dit et par
ce qu’il montre. En plus du contenu verbal du message
qu’il adresse à son interlocuteur, il manifeste, délibérément
ou non, un certain nombre d’attitudes et d’expressions,
qui révèlent ses émotions, ses sentiments ou ses intentions.
Il propose donc à son interlocuteur une image de soi
dont on peut dire qu’elle se partage en deux composantes,
une composante expressive – involontaire ou spontanée
– et une composante impressive, délibérée, intentionnelle.
Ces deux images, focalisées l’une sur le sujet, l’autre
sur son vis-à-vis, accompagnent à chaque instant le
jeu d’échange verbal. Le regard (comme la parole)
peut être caractérisé par sa polarisation émotive
ou conative, selon les termes de Roman Jakobson (1963)
– expressive ou impressive, selon nos propres termes.
On peut ainsi appeler fonction JE la dominante expressive
et fonction TU la dominante impressive (J.-P. Desgoutte,
1997, pp. 117-118). Le mouvement du dialogue mêle
sans cesse les images de l’un et de l’autre interlocuteurs,
dans un jeu quasi chorégraphique où alternent mouvements
vers l’autre et replis sur soi. Le foyer de l’échange,
verbal et visuel, oscille sur la ligne des regards,
privilégiant parfois l’un, parfois l’autre, donnant
lieu également à des affrontements, des conflits de
territoire, ou encore à des silences où chacun se
retrouve au plus intime de lui-même.
Ce mouvement caractéristique
du jeu intersubjectif, a été décrit, dans sa dimension
verbale, par Émile Benveniste. Il se manifeste dans
toute langue par le jeu plus ou moins complexe des
pronoms personnels. Nous nous proposons ici d’en formuler
de façon analogue la dimension visuelle en posant
qu’il existe trois images de tout sujet :
·
L’identité
du sujet est l’image dénotative ou descriptive simple.
Elle est présumée libre de toute expression et de
toute intention. On peut dire qu’elle appartient au
référent social.
·
L’expression du sujet manifeste – hors de toute intention – la subjectivité du locuteur.
·
Le regard
du sujet rend compte du rapport intentionnel que le
sujet entretient avec son vis-à-vis.
Cette transposition des catégories verbales personnelles
dans le domaine visuel est liée au développement depuis
un siècle d’une « grammaire implicite de l’image
animée ». Le cinéma et plus encore la télévision,
ont systématisé la simulation, l’enregistrement et
la diffusion des dialogues, conversations et débats.
Les réalisateurs et metteurs en scène ont ainsi été
amenés à élaborer de façon empirique des dispositifs
de représentation qui tendent à rendre compte, le
mieux possible, de l’ensemble de l’événement concerné,
dans sa totalité et dans ses parties.
Cette élaboration d’un dispositif
de représentation n’est rien d’autre, dans le fond,
qu’une théorie implicite de l’échange qui propose
de façon empirique un certain nombre de paradigmes
visuels représentatifs de la dynamique propre au discours.
La pratique de la réalisation conduit ainsi à faire
un certain nombre de choix de points de vue, cadrages,
angles, etc. qui sont autant de propositions d’analyse
de l’événement. Le découpage technique, propre à toute
représentation audiovisuelle, se propose, de fait
et par la force des choses, comme une théorie de l’action
sociale. Il mêle intimement une analyse « logique »
de l’événement à une interprétation énonciative, inhérente
à toute procédure de représentation.
Nulle part mieux que dans l’interview ne se révèle le jeu
d’implication qui lie l’instance référentielle et
l’instance énonciative. En effet, le principe même
de l’interview [22] est d’établir un
passage – voire une confusion – entre discours et
récit, performance et constat. L’interview mêle
donc les deux instances, topique, où la personne
interrogée, se livre à un échange discursif avec
son interlocuteur, et énonciative,
où l’interviewer met en scène le propos selon un
dispositif plus ou moins complexe à l’usage du public.
Le rôle de l’interviewer est d’ordonner, selon un schéma narratif interprétable
par un destinataire absent, les propos de l’interviewé.
Il intervient comme narrateur des deux côtés
de la frontière que constitue le cadre de l’entretien.
Il est partie prenante
du discours qu’il ordonne, sans toutefois s’y impliquer
personnellement, mais il est également narrateur
du récit destiné au public. Son rôle est modulable,
de la présence opaque à la transparence complète.
Présent dans la scène, il est acteur du drame. Silencieux,
voire absent du cadre, il tend à se confondre avec
le destinataire virtuel du propos. L’interviewer
trace le cadre énonciatif où le propos de l’interviewé
viendra s’inscrire. Il autorise ainsi la manifestation
d’une logique immanente au personnage en le conduisant
à donner de lui-même un récit structuré [23] .
La conversation et le dialogue,
peuvent être analysés à partir d’une généralisation
du modèle de l’interview. La représentation de la
conversation est assimilée, dans ce cas, à un double
jeu d’interviews simultanées où chacun prend à son
tour le rôle de narrateur-miroir. Chacun des interlocuteurs
assume donc le triple rôle d’émetteur, de récepteur
et de témoin.
Émetteur, il crée l’événement
en soumettant à son vis-à-vis une proposition dont
les fonctions sont multiples.
Récepteur, il propose un
cadre et une trame à l’image et au propos de son
interlocuteur, dont il produit une analyse instantanée.
La logique du propos de l’émetteur est donc déterminée
par la réaction du récepteur. Cette fonction du
récepteur est à rapprocher de celle de l’interviewer,
en ce sens que le récepteur est en position d’observateur
par rapport à l’émetteur et à son propos.
La réaction du récepteur
peut elle-même être objectivée du point de vue d’un
tiers. Autrement dit, le tiers institue une deuxième
instance d’observation qui révèle l’interactivité
propre à la conversation. Ce cadre est à la fois
le lieu d’un éventuel témoin et celui du réalisateur-narrateur.
Mais c’est également le lieu d’où l’émetteur observe
la réaction de son vis-à-vis à son propos. Ce qu’il
lit, dans le regard de l’autre, c’est sa propre
image.
Il y a donc deux niveaux
de narration qui s’enchâssent. Le premier est assuré
par la présence active du vis-à-vis et le second
par la présence explicite ou implicite du tiers.
L’interversion des rôles d’émetteur et de récepteur
présuppose ou induit l’existence d’un champ d’observation
externe au dialogue où le jeu intersubjectif est
observable dans sa totalité. C’est le lieu où
s’élabore une logique commune aux propos de l’un
et de l’autre.
Le référent – l’événement
– est constitué de plusieurs points de vue qui peuvent
et doivent être décrits dans leur unicité et dans
leur interrelation.
Si A, B et C sont respectivement
locuteur, destinataire et témoin de l’échange, la
représentation de l’échange doit rendre compte à
la fois du point de vue de A sur B, du point de
vue de B sur A et du point de vue tiers du témoin
C, qui encadre les deux précédents.
En ce lieu commun s’élabore
la logique du propos, qu’elle soit assumée par le
jeu intersubjectif, et donc immanente à l’événement,
ou qu’elle soit prise en charge par le narrateur,
et donc transcendante à l’événement.
Quand A parle, B fait fonction
de miroir de A, C révèle quant à lui, le jeu de
B par rapport à A. C’est la position de témoin qui
juge des interférences logiques entre A et B.
Il y a donc trois degrés
d’enchâssement. B est en position d’extériorité
par rapport à A, et C en position d’extériorité
par rapport à {A ® B}. Le rapport de C à A est médiatisé
par B. Si le sens du message s’inverse, le jeu d’enchâssement
se transforme : le rapport de C à B est médiatisé
par A.
La problématique de l’interview
se ramène donc à la métamorphose d’un discours –
par nature discontinu et intersubjectif – en un
récit cohérent, structuré, accessible et interprétable
par un tiers.
Cette problématique de la
métamorphose du discours en récit (ou, plus généralement,
de la parole en écriture) met en évidence la nécessité
d’un dispositif de médiation qui explicite les éléments
pragmatiques propres au discours. Le discours est
fondamentalement ininterprétable en dehors de son
contexte de manifestation, alors que le récit se
doit de pérenniser sa signification indépendamment
du contexte de son énonciation.
L’explicitation du discours
ne peut se faire que du point de vue du tiers. Elle
est prise en charge, d’une façon très générale,
par les médias. Le processus médiatique lève l’ambiguïté
propre au jeu intersubjectif dont il donne une représentation
ou, plus exactement, il en transforme la nature
et il en déplace le lieu. L’interprétation de ce
qui s’échange ne se joue plus à l’intérieur du discours
de référence mais entre les acteurs du jeu énonciatif.
Le travail de mise en scène
propre aux médias a pour nécessité – et pour objet
– de déplacer le processus performatif, créateur
de sens, de l’univers propre au discours de référence
à l’univers énonciatif, autrement dit de la « scène »
à la « salle ».
C’est ainsi que l’espace d’interprétation offert au spectateur est déterminé
à la fois par le support de médiation et par la
sophistication relative des choix de mise en scène. [24]
Qu’est-ce donc que rapporter un propos ? Est-ce se situer à la place de la personne
qui le profère ? A celle de celui à qui il est destiné
? Ou encore en un troisième lieu qui serait soit
la place d’un témoin de l’événement, soit la place
d’un observateur extérieur à l’événement
[25] ?
Faut-il mêler tous ces points de vue ou, à chaque
instant, privilégier l’un ou l’autre suivant en
cela quelque progression logique qui serait soit
inhérente à l’événement soit révélatrice de l’intelligence
du narrateur ?
La volonté de donner une représentation immanente et totalisante de l’événement
peut amener le narrateur à analyser l’événement
en autant de récits qu’il existe de points de vue.
On peut imaginer pour ce faire un dispositif enregistrant
les perceptions sonores et visuelles de chacun des
acteurs et les restituant sur un ensemble de moniteurs.
Dans le cas d’un dialogue, on aurait deux écrans
côte à côte [26] ,
simulant chacun le regard et l’ouïe de l’un des
interlocuteurs. Mais quelle serait donc la réalité
du point de vue du spectateur observant les deux
écrans ? Point de vue du tiers exclu (voyeur) ?
Certes non, mais bien point de vue artificiellement
reconstitué d’une double présence simultanée à l’événement.
Le spectateur serait censé être à la fois l’un et
l’autre des interlocuteurs.
Si la simulation est parfaite,
le spectateur aura l’étrange sensation que l’un
et l’autre interlocuteurs
ne conversent pas ensemble mais s’adressent à lui
spectateur. En ce cas, il se trouve en effet projeté
dans le lieu de l’énonciation à la place même de
l’un et l’autre interlocuteurs. Il cesse dès lors
d’être spectateur sans pour autant acquérir le rôle
d’acteur. Confronté aux images simultanées des deux
interlocuteurs, le spectateur concentre alternativement
ses regards sur l’un ou l’autre de ses vis-à-vis,
suivant la trajectoire du message, et révèle ainsi
un parcours signifiant de l’événement. Ce
mouvement manifeste que les divers points de vue
ne sont pas identiquement porteurs de signification
par rapport à l’événement. Le choix parmi les points
de vue disponibles, donne lieu à une segmentation
du propos qui est le propre du narrateur (i.e.
du réalisateur).
Pour restituer le discours
d’un orateur doit-on filmer la salle (on révèle
l’effet de la fonction impressive du discours) ou
le visage (voire le corps) de l’orateur (on révèle
la fonction expressive, l’intention consciente ou
inconsciente de l’orateur) ?
Doit-on filmer les deux
simultanément et laisser au spectateur le soin d’interpréter
les interactions visibles entre le propos de l’un
et le comportement des autres ?
Ou encore, montrera-t-on
alternativement les uns et les autres, mais le choix
du narrateur n’influera-t-il pas alors sur l’interprétation
de l’événement par le spectateur ?
À vrai dire, les trois cadres
disponibles ne sont pas équivalents ; ils sont subordonnés
les uns aux autres. Ainsi que nous l’avons vu précédemment,
l’accès à l’expression du sujet est médiatisé par
le regard de l’autre. Explicite ou implicite, présent
en amorce ou en contrechamp, l’autre est un cadre
à franchir pour accéder au sujet. Ce que l’on peut
formuler de la façon suivante : la médiatisation
imaginaire est nécessaire à l’interprétation du
référent.
En fait, s’il y a une place
pour un tiers dans une conversation, place de témoin
ou de narrateur qui comprend quelque chose à ce
qui s’échange, c’est que cette place est toujours
déjà présente dans le jeu intersubjectif. L’acteur
a toujours trois types de rapport à l’événement
: un rapport réflexif, un regard qui interpelle
et un regard qui constate.
Le rapport réflexif est
expressif, le regard qui interpelle saisit le regard
de l’autre, le regard qui constate voit sa propre
image dans les yeux de l’autre. Et cette image-là
est objective, étrangère. Elle ne peut être perçue
que parce que le sujet se situe alors en un lieu
tiers, hors de son propre corps. Le lieu où le locuteur
se voit en même temps que l’autre est le lieu du
tiers ou du narrateur. La restitution d’un discours
simule l’évolution du message – sa trajectoire sursignifiante
– en jouant alternativement sur les regards et sur
les points de vue de l’un et de l’autre. Elle tend
ainsi à déterminer une place du narrateur où viendra
également s’installer le spectateur.
Il existe un point de vue logique sur le récit, qui donne une image de l’ensemble
des fonctions à l’œuvre. Ce point de vue mêle la
logique immanente au propos et la logique propre
au regard du narrateur. Nous en venons ainsi à l’idée
que l’espace du discours n’est pas homogène par
rapport au sens de ce qui s’y produit mais qu’à
chaque instant un ou plusieurs foyers de signification
s’y révèlent, instituant un ordre dans l’émergence
des signifiants ou encore un parcours du message.
Ce foyer de la signification est un lieu potentiellement
consensuel, c’est-à-dire que l’ensemble des acteurs
s’y rejoignent en position de témoin ou de narrateur
(sans doute pas toujours, et sans doute pas de façon
continue mais c’est bien l’ensemble des segments
consensuels qui constituent à proprement parler
le résultat de l’échange ou encore son récit potentiel).
Participer à une conversation, c'est donc essayer
de rejoindre l'autre en un lieu où l'on est à la
fois témoin de sa propre performance et de la performance
de l'autre. À chaque instant, l’évolution du message
et de la situation de communication tend à privilégier
un cadre. Un événement en effet ne se réduit pas
à l’addition des subjectivités à l’œuvre mais plutôt
à la circulation et à la métamorphose d’un message
qui est premier et constituant de la situation.
Cette circulation du message dans le discours donne
lieu à une confrontation entre les acteurs qui,
d’une certaine façon, sont soumis à son parcours,
alors que dans le récit tout se passe comme si le
narrateur était lui-même le deux ex machina
qui élucide ou élabore a priori la nécessité
et la logique de l’échange. Du discours au récit,
le sujet passe d’une situation de soumission au
message et au jeu intersubjectif, à une situation
de maîtrise et de création. La représentation, en
révélant le parcours du message, métamorphose l’ordre
réel en ordre logique [27].
L’événement est à la fois
l’expérience vécue par chacun de ses acteurs (l’idée
que chacun se fait de ce que vivent les autres ou
l’idée que chacun se fait du regard de l’autre)
et la somme « géométrique » que le narrateur
(ou celui qui pour une raison ou pour une autre
veut bien prendre en charge le récit) réalise de
l’événement. A strictement parler, le récit dans
sa fonction totalisante et réductrice, se fait toujours
du lieu du tiers. Le récit ne commence que lorsque
l’événement est clos. Ainsi toutes les formes propres
au discours, qui parsèment le récit, ne fonctionnent
que comme des parenthèses « mimétiques ».
Le metteur en scène, narrateur
de l’événement, a la liberté de privilégier l’un
ou l’autre des cadres disponibles. Il peut adopter,
indifféremment l’un ou l’autre des points de vue.
Le choix des cadres et des angles de narration lui
permet de révéler les fonctions multiples du message
et/ou d’en privilégier l’un ou l’autre. La logique
de la mise en scène peut ainsi tendre à épouser
la logique propre à l’évolution de l’événement ou
l’interpréter en toute liberté.
L’étude des dispositifs narratifs audiovisuels propres à l’interview, offre
un vaste panorama des relations que peuvent entretenir
les univers référentiel et énonciatif. L’interview,
dans ses multiples avatars, est en effet un lieu
d’observation privilégié des contradictions pragmatiques
propres aux programmes télévisuels.
L’interviewer joue le rôle
d’un miroir intelligent qui radicalise, en l’objectivant,
le rapport que tout individu entretient à sa propre
image. Les choix de mise en scène portent à la fois
sur le décor, la durée de l’entretien et la ponctuation
des propos.
Ø
Le décor tend à organiser ou à structurer
l’espace de l’échange pour en faciliter le développement
ainsi que la représentation. Il prend donc en compte
à la fois les contraintes propres à la dynamique
de l’échange et à la logique de la diffusion. Il
anticipe les rôles de chacun des acteurs et ménage
les effets de mise en scène (quant à la position
et aux mouvements des caméras, en particulier).
Les places attribuées à chacun des protagonistes
se distribuent à la fois selon le ou les axes de
référence de la dynamique de l’échange et selon
le ou les axes de référence de la logique énonciative.
Toutes ces conventions évoluent selon un usage soumis
aux modes et aux enjeux de la programmation.
Ø
La
durée de l’entretien répond le plus souvent à la
logique du dispositif de diffusion. Ce qui n’est
pas sans influence sur la configuration et le rythme
de la ponctuation discursive. La durée et le rythme
de l’échange en conditionnent évidemment le contenu.
Ø
La
ponctuation, ou l’enchaînement des tours de parole,
qui est souvent le lieu privilégié d’observation
de l’évolution de l’échange, est également l’objet
de toutes les convoitises intradiégétiques et extradiégétiques.
Elle peut donner lieu à un accord ou rester le privilège
du meneur de jeu, représentant le metteur en scène,
mais reste en tous cas sous le contrôle du réalisateur
qui impose en dernier recours le découpage final.
La ponctuation du propos détermine en dernière analyse
la durée de présence de chacun des interlocuteurs
à l’image.
Nous notons dès à présent
que les logiques diégétique et énonciative développent
des stratégies autonomes, ou largement indépendantes,
à l’intérieur d’un même projet narratif. Cette situation
ne peut manquer de donner lieu à des conflits ou
des contradictions entre contenu et mise en scène.
Ces conflits pragmatiques sont un enjeu essentiel
de l’interprétation en ce sens que contrairement
à l’idée communément admise, la réalité – sinon
la vérité – n’est pas du côté du contenu mais bien
du côté de la mise en scène
[28]. Le cadre en effet
sépare le champ – imaginaire – du spectacle de l’espace
– réel – de son énonciation.
La diffusion en direct respecte
l’événement dans son intégrité. Le dispositif narratif
peut être réduit au minimum, une caméra fixe couvrant
la totalité du champ, pendant la totalité de l’événement.
L’angle que fait l’axe de la caméra par rapport
à l’axe de la conversation est alors la seule manifestation
concrète du projet narratif. En effet, si l’objet
de l’enregistrement est bien une interview (et non
une conversation : voir supra), l’angle
de prise de vues privilégiera la personne interviewée,
tendant par là même à éloigner l’interviewer du
foyer de l’événement et à le rapprocher du point
de vue extradiégétique
d’où se fait l’énonciation (i. e. l’objectif
de la caméra). Plus l’interviewer tend à limiter
son intervention à une fonction sémantique, c’est-à-dire
à entretenir et à relancer la parole, ou encore
à manifester les liens logiques latents aux propositions
émises par l’interviewé, plus il s’efface du champ.
En effet, la présence physique de l’interviewer,
ses gestes, ses expressions, révèlent soit la fonction
expressive de ses questions, soit la fonction impressive
des propos de son interlocuteur, toutes manifestations
qui gênent le rapport direct de l’interviewé au
spectateur. Dans le même ordre d’idée, les interventions
verbales de l’interviewer sont alors réduites au
minimum : elles n’ont pour strict objet que
de lancer, de faire rebondir ou de clarifier la
logique immanente au propos.
La présence de l’interviewer
en amorce révèle parfois son appartenance aux deux
champs disjoints de l’événement et de l’énonciation.
L’amorce manifeste l’ambivalence du personnage qui
est à la fois partie prenante du jeu intersubjectif
propre à l’échange, et metteur en scène, médiateur
d’un récit qui s’adresse au spectateur.
Le parti pris d’extraire
complètement l’interviewer du champ du spectacle,
le fait basculer dans le champ de la narration,
du côté du spectateur. En ce cas de figure, il existe
encore une progression narrative, qui est liée à
l’ouverture relative de l’angle de narration. Plus
l’angle est aigu, plus l’interviewer est identifié
au narrateur, voire au spectateur, plus il est large,
plus l’interviewer est perçu comme appartenant au
hors champ (et non au hors cadre) de l’événement.
Le cas limite est celui
où l’angle est nul. En ce cas, la caméra et l’interviewer
se situent en un même lieu. Cette situation est
assez rare en raison des problèmes techniques et
logistiques qu’elle soulève. On l’identifie souvent,
à tort, à la position occupée par le présentateur
du journal télévisé, qui s’adresse, à travers la
caméra, au spectateur. L’interviewé confronté à
un « homme-caméra » ne s’adresse pas, quant à lui,
au spectateur mais bien au narrateur du récit (qu’il
est en train de faire !) dont la présence,
transparente ou implicite, est indiscutable.
La position de l’interviewer
simule en fait une fonction interne au sujet. La
fonction narrative logique, sans cesse à l’œuvre,
permet au sujet de s’objectiver par rapport à lui-même,
de structurer son image et son histoire. C’est
pourquoi la simulation de la subjectivité du sujet
(narrateur de sa propre histoire), pour peu qu’elle
n’entende pas se limiter à la fonction sensorielle,
ne révèle pas le regard du sujet, mais bien son
expression. Le Je de la parole ne correspond
pas au regard porté sur l’objet mais à l’image que
le sujet a de lui-même du point de vue du miroir
que simule le narrateur. Le sujet qui dit Je
se regarde en miroir.
Un pas de plus dans l’élargissement du dispositif narratif peut être franchi
si l’interview est transmise en différé. En effet,
la transmission en différé offre au réalisateur
la possibilité d’intervenir sur la structure de
l’interview. Cette intervention peut prendre la
forme d’une segmentation ou d’un effacement de l’une
ou l’autre partie du propos. Elle peut également
prendre la forme d’un réarrangement des éléments
fragmentés. Cette intervention a posteriori
du narrateur peut être, ou non, rendue manifeste
dans le produit final, selon qu’elle épouse, ou
non, les fractures propres à la logique du propos
[29].
Le montage sonore se
fonde, dans le meilleur des cas, sur le respect
de la cohérence morphologique interne des unités
verbales et sur la cohérence sémantique implicite
externe au discours. Il est facilité par les temps
de « silence » caractérisant la fragmentation du
discours. Le montage visuel, s’il veut simuler de
même une continuité, est tenu d’analyser et de prendre
en compte les unités propres à la perception visuelle.
Le rapport entre la parole et le silence dans l’univers
sonore est un rapport d’intensité. La parole se
surimpose à l’ambiance sonore. On peut dire que
la parole est un objet sonore qui recouvre en partie
le décor sonore ambiant. De même, un objet ou un
personnage sont-ils identifiés comme se détachant
sur un décor ; d’où le double usage, fréquent
dans le montage d’interview, du fondu et du plan
de coupe. Le fondu au noir, suivi d’une ouverture
au noir, accompagne la baisse d’intensité sonore
caractérisant la fin de la proposition verbale ;
le plan de coupe manifeste le retour au décor ambiant
caractérisant la fin d’un mouvement visuel. Ces
deux procédés classiques du montage d’interviews
ont le défaut de révéler plus ou moins l’intervention
du narrateur. Une autre technique est donc utilisée
qui se fonde non plus sur la structure logique propre
à l’objet représenté mais sur la structure logique
propre au narrateur (voire au spectateur). Le problème
en ce cas n’est pas (seulement) d’analyser les fractures
propres à l’événement — fin d’un mouvement, clignement
d’œil, gestes divers, etc. — mais de simuler les
fractures propres à l’attention du narrateur ou
du spectateur. Il s’agit de faire basculer l’image
du côté de la narration.
Deux procédés sont utilisés pour ce faire : d’une part la multiplication
des points de vue, d’autre part l’utilisation du
contrechamp. Dans l’un et l’autre cas, la position
de l’interviewer cesse de se confondre avec celle
du narrateur. On tend donc à une séparation plus
nette des deux instances de l’événement et de la
représentation correspondant à une mise en scène
plus élaborée du propos.
La multiplication des points
de vue et des cadrages nécessite soit l’utilisation
de plusieurs caméras, soit un déplacement, objectif
ou subjectif, de la caméra utilisée. En chaque cas
la logique propre aux mouvements de caméra relève
de la logique du narrateur, qu’elle soit déléguée
à l’opérateur ou révélée par le mixage en direct.
Cette logique de la prise de vues, puis du montage
direct ou différé, s’inspire soit de la logique
du propos (on profite des temps faibles pour déplacer
la caméra, on accentue les temps forts en serrant
le cadre) soit du projet ou de la lecture du narraur
(qui peut fausser ou contredire la logique immanente
au propos, en accentuant les défauts, en mettant
l’accent sur les contradictions, etc.).
En tous cas, le montage qui peut être réalisé en différé à partir des
éléments ainsi filmés, a la possibilité de faire
alterner, selon une continuité subjective, un ensemble
de prises de vues qui manifestent ainsi à la fois
des éléments objectifs (diégétiques) et des éléments
subjectifs (narratifs). Ce qui est proposé dès lors
au spectateur n’est plus le spectacle d’un événement
mais son récit, c’est-à-dire la manifestation du
regard et de la logique du narrateur. La continuité
du récit se substitue à la continuité de l’événement.
Conclusion
Le récit audiovisuel est le lieu d’une double confrontation entre logique de
l’énoncé et logique de l’énonciation d’une part, logique
du verbe et logique de l’image d’autre part. C’est
ainsi que le sens de ce qui est donné à voir et à
entendre au spectateur procède d’une synthèse complexe
entre contenu (référentiel) de l’image et du son d’une
part, mise en image et commentaire d’autre part.
L’enregistrement et la représentation des entretiens et des débats procède de
la même logique et relève des mêmes contraintes. La
révélation du dispositif énonciatif permet donc la
mise en évidence des tensions, contradictions – voire
paradoxes – pragmatiques qui procèdent de la combinaison
de logiques hétérogènes ou de partis pris, conscients
ou inconscients du narrateur-réalisateur.
Notes
[28] « Le discours évolue
[...] dans deux dimensions différentes : à côté
de ce que dit un énoncé (l’état de choses qu’il représente),
il y a ce qu’il montre du fait de son énonciation.
Dès lors, il peut y avoir, dans certains cas, une
contradiction entre ce qui est dit et ce qui
est montré. Les contradictions de ce type, appelées
contradictions pragmatiques, doivent être soigneusement
distinguées des contradictions logiques qui sont des
contradictions internes à ce qui est dit » François
Récanati (1979, p. 195).
[21] Cet article a été publié dans La mise en scène du
discours audiovisuel, l'Harmattan, Jean-Paul
Desgoutte, éd. (1999).
[22] L’utilisation spécifique
du mot interview et la pratique même de l’interview
sont attachées aux débuts du journalisme moderne
tel qu’il a été inventé et mis en œuvre par les
Anglo-saxons. Le journaliste est un témoin sans
qualité particulière. Il est censé représenter
le public le plus large. Les questions qu’il se
pose doivent être celles que se poserait tout un
chacun à sa place. Ce n’est donc pas un spécialiste.
Ce n’est pas non plus, à proprement parler, le représentant
d’un groupe ou d’une institution. Il n’a pas d’autre
mission avouée que de raconter ce qu’il voit, de
dire ce qu’il entend. En ce sens, il n’appartient
pas à la scène qu’il décrit mais bien à la mise
en scène, au dispositif énonciatif, au canal médiatique.
L’interview, à l’instar du roman réaliste, prétend
donner accès à la réalité même du référent, hors
de toute déformation énonciative.
« Le
réalisme n’est pas seulement un discours aussi particulier
et aussi réglé que les autres ; l’une de ses règles
a un statut bien particulier : elle a pour effet
de dissimuler toute règle et de vous donner l’impression
que le discours est en lui-même parfaitement transparent,
autant dire inexistant, et que nous avons affaire
à du vécu brut, à une "tranche de vie" ».
Tzvetan Todorov (1982, p. 9)
Mais de fait l’interview n’est qu’un genre littéraire dont la forme et le
destin sont liés au développement des médias de
masse. Le journaliste de presse écrite est le premier
médiateur à se prétendre libre de toute interprétation
de la réalité qu’il décrit. Il donne accès au réel
afin de laisser le lecteur libre de ses opinions
et de ses jugements. Le développement technologique
va renforcer cet effet de réel. La radio en restituant
les caractéristiques individuelles de la parole,
propose en plus du contenu du propos le contexte
psychologique affectif tel qu’il se manifeste dans
le timbre, l’intensité et l’intonation de la voix.
Et l’image de cinéma, puis de télévision, parachève
l’effet de réalité en offrant au spectateur le contexte
visuel, spatial de l’entretien.
[23] Il tend, autrement dit à effacer le caractère intersubjectif
de l’échange. En ce sens, l’interview n’est pas
un discours, à peine un échange, mais le lieu et
le dispositif (narratif) qui autorisent à l’interviewé la manifestation d’une parole pleine à
l’usage d’un public virtuel. La parole est d’abord
une pratique du dialogue et le sujet construit son
identité linguistique, son JE, à partir des réponses
de l’autre, qui sont autant d’images spéculaires
de ses propos. C’est en ce sens que l’inconscient
se niche dans le discours de l’autre (Lacan,
1966). L’accès au récit, l’accès au monologue suppose
une phase ultérieure de construction linguistique
où le sujet intériorise son double en se situant
lui-même en position de tiers. Le dialogue avec
soi-même, qui achève l’image de soi, exige une scission
du sujet, car une parole pleine est une parole double,
unifiée du point de vue du tiers. C’est là que prend
place la talking cure freudienne, tout près
de l’interview journalistique en ce sens que le
thérapeute offre au patient un lieu d’observation
qui ne porte pas sur le contenu référentiel de ses
propos mais sur leur cohérence énonciative. L’analyste
comme le journaliste socialise la parole du sujet
en la confrontant au défilé radical de la mise en
scène.
[24] Le développement et la popularisation
de l’interview, sous ses multiples formes audiovisuelles,
sont liés à deux phénomènes concomitants, d’une
part l’essor d’un journalisme attentif à l’individu
– à l’homme sans qualités particulières – représentant
présumé de l’opinion collective, et d’autre part
la sophistication des moyens d’enregistrement et
de diffusion du son et de l’image. L’anonymat
et le réalisme font là fonction de garanties
d’authenticité – ou facilitent plus exactement la
reconnaissance et l’identification d’un public,
devenu, par le biais de l’audimat, de la consommation
et des élections, le véritable producteur des programmes.
Le processus de mise en scène permet d’adapter le
produit de consommation aux réactions du consommateur
et l’interview peut devenir le lieu privilégié d’une
mystification, qui fait passer de la forme pour
du contenu – le médiateur usant de son privilège
d’interprète pour cacher sa mise en forme derrière
la prétendue transparence du support. De fait et
contrairement à ce qu’il donne à voir, l’écran énonciatif
– le dispositif de représentation – implique dans
son effort même de transparence une mise en scène
de plus en plus sophistiquée.
[25] Sous
une forme ou sous une autre, cette question traverse
la « narratologie » : « [...]
Il nous semble que le découpage ordinaire est un
compromis entre trois systèmes d’analyse possible
de la réalité :1° une analyse purement logique
et descriptive (l’arme du crime près du cadavre) ;
2° une analyse psychologique intérieure au film,
c’est-à-dire conforme au point de vue de l’un des
protagonistes dans la situation donnée (le verre
de lait – peut-être empoisonné – que doit boire
Ingrid Bergman dans Notorious ou la bague
au doigt de Thérésa Wright dans l’Ombre d’un
doute) ; 3° enfin, une analyse psychologique
en fonction de l’intérêt du spectateur ; intérêt
spontané ou provoqué par le metteur en scène précisément
grâce à cette analyse : c’est le bouton de
porte tournant à l’insu du criminel qui se croit
seul (« attention ! » crieraient
les enfants à Guignol que le gendarme va surprendre) ».
André Bazin (1981, pp. 145-146)
[26] On note l’apparition, au début des années quatre-vingt-dix,
d’une figure narrative télévisuelle intéressante,
qui consiste à introduire dans le champ du locuteur
un moniteur révélant l’image de l’allocuteur. Le
cadre propre à la fonction impressive du propos
est ainsi rendu manifeste. Le contrechamp est inscrit
dans le champ, ce qui met en évidence la fonction
de subordination.
[27]
L’univers réel est continu.
Du point de vue du sujet, l’espace réel est explorable
dans sa continuité. Le sujet n’a pas la possibilité
réelle d’explorer l’espace de façon discontinue
ou fragmentaire. La trace de son parcours dans l’espace,
sa trajectoire, est continue. Parallèlement, et
de même, le temps du sujet est continu, orienté
et irréversible. Ajoutons que la conscience d’un
espace et d’un temps réel, qui outrepasse et englobe
celui reconnu par l’expérience réelle du sujet,
procède et présuppose la reconnaissance de l’autre
comme double de soi. Je ne partage l’espace que
si je reconnais l’autre comme mon identique ou mon
double. En reconnaissant l’autre comme mon double,
je prends place dans le monde à travers son regard.
En acceptant que l’autre puisse exister en dehors
de ma présence (hors de mon champ), j’accorde au
monde réel une existence objective indépendante
de moi. Ce n’est que par un détour imaginaire que
je peux accorder au monde une existence réelle.
Il en est de même du temps. L’originalité radicale
de mon rapport au temps ne peut être partagée. Et
si j’accepte de reconnaître l’autre après une absence,
c’est parce que j’admets d’une part qu’il possède
une temporalité propre, indépendante, identique
à la mienne, et que d’autre part nous participons
l’un et l’autre d’une même temporalité qui nous
outrepasse l’un et l’autre. Nous reconnaissons ainsi
trois types de rapports à l’espace et au temps :
·
le rapport individuel
perceptif, subjectif, le champ individuel, la trajectoire
d’exploration du réel, segment spatio-temporel continu,
·
le rapport à l’autre
avec qui je suis en relation, qu’on peut appeler
l’espace-contrechamp, en ce qu’il me met en scène
du point de vue de l’objet ou de la personne que
je regarde. L’autre fait fonction de cadre. Il ouvre
un espace imaginaire où je découvre ma propre image,
· le point
de vue d’un tiers abstrait, extérieur à l’événement,
au hic et nunc du sujet. Le point de vue
du tiers délimite un cadre «narratif» à l’intérieur
duquel Je suis présent avec l’autre. Le tiers-narrateur
n’intervient pas sur la dynamique du discours, même
si par son regard il constitue l’échange en objet,
réalisant ce faisant la clôture narrative de l’événement.
[29]
Chacun garde à l’esprit ces saucissonnages
d’interviews d’actualités où quelques plans collés
bout à bout restituent l’essentiel d’un discours.
Le procédé est légitime en ce sens qu’il ne s’intéresse
qu’au contenu du propos, et que, dans le meilleur
des cas, il en respecte les unités prosodiques,
voire la logique de l’enchaînement. Mais les sautes
d’images caractéristiques de ce genre de montage
révèlent l’« ellipse » narrative.
|