Le problème de l’interprétation des données à partir d’un corpus bilingue. L’exemple du discours des trois chefs de parti sur la motion de reconnaissance du « Québec comme société distincte au sein du Canada »

Le problème de l'interprétation des données à partir d'un corpus bilingue. L'exemple du discours des trois chefs de parti sur la motion de reconnaissance du « Québec comme société distincte au sein du Canada »

Duchastel, Jules, François Daoust et Dimitri della Faille (2008) “Le problème de l’interprétation des
données à partir d’un corpus bilingue. L’exemple du discours des trois chefs de parti sur la motion de
reconnaissance du « Québec comme société distincte au sein du Canada »”, dans Heiden, Serge et
Bénédicte Pincemin (sous la dir.), Actes des 9es Journées d’analyse de données textuelles, Lyon, Presses
Universitaires de Lyon, pp. 421-431.

ABSTRACT:
We are examining the problem of interpreting data with different statistical techniques (SATO, Lexico and
Alceste) applied to bilingual corpora. We are interested in the variation of interpretations based on the same
discursive data along two main lines: language and software. We are comparing the results obtained on both
linguistic versions of the speeches pronounced by the three party leaders on the motion recognizing “Quebec as a
distinct society within Canada”. Based on the observation that results generated by similar statistical techniques
vary from one linguistic version to the other, we are questioning the validity of some interpretations induced by
different sets of results. Our conclusion is that particular results may only be considered as indications leading to
local interpretations that must be reformulated in a more global context. Our findings also show that taking into
account the other linguistic version can produce new hermeneutical cues.

RÉSUMÉ:
Nous proposons d’examiner le problème de l’interprétation des données produites par des analyseurs statistiques
(SATO, Lexico et Alceste) à partir d’un corpus bilingue. Nous nous intéressons à la variation des interprétations
des mêmes données discursives selon deux axes : linguistique et logiciel. Nous comparons les résultats
d’analyse, dans les deux langues officielles du Canada, du discours des trois chefs de parti, prononcés à la
chambre des communes d’Ottawa à l’occasion de la présentation par le gouvernement de la « motion visant à
reconnaître le Québec comme société distincte au sein du Canada ». Sur la base du constat de la variation des
résultats générés par les mêmes techniques statistiques à partir des deux versions linguistiques, nous nous
interrogeons sur la validité de l’interprétation des données ainsi produites. Nous formulons la conclusion que les
résultats obtenus à partir de ces analyses ne représentent que des indices partiels menant à des interprétations
locales devant nécessairement être rapportées à un ensemble englobant d’interprétation globale. Nous établissons
également que le recours aux analyses dans l’autre langue est susceptible de faire surgir de nouveaux indices
herméneutiques.