SATO-XML : une plateforme Internet ouverte pour l’analyse de texte assistée par ordinateur

SATO-XML : une plateforme Internet ouverte pour l'analyse de texte assistée par ordinateur

Duchastel, Jules, François Daoust et Dimitri della Faille (2004) “SATO-XML : une plateforme Internet ouverte pour l’analyse de texte assistée par ordinateur”, dans Heiden, Serge et Bénédicte Pincemin (sous la dir.), 7es Journées d’analyse de données textuelles, Louvain-la-Neuve, Presses Universitaires de Louvain, pp. 353-363.

ABSTRACT:
In this contribution, we present a computer-based infrastructure available on the Internet, which allows the manipulation and analysis of text corpora. By the way of an HTML interface the researcher is given access to a personal workspace, a text library, some lexical resources, as well as software applications and procedures for a
collaborative work respectful of everyone’s data and specific analysis’ strategies. The SATO software, available in a client-server mode, allows the categorization of data and the iterative construction of protocols of analysis. XML gives the opportunity to save and exchange data in a standard format. Thus, the described data can be either imported from or exported to other software applications for statistical, linguistic or graphic treatments. The interface available on the Internet includes modes of simplified access to large documented corpora, in particular those of interest for Professor Jules Duchastel’s Canada Research Chair in Globalization, Citizenship and
Democracy. In this contribution, we are presenting a few exploratory analyses as examples of the possibilities of this computer-based infrastructure.

RÉSUMÉ:

Cet article présente une infrastructure informatique, accessible par le Web, qui permet de manipuler et d’analyser des corpus de textes. Une interface HTML donne au chercheur l’accès à un espace de travail personnel et à des librairies de textes, de ressources lexicales, de programmes et de procédures permettant d’envisager un travail coopératif qui respecte les stratégies d’analyse et les données de chacun. Au niveau des traitements, le logiciel SATO, accessible en mode « client-serveur » permet de catégoriser les données et de construire des protocoles d’analyse de façon itérative. La normalisation XML permet une conservation et un échange des données dans un format standard. Ainsi, les données décrites peuvent être importées ou exportées pour être traitées par divers logiciels statistiques, linguistiques ou graphiques. L’interface Web comprend aussi des modes simplifiés d’accès à de grands corpus documentés, en particulier ceux faisant partie des axes de recherche de la Chaire de recherche du Canada en Mondialisation, citoyenneté et démocratie du professeur Jules Duchastel. Dans cet article, quelques analyses exploratoires illustrent l’utilisation de cette infrastructure logicielle.