<-Back to home
<-Page à Aurélie
<- Work
<- Travaux

Etude du connecteur "d'autant plus que"
dans une optique de génération automatique.
Intégration au générateur CLEF
______________


Université Paris 7 - Ecole Doctorale Sciences du Langage
Mémoire présenté pour l'obtention du DEA de Linguistique Théorique, Descriptive et Automatique
(Option Linguistique Informatique)

Directeurs de Recherche: L. Danlos et S. Kahane

INTRODUCTION

En génération de texte, pour exprimer une même idée représentée par la forme logique simplifiée Lire(Pierre, livre), il est possible de construire une multitude de paraphrases : Pierre lit le livre. Le livre est lu par Pierre, Le livre, c'est Pierre qui le lit etc. Toutes ces phrases ont un sens équivalent, et pourtant, en contexte, elles ne sont pas toujours interchangeables. Ainsi, à la question Que fait Pierre ?on répondra naturellement Pierre lit le livre et non pas, Le livre, c'est Pierre qui le lit. Par contre, si la question est Qui est ce qui lit le livre ? on répondra volontiers C'est Pierre qui lit le livre ou encore Le livre, c'est Pierre qui le lit si on souhaite insister sur le livre. La réponse Pierre lit le livre. parfaite pour la question précédente paraîtrait déplacée dans ce contexte.
On voit donc que l'emploi une phrase plutôt qu'une autre est déterminé par deux facteurs principaux : l'enchaînement des phrases à l'intérieur d'un discours, et l'intention communicative du locuteur, c'est à dire, le relief que celui ci souhaite donner à sa phrase. Notre étude s'est donc axée sur l'analyse de la structure discursive, et sur l'enchaînement des relations de discours.
Nous avons amorcé notre travail par l'analyse d'un texte court contenant un discours complet. Le texte choisi relate la victoire d'une équipe de Hockey dans un championnat. Il contient un échantillon des relations de discours classiques, ainsi que des enchaînements causaux courants en langue, mais requérant à notre sens une étude approfondie afin d'en proposer une représentation utile à la fois en analyse et en génération de texte. Ainsi, l'étude linguistique de d'autant plus que que nous avons ensuite réalisée nous conduit à introduire deux nouvelles relations de discours, et aboutit à l'intégration à la plateforme CLEF développée à Lattice d'un module permettant de générer des phrases contenant d'autant plus que.

Ce mémoire comporte trois parties. La première vise à présenter le cadre théorique de notre étude, c'est à dire la génération de textes et les formalismes de représentation du discours utilisés par le générateur CLEF. Elle contient également l'analyse détaillée des relations de discours dans un texte complet. La deuxième partie présente une étude linguistique sur corpus du phrasème d'autant plus que. La dernière partie est consacrée aux emplois de d'autant plus que en tant que connecteur et propose l'introduction de deux nouvelles relations de discours permettant de rendre compte de l'articulation du discours réalisée par d'autant plus que, et leur implémentation dans le générateur CLEF.

REFERENCES

BALICCO, L. BEN-ALI, S. PONTON, C. et POUCHOT, S. (2000) Apports de la Génération Automatique de Textes en Langue Naturelle à la Recherche d'Information - ICM - Université Stendhal (article en ligne le 13 juillet 2002 à l'URL : http://www.slis.ualberta.ca/cais2000/balicco.htm)

CORBLIN, F. (2002), Représentation du discours et sémantique formelle, Séminaire du DEA de Linguistique Théorique, Formelle et Automatique, Université Paris 7.

DANLOS, L. (1988). " Connecteurs et relations causales ", in Langue Française 77, pp. 92-127.

DANLOS, L. (1998), G-TAG : un formalisme lexicalisé pour la génération de textes inspiré de TAG. Traitement Automatique des Langues - T.A.L., vol 39. n° 2.

DANLOS, L., GAIFFE, B. et ROUSSARIE, L. (2001). " Document Structuring à la SDRT ", Workshop on Text Generation, ACL, Toulouse.

DANLOS, L. et EL GHALI, A. (2002), A complete and integreted NLG system using IA and NLU tools, COLING'02. DANLOS, L. et LAPALME, G. (1997), Interface entre les modules " Quoi dire ? " et " Comment le dire? " dans un système de génération de textes, RIAO'97 - Session Spéciale sur la coopération France-Québec en ingénierie linguistique, Université Mc Gill, Montréal, Juin 1997, p741-750.

DELORT, L. (2002), Intégration d'informations sur la structure communicative dans un sysème de génération de textes. Mémoire de DEA de Linguistique Informatique, Université Paris 7.

DUCROT, O (1991), Dire et ne pas dire

DUCROT, O. et al. (1980) Les mots du Discours - Collection " le sens commun " dirigée par P. Bourdieu aux éditions de minuit.

DUCROT, TODOROV (1972), article " Catégorie ", Dictionnaire encyclopédique des sciences du langage - Paris, Le Seuil.

ELHADAD, M. (1992), Using Argumentation to Control Lexical Choice : A Functionnal Unification Implemetation, Thèse de PhD, Columbia University, New York.

EL GHALI, A., (2002) Use of Description Logic and SDRT in a NLG System, INLG'02

GREVISSE, M. (1981), Le bon usage.

IORDANSKAJA, L. and MEL'CUK, I. (1999) Textual Connectors Across Languages: French EN EFFET vs. Russian V SAMOM DELE. RASK, 9/10 [= J. Mey (ed.) E Pluribus Una], 305-347.

KAHANE, S. (2002). Grammaire d' Unification Sens-Texte : Vers un modèle mathématique articulé de la langue - Document de synthèse pour l' Habilitation à Diriger des Recherches, École Doctorale Sciences du Langage, Université Denis Diderot, Paris 7.

LAMBRECHT, K. (1994). Information Structure and Sentence Form : Topic, focus and the mental representations of discourse referents - Cambridge Studies in Linguistics 71, Cambridge University Press.

LAURENS, O. (1991), Les phrases comparatives en français - description linguistique et implémentation dans Eurotra. Eurotra, rapport technique n°3. CNRS - Paris 7

MEL'CUK, I. (1997), Vers une linguistique Sens-Texte, Leçon inaugurale. Paris, Collège de France, chaire internationnale.

MEL'CUK, I. avec ARBATCHEWSKY-JUMARIE, N. ELNITSKY, L. IORDANSKAJA, L. et LESSARD, A. (1999) Dictionnaire explicatif et combinatoire du français contemporain - Recherches lexico-sémantiques IV. Montréal: Presses de l'Université de Montréal.

MEUNIER, F. (1997) : Implémentation de G-TAG, formalisme pour la génération inspirée des grammaires d'arbres adjoints, Thèse de Doctorat en Informatique, Université de Paris 7.

POLGUERE, A. (1998), Pour un modèle stratifié de la lexicalisation en génération de texte - Traitement Automatique des Langues T.A.L., vol 39, n°2 p57-76.

ROUSSARIE, L. (2000) - Un modèle théorique d'inférence de structures sémantiques et discursives dans le cadre de la génération automatique de textes, Thèse de Doctorat en Informatique, Université de Paris 7.

Sept. 2002