CBSEAS, Une Approche Générique pour le Résumé Automatique

CBSEAS, Une Approche Générique pour le Résumé Automatique

Le résumé automatique est un axe de recherche encore ouvert. Les campagnes d’éva- luation récentes montrent que les systèmes actuels de résumé automatique ont encore du chemin à parcourir avant d’égaler les performances des résumés manuels. Nous situons notre travail dans le cadre du résumé automatique multi-documents. C’est à l’heure ac- tuelle la branche la plus explorée du résumé automatique ; les besoins industriels dans ce domaine sont en effet importants et ont conduit à un renouveau de la recherche en génération automatique de synthèses multi-documents. Les systèmes de génération de résumés par extraction se fondent soit sur la centra-lité seule et l’élimination dans un second temps de la redondance afin de maximiser la diversité (Salgueiro Pardo et al., 2002; Radev et al., 2001a; Saggion, 2005; Boudin et Torres-Moreno, 2007), soit sur la similarité à une requête utilisateur associée à l’élimina-tion de la redondance (Carbonell et Goldstein, 1998; Boudin et al., 2008b). Nous estimons que la gestion de la diversité est importante dans le cadre du résumé multi-documents, et nous présentons ici une approche qui vise à établir un modèle de représentation du corpus qui rend compte à la fois de la diversité et de la centralité avant de sélectionner les phrases à extraire. Générer automatiquement des résumés multi-documents ajoute une problématique supplémentaire à la génération de résumés mono-document : l’élimination de la redon- dance. La redondance d’information est en effet plus présente sur plusieurs documents que dans un document unique. Le risque d’extraire plusieurs phrases véhiculant la même information est donc plus élevé.

Cette redondance d’information apporte cependant des informations supplémentaires pour la réalisation d’un résumé, qu’elle soit automatique ou non. En effet, les infor- mations centrales d’un groupe de documents ont de fortes chances d’être reprises sur plusieurs documents (cf fig. 3.1). Par conséquent, réussir à identifier les passages re- dondants permet non seulement l’élimination de la redondance du résumé final – un des critères de qualité des résumés (cf §2) –, mais également de mieux sélectionner les phrases à extraire dans le résumé. De plus, nous considérons que dans un groupe de documents à résumer, il n’existe pas une information la plus centrale, mais une multitude d’informations qui constituent la diversité informationnelle des documents. Chaque information est véhiculée par une ou plusieurs phrases dont une peut être identifiée comme la plus représentative. Le résumé idéal est alors constitué de chaque phrase la plus représentative des informations les plus importantes.Des systèmes de résumé automatique récents se sont concentrés sur la détection de redondances et la fusion d’information (Barzilay et McKeown, 2005) en utilisant des techniques linguistiques fortement dépendantes de la langue. D’autres systèmes fondés sur l’analyse statistique ont tenté de rendre compte du phenomène de dépendance entre la centralité d’une information et son occurence en corpus (Erkan et Radev, 2004). Nous voulons aller plus loin que ces systèmes statistiques, tout en restant assez indépendant de la langue pour permettre la généricité de notre approche. Notre système pourra alors, sans avoir à effectuer de changements majeurs, être opéré sur différentes langues tout en gardant le même niveau de performances. Ceci exclut donc tout traitement linguistique poussé.

La France n’est « pas surprise » par les incidents qui ont opposé ses soldats lundi aux rebelles de l’Ouest en Côte d’Ivoire et reste déterminée à faire avancer le processus de paix, a dit mardi le ministère français des Affaires étrangères. « Nous ne sommes pas surpris par les événements d’hier (lundi) à l’Ouest de la Côte d’Ivoire où la situation est plus incontrôlable, plus volatile », a déclaré le porte-parole du ministère, François Rivasseau. Ces incidents, qui ont fait 30 morts dans les rangs des rebelles et neuf blessés dans ceux de l’armée française, sont le fruit de « bandes incontrôlées », a-t-il ajouté. Mais, « ceci ne fait que renforcer notre détermination à faire avancer le processus de paix », a encore assuré M. Rivasseau. La France a invité toutes les parties ivoiriennes à une table ronde politique la semaine prochaine à Paris pour tenter de trouver une solution à la crise qui secoue la Côte d’Ivoire, coupée en deux entre le nord conquis par les rebelles et le sud tenu par les forces loyales au président ivoirien Laurent Gbagbo. L’un des mouvements rebelles, le Mouvement patriotique de Côte d’Ivoire (MPCI), a laissé entendre mardi que les affrontements de la veille pourraient « compromettre dangereusement » la réunion de Paris. Interrogé sur ce point, M. Rivasseau a rappelé que toutes les parties avaient été invitées à se rendre à Paris où elles étaient les « bienvenues », y compris les rebelles de l’Ouest que l’ambassadeur de France à Abidjan Gildas le Lidec doit rencontrer à partir de mercredi. « Ils sont invités (à Paris) et nous voulons qu’ils viennent », a déclaré le porte-parole du quai d’Orsay. Lundi, à deux reprises, des combattants rebelles de l’ouest ivoirien se sont heurtés aux militaires français positionnés à Duékoué et le bilan des affrontements de la journée est de 30 morts chez les rebelles et de neuf soldats français blessés, dont un grièvement, selon l’état-major des armées françaises.

 

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *