Extraction automatique d’arguments dans des textes

Extraction automatique d’arguments dans des textes

Description :

L’extraction automatique d’arguments est un domaine de recherche en plein essor dont le but est de découvrir les structures argumentatives d’un texte. La complexité des dynamiques argumentatives (due en particulier au caractère implicite de certains éléments argumentatifs ou à leur interdépendance) a motivé le développement d’outils de Traitement Automatique des Langues permettant leur identification. Ces outils sont complexes à l’image de ce phénomène. Des outils d’apprentissage automatique ainsi que des grammaires peuvent être mis au point afin de reconnaître et extraire des arguments provenant de différentes sources. Pour cela, des analyses détaillées de discours argumentatifs sont nécessaires afin de découvrir les aspects linguistiques de l’argumentation. Ces analyses sont ensuite utilisées soit pour créer manuellement des règles qui permettent leur reconnaissance automatique ou bien pour entraîner des algorithmes d’apprentissage automatique.

Objectif :

L’objectif de ce tutoriel est de présenter les concepts théoriques et linguistiques de l’argumentation, leur intégration dans différents types de discours, associés à la rhétorique et au framing, puis les technologies actuelles de l’extraction automatique d’arguments. Le tutoriel sera l’occasion, dans un premier temps, de familiariser les participants aux concepts théoriques de l’argumentation et aux méthodes et outils existants, puis de présenter les aspects plus techniques tels que l’annotation d’arguments et l’écriture de règles grammaticales et lexicales permettant la reconnaissance automatique d’arguments. Enfin, une présentation des aspects non-textuels de l’argumentation sera proposée afin de montrer la nécessité de prendre en compte les aspects non-verbaux de l’activité argumentative.

Organisateurs :

Patrick Saint-Dizier (Institut de Recherche en Informatique de Toulouse – IRIT)

Mathilde Janier (Université Grenoble Alpes – UGA)

Contacts :

mathildejanier@hotmail.com ou patrick_saintdizier@yahoo.fr

Description du tutoriel (déroulement, organisation, etc.) :

Le tutoriel sera décomposé en deux parties. Une première partie, théorique, reprendra l’état de l’art ainsi que les notions et concepts de l’argumentation ; la deuxième partie, similaire à des travaux dirigés, sera consacrée à la pratique (annotations d’arguments, prise en mains d’outils etc.):

I- L’argumentation

a- Qu’est-ce que l’argumentation ? : quelques repères et définitions. Argumentation et rhétorique, le framing.

b- La structure de l’argumentation : modèle de Toulmin, schémas d’argumentation (exemples, questions critiques), stratégies d’argumentation, graphes argumentatifs, différence entre argumentation et rhétorique, les divers cadres applicatifs (dialogues, débats, médiations, sur le web, dans les éditoriaux, etc.).

II- Les technologies et guides d’annotation : principes de l’analyse d’arguments, exemples de modèles et outils pour l’analyse d’arguments, les technologies d’annotation via des exemples de corpus. Nous soulignerons :

a- Les ressources linguistiques pour l’argumentation, en particulier le lexique. Structure des ‘claims’, des supports et des attaques ; évaluation de la force d’un support ou d’une attaque.

b- L’analyse en TALN : architectures (pipeline, etc.), structure des données, stratégies de traitement, les différentes étapes d’un système d’extraction d’arguments (repérage des unités, identification, détermination de l’orientation et de la force etc.).

c- Quelques ressources et systèmes existants : les domaines d’application, les principes de l’extraction automatique d’arguments, l’évaluation des résultats.

III- Quelques pistes de recherche : l’apport des connaissances dans l’extraction d’arguments, l’argumentation non verbale dans la vidéo et le son, les aspects éthiques de l’analyse d’arguments.

Outils utilisés :

Le support principal de ce tutoriel est le livre Argument Mining – Linguistic foundations. Des programmes et outils disponibles en ligne seront également utilisés pour l’annotation d’arguments.

Public cible (pré-requis scientifique, connaissance du domaine, etc.) :

Le tutoriel s’inscrit dans un domaine de recherche, à la fois théorique et applicatif, qui s’étend de la linguistique au traitement automatique des langues naturelles en passant par l’intelligence artificielle. Une connaissance basique de la linguistique et de l’informatique est nécessaire.

Durée :

une demi-journée