HackaTAL 2021

https://hackatal.github.io/2021/

Description :

Le HackaTAL, organisé depuis 2016, a pour vocation de compléter la conférence TALN par un événement satellite, ouvert à un public plus varié (étudiants, startups, domaines connexes, etc.) et moins axé sur les communications scientifiques. Cet événement propose des défis TAL aux participants (entre 20 et 40 selon les années), à réaliser pendant l’atelier, par groupes. Nous proposons d’organiser de nouveau cet atelier en 2021 à Lille.

Thématiques envisagées

Quelques sujets sont en cours d’exploration, nous en donnons ici une description générique, l’objectif étant d’en sélectionner deux qui seront précisés d’ici l’appel à participation.

Terminologies et simplifications dans le domaine de la santé. Le domaine de la santé comporte une terminologie et des énoncés complexes qui sont parfois difficiles à comprendre pour des non-spécialistes. Un exemple caractéristique concerne les notices de médicaments, à l’usage du grand public, mais dont les termes ou la formulation peut conduire et des erreurs, parfois graves. L’objectif serait d’élaborer des outils permettant de repérer ces énoncés complexes et d’en proposer de reformulations plus simples et compréhensibles. Nous explorons également des pistes sur le dossier médical.

Arguments, polémiques et complots. Avec les nouvelles technologies, plusieurs théories du complot se sont développées et propagées en ligne. L’objectif du défi sera de les caractériser, du point de vue linguistique autant que par leurs mécanismes de propagation. Nous proposerons d’analyser la manière dont ces théories se construisent et se développent en ligne.

Le défi comportera trois étapes principales :

– aspirer des messages depuis des espaces de discussion en ligne,

– extraire les arguments associés à la théorie du complot,

– analyser la construction et la propagation de la théorie du complot dans le temps.

Élections américaines. Très médiatisée, la campagne américaine de 2020 a fait l’objet de nombreuses études et collectes de tweets, d’articles ou autres. Nous proposons ici de nous intéresser à toute l’élection américaine et non uniquement à la période de campagne. Ainsi, tweets et articles de plusieurs étapes de l’élection devront permettre aux participants d’effectuer une fouille de texte permettant de représenter l’évolution langagière (champ lexical, argumentation, etc. ) des deux principaux partis politiques et de leurs candidats.

Les périodes sont :

1. période de campagne,

2. période d’élection (du premier scrutin à l’officialisation),

3. période de transition / passation de pouvoir.

Il sera intéressant d’évaluer la pertinence et la représentation des changements identifiés par les différents groupes de participants. Les analyses produites seront essentiellement qualitatives.

Organisation :

Outre les organisateurs de l’atelier (ci-dessous) et de la conférence TALN, nous avons pris contact avec quelques entités locales (EuraTechnologies, Alicante.fr, Lili.ai).

Le principe serait, dans les grandes lignes, le même que les années précédentes : atelier sur un jour et demi (dates pressenties : les 28 et 29 juin), présentation des défis, regroupement des participants par équipes dans le cadre de compétitions, interventions de conférenciers invités, développement tardif le premier soir, restitution des travaux par équipes et remise d’un prix selon un vote des organisateurs et participants.

Comité d’organisation :

– Rémi Cardon (CNRS / Université de Lille – STL)

– Loïc Grobol (Lattice – ENS / LLF – Université de Paris)

– Gaël Guibon (Télécom Paris – SNCF)

– Yannick Parmentier (Université de Lorrain – LORIA)

– Damien Nouvel (INALCO – ERTIM)

Durée :

Un jour et demi (par exemple de lundi midi à mardi après-midi, à adapter selon le planning TALN)