Cental

Centre de traitement automatique du langage
Center for Natural Language Processing

UCLouvain 🇧🇪

🇫🇷 Le CENTAL est une plateforme technologique de l’UCLouvain impliquée à la fois dans des activités de recherche et d’enseignement. Il collabore également aux projets de plusieurs centres de recherche de l’UCLouvain auxquels il apporte son expertise en matière de traitement informatique des données textuelles. Les contacts spécifiques avec des entreprises belges sont nombreux et prennent la forme

de prestations ponctuelles, d’activités de conseil (guidance scientifique de plus ou moins longue durée) ou encore de projets de recherche et développement.

🇬🇧CENTAL is a technological platform associated with UCLouvain’s Institute for Language and Communication. Its expertise in natural language processing can be applied to both academic and industrial projects, ranging from ad hoc consultancy activities and expert training to the development of research projects.

03/04/2026

Le Workshop TALA 2026 – New Trends in Automatized Language Assessment, c'est dans quelques jours — le 7 avril 2026, à Louvain-la-Neuve et en ligne !

Cette journée couvre l'évaluation automatique de la langue, la lisibilité, la notation de productions écrites et l'usage des LLMs en contexte éducatif.

📍 Lieu : Salle Polyvalente du Learning Center Christine de Pizan (Place Cardinal Mercier 31, Louvain-la-Neuve).

📋 Les inscriptions sont encore ouvertes 👉 https://forms.cloud.microsoft/e/Z5JeyHfGtb

Programme :
14:00 - 14:10 – Session d’accueil
14:10 – 14:30 – Cognitive Grounding of Linguistic Variables for Automatic Readability Assessment (Elodie Vanzeveren, Rodrigo Wilkens, Thomas François)
14:30 – 14:50 – Automated CEFR-Level Assignment for Ukrainian Texts (Olha Kanishcheva, Mikhail Kopotev)
14:50 – 15:40 – From Simplification to Readability-Guided Text Adaptation (Rodrigo Wilkens)
15:40 – 16:00 – Coffee break
16:00 – 16:20 – Automatic Essay Scoring and Feedback Generation in Basque Language Learning (Ekhi Azurmendi, Xabier Arregi, Oier Lopez de Lacalle)
16:20 – 16:40 – AI, Human, or Hybrid? Evaluating the Reliability of AI Text Detection Tools in Multi-Authored Contexts (Laura C. Úbeda-Cuspinera, Sheila Queralt)
16:40 – 17:00 – Assessing L2 Writing with Generative AI: Comparing Models, Prompts, and Human Raters (Agnieszka Leńko-Szymańska, Jiří Milička)
17:00 – 17:30 – Roundtable discussion and closing

01/04/2026

Pendant que certains s'arrachent les dossards pour les 20 km de Bruxelles 🏃‍♂️…
Pourquoi ne pas opter pour un défi différent cet été ? 🤔

📊 L'école d'été « Intelligence artificielle pour le traitement de données textuelles en Python » revient du 13 au 17 juillet à l'UCLouvain - Université catholique de Louvain.

Au programme : text mining, deep learning, LLM et RAG, avec une approche mêlant théorie et pratique… Moins de kilomètres, mais tout autant de performance. 🌟

Organisée par le SMCS (Support en Méthodologie et Calcul Statistique) - UCLouvain et le CENTAL, cette semaine intensive s'adresse à toute personne ayant une base en Python et souhaitant monter en compétences sur des technologies aujourd'hui incontournables.

🔍 Au programme :
- Acquisition, nettoyage et prétraitement de corpus textuels
- Représentation vectorielle des textes
- Similarité de documents et clustering thématique
- Classification et étiquetage automatique
- Génération augmentée de récupération (RAG)

Un équilibre entre théorie solide et pratique intensive : vous repartirez avec une chaîne de traitement complète en Python, prête à l'emploi.

📌 Infos & inscriptions : https://sites.uclouvain.be/training/smcs/view.php?id=713&l=fr
📄 Brochure :https://sites.uclouvain.be/training/smcs/docs/smcs/upload/flyers/Ecole_Ete_Text_Mining_UCLouvain_2026_07.pdf

N'hésitez pas à partager autour de vous — chercheurs, doctorants, professionnels des données, cette formation est faite pour vous ! 🙌

Au plaisir de vous y retrouver cet été ☀️

23/02/2026

Rejoignez-nous pour la conférence finale du projet IRead4Skills !

Au programme : présentation des principaux résultats, conclusions et perspectives d'avenir en matière d'alphabétisation des adultes et de développement des compétences.

📅 25 février 2026
💻 Participation en présentiel ou en ligne
🔗 Informations et inscription :
https://iread4skills.com/iread4skills-conference-2026/

29/09/2025

Notre prochain séminaire abordera l'importance et les méthodes d'anonymisation des données textuelles pour protéger la vie privée.

🎤 « L’anonymisation/désidentification de données textuelles : pourquoi et comment »
👤 Pierre Lison
📅 Vendredi 03 octobre 2025 de 14:00 à 15:00
📍 Maison des Langues, local A118 (Voie du Roman Pays 3a, 1348 Louvain-la-Neuve, Belgique)
💻 Informations pour suivre à distance et agenda des prochaines présentations : https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/seminaires-du-cental.

Résumé :
Durant cette présentation, je vais faire un tour d’horizon des recherches à l’intersection du TAL et de la protection de la vie privée. La grande majorité des textes contiennent en effet, sous une forme ou une autre, des *données personnelles*, c’est-à-dire des données se rapportant à une personne physique identifiée ou identifiable. L’identité des personnes mentionnées ou évoquées dans un texte est typiquement révélée au travers de différents « indices », qui peuvent être directs (comme un nom ou un numéro de téléphone portable) ou indirects (comme le lieu de travail, l’âge, la nationalité ou l’appartenance à un club sportif).

Diverses méthodes peuvent heureusement être utilisées pour masquer automatiquement ces indices (souvent regroupés sous l’appellation de « personally identifiable information » ou PII) dans un texte. Ces méthodes de masquage peuvent reposer sur des systèmes classiques de reconnaissance des entités nommées ou sur l’utilisation de LLMs. Ce masquage des PII est notamment crucial pour des données personnelles au contenu particulièrement sensible comme des décisions de justice ou des rapports cliniques. Mais ces méthodes permettent-elles réellement de rendre un texte « anonyme » au sens du RGPD ? Et comment peut-on mesurer si un texte a été suffisamment désidentifié ? Dans un article que nous avons récemment publié, nous avons notamment montré comment il est possible « d’attaquer » un texte désidentifié en tentant activement de réidentifier la personne dont l’identité devait être cachée à partir de connaissances contextuelles auxquelles un adversaire (fictif) peut avoir accès.

29/07/2025

Cental’s delegation

12/07/2025

🎬 Clap de fin pour l’édition 2025 de l’école d’été « Intelligence artificielle pour le traitement de données textuelles en Python » !

Organisée par le CENTAL et le SMCS (Support en Méthodologie et Calcul Statistique), cette école d’été s’adressait à celles et ceux souhaitant se plonger au cœur des techniques modernes de traitement automatique du langage : collecte et structuration de données textuelles, mesure de similarité, classification, embeddings, transformers, systèmes RAG…

L’école d’été a mis un accent particulier sur les approches récentes du deep learning et des grands modèles de langage.

Grâce à l’intervention de Simon Legendre (Troople), les participant·e·s ont pu découvrir des cas d’usage concrets des systèmes de Retrieval-Augmented Generation (RAG), déployés dans divers secteurs d’activité.

Si vous n’avez pas pu y assister cette année, pas de panique : on vous donne rendez-vous très bientôt pour une prochaine édition… encore plus riche !

05/06/2025

🚨 Derniers jours pour vous inscrire ! 🚨

Il reste encore quelques places pour l’école d’été « Intelligence artificielle pour le traitement de données textuelles en Python », qui se tiendra du 7 au 11 juillet 2025 à l’UCLouvain (Louvain-la-Neuve, Belgique).

Organisée par la plateforme SMCS et le CENTAL, cette formation intensive s’adresse aux personnes disposant d’une bonne maîtrise de Python et souhaitant approfondir leurs compétences en text mining et traitement automatique du langage naturel (NLP).

🔍 Au programme :

- Acquisition et prétraitement de données
- Similarité de documents
- Classification et étiquetage automatique
- Modèles d’apprentissage automatique et profond (transformers, embeddings, etc.)
- Génération augmentée par récupération (RAG)
- … et bien plus encore !

Une semaine de formation à la croisée des approches statistiques classiques et des modèles récents à base de deep learning et LLMs, mêlant théorie et pratique.

💡 Et pour souffler un peu après les sessions intensives ? Louvain-la-Neuve se transforme en Louvain-la-Plage en juillet… 🌴☀️ L’endroit parfait pour réviser vos notebooks les pieds dans le sable !

📅 Infos & inscriptions :
👉 https://sites.uclouvain.be/training/smcs/view.php?id=622&l
📄 Brochure complète :
👉https://sites.uclouvain.be/training/smcs/docs/smcs/upload/flyers/ecole_ete_2025_07_03.pdf

03/06/2025

🎓 Offre de doctorat en traitement automatique du langage à l’UCLouvain !

Vous êtes passionné·e par le traitement du langage naturel, l’intelligence artificielle et l’enseignement du français langue étrangère ? Le CENTAL (Centre de traitement automatique du langage) de l’UCLouvain recrute un·e doctorant·e pour un projet de recherche ambitieux et novateur.

📌 Sujet : Normalisation et correction automatisée des productions écrites d’apprenants de FLE
📍 Lieu : Louvain-la-Neuve (Belgique)
🗓️ Début : 1er septembre 2025 (flexible)
💼 Contrat : Bourse de doctorat à temps plein (2 ans renouvelables)
📅 Date limite de candidature : 1er juillet 2025

Ce projet, en partenariat avec France Éducation International, s’appuie sur une ressource exceptionnelle : plus de 6500 textes écrits par des candidats au TCF. L’objectif ? Détecter automatiquement les erreurs dans ces productions, les normaliser et en tirer des analyses approfondies selon le niveau CECR et la langue maternelle.

➡️ Plus d’informations :

Bourse de doctorat à temps plein (100%) pour une durée de deux ans, renouvelable une fois sous conditionsPour le Centre de traitement automatique du langage (CENTAL), de l'Institut langage et communication (ILC) à l’UCLouvain (Louvain-la-Neuve)Entrée en fonction: 1er septembre 2025 (négociabl...

08/04/2025

Notre prochain séminaire s'intéressera à la manière dont le traitement automatique des langues peut renforcer la communication interlinguistique, à la lumière des récents progrès en traduction automatique et en modèles de langues multilingues.

🎤 « Au-delà de la Traduction : Un TAL Centré sur l'Humain pour une Communication Interlinguistique Fiable »
👤 Marine Carpuat, Associate Professor, Computer Science, University of Maryland
📅 Vendredi 11 avril 2025 de 14:00 à 15:00
📍 Maison des Langues, local A118 (Voie du Roman Pays 3a, 1348 Louvain-la-Neuve, Belgique)
💻 Informations pour suivre à distance et agenda des prochaines présentations : https://www.uclouvain.be/seminaires-du-cental.

Résumé :
Comment le Traitement Automatique des Langues (TAL) peut-il soutenir efficacement la communication interlinguistique, en particulier au regard des progrès récents en traduction automatique et modèles de langues multilingues ? Dans cet exposé, je présenterai deux axes de recherche visant à élargir la portée de la traduction automatique pour mieux répondre aux besoins de ses utilisateurs. Le premier examinera les défis rencontrés par les utilisateurs non familiers avec la langue source ou cible pour évaluer la fiabilité des traductions. Une étude menée dans un contexte médical illustrera les forces et les faiblesses des méthodes actuelles d'estimation de la qualité des traductions. Ces résultats motivent de nouvelles techniques de détection d'erreurs basées sur des interactions de type questions-réponses. Le second axe se concentrera sur les situations où des traductions littérales peuvent être mal comprises en raison d'un manque de contexte culturel ou de connaissances implicites dans la langue d'origine. Des approches de génération automatique d'explicitations, adaptées aux différences culturelles entre les publics, seront présentées comme solutions potentielles.

25/03/2025

Dans le cadre de notre prochain séminaire, plongez au cœur d’un sujet clé : comment relier la lisibilité des textes aux niveaux d’alphabétisation de la population ?

🎤 « Relation entre la lisibilité et la complexité dans un corpus français »
👤 Natalia Grabar, Chargée de recherche epst, Université de Lille

📅 Vendredi 28 mars 2025 de 14:00 à 15:00
📍 Auditoire SOCRATE 21 (place du Cardinal Mercier à 1348 Louvain-la-Neuve, Belgique)
💻 Agenda des prochaines présentations : https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/seminaires-du-cental.

Résumé :
Il existe des travaux assez conséquents sur la lisibilité des documents d'un côté et les niveaux d'alphabétisation de la population de l'autre côté. Cependant, les liens entre ces deux échelles restent faiblement étudiés. Une des motivations de ce travail consiste à établir de tels liens dans un corpus français. Une autre motivation concerne les méthodes pour la graduation de la complexité des documents.

24/03/2025

🚀 Nouvelle édition de notre École d’été : « Intelligence artificielle pour le traitement de données textuelles en Python » organisée en partenariat avec le SMCS (Support en Méthodologie et Calcul Statistique) !

Vous souhaitez maîtriser le text mining et l’IA appliquée aux données textuelles ? Rejoignez-nous du 7 au 11 juillet 2025 pour une semaine de formation intensive et pratique !

📍 Lieu : Louvain-la-Neuve, UCLouvain – Université catholique de Louvain
📅 Tarif préférentiel jusqu’au 30 avril – ne tardez pas à vous inscrire !
🔗 Inscription & infos : https://sites.uclouvain.be/training/smcs/view.php?id=622&l

Adres

Place Montesquieu, 3 (étage 3B)
Louvain-la-Neuve
1348

Website

http://www.uclouvain.be/cental

Meldingen

Wees de eerste die het weet en laat ons u een e-mail sturen wanneer Cental nieuws en promoties plaatst. Uw e-mailadres wordt niet voor andere doeleinden gebruikt en u kunt zich op elk gewenst moment afmelden.