Cental Centre de traitement automatique du langage
Center for Natural Language Processing

UCLouvain 🇧đŸ‡Ș

đŸ‡«đŸ‡· Le CENTAL est une plateforme technologique de l’UCLouvain impliquĂ©e Ă  la fois dans des activitĂ©s de recherche et d’enseignement. Il collabore Ă©galement aux projets de plusieurs centres de recherche de l’UCLouvain auxquels il apporte son expertise en matiĂšre de traitement informatique des donnĂ©es textuelles. Les contacts spĂ©cifiques avec des entreprises belges sont nombreux et prennent la forme

de prestations ponctuelles, d’activitĂ©s de conseil (guidance scientifique de plus ou moins longue durĂ©e) ou encore de projets de recherche et dĂ©veloppement.

🇬🇧CENTAL is a technological platform associated with UCLouvain’s Institute for Language and Communication. Its expertise in natural language processing can be applied to both academic and industrial projects, ranging from ad hoc consultancy activities and expert training to the development of research projects.

Le Workshop TALA 2026 – New Trends in Automatized Language Assessment, c'est dans quelques jours — le 7 avril 2026, à Lo...
03/04/2026

Le Workshop TALA 2026 – New Trends in Automatized Language Assessment, c'est dans quelques jours — le 7 avril 2026, à Louvain-la-Neuve et en ligne !

Cette journée couvre l'évaluation automatique de la langue, la lisibilité, la notation de productions écrites et l'usage des LLMs en contexte éducatif.

📍 Lieu : Salle Polyvalente du Learning Center Christine de Pizan (Place Cardinal Mercier 31, Louvain-la-Neuve).

📋 Les inscriptions sont encore ouvertes 👉 https://forms.cloud.microsoft/e/Z5JeyHfGtb

Programme :
14:00 - 14:10 – Session d’accueil
14:10 – 14:30 – Cognitive Grounding of Linguistic Variables for Automatic Readability Assessment (Elodie Vanzeveren, Rodrigo Wilkens, Thomas François)
14:30 – 14:50 – Automated CEFR-Level Assignment for Ukrainian Texts (Olha Kanishcheva, Mikhail Kopotev)
14:50 – 15:40 – From Simplification to Readability-Guided Text Adaptation (Rodrigo Wilkens)
15:40 – 16:00 – Coffee break
16:00 – 16:20 – Automatic Essay Scoring and Feedback Generation in Basque Language Learning (Ekhi Azurmendi, Xabier Arregi, Oier Lopez de Lacalle)
16:20 – 16:40 – AI, Human, or Hybrid? Evaluating the Reliability of AI Text Detection Tools in Multi-Authored Contexts (Laura C. Úbeda-Cuspinera, Sheila Queralt)
16:40 – 17:00 – Assessing L2 Writing with Generative AI: Comparing Models, Prompts, and Human Raters (Agnieszka LeƄko-SzymaƄska, Jiƙí Milička)
17:00 – 17:30 – Roundtable discussion and closing

Pendant que certains s'arrachent les dossards pour les 20 km de Bruxelles đŸƒâ€â™‚ïžâ€ŠPourquoi ne pas opter pour un dĂ©fi diffĂ©r...
01/04/2026

Pendant que certains s'arrachent les dossards pour les 20 km de Bruxelles đŸƒâ€â™‚ïžâ€Š
Pourquoi ne pas opter pour un dĂ©fi diffĂ©rent cet Ă©tĂ© ? đŸ€”

📊 L'Ă©cole d'Ă©tĂ© « Intelligence artificielle pour le traitement de donnĂ©es textuelles en Python » revient du 13 au 17 juillet Ă  l'UCLouvain - UniversitĂ© catholique de Louvain.

Au programme : text mining, deep learning, LLM et RAG, avec une approche mĂȘlant thĂ©orie et pratique
 Moins de kilomĂštres, mais tout autant de performance. 🌟

Organisée par le SMCS (Support en Méthodologie et Calcul Statistique) - UCLouvain et le CENTAL, cette semaine intensive s'adresse à toute personne ayant une base en Python et souhaitant monter en compétences sur des technologies aujourd'hui incontournables.

🔍 Au programme :
- Acquisition, nettoyage et prétraitement de corpus textuels
- Représentation vectorielle des textes
- Similarité de documents et clustering thématique
- Classification et étiquetage automatique
- Génération augmentée de récupération (RAG)

Un Ă©quilibre entre thĂ©orie solide et pratique intensive : vous repartirez avec une chaĂźne de traitement complĂšte en Python, prĂȘte Ă  l'emploi.

📌 Infos & inscriptions : https://sites.uclouvain.be/training/smcs/view.php?id=713&l=fr
📄 Brochure :https://sites.uclouvain.be/training/smcs/docs/smcs/upload/flyers/Ecole_Ete_Text_Mining_UCLouvain_2026_07.pdf

N'hĂ©sitez pas Ă  partager autour de vous — chercheurs, doctorants, professionnels des donnĂ©es, cette formation est faite pour vous ! 🙌

Au plaisir de vous y retrouver cet Ă©tĂ© ☀

Rejoignez-nous pour la conférence finale du projet IRead4Skills !Au programme : présentation des principaux résultats, c...
23/02/2026

Rejoignez-nous pour la conférence finale du projet IRead4Skills !

Au programme : présentation des principaux résultats, conclusions et perspectives d'avenir en matiÚre d'alphabétisation des adultes et de développement des compétences.

📅 25 fĂ©vrier 2026
đŸ’» Participation en prĂ©sentiel ou en ligne
🔗 Informations et inscription :
https://iread4skills.com/iread4skills-conference-2026/

Notre prochain séminaire abordera l'importance et les méthodes d'anonymisation des données textuelles pour protéger la v...
29/09/2025

Notre prochain séminaire abordera l'importance et les méthodes d'anonymisation des données textuelles pour protéger la vie privée.

đŸŽ€ « L’anonymisation/dĂ©sidentification de donnĂ©es textuelles : pourquoi et comment »
đŸ‘€ Pierre Lison
📅 Vendredi 03 octobre 2025 de 14:00 à 15:00
📍 Maison des Langues, local A118 (Voie du Roman Pays 3a, 1348 Louvain-la-Neuve, Belgique)
đŸ’» Informations pour suivre Ă  distance et agenda des prochaines prĂ©sentations : https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/seminaires-du-cental.

Résumé :
Durant cette prĂ©sentation, je vais faire un tour d’horizon des recherches Ă  l’intersection du TAL et de la protection de la vie privĂ©e. La grande majoritĂ© des textes contiennent en effet, sous une forme ou une autre, des *donnĂ©es personnelles*, c’est-Ă -dire des donnĂ©es se rapportant Ă  une personne physique identifiĂ©e ou identifiable. L’identitĂ© des personnes mentionnĂ©es ou Ă©voquĂ©es dans un texte est typiquement rĂ©vĂ©lĂ©e au travers de diffĂ©rents « indices », qui peuvent ĂȘtre directs (comme un nom ou un numĂ©ro de tĂ©lĂ©phone portable) ou indirects (comme le lieu de travail, l’ñge, la nationalitĂ© ou l’appartenance Ă  un club sportif).

Diverses mĂ©thodes peuvent heureusement ĂȘtre utilisĂ©es pour masquer automatiquement ces indices (souvent regroupĂ©s sous l’appellation de « personally identifiable information » ou PII) dans un texte. Ces mĂ©thodes de masquage peuvent reposer sur des systĂšmes classiques de reconnaissance des entitĂ©s nommĂ©es ou sur l’utilisation de LLMs. Ce masquage des PII est notamment crucial pour des donnĂ©es personnelles au contenu particuliĂšrement sensible comme des dĂ©cisions de justice ou des rapports cliniques. Mais ces mĂ©thodes permettent-elles rĂ©ellement de rendre un texte « anonyme » au sens du RGPD ? Et comment peut-on mesurer si un texte a Ă©tĂ© suffisamment dĂ©sidentifiĂ© ? Dans un article que nous avons rĂ©cemment publiĂ©, nous avons notamment montrĂ© comment il est possible « d’attaquer » un texte dĂ©sidentifiĂ© en tentant activement de rĂ©identifier la personne dont l’identitĂ© devait ĂȘtre cachĂ©e Ă  partir de connaissances contextuelles auxquelles un adversaire (fictif) peut avoir accĂšs.

Cental’s delegation
29/07/2025

Cental’s delegation

🎬 Clap de fin pour l’édition 2025 de l’école d’étĂ© « Intelligence artificielle pour le traitement de donnĂ©es textuelles ...
12/07/2025

🎬 Clap de fin pour l’édition 2025 de l’école d’étĂ© « Intelligence artificielle pour le traitement de donnĂ©es textuelles en Python » !

OrganisĂ©e par le CENTAL et le SMCS (Support en MĂ©thodologie et Calcul Statistique), cette Ă©cole d’étĂ© s’adressait Ă  celles et ceux souhaitant se plonger au cƓur des techniques modernes de traitement automatique du langage : collecte et structuration de donnĂ©es textuelles, mesure de similaritĂ©, classification, embeddings, transformers, systĂšmes RAG


L’école d’étĂ© a mis un accent particulier sur les approches rĂ©centes du deep learning et des grands modĂšles de langage.

GrĂące Ă  l’intervention de Simon Legendre (Troople), les participant·e·s ont pu dĂ©couvrir des cas d’usage concrets des systĂšmes de Retrieval-Augmented Generation (RAG), dĂ©ployĂ©s dans divers secteurs d’activitĂ©.

Si vous n’avez pas pu y assister cette annĂ©e, pas de panique : on vous donne rendez-vous trĂšs bientĂŽt pour une prochaine Ă©dition
 encore plus riche !

🚹 Derniers jours pour vous inscrire ! 🚹Il reste encore quelques places pour l’école d’étĂ© « Intelligence artificielle po...
05/06/2025

🚹 Derniers jours pour vous inscrire ! 🚹

Il reste encore quelques places pour l’école d’étĂ© « Intelligence artificielle pour le traitement de donnĂ©es textuelles en Python », qui se tiendra du 7 au 11 juillet 2025 Ă  l’UCLouvain (Louvain-la-Neuve, Belgique).

OrganisĂ©e par la plateforme SMCS et le CENTAL, cette formation intensive s’adresse aux personnes disposant d’une bonne maĂźtrise de Python et souhaitant approfondir leurs compĂ©tences en text mining et traitement automatique du langage naturel (NLP).

🔍 Au programme :

- Acquisition et prétraitement de données
- Similarité de documents
- Classification et étiquetage automatique
- Modùles d’apprentissage automatique et profond (transformers, embeddings, etc.)
- Génération augmentée par récupération (RAG)
- 
 et bien plus encore !

Une semaine de formation Ă  la croisĂ©e des approches statistiques classiques et des modĂšles rĂ©cents Ă  base de deep learning et LLMs, mĂȘlant thĂ©orie et pratique.

💡 Et pour souffler un peu aprĂšs les sessions intensives ? Louvain-la-Neuve se transforme en Louvain-la-Plage en juillet
 đŸŒŽâ˜€ïž L’endroit parfait pour rĂ©viser vos notebooks les pieds dans le sable !

📅 Infos & inscriptions :
👉 https://sites.uclouvain.be/training/smcs/view.php?id=622&l
📄 Brochure complùte :
👉https://sites.uclouvain.be/training/smcs/docs/smcs/upload/flyers/ecole_ete_2025_07_03.pdf

🎓 Offre de doctorat en traitement automatique du langage Ă  l’UCLouvain !Vous ĂȘtes passionné·e par le traitement du langa...
03/06/2025

🎓 Offre de doctorat en traitement automatique du langage à l’UCLouvain !

Vous ĂȘtes passionné·e par le traitement du langage naturel, l’intelligence artificielle et l’enseignement du français langue Ă©trangĂšre ? Le CENTAL (Centre de traitement automatique du langage) de l’UCLouvain recrute un·e doctorant·e pour un projet de recherche ambitieux et novateur.

📌 Sujet : Normalisation et correction automatisĂ©e des productions Ă©crites d’apprenants de FLE
📍 Lieu : Louvain-la-Neuve (Belgique)
đŸ—“ïž DĂ©but : 1er septembre 2025 (flexible)
đŸ’Œ Contrat : Bourse de doctorat Ă  temps plein (2 ans renouvelables)
📅 Date limite de candidature : 1er juillet 2025

Ce projet, en partenariat avec France Éducation International, s’appuie sur une ressource exceptionnelle : plus de 6500 textes Ă©crits par des candidats au TCF. L’objectif ? DĂ©tecter automatiquement les erreurs dans ces productions, les normaliser et en tirer des analyses approfondies selon le niveau CECR et la langue maternelle.

âžĄïž Plus d’informations :

Bourse de doctorat Ă  temps plein (100%) pour une durĂ©e de deux ans, renouvelable une fois sous conditionsPour le Centre de traitement automatique du langage (CENTAL), de l'Institut langage et communication (ILC) Ă  l’UCLouvain (Louvain-la-Neuve)EntrĂ©e en fonction: 1er septembre 2025 (nĂ©gociabl...

Notre prochain séminaire s'intéressera à la maniÚre dont le traitement automatique des langues peut renforcer la communi...
08/04/2025

Notre prochain séminaire s'intéressera à la maniÚre dont le traitement automatique des langues peut renforcer la communication interlinguistique, à la lumiÚre des récents progrÚs en traduction automatique et en modÚles de langues multilingues.

đŸŽ€ « Au-delĂ  de la Traduction : Un TAL CentrĂ© sur l'Humain pour une Communication Interlinguistique Fiable »
đŸ‘€ Marine Carpuat, Associate Professor, Computer Science, University of Maryland
📅 Vendredi 11 avril 2025 de 14:00 à 15:00
📍 Maison des Langues, local A118 (Voie du Roman Pays 3a, 1348 Louvain-la-Neuve, Belgique)
đŸ’» Informations pour suivre Ă  distance et agenda des prochaines prĂ©sentations : https://www.uclouvain.be/seminaires-du-cental.

Résumé :
Comment le Traitement Automatique des Langues (TAL) peut-il soutenir efficacement la communication interlinguistique, en particulier au regard des progrĂšs rĂ©cents en traduction automatique et modĂšles de langues multilingues ? Dans cet exposĂ©, je prĂ©senterai deux axes de recherche visant Ă  Ă©largir la portĂ©e de la traduction automatique pour mieux rĂ©pondre aux besoins de ses utilisateurs. Le premier examinera les dĂ©fis rencontrĂ©s par les utilisateurs non familiers avec la langue source ou cible pour Ă©valuer la fiabilitĂ© des traductions. Une Ă©tude menĂ©e dans un contexte mĂ©dical illustrera les forces et les faiblesses des mĂ©thodes actuelles d'estimation de la qualitĂ© des traductions. Ces rĂ©sultats motivent de nouvelles techniques de dĂ©tection d'erreurs basĂ©es sur des interactions de type questions-rĂ©ponses. Le second axe se concentrera sur les situations oĂč des traductions littĂ©rales peuvent ĂȘtre mal comprises en raison d'un manque de contexte culturel ou de connaissances implicites dans la langue d'origine. Des approches de gĂ©nĂ©ration automatique d'explicitations, adaptĂ©es aux diffĂ©rences culturelles entre les publics, seront prĂ©sentĂ©es comme solutions potentielles.

Dans le cadre de notre prochain sĂ©minaire, plongez au cƓur d’un sujet clĂ© : comment relier la lisibilitĂ© des textes aux ...
25/03/2025

Dans le cadre de notre prochain sĂ©minaire, plongez au cƓur d’un sujet clĂ© : comment relier la lisibilitĂ© des textes aux niveaux d’alphabĂ©tisation de la population ?

đŸŽ€ « Relation entre la lisibilitĂ© et la complexitĂ© dans un corpus français »
đŸ‘€ Natalia Grabar, ChargĂ©e de recherche epst, UniversitĂ© de Lille

📅 Vendredi 28 mars 2025 de 14:00 à 15:00
📍 Auditoire SOCRATE 21 (place du Cardinal Mercier à 1348 Louvain-la-Neuve, Belgique)
đŸ’» Agenda des prochaines prĂ©sentations : https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/seminaires-du-cental.

Résumé :
Il existe des travaux assez conséquents sur la lisibilité des documents d'un cÎté et les niveaux d'alphabétisation de la population de l'autre cÎté. Cependant, les liens entre ces deux échelles restent faiblement étudiés. Une des motivations de ce travail consiste à établir de tels liens dans un corpus français. Une autre motivation concerne les méthodes pour la graduation de la complexité des documents.

🚀 Nouvelle Ă©dition de notre École d’étĂ© : « Intelligence artificielle pour le traitement de donnĂ©es textuelles en Python...
24/03/2025

🚀 Nouvelle Ă©dition de notre École d’étĂ© : « Intelligence artificielle pour le traitement de donnĂ©es textuelles en Python » organisĂ©e en partenariat avec le SMCS (Support en MĂ©thodologie et Calcul Statistique) !

Vous souhaitez maĂźtriser le text mining et l’IA appliquĂ©e aux donnĂ©es textuelles ? Rejoignez-nous du 7 au 11 juillet 2025 pour une semaine de formation intensive et pratique !

📍 Lieu : Louvain-la-Neuve, UCLouvain – UniversitĂ© catholique de Louvain
📅 Tarif prĂ©fĂ©rentiel jusqu’au 30 avril – ne tardez pas Ă  vous inscrire !
🔗 Inscription & infos : https://sites.uclouvain.be/training/smcs/view.php?id=622&l

Adres

Place Montesquieu, 3 (étage 3B)
Louvain-la-Neuve
1348

Meldingen

Wees de eerste die het weet en laat ons u een e-mail sturen wanneer Cental nieuws en promoties plaatst. Uw e-mailadres wordt niet voor andere doeleinden gebruikt en u kunt zich op elk gewenst moment afmelden.

Delen