Vous êtes ici

Le projet PersPred

PersPred est le premier lexique multilingue (persan, français, anglais) des verbes composés (prédicats complexes ou locutions verbales) du persan en accès libre. Il a été conçu dans le cadre du projet ANR-DFG PERGRAM (2008-2012) et de l’opération LR4.1 de l’axe 6 « Ressources linguistiques » du Labex EFL, par les chercheurs de l’UMR Mondes iranien et indien (CNRS, Sorbonne nouvelle, Inalco, EPHE). La version actuelle contient environ 1500 entrées et 25 champs annotés pour chaque combinaison. L’objectif, à terme, est de mettre à la disposition des chercheurs et à tous ceux qui s’intéressent au persan pour diverses raisons (traduction, enseignement, applications automatiques), une ressource lexicale richement annotée et la plus exhaustive possible dédiée aux locutions verbales du persan.

Le lexique verbal du persan est essentiellement composé de locutions verbales, appelées également « verbes composés », « constructions à verbe support » ou, plus récemment, « prédicats complexes ». Cette caractéristique s’explique par le fait que la conversion des noms et des adjectifs en verbes, procédé morphologique abondamment utilisé dans des langues telles que l’anglais (ex. comb (n.) > comb (v.), short (adj.) > shorten (v.)) et le français (ex. balai (n.) > balayer (v.), court (adj.) > raccourcir (v.)), a cessé d’être productif en persan au détriment de la construction syntaxique des lexèmes verbaux, c’est-à-dire la combinaison d’un verbe (support) et d’un élément non verbal (nom, adjectif, adverbe, préposition…), ex. gomân kardan `supposer’ (litt. ‘supposition faire’), derâz kešidan `s’allonger’ (litt. ‘long tirer’). Ainsi, dans la plupart des cas, un verbe simple en anglais ou en français se traduit par une locution verbale en persan. Le persan ne dispose que d’environ 250 verbes simples, dont seulement la moitié est usitée, alors que le nombre des locutions verbales s’élève à quelques milliers et ne cesse d’augmenter.

Or, malgré cette omniprésence, peu d’attention a été accordée à la nécessité d’élaboration d’un lexique de ces combinaisons (sous forme de dictionnaires traditionnels ou électroniques). A cet égard, PersPred est une ressource unique en son genre qui vise à combler la lacune existante. Il propose non seulement un inventaire des locutions verbales du persan, mais également un ensemble très riche d’informations syntaxiques (valence, appariement des arguments et les fonctions grammaticales, variantes diathétiques…) et sémantiques (groupements sémantiques des prédicats) encodées pour chaque entrée. En outre, PersPred fournit également la traduction en anglais et en français de chaque locution, ainsi que celle de ces composantes. Chaque locution est illustrée à l’aide d’un ou plusieurs exemples attestés, tirés de la littérature, de la presse écrite ou d’Internet. L’originalité de PersPred réside dans les regroupements sémantiques des prédicats permettant notamment de rendre compte de la productivité de ces combinaisons et de faciliter ainsi l’intégration de nouveaux prédicats complexes.

Toutes ces caractéristiques font de PersPred un outil lexicographique approprié pour diverses applications telle que la traduction, le traitement automatique, l’enseignement, mais également une ressource linguistique exploitable pour la recherche sur diverses questions théoriques.

L’interface en ligne permet d’exploiter la base en combinant plusieurs critères (valeurs des champs). Pour une description détaillée de PersPred et de ses fonctionnalités, veuillez vous référer à la documentation mise à votre disposition, qui vous permet une exploitation optimale de la base.

 PersPred est diffusée sous licence LGPL-LR. Vous devez accepter les termes de la licence LGPL-LR pour utiliser cette ressource.

 

A citer

Samvelian Pollet & Pegah Faghiri (2013), Introducing PersPred, a syntactic and semantic database for Persian Complex Predicates, in Proceedings of The 9th Workshop on Multiword Expressions, NAACL-HLT 2013, June 14-15, Atlanta, Georgia, USA : Association for Computational Linguistics, pp 11-20.