ULiS project qrcode

Meaning-Text Theory Lexical Semantic Knowledge Representation : Conceptualization, Representation, and Operationalization of Lexicographic Definitions

Ph.D. supervised by Fabien Gandon and Christian Boitet

ATER IUT Nice Sophia-Antipolis | Inria Wimmics team | Allocation ministérielle EDSTIC Université de Nice Sophia-Antipolis

See the PhD thesis memoir (French).

Abstract (English)
Abstract

We present our research in applying knowledge engineering to linguistics. In particular, to linguistic predicates, linguistic representations, and lexicographic definitions of the Meaning-Text Theory (MTT). We adopt a three-step methodology.

We first study the MTT conceptualization, and show how it should be extended to ease its formalization. We therefore justify the need of defining a new deep semantic, graph-based, representation level for the Meaning-Text model. We define the notion of deep semantic unit types and its actantial structure: a set of signed obligatory, optional or forbidden actant slots with lexicalized semantic roles as labels. We show that their hierarchical organization may correspond to a hierarchy of meanings, inside which actantial structures are inherited and specialized. We re-conceptualize lexicographic definitions at the deep semantic level, and at the level of dictionaries. Finally, we present a definition editor prototype based on graph direct manipulation, which will allow us, in future work, to integrate our formal model into explanatory combinatorial lexicographic projects.

We then propose a knowledge representation formalism adapted for this conceptualization. We demonstrate that Description Logics and the Conceptual Graphs formalism do not fit our needs. This leads us to construct a new knowledge representation formalism: the Unit Graphs formalism.

Finally, we operationalize the Unit Graphs formalism. We assign it a formal semantic model, which we create based on model theory and relational algebra. We then show that the reasoning decidability conditions match the intuitions that lexicographers have. We also provide an implementation using semantic web standards, which enable us to use existing architectures for sharing, interoperability, and knowledge querying over the web of lexical linked data.

Keywords

Knowledge Representation, Linguistic Knowledge, Meaning-Text Theory, Linguistic Predicates, Linguistic Representations, Lexicographic Definitions, Decompositional Semantics, Web of linked data

Abstract (French)
Résumé

Nous présentons notre recherche en ingénierie des connaissances appliquée à la linguistique. Plus particulièrement, aux prédicats linguistiques, aux représentations linguistiques, et aux définitions lexicographiques de la théorie linguistique Sens-Texte (TST). Nous adoptons une méthodologie en trois étapes.

Nous étudions dans un premier temps la conceptualisation de la TST, et montrons en quoi elle devrait être étendue pour faciliter une formalisation ultérieure. Nous justifions en particulier la nécessité de définir un nouveau niveau de représentation sémantique profond, basé sur des graphes. Nous y définissons la notion de type d'unité sémantique profonde et sa structure actancielle: un ensemble de positions actancielles signées, qui peuvent être obligatoires, optionnelles, ou interdites, et étiquetées par des rôles sémantiques lexicalisés. Nous montrons que l'organisation hiérarchique des types d'unités sémantiques profondes peut correspondre à une hiérarchie de sens au sein de laquelle les structures actancielles sont héritées et spécialisées. Nous reconceptualisons les définitions lexicographiques au niveau sémantique profond, et au niveau du dictionnaire. Finalement, nous présentons un prototype d'éditeur de définitions basé sur la manipulation directe de graphes, qui permettera une intégration future de nos travaux dans des projets de lexicographie explicative et combinatoire.

Ensuite, nous proposons un formalisme de représentation des connaissances adapté à cette conceptualisation. Nous démontrons que les logiques de description et le formalisme des Graphes Conceptuels ne sont pas adaptés pour représenter les connaissances de la TST. Nous construisons alors un nouveau formalisme de représentation des connaissances adapté, dit des Graphes d'Unités.

Enfin nous étudions l'opérationnalisation du formalisme des Graphes d'Unités. Nous lui associons une sémantique formelle basée sur la théorie des modèles et l'algèbre relationnelle, et montrons que les conditions de décidabilité du raisonnement logique correspondent aux intuitions des lexicographes. Nous proposons également une implémentation du formalisme avec les standards du web sémantique, ce qui permet de profiter des architectures existantes pour le partage, l'interopérationnalisation, et l'interrogation des connaissances sur le web des données lexicales liées.

Mots-clés:

Représentation de Connaissances, Connaissances Linguistiques, Théorie Sens-Texte, Prédicats Linguistiques, Représentations linguistiques, Définitions Lexicographiques, Sémantique Décompostionnelle, Web des données liées

Key publications:

Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte : Conceptualisation, représentation, et opérationnalisation des définitions lexicographiques, Thèse de doctorat, Juin 2014..

Lefrançois and Gandon, 2013, Rationale, Concepts, and Current Outcome of the Unit Graphs Framework, RANLP'2013

Maxime Lefrançois, Fabien Gandon, Alain Giboin, Méthodologie d'ingénierie des connaissances pour la représentation des définitions lexicographiques de la théorie Sens-Texte, TOTh'2014


Slides of the defense