Défiler vers le haut

Licence Creative Commons [Séminaire ATILF] Guillaume Desagulier : Les réseaux de constructions : de la théorie à l'empirie

29 juin 2018
Durée : 01:27:30
Nombre de vues 337
Nombre d’ajouts dans une liste de lecture 1
Nombre de favoris 0

La modélisation des assemblages symboliques de forme et de sens (les constructions) sous la forme de réseaux fait partie intégrante du programme des grammaires de constructions : « It is argued that constructions form a network and are linked by inheritance relations which motivate many of the properties of particular constructions. The inheritance network lets us capture generalizations across constructions while at the same time allowing for subregularities and exceptions. » (Goldberg 1995, p. 67)

Le concept de réseau dynamique est largement consigné au statut d’abstraction théorique en linguistique cognitive de première génération. Il ne commence à recevoir de fondations empiriques que récemment. Ainsi, Ellis et al. (2014) et Gries et Ellis (2015) parviennent à quantifier les traits sémantiques distinctifs de constructions Verbe-Argument telles que les causatives en into de manière à projeter les verbes qui interviennent dans ces constructions sous la forme d’un réseau. En somme, grâce à la théorie des graphes, le réseau de constructions a l’occasion de dépasser le simple statut de métaphore.

Ce séminaire comprend deux moments. Dans un premier temps, je rappelle les fondements de la théorie des graphes et décris les graphes « petit-monde » propres aux phénomènes linguistiques. Je dresse ensuite l’inventaire des méthodes distributionnelles traditionnelles qui permettent de visualiser un réseau constructionnel à partir d’un corpus. Ces méthodes reposent principalement sur les collocations. Elles font intervenir des données de fréquences ainsi que des mesures d’association symétriques et asymétriques. J’illustre cette approche à l’aide de trois études de cas en anglais : l’alternance dative, A as GN (Desagulier 2015) et it be A to Vinf that.

Visualiser les réseaux constructionnels sur la base de tableaux de données à l’aide de la théorie des graphes est une procédure relativement aisée. Les constructions sont pré-identifiées et les données pré-classées. Le graphe synthétise les données. Cette méthodologie suit, peu ou prou, une démarche exploratoire, à la manière de ce que proposent les méthodes de clustering. Plus ambitieuse et autrement plus difficile est la détection de réseaux de constructions à partir de grands corpus.

Dans un second temps, je pose les bases de ce programme de recherche en m’appuyant sur les avancées récentes en matière d’apprentissage profond, notamment les vecteurs lexicaux (Mikolov, Chen et al. 2013; Mikolov, Sutskever et al. 2013; Mikolov, Yih et al. 2013; Pennington et al. 2014). Fondés sur l’hypothèse distributionnelle (Harris 1954; Miller et Charles 1991), ces vecteurs sont le produit de modèles de sémantique distributionnelle s’articulant sur des réseaux de neurones artificiels. Les vecteurs lexicaux de nouvelle génération ont fait leur preuve quant à l’étude du sens de mots isolés. Toutefois, leur application aux unités polylexicales ne va pas de soi. J’aborderai les obtacles à la reconnaissance et la vectorisation des constructions, préalable à leur visualisation sous forme de réseaux. Je proposerai quelques pistes d’exploration ainsi qu’un outil de visualisation des unités polylexicales (DepVis).

Références
Desagulier, Guillaume (2015). “A lesson from associative learning : asymmetry and productivity in multiple-slot constructions.” In : Corpus Linguistics and Linguistic Theory. doi : 10.1515/cllt-2015-0012.
Ellis, Nick C., Matthew Brook O’Donnell et Ute Römer (2014). “The processing of verb-argument constructions is sensitive to form, function, frequency, contingency and prototypicality”. In : Cognitive Linguistics 25.1, p. 55-98.
Goldberg, Adele E. (1995). Constructions : a Construction Grammar Approach to Argument Structure. Chicago : University of Chicago Press.
Gries, Stefan Thomas et Nick C. Ellis (2015). “Statistical measures for usage-based linguistics”. In : Language Learning 65.S1, p. 228-255. doi : 10.1111/lang.12119.
Harris, Zellig S. (1954). “Distributional structure”. In : Word 10.2-3, p. 146-162.
Mikolov, Tomas, Kai Chen et al. (2013). “Efficient Estimation of Word Representations in Vector Space”. In : CoRR abs/1301.3781. url : http://arxiv.org/abs/1301.3781.
Mikolov, Tomas, Ilya Sutskever et al. (2013). “Distributed representations of words and phrases and their compositionality”. In : Advances in Neural Information Processing Systems, p. 3111-3119.
Mikolov, Tomas, Wen-tau Yih et Geoffrey Zweig (2013). “Linguistic regularities in continuous space word representations”. In : Proceedings of NAACL-HLT, p. 746-751. url : http://www.aclweb.org/anthology/N/N13/N131090.pdf.
Miller, George A. et Walter G. Charles (1991). “Contextual correlates of semantic similarity”. In : Language and Cognitive Processes 6.1, p. 1-28.
Pennington, Jeffrey, Richard Socher et Christopher D. Manning (2014). “GloVe : Global Vectors for Word Representation”. In : Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP 2014), p. 1532-1543. url : http://www.aclweb.org/anthology/D141162.

Mots clés : atilf

 Informations