Morphological Irregularity Correlates with Frequency

Juin 2019

Morphological Irregularity Correlates with Frequency

Juin 2019

Nous présentons une étude d’irrégularité morphologique. À la suite de travaux récents, nous définissons une mesure théorique de l’irrégularité fondée sur la théorie de l’information, basée sur la prévisibilité des formes dans une langue. À l’aide d’un modèle de transduction neuronale, nous estimons cette quantité pour les formulaires dans 28 langues. Nous présentons d’abord plusieurs analyses valides et exploratoires de l’irrégularité. Nous montrons ensuite que nos analyses fournissent des preuves d’une corrélation entre irrégularité et la fréquence: les éléments à fréquence plus élevée sont plus susceptibles d’être irréguliers et les éléments irréguliers sont plus susceptibles d’être très fréquents. À notre connaissance, ce résultat est le premier de son ampleur et confirme les propositions de longue date de la littérature linguistique. La corrélation est plus robuste lorsqu’elle est agrégée au niveau de paradigmes entiers – fournissant un support aux modèles de structure linguistique dans lesquels les formes infléchies sont unifiées par des racines ou des lexèmes sous-jacents abstraits. Le code est disponible à cette URL https.

Reference

https://arxiv.org/abs/1906.11483

Linked Profiles