A data repository for the management of dynamic linguistic datasets - Conflits, représentations et dialogues dans l'univers anglo-saxon - UR UPJV 4295 Accéder directement au contenu
Communication Dans Un Congrès Année : 2021

A data repository for the management of dynamic linguistic datasets

Résumé

This paper addresses the issue of using Nakala, a dynamic database technology, for the management of language corpora. We present our ongoing attempt at storing and classifying multimedia documents of a corpus of language learner oral and written productions with universal resource identifiers. The architecture supports query APIs compatible with R packages and other tools which will facilitate the generation of linguistically enriched datasets for a more effective corpus-based study of language acquisition.
Fichier principal
Vignette du fichier
CLARIN2021_Nakala.pdf (163.86 Ko) Télécharger le fichier
Clarin_Gaillat_Contreras-Roa_Attoumbre.pdf (352.1 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03343010 , version 1 (13-09-2021)

Identifiants

  • HAL Id : hal-03343010 , version 1

Citer

Thomas Gaillat, Leonardo Contreras Roa, Juvénal Attoumbre. A data repository for the management of dynamic linguistic datasets. CLARIN Annual Conference 2021, Sep 2021, Madrid (online), Spain. ⟨hal-03343010⟩
81 Consultations
75 Téléchargements

Partager

Gmail Facebook X LinkedIn More