Enjeux des corpus bilingues en diachronie longue : l’exemple du projet MICLE

Mathieu Goux

Download from

dx.doi.org

More download options

Enjeux des corpus bilingues en diachronie longue : l’exemple du projet MICLE

Mathieu Goux

Corpus 25 (2024) Copy BIBT_EX

Abstract

La multiplication des très grands corpus en linguistique historique a entraîné des discussions nombreuses sur les procédures d’annotation et les métadonnées associées, notamment concernant les questions relevant de l’étiquetage morphosyntaxique et de la tokenisation. D’autres sujets cruciaux, en revanche, semblent moins abordés, comme la question de la découpe en propositions ou en « phrases » des données linguistiques, la préservation des informations philologiques ou, encore, la question de l’encodage et des formats de données. Notre contribution explore ces thématiques en prenant exemple sur le corpus MICLE, qui a dû résoudre des difficultés inédites au long de sa constitution.

Cite

Plain text

BibTeX

Formatted text

Zotero

EndNote

Reference Manager

RefWorks

Options

Mark as duplicate

Find it on Scholar

Request removal from index

Translate to english

Revision history

Edit

Keywords

annotation syntaxique computational linguistics corpus linguistics corpus linguistics, computational linguistics, historical linguistics, format, syntactic annotation diachronie, linguistique outillée, linguistique de corpus, format, annotation syntaxique format historical linguistics linguistique de corpus linguistique outillée syntactic annotation diachronie

Reprint years

DOI

10.4000/corpus.8468

My notes

Similar books and articles

Traitement des lexies d’émotion dans les corpus et les applications d’EmoBase.Sascha Diwersy, Vannina Goossens, Anke Grutschus, Beate Kern, Olivier Kraif, Elena Melnikova & Iva Novakova - 2014 - Corpus 13:269-293.

Basic theoretical principles of corpus linguistics.Azizbek Vosiljonov - unknown

Linguistique de corpus philosophiques: l'exemple de Deleuze.Sylvain Loiseau & François Rastier - 2011 - In Patrice Maniglier (ed.), Le moment philosophique des années 1960 en France. Paris: Presses universitaires de France. pp. 73--93.

Syntactic Annotation of Old French Text Corpora.Achim Stein - 2008 - Corpus 7.

Un corpus pour l’analyse de la variation et du changement linguistique.France Martineau - 2008 - Corpus 7.

Syntactic Annotation of Old French Text Corpora.Achim Stein - 2008 - Corpus 7.

The phraseology of the contemporary fiction in the PhraseoBase’s corpora and applications.Sascha Diwersy, Laetitia Gonon, Vannina Goossens, Olivier Kraif, Iva Novakova, Julie Sorba & Ilaria Vidotto - 2021 - Corpus 22.

Penn parsed corpora of historical English.Anthony Kroch - unknown

Constitution d’un corpus plurilingue en sociolinguistique historique : objectifs, méthodologie et défis.Carole Werner - 2024 - Corpus 25.

Croiser les corpus calibrés pour faire l’histoire de la langue : le cas de l’antéposition stylistique de l’infinitif et du participe.Pierre Goux Larrivée - 2024 - Corpus 25.

Un corpus pour l'analyse de la variation et du changement linguistique.France Martineau - 2008 - Corpus 7.

Profiterole : un corpus morpho-syntaxique et syntaxique de français médiéval.Sophie Grobol Prévost - 2024 - Corpus 25.

Parole e testi : l’esperienza di un atlante.Sabina Canobbio - 2013 - Corpus 12:39-60.

Le corpus PhraséoRoChe : les défis de l’établissement des textes et de l’hétérogénéité des états de la langue.Corinne Kraif Denoyelle - 2024 - Corpus 25.

Eléments initiaux : combinaisons et schémas préférentiels dans un corpus d’articles scientifiques.Frédérique Mélanie-Becquet & Sophie Prevost - 2014 - Corpus 13:29-60.

Analytics

Added to PP
2024-02-02

Downloads
8 (#1,322,828)

6 months
8 (#370,225)

Historical graph of downloads

How can I increase my downloads?

Citations of this work

No citations found.

Add more citations

References found in this work

No references found.

Add more references

Applied ethics	Epistemology	History of Western Philosophy	Meta-ethics	Metaphysics	Normative ethics
Philosophy of biology	Philosophy of language	Philosophy of mind	Philosophy of religion	Science Logic and Mathematics	More ...

Enjeux des corpus bilingues en diachronie longue : l’exemple du projet MICLE

Abstract

Categories

Keywords

Reprint years

DOI

Links

PhilArchive

External links

Through your library

My notes

Similar books and articles

Analytics

Citations of this work

References found in this work