Pourquoi un corpus berbère ?
Les développements
actuels de la linguistique générale et typologique, ainsi que les besoins des
chercheurs en traitement automatique des langues, donnent une place
particulière à la recherche fondée sur des corpus. Or ceux-ci ont été majoritairement composés
dans des langues à grande diffusion comme l'anglais. Des initiatives visant à
promouvoir de telles collections de textes pour des langues moins bien
documentées se développent actuellement.
C'est dans cette dynamique
que se situe le projet Corpus Berbère, qui a été présenté pour la première fois
à l'INALCO en décembre 2000, en même temps qu'un projet de description des intonations du berbère. De
ces deux actions, proposées par A. Mettouchi, la seconde a déjà été mise en
œuvre, et constituera à terme un volet de la première.
En effet, le caractère
prioritairement oral des langues berbères, et l'importance du lien entre
structure informationnelle, intonation, pragmatique et morpho-syntaxe, nous
amènent à viser la constitution d'un corpus composé majoritairement
d'enregistrements, audio et vidéo, rattachés à une transcription unifiée et une
traduction. Des textes de néo-littérature, ainsi que des productions
journalistiques seront également intégrés, dans les parlers pour lesquels le
passage à l'écrit s'est fait. L'accent est mis sur la variété des genres, des
dialectes et des locuteurs. Les corpus conversationnels ainsi que les
interactions culturellement spécifiques sont au cœur de notre projet.
La première étape de
constitution de ce corpus, qui est en cours, consiste à contacter des
partenaires nationaux et internationaux, mettre en place des normes pour la
collecte de données (normes d'enregistrement en vue d'un traitement prosodique,
informations unifiées sur les locuteurs, les genres, et les conditions
d'enregistrement, système d'archivage, accès…).
Une journée d'étude a eu
lieu Vendredi 6 décembre 2002 à l'INALCO, 2 rue de Lille 75007 Paris.
Une page décrivant de manière détaillée le processus de collecte et de
transcription est accessible à partir de
cette page.
Outre les chercheurs
de l'INALCO, ce projet rassemble des chercheurs (associés au CRB ou collaborant
avec celui-ci) appartenant à plusieurs établissements.
Salem Chaker,
Professeur à l'INALCO |
Abdallah Bounfour,
Professeur à l'INALCO |
Rachid Bellil,
Chercheur associé à l'INALCO |
Amina Mettouchi,
Maître de Conférences à l'Université de Nantes, |
Hakim Smaïl,
Doctorant à Paris 5 ; chargé de cours Inalco/Paris 5 |
Johanna Kuningas,
Doctorante à Paris 3 |
Yasmina Oubouzar,
DEA à l'INALCO |
Farida Chekri, DEA à
l'INALCO |
Abdallah Boumalk,
Maître-Assistant, Université d'Oujda, Maroc |
Mena Lafkioui,
Assistante de recherche, université de Leyden, Pays-Bas |
Naïma Louali,
Chargée de Recherche au CNRS, DDL-Lyon 2 |
Nora Tigziri,
Maître-Assistante, Université de Tizi-Ouzou, Algérie |
Rachid Ridouane,
Doctorant à l'ILPGA, Paris 3 |
Cette liste n'est pas
limitative. Si ce projet vous intéresse, merci de prendre contact avec:
amina.mettouchi@humana.univ-nantes.fr