Pourquoi un corpus berbère ?

Les développements actuels de la linguistique générale et typologique, ainsi que les besoins des chercheurs en traitement automatique des langues, donnent une place particulière à la recherche fondée sur des corpus.  Or ceux-ci ont été majoritairement composés dans des langues à grande diffusion comme l'anglais. Des initiatives visant à promouvoir de telles collections de textes pour des langues moins bien documentées se développent actuellement.

C'est dans cette dynamique que se situe le projet Corpus Berbère, qui a été présenté pour la première fois à l'INALCO en décembre 2000, en même temps qu'un projet de description des intonations du berbère. De ces deux actions, proposées par A. Mettouchi, la seconde a déjà été mise en œuvre, et constituera à terme un volet de la première.

En effet, le caractère prioritairement oral des langues berbères, et l'importance du lien entre structure informationnelle, intonation, pragmatique et morpho-syntaxe, nous amènent à viser la constitution d'un corpus composé majoritairement d'enregistrements, audio et vidéo, rattachés à une transcription unifiée et une traduction. Des textes de néo-littérature, ainsi que des productions journalistiques seront également intégrés, dans les parlers pour lesquels le passage à l'écrit s'est fait. L'accent est mis sur la variété des genres, des dialectes et des locuteurs. Les corpus conversationnels ainsi que les interactions culturellement spécifiques sont au cœur de notre projet.

 

La première étape de constitution de ce corpus, qui est en cours, consiste à contacter des partenaires nationaux et internationaux, mettre en place des normes pour la collecte de données (normes d'enregistrement en vue d'un traitement prosodique, informations unifiées sur les locuteurs, les genres, et les conditions d'enregistrement, système d'archivage, accès…).

Une journée d'étude a eu lieu Vendredi 6 décembre 2002 à l'INALCO, 2 rue de Lille 75007 Paris.

Une page décrivant de manière détaillée le processus de collecte et de transcription est accessible à partir de cette page.

 

 

Outre les chercheurs de l'INALCO, ce projet rassemble des chercheurs (associés au CRB ou collaborant avec celui-ci) appartenant à plusieurs établissements.

 

Salem Chaker, Professeur à l'INALCO

Abdallah Bounfour, Professeur à l'INALCO

Rachid Bellil, Chercheur associé à l'INALCO

Amina Mettouchi, Maître de Conférences à l'Université de Nantes,
      chercheur associé à l'INALCO

Hakim Smaïl, Doctorant à Paris 5 ; chargé de cours Inalco/Paris 5

Johanna Kuningas, Doctorante à Paris 3

Yasmina Oubouzar, DEA à l'INALCO

Farida Chekri, DEA à l'INALCO

Abdallah Boumalk, Maître-Assistant, Université d'Oujda, Maroc

Mena Lafkioui, Assistante de recherche, université de Leyden, Pays-Bas

Naïma Louali, Chargée de Recherche au CNRS, DDL-Lyon 2

Nora Tigziri, Maître-Assistante, Université de Tizi-Ouzou, Algérie

Rachid Ridouane, Doctorant à l'ILPGA, Paris 3

 

Cette liste n'est pas limitative. Si ce projet vous intéresse, merci de prendre contact avec:

 

amina.mettouchi@humana.univ-nantes.fr

 

accueil