Descriptif détaillé du Projet

Detailed description of the Project

 

Le corpus sera constitué d'enregistrements transcrits, glosés et traduits, accompagnés de leurs fichiers sons.

Pour les documents écrits, une traduction juxtalinéaire (glose en morphèmes) et globale devra être fournie.

Voici un exemple extrait d'un corpus de kabyle.

 

 

écouter 

 

transcription

N(document pdf)

 

 

Certains textes seront accompagnés d'une transcription phonétique et/ou phonologique. Les documents ayant vocation à être ainsi complétés sont :

-         ceux qui seront utilisés pour l'analyse intonative (avec un fichier son respectant certaines normes de qualité)

-         ceux qui concernent des parlers peu décrits (Siwa...)

-         ceux qui mettent en jeu des enfants en période d'acquisition (avant 3 ans)

 

Le principe adopté est coopératif : les personnes qui contribuent au corpus en donnant leurs enregistrements et textes, pourront en retour bénéficier des textes des autres.

 

Si vous souhaitez participer à ce projet, prenez contact auprès d'Amina Mettouchi, après avoir lu les documents de ce site. Merci.

 

 

 

 

Le développement qui suit s'adresse aux collecteurs et collectrices isolé(e)s, et fournit des conseils et des outils pour que la constitution d'un corpus personnel puisse en même temps servir au projet global présenté ici.

 

 Les étapes de constitution du corpus

 

Pourquoi rassembler un corpus ? Parce que l'on a un centre d'intérêt, linguistique ou culturel, précis. C'est à partir de ce centre d'intérêt que l'on devra réfléchir à son angle d'approche. On ne peut pas simplement enregistrer des heures de corpus sans avoir préalablement cerné ses objectifs : étudier un point de grammaire précis ? S'intéresser à la production poétique ? Analyser la dynamique conversationnelle ? Collecter des contes ?...

Une fois l'objectif individuel établi, on peut choisir un terrain, une situation, un thème propices à la collecte des matériaux visés.

 

1. Collecte

 

1.1. Choix d'une approche

 

Pour collecter des matériaux en vue de la constitution d'un corpus, il faut au préalable adopter une approche liée à la situation considérée :

 

F Soit on est locuteur de la variété de berbère collectée, et alors on prend contact avec une famille, ou les amis avec lesquels on va travailler, pour prévoir des séances d'enregistrement. Plusieurs rendez-vous sont souvent nécessaires pour trouver : les personnes prêtes à se laisser enregistrer, le lieu propice (éviter les lieux bruyants), le moment propice (pour éviter d'être dérangés).

 

F Soit on n'est pas locuteur du parler, et alors, il faut suivre la procédure décrite dans les manuels de travail sur le terrain (voir la présentation de N. Louali, téléchargeable sur ce site (.pdf)).

 

Il faut avoir préparé à l'avance les demandes que l'on fait aux locuteurs, en fonction du type de matériau visé et de la problématique.

En sémantique, si l'on s'intéresse au système verbal par exemple, on aura intérêt à varier les thèmes : en collectant des recettes de cuisine, on obtiendra des aoristes, en collectant des récits de vie, des accomplis.

En pragmatique et structure de l'information, on aura intérêt à collecter de la conversation spontanée, mais également des narrations (contes, par exemple).

Il vaut mieux éviter, sauf si c'est notre objectif de collecte, les conversations à plus de deux participants : la transcription devient très ardue.

Les types de discours sont très nombreux : monologues privés ou publics, dialogues privés ou publics (pour une liste indicative, voir la présentation d'A. Mettouchi, téléchargeable sur ce site (au format .pdf)).

 

1.2. Matériel audio

 

Collecter du corpus prend du temps, il faut donc s'assurer de ne pas travailler 'pour rien'. Le choix du matériel audio est essentiel. De lui dépendront beaucoup de choses, dont la fiabilité de la transcription.

Nos suggestions sont les suivantes :

F DAT ou Mini-Disk, ou à défaut, un bon magnétophone à cassettes.

F Un micro par locuteur.

F Si possible, un magnétoscope pour enregistrer l'interaction (si les personnes sont d'accord pour se laisser filmer).

ê Attention, il ne faut pas utiliser d'appareil à activation vocale, les pauses sont importantes dans l'étude d'une langue.

Si l'on enregistre des matériaux en vue d'une étude acoustique (et pas seulement pour les transcrire), les normes et conseils sont plus stricts. Pour plus de détails, contactez Amina Mettouchi.

 

1.3. Fiche de collecte

 

Elle est indispensable pour que, même dans dix ou vingt ans ou plus, nous conservions les renseignements liés à l'enregistrement qui nous sera confié.

Elle est téléchargeable ici et photocopiable.

 

 

2. Transcription

 

On ne procèdera pas de la même manière selon que la variété de berbère que l'on peut collecter est bien décrite (kabyle) ou peu connue (siwi).

 

2.1. Notation usuelle, notation phonétique ou notation phonologique ?

 

F La notation usuelle sera utilisée pour les parlers les plus documentés et pour lesquels une habitude de notation est largement répandue (Kabyle, Chleuh, Rifain, …). Un minimum d’initiation à ce type de notation est néanmoins nécessaire pour en faciliter l’usage surtout pour des utilisateurs non berbérophones ou n’ayant jamais eu recours à ce type de notation (voir, pour une présentation générale, les liens pdf. en 4.2 a) et b) en bas de cette page)

 

F La notation phonétique (avec également une notation phonologique) pour les parlers peu documentés et décrits (le Siwi par exemple) ou alors pour des parlers présentant des caractéristiques particulières qui peuvent présenter un intérêt particulier dans le cadre de l’analyse ou de l’étude envisagées.

 

F La notation phonétique sera également utilisée pour les conversations avec des enfants en début d'acquisition du langage (avant 3 ans) : cela permet d'éviter de trop plaquer sur les productions enfantines (ou justement l'intérêt est d'étudier l'évolution du langage) des interprétations fondées sur le langage de l'adulte.

 

Une ligne de traduction juxtalinéaire (morphèmes et lexèmes alignés avec la transcription) est indispensable. Cette traduction juxtalinéaire comportera les abréviations standardisées suivantes :

 

Liste des abréviations (format pdf)

 

Il faut également donner une ligne de traduction globale (en français ou en anglais).

 

Remarque : selon la nature de l’étude, il pourra être nécessaire d’avoir recours à deux ou plusieurs notations à la fois.

 

2.2. Que noter ?

 

Il faut tout noter, y compris les chevauchements de parole, les hésitations, les bruits environnants, etc.

La notation de ces phénomènes interactifs se fera à l’aide de la liste de symboles suivante :

 

 Liste des symboles (format pdf)

 

 

3.  Mise en commun des données

 

3.1. envoyer le fichier-son numérisé (format .wav) ou à défaut, une copie audio de votre enregistrement

 

3.2. envoyer le texte (format .rtf ou .doc)

 

Attention, il faut utiliser les tabulations du traitement de texte (et pas les espaces) pour aligner la traduction juxtalinéaire à la transcription.

 

3.3.  envoyer ses coordonnées (pour être enregistré comme contributeur et avoir accès à l'ensemble des données) et sa fiche de collecte

 

Cet ensemble d'éléments doit être envoyé à l'adresse suivante:

 

Projet Corpus Berbère,

Centre de Recherche Berbère

Institut National des Langues et Civilisations Orientales (INALCO)

2 rue de Lille

75007 Paris, France

 

4.  Documents utiles

 

4.1. Fiche de collecte (télécharger ici)

 

4.2. Notation usuelle (télécharger ici)

a)    Notation usuelle, atelier INALCO-CRB, 1996 [http://www.inalco.fr/pub/enseignements/langues/afrique/berbere/docs_pdf/notation.pdf]

 

b)    Aménagement du berbère, Atelier INALCO-CRB, 1998 [http://www.inalco.fr/pub/enseignements/langues/afrique/berbere/docs_pdf/amenage1998.pdf]

 

 

4.3.  Alphabet Phonétique International ( http://www.unil.ch/ling/phon/index.html )

 

4.4.  Un site dédié aux corpus (http://devoted.to/corpora)

 

 

Accueil