Descriptif détaillé du Projet
Detailed description of the Project
Le corpus sera constitué d'enregistrements transcrits,
glosés et traduits, accompagnés de leurs fichiers sons.
Pour les documents écrits, une traduction juxtalinéaire (glose
en morphèmes) et globale devra être fournie.
Voici un exemple extrait d'un corpus de kabyle.
écouter
|
transcription
N |
Certains textes seront accompagnés d'une transcription phonétique
et/ou phonologique. Les documents ayant vocation à être ainsi complétés sont :
- ceux qui
seront utilisés pour l'analyse intonative (avec un fichier son respectant
certaines normes de qualité)
- ceux qui
concernent des parlers peu décrits (Siwa...)
- ceux qui
mettent en jeu des enfants en période d'acquisition (avant 3 ans)
Le principe adopté est coopératif : les personnes qui
contribuent au corpus en donnant leurs enregistrements et textes, pourront en
retour bénéficier des textes des autres.
Si vous souhaitez participer à ce projet, prenez contact
auprès d'Amina Mettouchi, après avoir lu les
documents de ce site. Merci.
Le développement qui suit s'adresse aux collecteurs et
collectrices isolé(e)s, et fournit des conseils et des outils pour que la
constitution d'un corpus personnel puisse en même temps servir au projet global
présenté ici.
Les étapes de constitution
du corpus
Pourquoi rassembler un corpus ? Parce que l'on a un centre
d'intérêt, linguistique ou culturel, précis. C'est à partir de ce centre
d'intérêt que l'on devra réfléchir à son angle d'approche. On ne peut pas
simplement enregistrer des heures de corpus sans avoir préalablement cerné ses
objectifs : étudier un point de grammaire précis ? S'intéresser à la production
poétique ? Analyser la dynamique conversationnelle ? Collecter des contes ?...
Une fois l'objectif individuel établi, on peut choisir un
terrain, une situation, un thème propices à la collecte des matériaux visés.
1. Collecte
1.1. Choix d'une
approche
Pour collecter des matériaux en vue de la constitution
d'un corpus, il faut au préalable adopter une approche liée à la situation
considérée :
F Soit on est locuteur
de la variété de berbère collectée, et alors on prend contact avec une famille,
ou les amis avec lesquels on va travailler, pour prévoir des séances
d'enregistrement. Plusieurs rendez-vous sont souvent nécessaires pour trouver :
les personnes prêtes à se laisser enregistrer, le lieu propice (éviter les
lieux bruyants), le moment propice (pour éviter d'être dérangés).
F Soit on n'est pas
locuteur du parler, et alors, il faut suivre la procédure décrite dans les
manuels de travail sur le terrain (voir la présentation de N. Louali, téléchargeable sur
ce site (.pdf)).
Il faut avoir préparé à l'avance les demandes que l'on
fait aux locuteurs, en fonction du type de matériau visé et de la
problématique.
En sémantique, si l'on s'intéresse au système verbal par
exemple, on aura intérêt à varier les thèmes : en collectant des recettes de
cuisine, on obtiendra des aoristes, en collectant des récits de vie, des
accomplis.
En pragmatique et structure de l'information, on aura
intérêt à collecter de la conversation spontanée, mais également des narrations
(contes, par exemple).
Il vaut mieux éviter, sauf si c'est notre objectif de
collecte, les conversations à plus de deux participants : la transcription
devient très ardue.
Les types de discours sont très nombreux : monologues
privés ou publics, dialogues privés ou publics (pour une liste indicative, voir
la présentation d'A.
Mettouchi, téléchargeable sur ce site (au format .pdf)).
1.2. Matériel audio
Collecter du corpus prend du temps, il faut donc s'assurer
de ne pas travailler 'pour rien'. Le choix du matériel audio est essentiel. De lui
dépendront beaucoup de choses, dont la fiabilité de la transcription.
Nos suggestions sont les suivantes :
F DAT ou Mini-Disk, ou à
défaut, un bon magnétophone à cassettes.
F Un micro par locuteur.
F Si possible, un
magnétoscope pour enregistrer l'interaction (si les personnes sont d'accord
pour se laisser filmer).
ê Attention, il ne faut
pas utiliser d'appareil à activation vocale, les pauses sont importantes dans
l'étude d'une langue.
Si l'on enregistre des matériaux en vue d'une étude
acoustique (et pas seulement pour les transcrire), les normes et conseils sont
plus stricts. Pour plus de détails, contactez Amina Mettouchi.
1.3. Fiche de collecte
Elle est indispensable pour que, même dans dix ou vingt
ans ou plus, nous conservions les renseignements liés à l'enregistrement qui
nous sera confié.
Elle est téléchargeable ici et photocopiable.
2. Transcription
On ne procèdera pas de la même manière selon que la
variété de berbère que l'on peut collecter est bien décrite (kabyle) ou peu
connue (siwi).
2.1. Notation usuelle,
notation phonétique ou notation phonologique ?
F La notation usuelle
sera utilisée pour les parlers les plus documentés et pour lesquels une
habitude de notation est largement répandue (Kabyle, Chleuh, Rifain, …). Un
minimum d’initiation à ce type de notation est néanmoins nécessaire pour en
faciliter l’usage surtout pour des utilisateurs non berbérophones ou n’ayant
jamais eu recours à ce type de notation (voir, pour une présentation générale,
les liens pdf. en 4.2 a) et b) en bas de cette page)
F La notation phonétique
(avec également une notation phonologique) pour les parlers peu documentés et
décrits (le Siwi par exemple) ou alors pour des parlers présentant des
caractéristiques particulières qui peuvent présenter un intérêt particulier
dans le cadre de l’analyse ou de l’étude envisagées.
F La notation phonétique
sera également utilisée pour les conversations avec des enfants en début d'acquisition
du langage (avant 3 ans) : cela permet d'éviter de trop plaquer sur les
productions enfantines (ou justement l'intérêt est d'étudier l'évolution du
langage) des interprétations fondées sur le langage de l'adulte.
Une ligne de traduction juxtalinéaire (morphèmes et
lexèmes alignés avec la transcription) est indispensable. Cette traduction
juxtalinéaire comportera les abréviations standardisées suivantes :
Liste des abréviations
(format pdf)
Il faut également donner une ligne de traduction globale
(en français ou en anglais).
Remarque : selon la nature de
l’étude, il pourra être nécessaire d’avoir recours à deux ou plusieurs
notations à la fois.
2.2. Que noter ?
Il faut tout noter, y compris les chevauchements de
parole, les hésitations, les bruits environnants, etc.
La notation de ces phénomènes interactifs se fera à l’aide
de la liste de symboles suivante :
Liste
des symboles (format pdf)
3. Mise en commun
des données
3.1. envoyer le fichier-son numérisé (format .wav) ou à
défaut, une copie audio de votre enregistrement
3.2. envoyer le texte (format .rtf ou .doc)
Attention, il faut utiliser les tabulations du traitement de
texte (et pas les espaces) pour aligner la traduction juxtalinéaire à la
transcription.
3.3. envoyer ses
coordonnées (pour être enregistré comme contributeur et avoir accès à
l'ensemble des données) et sa fiche de collecte
Cet ensemble d'éléments doit être envoyé à l'adresse
suivante:
Projet Corpus Berbère,
Centre de Recherche Berbère
Institut National des Langues et Civilisations Orientales
(INALCO)
2 rue de Lille
75007 Paris, France
4. Documents
utiles
4.1.
Fiche de collecte (télécharger ici)
4.2. Notation usuelle (télécharger ici)
a)
Notation usuelle, atelier INALCO-CRB, 1996
[http://www.inalco.fr/pub/enseignements/langues/afrique/berbere/docs_pdf/notation.pdf]
b)
Aménagement du berbère, Atelier INALCO-CRB, 1998
[http://www.inalco.fr/pub/enseignements/langues/afrique/berbere/docs_pdf/amenage1998.pdf]
4.3. Alphabet
Phonétique International ( http://www.unil.ch/ling/phon/index.html )
4.4. Un site
dédié aux corpus (http://devoted.to/corpora)