LINGUISTIQUE DE CORPUS

LINGUISTIQUE DE CORPUS

Approche en linguistique de corpus

« … la langue a l’air assez différente quand on examine un grand morceau d’un coup » [une remarque de Sinclair citée dans l’ouverture de l’ouvrage de Habert et al. (1997)] Il va sans dire que depuis longtemps, la plupart des linguistes, surtout ceux qui exercent la linguistique de terrain, s’appuient sur des « corpus » de diverses formes dans leurs travaux. Or le terme « corpus » est employé dans notre étude avec un sens spécifique défini dans le cadre de la linguistique de corpus dont nous nous inspirons. Comme pour toute terminologie lorsqu’il s’agit de domaines assez « nouveaux » tels que la linguistique de corpus qui ne s’est développée qu’à partir des années quatrevingts (Williams, 2005)% , les avis divergent concernant la définition du terme « corpus », selon l’approche que l’on adopte ou le but/genre des analyses. Il nous semble donc utile et important de considérer au premier abord ce qu’implique la linguistique de corpus en général, et ensuite pour les analyses des fonctions discursives du birman parlé. Plusieurs linguistes reconnaissent que le terme même « linguistique de corpus » qui est en fait la traduction littérale de corpus linguistics en anglais, issue d’une tradition anglo-saxonne, reste une notion plutôt floue en français [cf. Williams, 2006 ; UFR EILA, 1223″445600789::%;97<=4=;>1;=>1;7:12?0, etc.]. Williams (2006), dans son article intitulé « La linguistique et le corpus : une affaire prépositionnelle » explique son point de vue comme suit : dans le terme original en anglais corpus linguistics, le mot « linguistique » représente la discipline et le mot « corpus » décrit son objet, laissant le reste sujet à l’interprétation. Il soutient ainsi que « la puissance de l’anglais est dans l’ambiguïté » mais qu’en français la situation est plus complexe, étant donné que l’on ne peut pas juxtaposer les deux mots sans préposition. Or le choix de préposition entre ‘de’, ‘des’, ou ‘sur’ n’est pas chose simple, car chaque choix implique une interprétation différente : de signifiera la présence d’une discipline unique ; des suggère que plusieurs disciplines (et non plusieurs approches de la même discipline) sont en jeu ; sur implique que d’autres domaines de la linguistique peuvent utiliser les corpus sans faire de la linguistique de corpus per se, ce qui soulève la question de la nature des corpus (p.151)% . Mellet (2002 : 2) partage l’avis de Williams en soulignant que la notion de corpus « s’est complexifiée au cours des dernières années en fonction de la diversité des pratiques et des objectifs assignés à la constitution et à l’exploitation des corpus ». Rastier (2005 :31), pour sa part reconnaît que « la linguistique de corpus ne constitue aucunement un domaine de recherche unifié ». En effet, le titre même d’un des ouvrages clés sur le sujet pour les francophones,%% « Les Linguistiques de corpus » de Habert et al. (1997) souligne l’hétérogénéité du domaine de recherche. Ces derniers utilisent également le terme « la linguistique à base de corpus », dont la condition décisive est l’accès à de vastes ensembles des données linguistiques sous forme électronique. Ce débat pourrait continuer (sans doute à l’infini) si l’objet de notre étude portait sur cette nouvelle discipline, mais ce n’est pas le cas ici%%%. En ce qui concerne nos analyses, nous proposons donc de souligner simplement quelques notions pertinentes de la linguistique de corpus et en particulier la façon dont nous les appliquons à notre enquête sur les particules énonciatives en birman. Nous présentons les quatre approches adoptées dans notre analyse de corpus, avant d’arriver à la définition de corpus appliquée, qui est un peu différente de celle employée d’une façon générale parmi les linguistes.

Approche descriptive des faits réels

D’une manière générale, la linguistique de corpus s’intéresse à la langue en contexte sous la forme de grands ensembles de textes – les corpus – afin de « révéler les choix linguistiques opérés par des locuteurs dans des contextes réels » et à « comprendre les mécanismes de la communication » (Williams, 2005 :13). L’approche de la linguistique de corpus qui est par ailleurs l’apanage d’une linguistique descriptive, représente ainsi une « alternative à des démarches fondées sur l’introspection du linguiste ou sur l’élicitation de jugements des locuteurs » (Mondada, 2005 :75). C’est tout à fait un avis partagé par d’autres linguistes : par exemple, le motif essentiel de la linguistique de corpus est, selon Jacques (2005), l’intérêt grandissant de la linguistique pour ces aspects impossibles à traiter par l’introspection et l’intuition. Cela correspond/convient exactement à l’objectif principal de notre enquête, i.e. de chercher à comprendre le rôle et les fonctions discursives des particules en birman dont les fonctions grammaticales seules ne donnent pas une explication satisfaisante [cf. 1.3.2.2 : Morphèmes dépendants]. Cela n’est guère étonnant si l’on considère l’observation de Jacques (2005 :25)% que la capacité des phénomènes discursifs échappe souvent aux capacités d’invention hors situation réelle.En nous appuyons sur le corpus du birman parlé (de divers genres et locuteurs) enregistré que nous avons constitué, notre description des particules énonciatives se fonde sur des faits observables i.e. des traces (transcriptions) des paroles produites pour des raisons de communication entre êtres humains, et non sur des productions (parfois « artificielles ») produites par ou pour l’introspection des linguistes. Nous estimons ainsi qu’une telle approche nous permettra de dépasser la grammaire normative, et par conséquent c’est une approche qui nous semble idéale et séduisante, surtout pour mettre en lumière des fonctions discursives des particules birmanes, dont le sens est souvent à interpréter dans le contexte

Approche contextualiste

« You shall know a word from the company it keeps ». [Vous connaissez un mot par la compagnie qu’il tient] [Firth (1935), traduction citée dans William (2006)] Le propos de Firth ci-dessus décrit précisément la situation des particules énonciatives en birman, dont la valeur sémantique est étroitement liée au contexte, comme nous l’avons indiqué précédemment. De ce fait, nous jugeons ce choix d’approche idéal, car la linguistique de corpus est, selon Williams (2006 :153), de par sa nature, contextualiste. Dans cette approche, il s’agit d’observer de grands ensembles de textes soigneusement choisis pour les besoins de la recherche linguistique. Par la suite, ces textes représentent une partie de la langue en action. Dans ce sens, l’environnement de la langue, avec tous les aspects sociolinguistiques, doit être pris en compte, c’est à dire, le contexte culturel et le contexte situationnel. De nos jours, personne ne niera plus que le sens (dans la compréhension de la langue) ne puisse pas être évalué en dehors du contexte situationnel. Reconnaissant que le contexte est primordial dans nos interprétations des particules énonciatives, nous consacrons également une place considérable au contexte dans la présentation des données afin de bien accompagner nos lecteurs.

Approche inductive (corpus-drive approach)

Parmi les deux approches fondamentales de la linguistique de corpus, notre travail s’inscrit plutôt dans l’approche inductive motivée par le corpus, corpus-driven en anglais% (cf. Sinclair 1987 ; Tognini-Bonelli 2001 ; Williams 2005 ; Hnin Tun 2006, ente autres) que de l’approche déductive appliquée au corpus, corpus-based en anglais (cf. Leech 1987, Biber 1998, Williams 2005, etc.). L’approche déductive%% utilise les donnés dans le corpus pour confirmer ou infirmer la validité des hypothèses. Les adeptes de cette approche cherchent à explorer des aspects et des phénomènes connus de la langue, dans les situations concrètes des corpus. L’approche de notre choix, i.e. l’approche inductive!!! motivée par le corpus, cherche à examiner en revanche sans a priori ni charpente théorique préétablie, des unités de corpus telles que des éléments récurrents (recurring patterns en anglais), des constructions lexicales ainsi que syntaxiques, afin d’aboutir « à la description des régularités linguistiques et à la formulation des conceptions théoriques » (Martelli, 2003 :15). Par exemple pour chaque particule dans notre étude, nous examinons ses éléments récurrents qui servent à identifier les contextes (syntaxiques ou situationnelles) dans lesquels les particules sont employées. Pendant les analyses nous posons des questions telles que Est-ce que la particule X apparaît régulièrement avec les pronoms ou les noms ? Dans une construction affirmative ou négative ? Au début ou à la fin du tour de parole ? et ainsi de suite. Nous estimons que les réponses à ces questions mettent en lumière les fonctions discursives des particules.

Cours gratuitTélécharger le cours complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *