|
Les outils informatiques
Bernard Cerquiglini
J’aimerais tout d’abord rebondir sur la proposition du Livre Blanc évoquée par Xavier North qui me paraît excellente dans la mesure où il convient de lutter activement contre le défaitisme et contre le discours de la décadence. Le français a comme principaux adversaires la plupart de ses défenseurs : associations de défense du français, chroniqueurs mondains, conférenciers de deuxième ordre, etc.
Beaucoup d’écrivains vendent des livres sur ce principe de la décadence de la langue française. Je me rappelle une conférence que je donnais avec mon amie Henriette Walter sur l’état du français. La salle était très hostile car les participants avaient payé pour entendre que tout allait mal, or nous disions que le français n’avait jamais été autant écrit et parlé.
Il faut absolument s’opposer à ce discours sur la décadence qui date du XVIIIe siècle. Quand Marc Fumaroli parle de l’époque où l’Europe parlait français, il s’agissait des intellectuels des châteaux. En réalité, seuls 2,5 millions de personnes parlaient effectivement le français dans notre pays. Par ailleurs, grâce à l’électronique, on n’a jamais autant écrit le français. Les machines tournent et constatent le néologisme foisonnant du français. Il me semble que l’on crée entre 30 000 et 35 000 mots chaque année.
J’ai, bien entendu, tendance à faire montre d’un optimisme un peu naïf. Il existe sans doute des côtés plus sombres. Toujours est-il qu’il serait très intéressant de faire un bon bilan de la situation. Nous ne manquons pas d’information pour cela. Tous les ans, le Haut Conseil de la francophonie et l’Organisation internationale de la francophonie publient un rapport annuel sur l’état de la langue française. Le dernier a été publié la semaine dernière aux éditions Larousse. Par ailleurs, la Délégation à la langue française rend son rapport au Parlement de la République française sur l’état du français en France et dans les autres pays. Ces deux rapports sont faits en étroite relation. Les Québécois réalisent également des enquêtes. L’essentiel du travail consisterait donc en une vaste compilation des données disponibles pour nous donner une bonne photographie. Celle-ci nous montrerait sans doute que le français n’est pas en péril dans sa vitalité mais peut-être dans certaines de ses ambitions. Les différents organismes que j’ai mentionnés pourraient y travailler main dans la main.
1 Les avantages des outils informatiques
Cependant, la parole m’a été donnée pour que j’aborde la question des outils informatiques. Ils ont un double avantage.Le premier est celui de l’efficacité concrète. En effet, l’informatique permet un accès immédiat aux données et informations et la mise en commun de cours. Je pense notamment au projet Comète qui met en circulation des cours gratuits sur Internet.
Le second intérêt est symbolique. Les grandes langues internationales survivront si elles savent jouer le jeu de la modernité. Le Conseil supérieur de la langue française a consacré deux années de travaux à un bilan de tout ce dont nous disposons comme outils de traitement. Il en ressort qu’il existe de très nombreux logiciels et bases de données. Là encore, il serait très intéressant de mettre en place un portail dans lequel seraient mis à disposition les outils et les informations. Le projet « Technolangue » que nous pilotons en France en relation avec les ministères de la Culture, de la Recherche et de l’Éducation nationale va déboucher sur un portail de ce type en libre accès.
Je me permets de rappeler que le Trésor de la langue française informatisé est en libre accès sur Internet. Je vous propose de le comparer avec l’Oxford English Dictionnary, auprès duquel il supporte cette comparaison. Je vous rappelle que la base de données Frantexte contient l’ensemble de la littérature de langue française au complet, contrairement à la base de données anglaise qui n’en contient que des extraits. Nous venons d’y adjoindre une base d’ancien et de moyen français. Les textes ont été corrigés et édités d’une façon philologique parfaite, ce qui n’est pas le cas de beaucoup de bases de données disponibles sur Internet. Le logiciel permet des recherches paramétriques extraordinaires, par exemple l’étude de la fréquence des mots dans un texte.
Le seul problème réside dans le fait que l’accès n’est pas libre et gratuit, mais les maisons d’édition nous ont menacés de procès si nous mettions ces textes en accès libre, pensant que les gens pourraient télécharger les textes plutôt que de les acheter. De ce fait, nous autorisons seulement les laboratoires et les universités à les utiliser. Depuis longtemps, la délégation réfléchit à cette question dans la mesure où cette base est utile pour la pédagogie et pour la traduction. Les deux associations de traducteurs françaises nous ont récemment demandé d’avoir accès à cette base dans un but de recherche. Nous avons proposé de rencontrer le syndicat des éditeurs pour voir s’il ne serait pas possible de payer des droits globaux permettant à tous les professeurs de français du monde d’avoir accès à cette base. Nous avions proposé tout d’abord d’extraire de cette base les textes hors droit mais cela donne une très mauvaise image de la littérature française. Je rêve d’un outil global qui réunirait le TLF, Frantexte et les autres bases.
2 Le retard de la francophonie en matière de corpus de français oral
Je voudrais pointer un retard évident de la francophonie : il s’agit des corpus de français oral. Nous avons adjoint à Frantexte des ouvrages moins littéraires, des romans policiers et des bandes dessinées, mais cela n’en demeure pas moins de l’écrit. Par rapport au Portugal, Israël et d’autres pays, nous sommes donc en retard.
Naturellement, de nombreux travaux ont été réalisés, mais il faut avancer rapidement. Les besoins sont pédagogiques, industriels et de recherche. L’oral n’est pas que du relâchement comme le pensent les grammairiens. Il existe un oral de bonne tenue qui n’est pas de l’écrit. À partir du XVIIe siècle, l’oral et l’écrit se sont distingués ; il y a deux syntaxes, dont l’une de français oral de bonne tenue.
Nous pensons agir rapidement de façon interministérielle pour constituer rapidement un corpus. Pour cela, nous pensons mettre au point une norme de formatage du corpus puis financer une compilation des corpus existants. Pour cela, nous disposons des bandes magnétiques d’émissions de radio de l’Institut national de l’audiovisuel. Il est capital de sauver ces bandes périssables. Ce travail requiert de la réflexion scientifique, de la normalisation et beaucoup d’argent. Nous trouverons cet argent de manière à mettre ce corpus à la disposition de ceux qui le souhaitent.
|