1999: LES BIBLIOTHECAIRES DEVIENNENT CYBERTHECAIRES

= [Résumé]

Selon Peter Raggett, bibliothécaire depuis plus de vingt ans, «l’internet offre aux chercheurs un stock d’informations considérable. Le problème pour eux est de trouver ce qu’ils cherchent (en 1999). Jamais auparavant on n’avait senti une telle surcharge d’informations, comme on la sent maintenant quand on tente de trouver un renseignement sur un sujet précis en utilisant les moteurs de recherche disponibles sur l’internet. A mon avis, les bibliothécaires auront un rôle important à jouer pour améliorer la recherche et l’organisation de l’information sur le réseau. (…) La tâche du bibliothécaire sera de filtrer les informations pour le public. Personnellement, je me vois de plus en plus devenir un bibliothécaire virtuel. Je n’aurai pas l’occasion de rencontrer les usagers, ils me contacteront plutôt par courriel, par téléphone ou par fax, j’effectuerai la recherche et je leur enverrai les résultats par voie électronique.»

= Bibliothécaires et internet

Le bibliothécaire-documentaliste voit son activité professionnelle frappée de plein fouet par l'informatique puis par l’internet. Dans les années 1980, l'informatique permet aux bibliothécaires de remplacer des catalogues de fiches sur bristol par des catalogues consultables à l’écran, avec un classement alphabétique ou systématique effectué par la machine. L'informatisation du prêt et des commandes de livres fait disparaître l’impressionnant stock de fiches et bordereaux nécessaires lors des opérations manuelles. L’informatique en réseau permet ensuite la gestion de catalogues collectifs regroupant dans une même base de données les catalogues des bibliothèques de la même région, du même pays ou de la même spécialité, entraînant du même coup des services très facilités pour le prêt inter-bibliothèques et le regroupement des commandes auprès des fournisseurs. Puis les bibliothèques ouvrent un serveur minitel pour la consultation de leur catalogue, désormais disponible au domicile du lecteur. Ces catalogues sont progressivement transférés sur l’internet, avec une consultation plus souple et plus attractive que sur minitel. Outre le catalogue en ligne, les sites web des bibliothèques offrent un ensemble de documents numérisés ou encore un choix de liens hypertextes vers d’autres sites, évitant ainsi aux usagers de se perdre sur la toile.

Selon Olivier Bogros, directeur de la Bibliothèque municipale de Lisieux (Normandie), interviewé en juin 1998, l’internet est «un outil formidable d’échange entre professionnels (tout ce qui passe par le courrier électronique, les listes de diffusion et les forums) (…). C’est aussi pour les bibliothèques la possibilité d’élargir leur public en direction de toute la Francophonie. Cela passe par la mise en ligne d’un contenu qui n’est pas seulement la mise en ligne du catalogue, mais aussi et surtout la constitution de véritables bibliothèques virtuelles.»

La liste de diffusion Biblio-fr est créée en 1993 par Hervé Le Crosnier, professeur à l’Université de Caen (Normandie), à l’intention des «bibliothécaires et documentalistes francophones et [de] toute personne intéressée par la diffusion électronique de l’information documentaire». La liste se veut le regard francophone des documentalistes sur les questions soulevées par le développement de l’internet, par exemple «la diffusion de la connaissance, l’organisation de collections de documents électroniques, la maintenance et l’archivage de l’écrit électronique». Biblio-fr compte 3.329 abonnés le 20 décembre 1998 et 15.136 abonnés le 20 avril 2007. Une autre liste de diffusion est ADBS-info, gérée par l’Association des professionnels de l’information et de la documentation (ADBS), avec 7.699 abonnés le 20 avril 2007.

Des portails sont créés à l’intention des bibliothèques, par exemple Biblio On Line. Jean-Baptiste Rey, son rédacteur et webmestre, relate en juin 1998: «Le site dans sa première version a été lancé en juin 1996. Une nouvelle version (l’actuelle) a été mise en place à partir du mois de septembre 1997. Le but de ce site est d’aider les bibliothèques à intégrer internet dans leur fonctionnement et dans les services qu’elles offrent à leur public. Le service est décomposé en deux parties: (a) une partie "professionnelle" où les bibliothécaires peuvent retrouver des informations professionnelles et des liens vers les organismes, les institutions, et les projets et réalisations ayant trait à leur activité; (b) une partie comprenant annuaire, mode d’emploi de l’internet, villes et provinces, etc… permet au public des bibliothèques d’utiliser le service Biblio On Line comme un point d’entrée vers internet.»

Le site de l’ENSSIB (Ecole nationale supérieure des sciences de l’information et des bibliothèques) héberge la version électronique du Bulletin des bibliothèques de France (BBF), une revue professionnelle bimensuelle dans laquelle «professionnels et spécialistes de l’information discutent de toutes les questions concernant la politique et le développement des bibliothèques et des centres de documentation: évolution par secteur, grands projets, informatisation, technologies de l’information, écrits électroniques, réseaux, coopération, formation, gestion, patrimoine, usagers et publics, livre et lecture…»

Annie Le Saux, rédactrice de la revue, relate en juillet 1998: «C’est en 1996 que le BBF a commencé à paraître sur internet (les numéros de 1995). (…) Nous nous servons beaucoup du courrier électronique pour prendre contact avec nos auteurs et pour recevoir leurs articles. Cela diminue grandement les délais. Nous avons aussi recours au web pour prendre connaissance des sites mentionnés lors de colloques, vérifier les adresses, retrouver des indications bibliographiques dans les catalogues des bibliothèques…»

= Quelques expériences

# En 1999

Avec cette manne documentaire qu’offre désormais l’internet, que vont devenir les bibliothécaires-documentalistes? Vont-ils devenir des cyberthécaires, ou bien vont-ils progressivement disparaître parce que les usagers n’auront tout simplement plus besoin d’eux? A la fin des années 1990, il ne semble pas que la profession soit en danger, au contraire. Piloter les usagers sur l’internet, filtrer et organiser l’information à leur intention, créer et gérer un site web, rechercher des documents dans des bases de données spécialisées, telles sont désormais les tâches de nombreux bibliothécaires. C'est le cas de Peter Raggett à l'OCDE et de Bruno Didier à l'Institut Pasteur.

Peter Raggett est sous-directeur (puis directeur) de la Bibliothèque centrale de l’OCDE (Organisation de coopération et de développement économiques), rebaptisée ensuite Centre d'information et de documentation (CDI).

Située à Paris, l’OCDE regroupe trente pays membres. Au noyau d’origine, constitué des pays d’Europe de l’Ouest et d’Amérique du Nord, viennent s’ajouter le Japon, l’Australie, la Nouvelle-Zélande, la Finlande, le Mexique, la République tchèque, la Hongrie, la Pologne et la Corée.

Réservée aux fonctionnaires de l’organisation, la bibliothèque permet la consultation de 60.000 monographies et 2.500 périodiques imprimés. En ligne depuis 1996, ses pages intranet deviennent une source d’information majeure pour le personnel.

«Je dois filtrer l’information pour les usagers de la bibliothèque, ce qui signifie que je dois bien connaître les sites et les liens qu’ils proposent, explique Peter Raggett en août 1999. J’ai sélectionné plusieurs centaines de sites pour en favoriser l’accès à partir de l’intranet de l’OCDE. Cette sélection fait partie du bureau de référence virtuel proposé par la bibliothèque à l’ensemble du personnel. Outre de nombreux liens, ce bureau de référence contient des pages recensant les articles, monographies et sites web correspondant aux différents projets de recherche en cours à l’OCDE, l’accès en réseau aux CD-ROM et une liste mensuelle des nouveaux titres.»

Comment voit-il l’avenir de la profession? «L’internet offre aux chercheurs un stock d’informations considérable. Le problème pour eux est de trouver ce qu’ils cherchent. Jamais auparavant on n’avait senti une telle surcharge d’informations, comme on la sent maintenant quand on tente de trouver un renseignement sur un sujet précis en utilisant les moteurs de recherche disponibles sur l’internet. A mon avis, les bibliothécaires auront un rôle important à jouer pour améliorer la recherche et l’organisation de l’information sur le réseau. Je prévois aussi une forte expansion de l’internet pour l’enseignement et la recherche. Les bibliothèques seront amenées à créer des bibliothèques numériques permettant à un étudiant de suivre un cours proposé par une institution à l’autre bout du monde. La tâche du bibliothécaire sera de filtrer les informations pour le public. Personnellement, je me vois de plus en plus devenir un bibliothécaire virtuel. Je n’aurai pas l’occasion de rencontrer les usagers, ils me contacteront plutôt par courriel, par téléphone ou par fax, j’effectuerai la recherche et je leur enverrai les résultats par voie électronique.»

En 1999, Bruno Didier est bibliothécaire à l’Institut Pasteur (Paris), une fondation privée dont le but est la prévention et le traitement des maladies infectieuses par la recherche, l’enseignement et des actions de santé publique.

Séduit par les perspectives qu’offre le réseau pour la recherche documentaire, Bruno Didier crée le site web de la bibliothèque en 1996 et devient son webmestre. «Le site web de la bibliothèque a pour vocation principale de servir la communauté pasteurienne, relate-t-il en août 1999. Il est le support d’applications devenues indispensables à la fonction documentaire dans un organisme de cette taille: bases de données bibliographiques, catalogue, commande de documents et bien entendu accès à des périodiques en ligne. C’est également une vitrine pour nos différents services, en interne mais aussi dans toute la France et à l’étranger. Il tient notamment une place importante dans la coopération documentaire avec les instituts du réseau Pasteur à travers le monde. Enfin j’essaie d’en faire une passerelle adaptée à nos besoins pour la découverte et l’utilisation d’internet. (…) Je développe et maintiens les pages du serveur, ce qui s’accompagne d’une activité de veille régulière. Par ailleurs je suis responsable de la formation des usagers, ce qui se ressent dans mes pages. Le web est un excellent support pour la formation, et la plupart des réflexions actuelles sur la formation des usagers intègrent cet outil.»

Son activité professionnelle a changé de manière radicale, tout comme celle de ses collègues. «C’est à la fois dans nos rapports avec l’information et avec les usagers que les changements ont eu lieu, explique-t-il. Nous devenons de plus en plus des médiateurs, et peut- être un peu moins des conservateurs. Mon activité actuelle est typique de cette nouvelle situation: d’une part dégager des chemins d’accès rapides à l’information et mettre en place des moyens de communication efficaces, d’autre part former les utilisateurs à ces nouveaux outils. Je crois que l’avenir de notre métier passe par la coopération et l’exploitation des ressources communes. C’est un vieux projet certainement, mais finalement c’est la première fois qu’on dispose enfin des moyens de le mettre en place.»

# En 2000

En 2000, Bakayoko Bourahima est responsable de la bibliothèque de l'Ecole nationale supérieure de statistique et d’économie appliquée (ENSEA) d’Abidjan (Côte d'Ivoire). L'ENSEA est un établissement qui assure la formation de statisticiens pour les pays africains d’expression française. Son site web est mis en ligne en avril 1999 dans le cadre du réseau REFER, un réseau mis sur pied par l’Agence universitaire de la Francophonie (AUF) pour desservir la communauté scientifique et technique en Afrique, en Asie et en Europe orientale (24 pays participants en 2002).

En tant que responsable de la bibliothèque, Bakayoko Bourahima s’occupe de la gestion de l’information et de la diffusion des travaux publiés par l’ENSEA. Quel est l'apport de l’internet dans son travail? «Mon service a eu récemment des séances de travail avec l’équipe informatique pour discuter de l’implication de la bibliothèque dans l’animation du site, relate-t-il en juillet 2000. Le service de la bibliothèque travaille aussi à deux projets d’intégration du web pour améliorer ses prestations. (…) J’espère bientôt pouvoir mettre à la disposition de mes usagers un accès internet pour l’interrogation de bases de données. Par ailleurs, j’ai en projet de réaliser et de mettre sur l’intranet et sur le web un certain nombre de services documentaires (base de données thématique, informations bibliographiques, service de références bibliographiques, bulletin analytique des meilleurs travaux d’étudiants…). Il s’agit donc pour la bibliothèque, si j’obtiens les financements nécessaires pour ces projets, d’utiliser pleinement l’internet pour donner à notre Ecole un plus grand rayonnement et de renforcer sa plateforme de communication avec tous les partenaires possibles. En intégrant cet outil au plan de développement de la bibliothèque, j’espère améliorer la qualité et élargir la gamme de l’information scientifique et technique mise à la disposition des étudiants, des enseignants et des chercheurs, tout en étendant considérablement l’offre des services de la bibliothèque.»

En 2000, Emmanuel Barthe est documentaliste juridique et responsable informatique de Coutrelis & Associés, un cabinet d’avocats parisien. «Les principaux domaines de travail du cabinet sont le droit communautaire, le droit de l’alimentation, le droit de la concurrence et le droit douanier, écrit-il en octobre 2000. Je fais de la saisie indexation, et je conçois et gère les bases de données internes. Pour des recherches documentaires difficiles, je les fais moi-même ou bien je conseille le juriste. Je suis aussi responsable informatique et télécoms du cabinet: conseils pour les achats, assistance et formation des utilisateurs. De plus, j’assure la veille, la sélection et le catalogage de sites web juridiques: titre, auteur et bref descriptif. Je suis également formateur internet juridique aussi bien à l’intérieur de mon entreprise qu’à l’extérieur lors de stages de formation.»

Par ailleurs, Emmanuel Barthe est le modérateur de Juriconnexion, une liste de discussion créée par l’association du même nom. «L’association Juriconnexion a pour but la promotion de l’électronique juridique, c’est-à-dire la documentation juridique sur support électronique et la diffusion des données publiques juridiques. Elle organise des rencontres entre les utilisateurs et les éditeurs juridiques (et de bases de données), ainsi qu’une journée annuelle sur un thème. Vis-à- vis des autorités publiques, Juriconnexion a un rôle de médiateur et de lobbying à la fois. L’association, notamment, est favorable à la diffusion gratuite sur internet des données juridiques produites par le Journal officiel et les tribunaux. Les bibliothécaires-documentalistes juridiques représentent la majorité des membres de l’association, suivis par certains représentants des éditeurs et des juristes.»

# En 2001

En 2001, Anissa Rachef est bibliothécaire et professeur à l’Institut français de Londres. Présents dans de nombreux pays, les instituts français sont des organismes officiels proposant des cours et manifestations culturelles. A Londres, 5.000 étudiants environ s'inscrivent aux cours chaque année. Inaugurée en mai 1996, la médiathèque utilise l’internet dès sa création.

«L’objectif de la médiathèque est double, explique Anissa Rachef en avril 2001. Servir un public s’intéressant à la culture et la langue françaises et "recruter" un public allophone en mettant à disposition des produits d’appel tels que vidéos documentaires, livres audio, CD- ROM. La mise en place récente d’un espace multimédia sert aussi à fidéliser les usagers. L’installation d’un service d’information rapide a pour fonction de répondre dans un temps minimum à toutes sortes de questions posées via le courrier électronique, ou par fax. Ce service exploite les nouvelles technologies pour des recherches très spécialisées. Nous élaborons également des dossiers de presse destinés aux étudiants et professeurs préparant des examens de niveau secondaire. Je m’occupe essentiellement de catalogage, d’indexation et de cotation. (…) J’utilise internet pour des besoins de base. Recherches bibliographiques, commande de livres, courrier professionnel, prêt inter-bibliothèques. C’est grâce à internet que la consultation de catalogues collectifs, tels SUDOC (Système universitaire de documentation) et OCLC (Online Computer Library Center), a été possible. C’est ainsi que j’ai pu mettre en place un service de fourniture de documents extérieurs à la médiathèque. Des ouvrages peuvent désormais être acheminés vers la médiathèque pour des usagers ou bien à destination des bibliothèques anglaises.»

= [Résumé]

De pratiquement anglophone à ses débuts, le web, devenu multilingue en 2000, permet une large diffusion des textes électroniques sans contrainte de frontières. Mais la barrière de la langue est loin d’avoir disparu. Que préconise Olivier Gainon, fondateur des éditions CyLibris? «Première étape: le respect des particularismes au niveau technique, explique-t-il en décembre 2000. Il faut que le réseau respecte les lettres accentuées, les lettres spécifiques, etc. Je crois très important que les futurs protocoles permettent une transmission parfaite de ces aspects - ce qui n’est pas forcément simple (dans les futures évolutions de l’HTML ou des protocoles IP, etc.). Donc il faut que chacun puisse se sentir à l’aise avec l’internet et que ce ne soit pas simplement réservé à des (plus ou moins) anglophones. Il est anormal aujourd’hui que la transmission d’accents puisse poser problème dans les courriers électroniques. La première démarche me semble donc une démarche technique. Si on arrive à faire cela, le reste en découle: la représentation des langues se fera en fonction du nombre de connectés, et il faudra envisager à terme des moteurs de recherche multilingues.»

= Premiers pas

A tort ou à raison, on se plaint souvent de l’hégémonie de l’anglais sur l’internet. Celle-ci était inévitable au début, puisque le réseau se développe d’abord en Amérique du Nord avant de s'étendre au monde entier. En 1997, on note déjà la présence de nombreuses langues, cette présence dépendant du dynamisme de chaque communauté linguistique. En décembre 1997, Tim Berners-Lee, inventeur du web, déclare à Pierre Ruetschi, journaliste à la Tribune de Genève, un quotidien suisse: «Pourquoi les Francophones ne mettent-ils pas davantage d’informations sur le web? Est-ce qu’ils pensent que personne ne veut la lire, que la culture française n’a rien à offrir? C’est de la folie, l’offre est évidemment énorme.» C’est chose faite dans les années qui suivent.

Consultant en marketing internet de produits et services de traduction, Randy Hobler écrit en septembre 1998: «Comme l’internet n’a pas de frontières nationales, les internautes s’organisent selon d’autres critères propres au médium. En termes de multilinguisme, vous avez des communautés virtuelles, par exemple ce que j’appelle les "nations des langues", tous ces internautes qu’on peut regrouper selon leur langue maternelle quel que soit leur lieu géographique. Ainsi la nation de la langue espagnole inclut non seulement les internautes d’Espagne et d’Amérique latine, mais aussi tous les Hispanophones vivant aux Etats- Unis, ou encore ceux qui parlent espagnol au Maroc.»

En 1998 et 1999, la nécessité d’un web multilingue occupe tous les esprits. Au début des années 2000, le web, devenu multilingue, permet une large diffusion des textes électroniques sans contrainte de frontières, mais la barrière de la langue est loin d’avoir disparu. La priorité semble être la création de passerelles entre les communautés linguistiques pour favoriser la circulation des écrits dans d’autres langues, en améliorant notamment les outils de traduction.

Au cours de l'été 2000, les usagers non anglophones dépassent la barre des 50%. Ce pourcentage continue ensuite d'augmenter, comme le montrent les statistiques de la société Global Reach, mises à jour à intervalles réguliers. Le nombre d’usagers non anglophones est de 52,5% en été 2001, 57% en décembre 2001, 59,8% en avril 2002, 64,4% en septembre 2003 (dont 34,9% d’Européens non anglophones et 29,4% d’Asiatiques) et 64,2% en mars 2004 (dont 37,9% d’Européens non anglophones et 33% d’Asiatiques).

Bruno Didier, webmestre de la Bibliothèque de l’Institut Pasteur, écrit en août 1999: «Internet n’est une propriété ni nationale, ni linguistique. C’est un vecteur de culture, et le premier support de la culture, c’est la langue. Plus il y a de langues représentées dans leur diversité, plus il y aura de cultures sur internet. Je ne pense pas qu’il faille justement céder à la tentation systématique de traduire ses pages dans une langue plus ou moins universelle. Les échanges culturels passent par la volonté de se mettre à la portée de celui vers qui on souhaite aller. Et cet effort passe par l’appréhension de sa langue. Bien entendu c’est très utopique comme propos. Concrètement, lorsque je fais de la veille, je peste dès que je rencontre des sites norvégiens ou brésiliens sans un minimum d’anglais.»

Dès décembre 1997, le moteur de recherche AltaVista lance Babel Fish Translation, un logiciel de traduction automatique de l’anglais vers cinq autres langues (allemand, espagnol, français, italien, portugais), et vice versa. Alimenté par un dictionnaire multilingue de 2,5 millions de mots, ce service gratuit est l’oeuvre de Systran, société pionnière en traitement automatique des langues. Le texte à traduire doit être de trois pages maximum. La page originale et la traduction apparaissent en vis-à-vis à l’écran. La traduction étant entièrement automatisée, elle est évidemment approximative. Si cet outil a ses limites, il a le mérite d’exister et il préfigure ceux des années suivantes, développés entre autres par Systran, Alis Technologies, Globalink ou Lernout & Hauspie.

= De l'ASCII à l'Unicode

Communiquer dans plusieurs langues implique d’avoir des systèmes de codage adaptés à nos alphabets ou idéogrammes respectifs.

Le premier système d'encodage informatique est l’ASCII (American standard code for information interchange). Publié en 1968 aux Etats- Unis par l’American National Standards Institute (ANSI), avec actualisation en 1977 et 1986, l'ASCII est un code standard de 128 caractères traduits en langage binaire sur sept bits (A est traduit par «1000001», B est traduit par «1000010», etc.). Les 128 caractères comprennent 33 caractères de contrôle (qui ne représentent donc pas de symbole écrit) et 95 caractères imprimables: les 26 lettres sans accent en majuscules (A-Z) et minuscules (a-z), les chiffres, les signes de ponctuation et quelques symboles, le tout correspondant aux touches du clavier anglais ou américain.

L'ASCII permet uniquement la lecture de l’anglais et du latin. Il ne permet pas de prendre en compte les lettres accentuées présentes dans bon nombre de langues européennes, et à plus forte raison les langues non alphabétiques (chinois, japonais, coréen, etc.). Ceci ne pose pas de problème majeur les premières années, tant que l’échange de fichiers électroniques se limite essentiellement à l’Amérique du Nord. Mais le multilinguisme devient bientôt une nécessité vitale. Des variantes de l’ASCII (norme ISO-8859 ou ISO-Latin) prennent en compte les caractères accentués de quelques langues européennes. Par exemple, la variante pour le français est définie par la norme ISO-8859-1 (ISO-Latin-1). Mais le passage de l’ASCII original à ses différentes extensions devient vite un véritable casse-tête, y compris au sein de l’Union européenne, les problèmes étant entre autres la multiplication des variantes, la corruption des données dans les échanges informatiques ou encore l’incompatibilité des systèmes, les pages ne pouvant être affichées que dans une seule langue à la fois.

Avec le développement du web, l’échange des données s’internationalise de plus en plus. On ne peut plus se limiter à l’utilisation de l’anglais et de quelques langues européennes, traduites par un système d’encodage datant de 1968.

Publié pour la première fois en janvier 1991, l’Unicode est un système d'encodage «universel» sur 16 bits spécifiant un nombre unique pour chaque caractère. Ce nombre est lisible quels que soient la plateforme, le logiciel et la langue utilisés. L’Unicode peut traiter 65.000 caractères uniques et prendre en compte tous les systèmes d’écriture de la planète. A la grande satisfaction des linguistes, il remplace progressivement l’ASCII. L’Unicode dispose de plusieurs variantes en fonction des besoins, par exemple UTF-8, UTF-16 et UTF-32 (UTF: Unicode transformation format). Il devient une composante des spécifications du W3C (World Wide Web Consortium), l'organisme international chargé du développement du web.

L’utilisation de l’Unicode se généralise en 1998, par exemple pour les fichiers texte sous plateforme Windows (Windows NT, Windows 2000, Windows XP et versions suivantes), qui étaient jusque-là en ASCII. Mais l’Unicode ne peut résoudre tous les problèmes, comme le souligne en juin 2000 Luc Dall’Armellina, co-auteur et webmestre d’oVosite, un espace d’écriture hypermédia: «Les systèmes d’exploitation se dotent peu à peu des kits de langues et bientôt peut-être de polices de caractères Unicode à même de représenter toutes les langues du monde; reste que chaque application, du traitement de texte au navigateur web, emboîte ce pas. Les difficultés sont immenses: notre clavier avec ses ± 250 touches avoue ses manques dès lors qu’il faille saisir des Katakana ou Hiragana japonais, pire encore avec la langue chinoise. La grande variété des systèmes d’écriture de par le monde et le nombre de leurs signes font barrage. Mais les écueils culturels ne sont pas moins importants, liés aux codes et modalités de représentation propres à chaque culture ou ethnie.»

Que préconise Olivier Gainon, fondateur de CyLibris et pionnier de l’édition littéraire en ligne? « Première étape: le respect des particularismes au niveau technique, explique-t-il en décembre 2000. Il faut que le réseau respecte les lettres accentuées, les lettres spécifiques, etc. Je crois très important que les futurs protocoles permettent une transmission parfaite de ces aspects - ce qui n’est pas forcément simple (dans les futures évolutions de l’HTML ou des protocoles IP, etc.). Donc il faut que chacun puisse se sentir à l’aise avec l’internet et que ce ne soit pas simplement réservé à des (plus ou moins) anglophones. Il est anormal aujourd’hui que la transmission d’accents puisse poser problème dans les courriers électroniques. La première démarche me semble donc une démarche technique. Si on arrive à faire cela, le reste en découle: la représentation des langues se fera en fonction du nombre de connectés, et il faudra envisager à terme des moteurs de recherche multilingues.»

Yoshi Mikami est informaticien à Fujisawa, au Japon. En décembre 1995, il lance le site "The Languages of the World by Computers and the Internet", communément appelé Logos Home Page ou Kotoba Home Page. Son site donne un bref historique de chaque langue, ses caractéristiques, son système d'écriture, son jeu de caractères et enfin la configuration du clavier dans la langue donnée. Yoshi Mikami est également co-auteur (avec Kenji Sekine et Nobutoshi Kohara) de "Pour un web multilingue", publié en août 1997 en japonais par les éditions O'Reilly avant d'être traduit en anglais, en allemand et en français (version française parue en septembre 1998).

Yoshi explique en décembre 1998: «Ma langue maternelle est le japonais. Comme j'ai suivi mes études de troisième cycle aux Etats-Unis et que j'ai travaillé dans l'informatique, je suis devenu bilingue japonais/anglais américain. J'ai toujours été intéressé par différentes langues et cultures, aussi j'ai appris le russe, le français et le chinois dans la foulée. A la fin de 1995, j'ai créé sur le web le site "The Languages of the World by Computers and the Internet" et j'ai tenté de donner - en anglais et en japonais - un bref historique de toutes ces langues, ainsi que les caractéristiques propres à chaque langue et à sa phonétique. Suite à l'expérience acquise, j'ai invité mes deux associés à écrire un livre sur la conception, la création et la présentation de pages web multilingues, livre qui fut publié en août 1997 sous le titre "The Multilingual Web Guide", le premier livre au monde sur un tel sujet.»

Comment voit-il l'évolution vers un web multilingue? «Il y a des milliers d'années de cela, en Egypte, en Chine et ailleurs, les gens étaient plus sensibles au fait de communiquer leurs lois et leurs réflexions non seulement dans une langue mais dans plusieurs. Dans notre monde moderne, chaque Etat a adopté plus ou moins une seule langue de communication. A mon avis, l'internet verra l'utilisation plus grande de langues différentes et de pages multilingues (et pas seulement une gravitation autour de l'anglais américain) et un usage plus créatif de la traduction informatique multilingue. 99% des sites web créés au Japon sont en japonais!»

= De l'anglais au plurilinguisme

Après avoir été anglophone à pratiquement 100%, l’internet est encore anglophone à plus de 80% en 1998, un pourcentage qui s’explique par trois facteurs: (a) la création d’un grand nombre de sites web émanant des Etats-Unis, du Canada et du Royaume-Uni; (b) une proportion d'usagers particulièrement forte en Amérique du Nord par rapport au reste du monde; (c) l’usage de l'anglais en tant que principale langue d’échange internationale.

L’anglais reste en effet prépondérant et ceci n’est pas près de disparaître. Comme indiqué en janvier 1999 par Marcel Grangier, responsable de la section française des services linguistiques centraux de l’Administration fédérale suisse, «cette suprématie n’est pas un mal en soi, dans la mesure où elle résulte de réalités essentiellement statistiques (plus de PC par habitant, plus de locuteurs de cette langue, etc.). La riposte n’est pas de "lutter contre l’anglais" et encore moins de s’en tenir à des jérémiades, mais de multiplier les sites en d’autres langues. Notons qu’en qualité de service de traduction, nous préconisons également le multilinguisme des sites eux- mêmes. La multiplication des langues présentes sur internet est inévitable, et ne peut que bénéficier aux échanges multiculturels.»

Professeur en technologies de la communication à la Webster University de Genève, Henk Slettenhaar insiste lui aussi sur la nécessité de sites bilingues, dans la langue originale et en anglais. «Les communautés locales présentes sur le web devraient en tout premier lieu utiliser leur langue pour diffuser des informations, écrit-il en décembre 1998. Si elles veulent également présenter ces informations à la communauté mondiale, celles-ci doivent être aussi disponibles en anglais. Je pense qu’il existe un réel besoin de sites bilingues. (…) Mais je suis enchanté qu’il existe maintenant tant de documents disponibles dans leur langue originale. Je préfère de beaucoup lire l’original avec difficulté plutôt qu’une traduction médiocre.»

Henk ajoute en août 1999: «A mon avis, il existe deux types de recherches sur le web. La première est la recherche globale dans le domaine des affaires et de l’information. Pour cela, la langue est d’abord l’anglais, avec des versions locales si nécessaire. La seconde, ce sont les informations locales de tous ordres dans les endroits les plus reculés. Si l’information est à destination d’une ethnie ou d’un groupe linguistique, elle doit d’abord être dans la langue de l’ethnie ou du groupe, avec peut-être un résumé en anglais.»

Philippe Loubière, traducteur littéraire et dramatique, dénonce pour sa part la main-mise anglophone sur le réseau. «Tout ce qui peut contribuer à la diversité linguistique, sur internet comme ailleurs, est indispensable à la survie de la liberté de penser, explique-t-il en mars 2001. Je n’exagère absolument pas: l’homme moderne joue là sa survie. Cela dit, je suis très pessimiste devant cette évolution. Les Anglo-saxons vous écrivent en anglais sans vergogne. L’immense majorité des Français constate avec une indifférence totale le remplacement progressif de leur langue par le mauvais anglais des marchands et des publicitaires, et le reste du monde a parfaitement admis l’hégémonie linguistique des Anglo-saxons parce qu’ils n’ont pas d’autres horizons que de servir ces riches et puissants maîtres. La seule solution consisterait à recourir à des législations internationales assez contraignantes pour obliger les gouvernements nationaux à respecter et à faire respecter la langue nationale dans leur propre pays (le français en France, le roumain en Roumanie, etc.), cela dans tous les domaines et pas seulement sur internet. Mais ne rêvons pas…»

Richard Chotin, professeur à l’Ecole supérieure des affaires (ESA) de Lille, rappelle à juste titre que la suprématie de l’anglais a succédé à celle du français. «Le problème est politique et idéologique: c’est celui de l’"impérialisme" de la langue anglaise découlant de l’impérialisme américain, explique-t-il en septembre 2000. Il suffit d’ailleurs de se souvenir de l’"impérialisme" du français aux 18e et 19e siècles pour comprendre la déficience en langues des étudiants français: quand on n’a pas besoin de faire des efforts pour se faire comprendre, on n’en fait pas, ce sont les autres qui les font.»

Guy Antoine, créateur de Windows on Haiti, site de référence sur la culture haïtienne, croit en la nécessité de l'anglais en tant que langue commune. Il relate en novembre 1999: «Pour des raisons pratiques, l'anglais continuera à dominer le web. Je ne pense pas que ce soit une mauvaise chose, en dépit des sentiments régionalistes qui s'y opposent, parce que nous avons besoin d'une langue commune permettant de favoriser les communications à l'échelon international. Ceci dit, je ne partage pas l'idée pessimiste selon laquelle les autres langues n'ont plus qu'à se soumettre à la langue dominante. Au contraire. Tout d'abord l'internet peut héberger des informations utiles sur les langues minoritaires, qui seraient autrement amenées à disparaître sans laisser de traces. De plus, à mon avis, l'internet incite les gens à apprendre les langues associées aux cultures qui les intéressent. Ces personnes réalisent rapidement que la langue d'un peuple est un élément fondamental de sa culture. De ce fait, je n'ai pas grande confiance dans les outils de traduction automatique qui, s'ils traduisent les mots et les expressions, ne peuvent guère traduire l'âme d'un peuple. Que sont les Haïtiens, par exemple, sans le kreyòl (créole pour les non initiés), une langue qui s'est développée et qui a permis de souder entre elles diverses tribus africaines transplantées à Haïti pendant la période de l'esclavage? Cette langue représente de manière la plus palpable l'unité de notre peuple. Elle est toutefois principalement une langue parlée et non écrite. A mon avis, le web va changer cet état de fait plus qu'aucun autre moyen traditionnel de diffusion d'une langue. Dans Windows on Haiti, la langue principale est l'anglais, mais on y trouve tout aussi bien un forum de discussion animé conduit en kreyòl. Il existe aussi des documents sur Haïti en français et dans l'ancien créole colonial, et je suis prêt à publier d'autres documents en espagnol et dans diverses langues. Je ne propose pas de traductions, mais le multilinguisme est effectif sur ce site, et je pense qu'il deviendra de plus en plus la norme sur le web.»

Bakayoko Bourahima, bibliothécaire de l'Ecole nationale supérieure de statistique et d’économie appliquée (ENSEA) à Abidjan, écrit en juillet 2000: «Pour nous les Africains francophones, le diktat de l’anglais sur la toile représente pour la masse un double handicap d’accès aux ressources du réseau. Il y a d’abord le problème de l’alphabétisation qui est loin d’être résolu et que l’internet va poser avec beaucoup plus d’acuité, ensuite se pose le problème de la maîtrise d’une seconde langue étrangère et son adéquation à l’environnement culturel. En somme, à défaut de multilinguisme, l’internet va nous imposer une seconde colonisation linguistique avec toutes les contraintes que cela suppose. Ce qui n’est pas rien quand on sait que nos systèmes éducatifs ont déjà beaucoup de mal à optimiser leurs performances, en raison, selon certains spécialistes, des contraintes de l’utilisation du français comme langue de formation de base. Il est donc de plus en plus question de recourir aux langues vernaculaires pour les formations de base, pour "désenclaver" l’école en Afrique et l’impliquer au mieux dans la valorisation des ressources humaines. Comment faire? Je pense qu’il n’y a pas de chance pour nous de faire prévaloir une quelconque exception culturelle sur la toile, ce qui serait de nature tout à fait grégaire. Il faut donc que les différents blocs linguistiques s’investissent beaucoup plus dans la promotion de leur accès à la toile, sans oublier leurs différentes spécificités internes.»

Tôt ou tard, le pourcentage des langues sur le réseau correspondra-t-il à leur répartition sur la planète? Rien n’est moins sûr à l’heure de la fracture numérique entre riches et pauvres, entre zones rurales et zones urbaines, entre régions favorisées et régions défavorisées, entre l’hémisphère nord et l’hémisphère sud, entre pays développés et pays en développement.

Selon Zina Tucsnak, ingénieur d’études au laboratoire ATILF (Analyse et traitement informatique de la langue française), interviewée en octobre 2000, «le meilleur moyen serait l’application d’une loi par laquelle on va attribuer un "quota" à chaque langue. Mais n’est-ce pas une utopie de demander l’application d’une telle loi dans une société de consommation comme la nôtre?»

A la même date, Emmanuel Barthe, documentaliste juridique, exprime un avis contraire: «Des signes récents laissent penser qu’il suffit de laisser les langues telles qu’elles sont actuellement sur le web. En effet, les langues autres que l’anglais se développent avec l’accroissement du nombre de sites web nationaux s’adressant spécifiquement aux publics nationaux, afin de les attirer vers internet. Il suffit de regarder l’accroissement du nombre de langues disponibles dans les interfaces des moteurs de recherche généralistes.»

= Langues minoritaires

De plus, l’«impérialisme» dénoncé plus haut ne concerne pas seulement les Etats-Unis et la langue anglaise. La France elle aussi n’est pas sans exercer pression pour imposer la suprématie de la langue française sur d’autres langues, comme en témoigne Guy Antoine, créateur du site Windows on Haiti. Il relate en juin 2001: «J’ai fait de la promotion du kreyòl (créole haïtien) une cause personnelle, puisque cette langue est le principal lien unissant tous les Haïtiens, malgré l’attitude dédaigneuse d’une petite élite haïtienne - à l’influence disproportionnée - vis-à-vis de l’adoption de normes pour l’écriture du kreyòl et le soutien de la publication de livres et d’informations officielles dans cette langue. A titre d’exemple, il y avait récemment dans la capitale d’Haïti un Salon du livre de deux semaines, à qui on avait donné le nom de "Livres en folie". Sur les 500 livres d’auteurs haïtiens qui étaient présentés lors du salon, il y en avait une vingtaine en kreyòl, ceci dans le cadre de la campagne insistante que mène la France pour célébrer la Francophonie dans ses anciennes colonies. A Haïti cela se passe relativement bien, mais au détriment direct de la Créolophonie.

En réponse à l’attitude de cette minorité haïtienne, j’ai créé sur mon site web Windows on Haiti deux forums de discussion exclusivement en kreyòl. Le premier forum regroupe des discussions générales sur toutes sortes de sujets, mais en fait ces discussions concernent principalement les problèmes socio-politiques qui agitent Haïti. Le deuxième forum est uniquement réservé aux débats sur les normes d’écriture du kreyòl. Ces débats sont assez animés, et un certain nombre d’experts linguistiques y participent. Le caractère exceptionnel de ces forums est qu’ils ne sont pas académiques. Je n’ai trouvé nulle part ailleurs sur l’internet un échange aussi spontané et aussi libre entre des experts et le grand public pour débattre dans une langue donnée des attributs et des normes de la même langue.»

En septembre 2000, Guy Antoine rejoint l’équipe dirigeante de Mason Integrated Technologies, dont l’objectif est de créer des outils permettant l’accessibilité des documents publiés dans des langues dites minoritaires. «Etant donné l’expérience de l’équipe en la matière, nous travaillons d’abord sur le créole haïtien (kreyòl), qui est la seule langue nationale d’Haïti, et l’une des deux langues officielles, l’autre étant le français. Cette langue ne peut guère être considérée comme une langue minoritaire dans les Caraïbes puisqu’elle est parlée par huit à dix millions de personnes.»

Autre expérience, celle de Caoimhín Ó Donnaíle, professeur d’informatique à l’Institut Sabhal Mór Ostaig, situé sur l’île de Skye, en Ecosse. Caoimhín dispense ses cours en gaélique écossais. Il est aussi le webmestre du site de l’institut, qui est bilingue anglais- gaélique et se trouve être la principale source d’information mondiale sur le gaélique écossais. Sur ce site, il tient à jour la page "European Minority Languages", une liste de langues européennes minoritaires elle aussi bilingue, avec classement par ordre alphabétique de langues et par famille linguistique. Interviewé en mai 2001, Caoimhín raconte: «Nos étudiants utilisent un correcteur d’orthographe en gaélique et une base terminologique en ligne en gaélique. (…) Il est maintenant possible d’écouter la radio en gaélique (écossais et irlandais) en continu sur l’internet partout dans le monde. Une réalisation particulièrement importante a été la traduction en gaélique du logiciel de navigation Opera. C’est la première fois qu’un logiciel de cette taille est disponible en gaélique.»

En février 2000, Robert Beard co-fonde yourDictionary.com en tant que portail de référence pour toutes les langues sans exception, avec une section spécifique consacrée aux langues menacées (Endangered Language Repository). «Les langues menacées sont essentiellement des langues non écrites, écrit-il en janvier 2000. Un tiers seulement des quelque 6.000 langues existant dans le monde sont à la fois écrites et parlées. Je ne pense pourtant pas que le web va contribuer à la perte de l’identité des langues et j’ai même le sentiment que, à long terme, il va renforcer cette identité. Par exemple, de plus en plus d’Indiens d’Amérique contactent des linguistes pour leur demander d’écrire la grammaire de leur langue et de les aider à élaborer des dictionnaires. Pour eux, le web est un instrument à la fois accessible et très précieux d’expression culturelle.»

Caoimhín Ó Donnaíle indique pour sa part en mai 2001: «En ce qui concerne l’avenir des langues menacées, l’internet accélère les choses dans les deux sens. Si les gens ne se soucient pas de préserver les langues, l’internet et la mondialisation qui l’accompagne accéléreront considérablement la disparition de ces langues. Si les gens se soucient vraiment de les préserver, l’internet constituera une aide irremplaçable.»

= Traductions

L’internet étant une source d’information à vocation mondiale, il semble indispensable de favoriser les activités de traduction. Auteur des Chroniques de Cybérie, une chronique hebdomadaire en ligne des actualités du réseau, Jean-Pierre Cloutier déplore en août 1999 «qu’il se fasse très peu de traductions des textes et essais importants qui sont publiés sur le web, tant de l’anglais vers d’autres langues que l’inverse. (…) La nouveauté d’internet dans les régions où il se déploie présentement y suscite des réflexions qu’il nous serait utile de lire. À quand la traduction des penseurs hispanophones et autres de la communication?»

Professeur d’espagnol en entreprise et traductrice, Maria Victoria Marinetti écrit à la même date: «Il est très important de pouvoir communiquer en différentes langues. Je dirais même que c’est obligatoire, car l’information donnée sur le net est à destination du monde entier, alors pourquoi ne l’aurions-nous pas dans notre propre langue ou dans la langue que nous souhaitons lire? Information mondiale, mais pas de vaste choix dans les langues, ce serait contradictoire, pas vrai?»

Une solution résidera peut-être dans l'utilisation à grande échelle des logiciels de traduction automatique, dont on nous promet l'amélioration d'ici quelques années. Il va sans dire que, pour le moment, la traduction automatique n’offre pas la qualité de travail des professionnels de la traduction, et qu’il est préférable de faire appel à ces derniers lorsqu'on a le temps et l’argent nécessaires. Mais qui a l’argent nécessaire pour faire traduire des centaines sinon des milliers de pages web et, qui plus est, en plusieurs langues? Les logiciels de traduction sont donc très pratiques pour fournir un résultat immédiat et à moindres frais, sinon gratuit, même si celui-ci est très imparfait. Depuis 1998, des logiciels sont en accès libre sur le web - par exemple ceux de Systran, d'Alis technologies ou de Google - et permettent de traduire en quelques secondes une page web ou un texte court, avec plusieurs combinaisons de langues possibles.

Le but d’un logiciel de traduction est d’analyser le texte dans la langue source (texte à traduire) et de générer automatiquement le texte correspondant dans la langue cible (texte traduit), en utilisant des règles précises pour le transfert de la structure grammaticale. Comme l’explique l’EAMT (European Association for Machine Translation) sur son site, «il existe aujourd’hui un certain nombre de systèmes produisant un résultat qui, s’il n’est pas parfait, est de qualité suffisante pour être utile dans certaines applications spécifiques, en général dans le domaine de la documentation technique. De plus, les logiciels de traduction, qui sont essentiellement destinés à aider le traducteur humain à produire des traductions, jouissent d’une popularité croissante auprès des organismes professionnels de traduction.»

La tâche est immense. Comme le souligne en février 2001 Pierre-Noël Favennec, expert à la direction scientifique de France Télécom R&D, «les recherches sur la traduction automatique devraient permettre une traduction automatique dans les langues souhaitées, mais avec des applications pour toutes les langues et non les seules dominantes (ex.: diffusion de documents en japonais, si l’émetteur est de langue japonaise, et lecture en breton, si le récepteur est de langue bretonne…). Il y a donc beaucoup de travaux à faire dans le domaine de la traduction automatique et écrite de toutes les langues.»

= [Résumé]

Lancée en 2001 à l'initiative de Lawrence Lessig, professeur de droit à la Stanford Law School (Californie), la licence Creative Commons a pour but de favoriser la diffusion d'oeuvres numériques tout en protégeant le droit d'auteur. L'organisme du même nom propose des licences-type, qui sont des contrats flexibles de droit d'auteur compatibles avec une diffusion sur l'internet. Simplement rédigées, ces autorisations non exclusives permettent aux titulaires des droits d'autoriser le public à utiliser leurs créations tout en ayant la possibilité de restreindre les exploitations commerciales et les oeuvres dérivées. L'auteur peut par exemple choisir d'autoriser ou non la reproduction et la rediffusion de ses oeuvres. Ces contrats peuvent être utilisés pour tout type de création: texte, film, photo, musique, site web, etc. Finalisée en février 2007, la version 3.0 de la Creative Commons instaure une licence internationale et la compatibilité avec d'autres licences similaires, dont le copyleft et la GPL (general public license).

= Internet et droit d'auteur

Si le débat relatif au droit d’auteur sur l’internet est vif à la fin des années 1990, Philippe Loubière, traducteur littéraire et dramatique, ramène ce débat aux vrais problèmes. «Ce débat me semble assez proche sur le fond de ce qu’il est dans les autres domaines où le droit d’auteur s’exerce, ou devrait s’exercer, écrit-il en mars 2001. Le producteur est en position de force par rapport à l’auteur dans pratiquement tous les cas de figure. Les pirates, voire la simple diffusion libre, ne menacent vraiment directement que les producteurs. Les auteurs ne sont menacés que par ricochet. Il est possible que l’on puisse légiférer sur la question, au moins en France où les corporations se revendiquant de l’exception culturelle sont actives et résistent encore un peu aux Américains, mais le mal est plus profond. En effet, en France comme ailleurs, les auteurs étaient toujours les derniers et les plus mal payés avant l’apparition d’internet, on constate qu’ils continuent d’être les derniers et les plus mal payés depuis. Il me semble nécessaire que l’on règle d’abord la question du respect des droits d’auteur en amont d’internet. Déjà dans le cadre général de l’édition ou du spectacle vivant, les sociétés d’auteurs - SACD (Société des auteurs et compositeurs dramatiques), SGDL (Société des gens de lettres), SACEM (Société des auteurs, compositeurs et éditeurs de musique), etc. - faillissent dès lors que l’on sort de la routine ou du vedettariat, ou dès que les producteurs abusent de leur position de force, ou tout simplement ne payent pas les auteurs, ce qui est très fréquent.»

Pour nombre d'auteurs, le web est avant tout un espace public basé sur l'échange. Alain Bron, consultant en systèmes d'information et auteur de romans, écrit en novembre 1999: «Je considère aujourd'hui le web comme un domaine public. Cela veut dire que la notion de droit d'auteur sur ce média disparaît de facto: tout le monde peut reproduire tout le monde. La création s'expose donc à la copie immédiate si les copyrights ne sont pas déposés dans les formes usuelles et si les oeuvres sont exposées sans procédures de revenus.»

Jacques Gauchey, journaliste et spécialiste des technologies de l'information, exprime un avis différent. «Le droit d'auteur dans son contexte traditionnel n'existe plus, écrit-il en juillet 1999. Les auteurs ont besoin de s'adapter à un nouveau paradigme, celui de la liberté totale du flot de l'information. Le contenu original est comme une empreinte digitale: il est incopiable. Il survivra et prospérera donc.»

Selon Xavier Malbreil, auteur multimédia interviewé en mars 2001, «il y a deux choses. Le web ne doit pas être un espace de non-droit, et c'est un principe qui doit s'appliquer à tout, et notamment au droit d'auteur. Toute utilisation commerciale d'une oeuvre doit ouvrir droit à rétribution. Mais également, le web est un lieu de partage. Echanger entre amis des passages d'un texte qui vous a plu, comme on peut recopier des passages d'un livre particulièrement apprécié, pour le faire aimer, cela ne peut faire que du bien aux oeuvres, et aux auteurs. La littérature souffre surtout de ne pas être diffusée. Tout ce qui peut concourir à la faire sortir de son ghetto sera positif.»

= Copyleft et Creative Commons

Des auteurs et autres créateurs souhaitent respecter la vocation première du web, réseau de diffusion à l’échelon mondial. De ce fait, les adeptes de contrats flexibles - copyleft, GPL (general public license) et Creative Commons - sont de plus en plus nombreux.

L'idée du copyleft est lancée dès 1984 par Richard Stallman, ingénieur en informatique et défenseur inlassable du mouvement Open Source au sein de la Free Software Foundation (FSF). Conçu à l’origine pour les logiciels, le copyleft est formalisé par la GPL (general public license) et étendu par la suite à toute oeuvre de création. Il contient la déclaration normale du copyright affirmant le droit d'auteur. Son originalité est de donner au lecteur le droit de librement redistribuer le document et de le modifier. Le lecteur s’engage toutefois à ne revendiquer ni le travail original, ni les changements effectués par d’autres personnes. De plus, tous les travaux dérivés de l’oeuvre originale sont eux-mêmes soumis au copyleft.

Lancée en 2001 à l'initiative de Lawrence Lessig, professeur de droit à la Stanford Law School, en Californie, la licence Creative Commons a elle aussi pour but de favoriser la diffusion d'oeuvres numériques tout en protégeant le droit d'auteur. L'organisme du même nom propose des licences-type, qui sont des contrats flexibles de droit d'auteur compatibles avec une diffusion sur l'internet. Simplement rédigées, ces autorisations non exclusives permettent aux titulaires des droits d'autoriser le public à utiliser leurs créations tout en ayant la possibilité de restreindre les exploitations commerciales et les oeuvres dérivées. L'auteur peut par exemple choisir d'autoriser ou non la reproduction et la rediffusion de ses oeuvres. Ces contrats peuvent être utilisés pour tout type de création: texte, film, photo, musique, site web, etc. Finalisée en février 2007, la version 3.0 de la Creative Commons instaure une licence internationale et la compatibilité avec d'autres licences similaires, dont le copyleft et la GPL.

Une licence Creative Commons est utilisée pour un million d'oeuvres en 2003, 4,7 millions d'oeuvres en 2004, 20 millions d'oeuvres en 2005, 50 millions d'oeuvres en 2006, 90 millions d'oeuvres en 2007 et 130 millions d'oeuvres en 2008.

En complément, Science Commons est fondé en 2005 pour définir les stratégies et les outils nécessaires à la diffusion sur le web de la recherche scientifique, et ccLearn est fondé en 2007 en vue de définir des stratégies et outils pour l'enseignement.

= Domaine public et copyright

Chose inquiétante à l’heure d’une société dite de l’information, le domaine public se réduit comme peau de chagrin. A une époque qui n'est pas si lointaine, 50% des oeuvres appartenaient au domaine public, et pouvaient donc être librement utilisées par tous. D'ici 2100, 99% des oeuvres seraient régies par le droit d’auteur, avec un maigre 1% laissé au domaine public. Un problème épineux pour tous ceux qui gèrent des bibliothèques numériques, et qui affecte aussi bien le Projet Gutenberg que Google Books.

Si le Projet Gutenberg s’est donné pour mission de diffuser gratuitement par voie électronique le plus grand nombre possible d’oeuvres du domaine public, sa tâche n’est guère facilitée par les coups de boutoir portés au domaine public. Michael Hart, son fondateur, se penche sur la question depuis plus de trente ans, avec l’aide d’un groupe d’avocats spécialisés dans le droit d’auteur.

Dans la section Copyright HowTo, le Projet Gutenberg détaille les calculs à faire pour déterminer si un titre publié aux Etats-Unis appartient ou non au domaine public. Les oeuvres publiées avant 1923 sont soumises au droit d’auteur pendant 75 ans à partir de leur date de publication (elles sont donc maintenant dans le domaine public). Les oeuvres publiées entre 1923 et 1977 sont soumises au droit d’auteur pendant 95 ans à partir de leur date de publication (rien ne tombera dans le domaine public avant 2019). Une oeuvre publiée en 1998 et les années suivantes est soumise au droit d’auteur pendant 70 ans à partir de la date du décès de l’auteur s’il s’agit d’un auteur personnel (rien dans le domaine public avant 2049), ou alors pendant 95 ans à partir de la date de publication - ou 120 ans à partir de la date de création - s’il s’agit d’un auteur collectif (rien dans le domaine public avant 2074). Tout ceci dans les grandes lignes. D’autres règles viennent s’ajouter à ces règles de base, la loi sur le copyright ayant été amendée plusieurs fois fois depuis 1971, date de fondation du Projet Gutenberg.

Nettement plus contraignant que l'amendement précédent, une nouveau renforcement du copyright est entériné par le Congrès le 27 octobre 1998 pour contrer le formidable véhicule de diffusion qu'est l'internet. Au fil des siècles, chaque avancée technique est accompagnée d'un durcissement du copyright, qui semble être la réponse des éditeurs à un accès plus facile au savoir, et la peur afférente de perdre des royalties. «Le copyright a été augmenté de 20 ans, explique Michael Hart en juillet 1999. Auparavant on devait attendre 75 ans, on est maintenant passé à 95 ans. Bien avant, le copyright durait 28 ans (plus une extension de 28 ans si on la demandait avant l’expiration du délai) et, avant cela, le copyright durait 14 ans (plus une extension de 14 ans si on la demandait avant l’expiration du délai). Comme on le voit, on assiste à une dégradation régulière et constante du domaine public.»

Les dates évoquées par Michael sont les suivantes, comme expliqué en détail dans son blog:

(a) 1790 est la date de la main-mise de la Guilde des imprimeurs (les éditeurs de l’époque en Angleterre) sur les auteurs, qui entraîne la naissance du copyright. Le 1790 Copyright Act institue un copyright de 14 ans après la date de publication de l’oeuvre, plus une extension de 28 ans si celle-ci est demandée avant l’expiration du délai. Les oeuvres pouvant être légalement imprimées passent subitement de 6.000 à 600, et neuf titres sur dix disparaissent des librairies. Quelque 335 ans après les débuts de l'imprimerie, censée ouvrir les portes du savoir à tous, le monde du livre est désormais contrôlé par les éditeurs et non plus par les auteurs. Cette nouvelle législation est également effective aux Etats-Unis et en France.

(b) 1831 est la date d'un premier renforcement du copyright pour contrer la réédition de vastes collections du domaine public sur les nouvelles presses à vapeur. Le 1831 Copyright Act institue un copyright de 28 ans après la date de publication de l’oeuvre, plus une extension de 14 ans si celle-ci est demandée avant l’expiration du délai, à savoir un total de 42 ans.

(c) 1909 est la date d'un deuxième renforcement du copyright pour contrer une réédition des collections du domaine public sur les nouvelles presses électriques. Le 1909 Copyright Act double la période de l’extension, qui passe à 28 ans, le tout représentant un total de 56 ans.

(d) 1976 est la date d’un nouveau durcissement du copyright suite l’apparition de la photocopieuse lancée par Xerox. Le 1976 Copyright Act institue un copyright de 50 ans après le décès de l’auteur. De ce fait, tout copyright en cours avant le 19 septembre 1962 n’expire pas avant le 31 décembre 1976.

(e) 1998 est la date d’un durcissement supplémentaire du copyright suite au développement rapide des technologies numériques et aux centaines de milliers d'oeuvres désormais disponibles sur CD et DVD et sur le web, gratuitement ou à un prix très bas. Le 1998 Copyright Act allonge la durée du copyright qui est désormais de 70 ans après le décès de l’auteur, pour protéger l'empire Disney (raison pour laquelle on parle souvent de Mickey Mouse Copyright Act) et nombre de multinationales culturelles.

Pour ne prendre qu'un exemple, le classique mondial "Gone With the Wind" ("Autant en emporte le vent") de Margaret Mitchell, publié en 1939, aurait dû tomber dans le domaine public au bout de 56 ans, en 1995, conformément à la législation de l'époque, libérant ainsi les droits pour les adaptations en tous genres. Suite aux législations de 1976 et 1998, ce classique ne devrait désormais tomber dans le domaine public qu'en 2035.

La législation de 1998 porte un coup très rude aux bibliothèques numériques, en plein essor avec le développement du web, et scandalisent ceux qui les gèrent, à commencer par Michael Hart et John Mark Ockerbloom, créateur de l'Online Books Page. Mais comment faire le poids vis-à-vis des majors de l’édition? Nombre de titres doivent être retirés des collections.

Michael raconte en juillet 1999: «J’ai été le principal opposant aux extensions du copyright, mais Hollywood et les grands éditeurs ont fait en sorte que le Congrès ne mentionne pas mon action en public. Les débats actuels sont totalement irréalistes. Ils sont menés par “l’aristocratie terrienne de l’âge de l’information” et servent uniquement ses intérêts. Un âge de l’information? Et pour qui?»

En effet. Les instances politiques ne cessent de parler d’âge de l’information alors que, en parallèle, elles durcissent la réglementation relative à la mise à disposition de cette information. La contradiction est flagrante. Le copyright est passé d'une durée de 30 ans en moyenne en 1909 à une durée de 95 ans en moyenne en 1998, explique aussi Michael dans son blog. En 89 ans, de 1909 à 1998, le copyright a subi une extension de 65 ans qui affecte les trois quarts de la production du 20e siècle. Seul un livre publié avant 1923 peut être considéré avec certitude comme du domaine public.

Un durcissement similaire touche les pays de l'Union européenne. La règle générale est désormais un copyright de 70 ans après le décès de l’auteur, alors qu’il était auparavant de 50 ans, suite aux pressions exercées par les éditeurs de contenu sous le prétexte d’«harmoniser» les lois nationales relatives au copyright pour répondre à la mondialisation du marché.

A ceci s'ajoute la législation sur le copyright des éditions numériques en application des traités internationaux de l'OMPI (Organisation mondiale de la propriété intellectuelle). Ces traités sont signés en 1996 dans l'optique de contrôler la gestion des droits numériques. Le Digital Millenium Copyright Act (DMCA) est entériné en octobre 1998 aux Etats-Unis. La directive EUCD (European Union Copyright Directive) est entérinée en mai 2001 par la Communauté européenne. Cette directive s'intitule très précisément «Directive 2001/29/EC du Parlement européen et du Conseil sur l'harmonisation de certains aspects du droit d'auteur et des droits voisins dans la société de l'information». Elle fait suite à la directive de février 1993 (Directive 93/98/EEC) qui visait à harmoniser les législations des différents pays en matière de protection du droit d'auteur. La directive EUCD entre peu à peu en vigueur dans tous les pays de l'Union européenne, avec mise en place de législations nationales, le but officiel étant de renforcer le respect du droit d'auteur sur l'internet et de contrer ainsi le piratage. En France, par exemple, la loi DADVSI (Droit d'auteur et droits voisins dans la société de l'information) est promulguée en août 2006, et n'est pas sans susciter de nombreux remous.

= [Résumé]

En 2002, le MIT (Massachusetts Institute of Technology) décide de publier le contenu de ses cours en ligne, avec accès libre et gratuit, en privilégiant la diffusion libre du savoir. Mise en ligne en septembre 2002, la version pilote du MIT OpenCourseWare (MIT OCW) offre en accès libre le matériel d’enseignement de 32 cours représentatifs des cinq facultés du MIT. Ce matériel d’enseignement comprend des textes de conférences, des travaux pratiques, des exercices et corrigés, des bibliographies, des documents audio et vidéo, etc. Parallèlement, la Public Library of Science (PLoS) met sur pied des revues scientifiques en ligne de haut niveau. En ce qui concerne les encyclopédies, Wikipédia ouvre la voie en 2001, en lançant une encyclopédie écrite collectivement et dont le contenu est librement réutilisable. Wikipédia est rédigé par des milliers de volontaires, avec possibilité de corriger et de compléter les articles, aussi bien les leurs que ceux d'autres contributeurs. Suivent d'autres encyclopédies comme Citizendium et l'Encyclopedia of Life.

= Vers un savoir numérique

Sur le site de l'Internet Society (ISOC), qu'il fonde en 1992 pour promouvoir le développement de l’internet, Vinton Cerf explique: «Le réseau fait deux choses (…): comme les livres, il permet d’accumuler de la connaissance. Mais, surtout, il la présente sous une forme qui la met en relation avec d’autres informations. Alors que, dans un livre, l’information est maintenue isolée.»

De plus, l’information contenue dans les livres reste la même, au moins pendant une période donnée, alors que l'internet privilégie l’information la plus récente et constamment actualisée.

Lors d'une conférence organisée par l'IFIP (International Federation of Information Processing) en septembre 1996, Dale Spender, professeur et chercheuse, tente de cerner les changements fondamentaux apportés par l'internet dans l'acquisition du savoir et les méthodes d'enseignement. Voici son argumentation résumée en deux paragraphes.

Pendant plus de cinq siècles, l'enseignement est principalement basé sur l'information donnée par les livres. Or les habitudes liées à l'imprimé ne peuvent être transférées au monde numérique. L'enseignement en ligne offre des possibilités tellement nouvelles qu'il n'est guère possible d'effectuer les distinctions traditionnelles entre enseignant et enseigné. Le passage de la culture imprimée à la culture numérique exige d'entièrement repenser le processus d'enseignement, puisque nous avons maintenant l'opportunité sans précédent de pouvoir influer sur le genre d'enseignement que nous souhaitons.

Dans la culture imprimée, l'information contenue dans les livres restait la même un certain temps, ce qui nous a encouragé à penser que l'information était stable. La nature même de l'imprimé est liée à la notion de vérité, stable elle aussi. Cette stabilité et l'ordre qu'elle engendre ont été un des fondements de l'âge industriel et de la révolution scientifique. Les notions de vérité, de lois, d'objectivité et de preuve ont été les éléments de référence de nos croyances et de nos cultures. Mais la révolution numérique change tout ceci. Soudain l'information en ligne supplante l'information imprimée pour devenir la plus fiable et la plus utile, et l'usager est prêt à la payer en conséquence. C'est cette transformation radicale dans la nature de l'information qui doit être au coeur du débat concernant les méthodes d'enseignement.

En témoigne l'expérience de Russon Wooldridge, professeur au département des études françaises de l'Université de Toronto (Canada), qui relate en février 2001: «Tout mon enseignement exploite au maximum les ressources d'internet (le web et le courriel): les deux lieux communs d'un cours sont la salle de classe et le site du cours, sur lequel je mets tous les matériaux des cours. Je mets toutes les données de mes recherches des vingt dernières années sur le web (réédition de livres, articles, textes intégraux de dictionnaires anciens en bases de données interactives, de traités du 16e siècle, etc.). Je publie des actes de colloques, j'édite un journal, je collabore avec des collègues français, mettant en ligne à Toronto ce qu'ils ne peuvent pas publier en ligne chez eux. En mai 2000 j'ai organisé à Toronto un colloque international sur "Les études françaises valorisées par les nouvelles technologies". (…)

Je me rends compte que sans internet mes activités seraient bien moindres, ou du moins très différentes de ce qu'elles sont actuellement. Donc je ne vois pas l'avenir sans. Mais il est crucial que ceux qui croient à la libre diffusion des connaissances veillent à ce que le savoir ne soit pas bouffé, pour être vendu, par les intérêts commerciaux. Ce qui se passe dans l'édition du livre en France, où on n'offre guère plus en librairie que des manuels scolaires ou pour concours (c'est ce qui s'est passé en linguistique, par exemple), doit être évité sur le web. Ce n'est pas vers les amazon.com qu'on se tourne pour trouver la science désintéressée. Sur mon site, je refuse toute sponsorisation.»

= Quelques projets pilotes

# Cours du MIT

Professeur à l’Université d’Ottawa (Canada), Christian Vandendorpe salue en mai 2001 «la décision du MIT (Massachusetts Institute of Technology) de placer tout le contenu de ses cours sur le web d’ici dix ans, en le mettant gratuitement à la disposition de tous. Entre les tendances à la privatisation du savoir et celles du partage et de l’ouverture à tous, je crois en fin de compte que c’est cette dernière qui va l’emporter.» Le MIT décide en effet de publier le contenu de ses cours en ligne, avec accès libre et gratuit, une initiative menée avec le soutien financier de la Hewlett Foundation et de la Mellon Foundation.

Mise en ligne en septembre 2002, la version pilote du MIT OpenCourseWare (MIT OCW) offre en accès libre le matériel d’enseignement de 32 cours représentatifs des cinq facultés du MIT. Ce matériel d’enseignement comprend des textes de conférences, des travaux pratiques, des exercices et corrigés, des bibliographies, des documents audio et vidéo, etc. Le lancement officiel du site a lieu un an plus tard, en septembre 2003, avec accès à quelques centaines de cours. En mars 2004, 500 cours sont disponibles dans 33 disciplines. En mai 2006, 1.400 cours sont disponibles dans 34 disciplines. La totalité des 1.800 cours dispensés par le MIT est en ligne en novembre 2007, avec actualisation régulière. Certains cours sont traduits en espagnol, en portugais et en chinois avec l’aide d’autres organismes.

Le MIT espère que cette expérience de publication électronique - la première du genre - va permettre de définir un standard et une méthode de publication, et inciter d’autres universités à créer un «opencourseware» pour la mise à disposition gratuite de leurs propres cours. Un «opencourseware» peut être défini comme la publication électronique en accès libre du matériel d’enseignement d'un ensemble de cours. A cet effet, le MIT lance l’OpenCourseWare Consortium (OCW Consortium) en décembre 2005, avec accès libre et gratuit au matériel d’enseignement de cent universités dans le monde un an plus tard.

# Public Library of Science

A l’heure de l’internet, il paraît assez scandaleux que le résultat de travaux de recherche – travaux originaux et demandant de longues années d’efforts – soit détourné par des éditeurs spécialisés s’appropriant ce travail et le monnayant à prix fort. L’activité des chercheurs est souvent financée par les deniers publics, et de manière substantielle en Amérique du Nord. Il semblerait donc normal que la communauté scientifique et le grand public puissent bénéficier librement du résultat de ces recherches.

Dans le domaine scientifique et médical par exemple, 1.000 nouveaux articles sont publiés chaque jour, en ne comptant que les articles révisés par les pairs. Se basant sur ce constat, la Public Library of Science (PLoS) est fondée en octobre 2000 à San Francisco à l’initiative de Harold Varmus, Patrick Brown et Michael Eisen, chercheurs dans les universités de Stanford et Berkeley (Californie). Le but est de contrer les pratiques de l’édition spécialisée en regroupant tous les articles scientifiques et médicaux au sein d’archives en ligne en accès libre. Au lieu d’une information disséminée dans des millions de rapports et des milliers de périodiques en ligne ayant chacun des conditions d’accès différentes, un point d’accès unique permettrait de lire le contenu intégral de ces articles, avec moteur de recherche multicritères et système d’hyperliens entre les articles.


Back to IndexNext