Signe des temps, en France, l’Ecole supérieure de journalisme de Lille propose une formation au journalisme multimédia, cette formation durant neuf mois, dont trois mois de stage en entreprise. "En associant sur un même support l'écrit, l'image, le son, les ressources documentaires et l'interactivité, le multimédia modifie substantiellement les pratiques des éditeurs et des professionnels", indique l'Ecole sur son site. Terminée en juin 1998, la première session comprend huit diplômés. Une deuxième session débute en septembre 1998. Dans un article du cybermag Multimédium daté du 17 avril 1998, Bruno Guglieminetti, réalisateur aux projets spéciaux numériques de Radio Canada, explique: "Le journalisme en ligne fait appel à une toute autre philosophie, à un tout autre système de production que le journalisme 'traditionnel'. Avec la création de cette filière, Lille se plante vraiment à l’avant-garde du journalisme européen, ce qui n’empêchera pas les journalistes traditionnels d’y recevoir leur formation et d’y trouver leur compte."
Par ailleurs, le Syndicat national des journalistes (SNJ) œuvre pour que soit respectée la protection du droit d’auteur sur l’internet. En mars 1998, le SNJ entame sa troisième poursuite contre un organe de presse écrite pour l’obliger à rétribuer les journalistes dont les articles sont repris sur le web. Après avoir poursuivi les Dernières nouvelles d’Alsace puis le Groupe Havas, le SNJ s’attaque au Figaro pour "contrefaçon et exploitation ligitieuse" des articles de la rédaction mis en ligne sur son site web. Selon le cybermag Multimédium, qui consacre un article à ce sujet, "la poursuite s'appuie sur l'article 9 de la convention collective qui stipule que 'si un journaliste est appelé par son employeur à collaborer à un autre titre que celui ou ceux auxquels il est attaché, ou à exécuter son contrat de travail selon un mode d'expression différent, cette modification doit faire l'objet d'un accord dans les conditions prévues à l'article 20, c'est à dire qu'un échange de lettres sera nécessaire chaque fois qu'interviendra une modification du contrat de travail'. L'employeur ayant décidé de mettre en ligne les articles sans l'accord des journalistes, et ceux-ci estimant que la publication en ligne n'est pas la même que l'imprimée à laquelle ils sont liés, le syndicat estime que la convention collective n'est pas respectée."
= L’avenir de la presse en ligne
L’internet permet une information en profondeur qu’aucun organe de presse ne pouvait donner jusqu’ici. Derrière l’information du jour se trouve toute une encyclopédie qui aide à la comprendre. Le réseau offre des avantages sans précédent: rapidité de propagation des informations, accès immédiat à de nombreux sites d’information, liens vers des articles et sources connexes, énormes capacités documentaires allant du général au spécialisé et réciproquement (cartes géographiques, notices biographiques, textes officiels, informations d’ordre politique, économique, social, culturel, etc.), grande variété d’illustrations suite à la création de banques d’images et de photos, possibilité d'archivage des articles, avec moteur de recherche permettant de les retrouver rapidement, etc.
L’internet est devenu lui-même un médium d’information à part entière. La presse en ligne reste toutefois essentielle, comme le rappelle en juin 1998 Jean-Pierre Cloutier, journaliste et auteur des Chroniques de Cybérie: "Quel que soit le degré de convergence, je crois qu'il y aura toujours place pour l'écrit, et aussi pour les analyses en profondeur sur les grandes questions." Selon lui, la presse en ligne a tout autant besoin des journalistes que la presse écrite, la radio et la télévision. Dans un article de WebdoMag daté de juillet 1998, il explique: "L'esprit de découverte et le goût de l'exploration et du bricolage technique de ceux et celles qui ont été précoces à adopter l'internet (…) ne sont pas partagés par la deuxième vague d'utilisateurs qui constituent maintenant la partie la plus importante de cette 'masse critique'. Et voilà le défi de la presse spécialisée, c'est-à-dire accompagner le grand public dans sa découverte du nouveau médium et dans son appropriation de l'espace cyber, l'aider à analyser, faciliter sa compréhension, ajouter une valeur à l'information brute."
[6.1. Sites web et répertoires / 6.2. L’internet dans les bibliothèques / 6.3. Les professionnels de l’information / 6.4. Les catalogues en ligne]
Ce chapitre est consacré aux bibliothèques traditionnelles, caractérisées par des bâtiments en dur, des imprimés alignés sur les rayonnages, des tables et des sièges pour les lecteurs, des jours et heures d’ouverture, et des bibliothécaires en chair et en os renseignant les lecteurs. Les bibliothèques numériques, qui regroupent des textes électroniques disponibles sur le web, seront abordées au chapitre suivant.
6.1. Sites web et répertoires
La première bibliothèque présente sur le web est la Bibliothèque municipale d’Helsinki (Finlande), qui inaugure son site en février 1994.
= En France
Le site très coloré de la Bibliothèque publique d’information (BPI) est un modèle du genre. Incluse dans le Centre national d’art et de culture Georges Pompidou, au cœur de l’ancien quartier des Halles, la BPI est la grande bibliothèque parisienne multimédia en libre accès. En travaux pour restructuration après vingt ans de fonctionnement (1977-1997), elle déménage provisoirement en novembre 1997 dans d’autres locaux situés dans le même quartier, en attendant la réouverture des locaux initiaux en l’an 2000. Entre autres services, le site web de la BPI propose l’Oriente-Express, un répertoire d’adresses de bibliothèques et de centres de documentation publics et privés situés à Paris ou en région parisienne, choisis soit parce qu’ils sont ouverts à un large public, soit parce qu’ils font référence dans leur domaine. Tous les organismes sont présentés dans un cadre identique avec description des collections et des domaines couverts, ainsi qu’un lien hypertexte vers leur site web.
Le site bilingue français-anglais de la Bibliothèque nationale de France (BnF) est à la fois solidement ancré dans le passé et résolument ouvert sur l’avenir, comme en témoigne le menu principal de la page d’accueil avec ses neuf rubriques: nouveau (à savoir les nouvelles manifestations culturelles), connaître la BnF, les actualités culturelles, les expositions virtuelles (quatre expositions en septembre 1998: les splendeurs persanes, le roi Charles V et son temps, naissance de la culture française, tous les savoirs du monde), des informations pratiques, l’accès aux catalogues de la BnF, l’information professionnelle (conservation, dépôt légal, produits bibliographiques, etc.), la bibliothèque en réseau (francophonie, coopération nationale, coopération internationale, etc.), et les autres serveurs (bibliothèques nationales, bibliothèques françaises, universités, etc.). Enfin, bien en vue sur la page d’accueil, un logo permet d’accéder à Gallica, sa bibliothèque numérique, sur laquelle on reviendra dans le chapitre suivant.
Les sites web de bibliothèques francophones étant de plus en plus nombreux, plusieurs répertoires sont créés pour en faciliter l’accès: le répertoire des catalogues des bibliothèques francophones de l’ENSSIB (Ecole nationale supérieure des sciences de l’information et des bibliothèques), le répertoire des bibliothèques présentes sur l’internet de l’Association des bibliothécaires français (ABF), le répertoire des sites web de bibliothèques de Biblio On Line, etc. Ces répertoires sont également accessibles par le biais de Sitebib, un site web permettant une gestion partagée des liens entre divers organismes spécialisés. Situé sur le serveur de la Bibliothèque nationale de France (BnF), le Catalogue collectif de France (CCFR) permet de "trouver des informations détaillées sur les bibliothèques françaises, leurs collections et leurs fonds (anciens, locaux ou spécifiques), connaître précisément les services qu'elles rendent et interroger leur catalogue en ligne".
= En Europe
Il existe nombre de répertoires nationaux, par exemple Bibliotheken, situé sur le site du Fachbereich Informatik (devenu ensuite: Fargebiet Wissensbasierte System) de la Technische Universität (TU) de Berlin, qui donne la liste des bibliothèques nationales, universitaires et publiques d’Allemagne, d’Autriche et de Suisse, ou encore BIBSYS,qui est le site des bibliothèques de Norvège. Géré par la bibliothèque de l’Université d’Exeter, Library and Related Resources est le répertoire des bibliothèques, musées et centres de recherche du Royaume-Uni.
Site trilingue (anglais, français, allemand), Gabriel est l’acronyme de: Gateway and Bridge to Europe’s National Libraries. Comme son nom l’indique, il s’agit du serveur des bibliothèques nationales européennes, créé afin d’offrir un point d’accès unique à leurs services et collections. Le choix de ce nom "rappelle également les travaux de Gabriel Naudé, dont l’Advis pour dresser une bibliothèque (Paris, 1627) est le premier travail théorique en Europe sur les bibliothèques et qui constitue ainsi un point de départ sur les bibliothèques de recherche modernes. Le nom Gabriel est aussi employé dans de nombreuses langues européennes et vient de l'Ancien Testament, Gabriel étant l'un des archanges, ou messager céleste. Il est également présent dans le Nouveau Testament et dans le Coran."
Le site propose des liens hypertextes vers les services en ligne des bibliothèques nationales européennes. Il couvre les pays suivants: Allemagne, Autriche, Belgique, Bulgarie, Danemark, Espagne, Estonie, Finlande, France, Grèce, Hongrie, Irlande, Islande, Italie, Lettonie, Liechtenstein, Lituanie, Luxembourg, Macédoine, Malte, Norvège, Pays-Bas, Pologne, Portugal, République slovaque, République tchèque, Roumanie, Royaume-Uni, San Marino, Suède, Suisse, Turquie et Vatican. Une rubrique informe des projets communs à plusieurs pays. La recherche sur Gabriel est possible par pays ou par type de services: OPAC (online public access catalogues), bibliographies nationales, catalogues collectifs nationaux, index de périodiques, serveurs web, gophers (systèmes d’information à base de menus textuels à plusieurs niveaux), et liste complète des services en ligne par bibliothèque.
Comment Gabriel voit-il le jour? L’idée d’un site web commun aux bibliothèques nationales européennes naît en 1994 à Oslo (Norvège) lors de la réunion de la Conference of European National Libraries (CENL). En mars 1995, une nouvelle réunion rassemble les représentants de la Koninklijke Bibliotheek (Pays-Bas), de la British Library (Royaume-Uni) et de l’Helsinki University Library (Finlande). Après s'être mises d’accord sur un projet pilote, ces trois bibliothèques sont rejointes par trois autres bibliothèques nationales: Die Deusche Bibliothek (Allemagne), la Bibliothèque nationale de France et la Biblioteka Narodowa (Pologne).
Le projet Gabriel est approuvé en septembre 1995 lors de la réunion annuelle de la CENL à Berne (Suisse). Un serveur pilote est lancé sur l’internet par la British Library, qui s’occupe ensuite de sa maintenance éditoriale avec la collaboration des bibliothèques nationales de Finlande et des Pays-Bas. La seconde étape se déroule entre octobre 1995 et septembre 1996. Les bibliothèques nationales n’ayant pas participé à la phase pilote sont invitées à se joindre au projet, ce qui permet son développement rapide. Entre-temps, de nombreuses bibliothèques débutent leur propre site web. Lors de sa réunion à Lisbonne (Portugal) en septembre 1996, la CENL décide le lancement de Gabriel, son site officiel, à compter du 1er janvier 1997. Sa maintenance éditoriale est désormais assurée par la Koninklijke Bibliotheek (Pays-Bas).
Quelle est la situation dans les bibliothèques publiques? Internet and the Library Sphere, document de l’Union européenne, évalue à 1.000 environ le nombre de bibliothèques publiques ayant un site web en novembre 1998. Ces bibliothèques sont réparties dans une trentaine de pays. Les pays les plus représentés sont la Finlande (247 bibliothèques), la Suède (132 bibliothèques), le Royaume-Uni (112 bibliothèques), le Danemark (107 bibliothèques), l'Allemagne (102 bibliothèques), les Pays-Bas (72 bibliothèques), la Lituanie (51 bibliothèques), l'Espagne (56 bibliothèques) et la Norvège (45 bibliothèques). La Russie est présente avec 26 bibliothèques. Les pays nouvellement représentés sont la République tchèque (29 bibliothèques) et le Portugal (3 bibliothèques). Les sites sont très hétérogènes. Certains mentionnent seulement l’adresse postale de la bibliothèque et ses heures d’ouverture, tandis que d’autres proposent toute une gamme de services, avec accès direct à leur catalogue en ligne (OPAC).
= Dans le monde
Les deux grandes bibliothèques anglophones présentes sur le web sont la British Library (Royaume-Uni) et la Library of Congress (Etats-Unis). Leurs sites web sont d’autant plus intéressants qu’ils incluent toute une réflexion sur la place de l’internet et des technologies numériques dans la profession. Dans sa section Library and Information Science Resources, la Library of Congress donne une liste des bibliothèques publiques universitaires aux Etats-Unis, avec accès à leurs sites web et à leurs catalogues. Plusieurs rubriques concernent la recherche et la référence, les services techniques, les collections particulières, les bibliothèques numériques, les organisations professionnelles, les écoles en bibliothéconomie et sciences de l’information, les journaux professionnels et les fournisseurs de bibliothèques.
Un outil pratique à l'échelle mondiale est le répertoire Libweb: Library Servers via WWW, tenu à jour par Thomas Dowling au sein de la Digital Berkeley Library, la bibliothèque numérique de l’Université de Berkeley (Californie). Libweb recense la totalité des sites web de bibliothèques dans le monde, soit, à l’automne 1998, 2.500 sites web dans 70 pays. Une centaine de bibliothèques européennes est répertoriée. La mise à jour est quotidienne, tous les jours à minuit heure locale.
6.2. L’internet dans les bibliothèques
"Cyberespace. Une hallucination consensuelle expérimentée quotidiennement par des milliards d’opérateurs réguliers, dans chaque nation, par des enfants à qui on enseigne des concepts mathématiques… Une représentation graphique des données extraites des banques de tous les ordinateurs dans le système humain. Complexité incroyable. Des lignes de lumière alignées dans le non-espace de l’esprit, des agglomérats et des constellations de données. Et qui s’estompent peu à peu, comme les lumières de la ville…" En attendant le cyberespace à l’échelle mondiale décrit par William Gibson dans Neuromancien, roman de science-fiction paru en 1984, nombreux sont les bibliothécaires qui mettent sur pied des cyberespaces entre quatre murs à destination de leurs lecteurs.
= L’internet en milieu rural
Lancé en 1996, le site web de l’ARPALS a pour sous-titre: "Internet et multimédia aux champs, ou comment amener la culture en milieu rural". L’ARPALS (Amicale du regroupement pédagogique Armillac Labretonie Saint-Barthélémy) regroupe les 950 habitants de quatre villages (Armillac, Labretonie, Laperche et Saint-Barthélémy) situés dans le département du Lot-et-Garonne, dans le sud-ouest de la France. Le regroupement pédagogique intercommunal (RPI) permet aux quatre villages de faire école commune afin d’éviter la fermeture de classes malheureusement fréquente dans le monde rural.
L’association met sur pied d’une part des animations (repas, kermesse, bal masqué), d’autre part une bibliothèque intercommunale de 1.300 livres en partenariat avec la Bibliothèque départementale de prêt (BDP) de Villeneuve-sur-Lot. Le site web présente une sélection de livres avec un résumé pour chacun d’eux. L’association crée aussi une médiathèque ouverte 22 heures par semaine pour un public allant de 3 à 76 ans. Quatre ordinateurs multimédia (complétés par deux imprimantes couleur et un scanner à plat) permettent la consultation de CD-Rom, le libre accès à l’internet et l’utilisation de logiciels bureautiques tels que Works, Dbase for Windows, Corel Draw, Publisher, PhotoPaint, etc.
En juin 1998, Jean-Baptiste Rey, webmestre de l’ARPALS, précise: "Le but de notre site internet est de faire connaître l'existence de la médiathèque intercommunale de St-Barthélémy et ce que nous y faisons. C'est un moyen pour nous de démontrer l'utilité et l'intérêt de ce type de structure et la simplicité de l'usage des nouvelles technologies dans le cadre d'une bibliothèque." C’est aussi un moyen de "pallier la faiblesse de notre fonds documentaire. Internet et le multimédia nous permettent d'offrir beaucoup plus de ressources et d'informations à nos usagers".
= Le cyberespace des Nations unies à Genève
L’internet peut aussi relancer les bibliothèques traditionnelles. C’est le cas de la Bibliothèque de l’Organisation des Nations unies à Genève (ONUG), sise dans l’imposant Palais des nations, entre le Lac Léman et le quartier des organisations internationales. En juillet 1997, à l’initiative de Pierre Pelou, son directeur, la bibliothèque ouvre un cyberespace de 24 postes informatiques en libre accès avec plusieurs dizaines de CD-Rom en réseau et connexion à l’internet. Très rapidement, de l’avis du personnel, "la consultation électronique induit une plus grande consultation imprimée et un renforcement de toutes les formes de recherche". Dépassant les prévisions les plus optimistes, ce cyberespace joue le rôle de catalyseur, amenant un nouveau public, jeune, varié et enthousiaste, à consulter les collections de la bibliothèque et à utiliser ses autres services.
Aménagé au premier étage de la bibliothèque par Antonio Bustamante, architecte au Palais des nations, ce cyberespace est mis gratuitement à la disposition des représentants des missions permanentes, délégués de conférences, fonctionnaires internationaux, chercheurs, étudiants, journalistes, membres des professions libérales, ingénieurs et techniciens, sans sélection par le rang, chose assez rare dans ce milieu. Le premier arrivé est le premier servi. A l’ouverture en 1997, les 24 stations comprennent chacune un ordinateur multimédia, un lecteur de CD-Rom et un casque individuel. Chaque groupe de trois ordinateurs est relié à une imprimante laser. Suite au succès du premier cyberespace, un deuxième cyberespace ouvre en avril 1998, deux étages plus haut, avec six postes informatiques et une vue imprenable sur le lac Léman et la chaîne des Alpes.
Chaque station permet de consulter l’internet, d’avoir accès à sa messagerie électronique et d’utiliser le traitement de texte WordPerfect. Sont disponibles aussi les services suivants: a) le système optique des Nations unies, b) un serveur regroupant une cinquantaine de CD-Rom en réseau, c) la banque de données UNBIS (United Nations Bibliographic Information System), coproduite par les deux bibliothèques des Nations unies à New York et à Genève, d) le catalogue de la Bibliothèque de l’Office des Nations unies à Genève, e) Profound, un ensemble de banques de données économiques et commerciales, f) RERO, le catalogue du Réseau romand des bibliothèques suisses (qui comprend le catalogue de la Bibliothèque des Nations unies de Genève à titre de bibliothèque associée), g) plusieurs CD-Rom multimédia (Encarta 97, L’Etat du monde, Elysée 2, Nuklear, etc.), h) des vidéocassettes multistandards et des DVD présentant des programmes, films et documentaires sur l’action internationale et l’action humanitaire.
= L’Union européenne
L’Union européenne dispose quant à elle d’un Programme des bibliothèques dont l’objectif est double: aider au développement des ressources internet et faciliter les connexions des bibliothèques, ainsi que l’interconnexion des bibliothèques entre elles. Géré par la Commission européenne, le portail I*M Europe (scindé ensuite en plusieurs portails) présente l’actualité du marché européen du multimédia et de l’information électronique. Le site web est en anglais, avec des documents dans les onze langues européennes officielles.
Emanant de CoBRA (Computerised Bibliographic Record Action), forum de l’Union européenne consacré à l’édition électronique, le projet BIBLINK est lancé en avril 1996 pour établir des liens entre les agences bibliographiques nationales et les éditeurs de documents électroniques, afin de contribuer à la création d’un service bibliographique qui fasse autorité. L’objectif est la mise en service d’un système permettant aux éditeurs de documents électroniques de transmettre aux services bibliographiques nationaux des notices de base comportant un nombre minimal d’informations sur ces documents. Ces services bibliographiques seront ensuite autorisés à compléter les notices de base, notamment par le contrôle d’autorités sur les noms propres et l’ajout de mots-clés correspondant aux sujets traités, et à retransmettre ensuite les notices complétées aux éditeurs. (Une fois réalisé, ce projet prend fin en février 2000.)
= Dans le monde
Deux associations professionnelles sont particulièrement actives en Amérique du Nord. L’American Society for Information Science (ASIS) (devenue ensuite l’ASIS&T – American Society for Information Science & Technology) est une association de recherche regroupant 4.000 professionnels de l’information. L’Association for Research Libraries (ARL) est une organisation à but non lucratif regroupant les bibliothèques des institutions de recherche nord-américaines. Elle se veut à la fois un forum pour les échanges d’idées et un agent pour l’action collective, cette action consistant à développer la communication dans le domaine de la recherche.
A la fois sobre et superbe, IFLANET, le site de l’International Federation of Library Associations and Institutions (IFLA), offre une mine d’informations, y compris pour l’internet et les technologies numériques. Organisme international indépendant, l’IFLA représente les bibliothécaires à l’échelon international et promeut la coopération internationale, la recherche et la formation continue.
Une réflexion particulièrement intéressante est celle menée par l’Internet Public Library (IPL), qui se définit comme la première bibliothèque publique de l’internet sur l’internet. En tant que bibliothèque expérimentale, l’IPL s’efforce de découvrir et promouvoir les projets les plus intéressants relatifs à l’utilisation de l’internet par les bibliothécaires. A cet effet, elle gère une section intitulée IPL Services For Librarians (intégrée plus tard à: Subject Collections), qui explicite les avantages de l’internet dans les bibliothèques, donne de nombreux exemples de réalisations et indique les possibilités de formation professionnelle dans ce domaine.
6.3. Les professionnels de l’information
= L’internet, un outil d’échange
Les avantages de l’internet pour les bibliothécaires? D'après Olivier Bogros, directeur de la Bibliothèque municipale de Lisieux (Normandie), interviewé en juin 1998, l’internet est "un outil formidable d'échange entre professionnels (tout ce qui passe par le courrier électronique, les listes de diffusion et les forums), mais aussi un consommateur de temps très dangereux. (…) C'est pour les bibliothèques la possibilité d'élargir leur public en direction de toute la francophonie. Cela passe par la mise en ligne d'un contenu qui n'est pas seulement la mise en ligne du catalogue, mais aussi et surtout la constitution de véritables bibliothèques virtuelles. Les professionnels des bibliothèques sont les acteurs d'un enjeu important concernant la place de la langue française sur le réseau."
L’internet est en effet un outil de communication sans précédent.
D’abord le courrier électronique. Ceux qui en bénéficient sont enthousiasmés par les avantages qu'il procure. Voici enfin un outil de communication simple et rapide permettant d’être en contact avec les collègues de sa ville, de sa région, de son pays et du monde entier. Plus besoin d’attendre que la ligne de téléphone de son correspondant soit libre. Pas d’enveloppe, pas de timbre, pas de fax engorgé. Le message attend le correspondant dans sa boîte aux lettres électronique, et le correspondant lit et répond à ses messages au moment choisi par lui.
Ensuite les forums de discussion. Ceux-ci permettent de suivre et de participer à des débats, de demander des avis et des conseils. Pour un bibliothécaire ou un documentaliste travaillant seul, c’est un grand bol d’air sur l’extérieur. Pour celui qui est entouré de collègues, le forum de discussion lui permet de fréquenter des personnes venant d’autres horizons.
Enfin les listes de diffusion. Celles-ci permettent de communiquer le même message à de très nombreux inscrits. La plus connue est Biblio-fr, créée en 1993 par Hervé Le Crosnier, professeur à l'Université de Caen (Normandie). Ouvert aux bibliothécaires et documentalistes francophones et à toute personne intéressée par la diffusion électronique de l'information documentaire, Biblio-fr compte 3.329 abonnés le 20 décembre 1998. La liste se veut le regard francophone des documentalistes sur les questions soulevées par le développement de l’internet: diffusion de la connaissance, organisation de collections de documents électroniques, maintenance et archivage de l'écrit électronique. Son but est également d’assurer la présence de la langue française sur un réseau multilingue qui accorde leur place à toutes les cultures.
Des portails sont créés pour les bibliothèques, par exemple Biblio On Line, géré par Quick Soft Ingénierie, société informatique parisienne. En juin 1998, Jean-Baptiste Rey, rédacteur et webmestre de Biblio On Line, relate: "Le site dans sa première version a été lancé en juin 1996. Une nouvelle version (l'actuelle) a été mise en place à partir du mois de septembre 1997. Le but de ce site est d'aider les bibliothèques à intégrer internet dans leur fonctionnement et dans les services qu'elles offrent à leur public. Le service est décomposé en deux parties: a) une partie 'professionnelle' où les bibliothécaires peuvent retrouver des informations professionnelles et des liens vers les organismes, les institutions, et les projets et réalisations ayant trait à leur activité; b) une partie comprenant annuaire, mode d'emploi de l'internet, villes et provinces, etc… permet au public des bibliothèques d'utiliser le service Biblio On Line comme un point d'entrée vers internet."
Connue pour son dynamisme, l’ENSSIB (Ecole nationale supérieure des sciences de l’information et des bibliothèques) propose sur son site web une section Référence qui comprend notamment des dossiers thématiques (histoire du livre, enseignement à distance, bibliothèques électroniques, cours en sciences de l'information, économie du document, normes et normalisation, droit de l'information) et une liste de revues en sciences de l'information.
Le site de l’ENSSIB héberge la version électronique du Bulletin des bibliothèques de France (BBF), une revue professionnelle bimensuelle dans laquelle "professionnels et spécialistes de l'information discutent de toutes les questions concernant la politique et le développement des bibliothèques et des centres de documentation: évolution par secteur, grands projets, informatisation, technologies de l'information, écrits électroniques, réseaux, coopération, formation, gestion, patrimoine, usagers et publics, livre et lecture…" En juillet 1998, Annie Le Saux, rédactrice de la revue, relate: "C'est en 1996 que le BBF a commencé à paraître sur internet (les numéros de 1995). (…) Nous nous servons beaucoup du courrier électronique pour prendre contact avec nos auteurs et pour recevoir leurs articles. Cela diminue grandement les délais. Nous avons aussi recours au web pour prendre connaissance des sites mentionnés lors de colloques, vérifier les adresses, retrouver des indications bibliographiques dans les catalogues des bibliothèques…"
Les associations de bibliothécaires sont également présentes sur le web. Avec ses 3.500 adhérents, l'Association des bibliothécaires français (ABF) est la principale association de bibliothécaires en France. L’Association des professionnels de l'information et de la documentation (ADBS) propose pour sa part un site bilingue français-anglais articulé autour de trois grandes rubriques: vie associative, vie professionnelle, produits et services. Elle gère aussi une liste de diffusion dénommée ADBS-info.
= Le rôle du bibliothécaire
Avec cette manne documentaire qu’offre désormais l’internet, que vont devenir les bibliothécaires-documentalistes? Vont-ils devenir des cyberthécaires, ou bien vont-ils progressivement disparaître parce que les usagers n’auront tout simplement plus besoin d’eux?
Dans son livre Digital Literacy (paru en 1997 chez Wiley à New York), Paul Gilster assure que ce sont les bibliothécaires et non les programmeurs qui seront la clé du développement de l’internet, notamment par le biais des bibliothèques numériques. Surpris par le pessimisme qui saisit les bibliothécaires devant les changements affectant leur profession, il pense que celui-ci est sans fondement. D’après lui, l’internet n’est pas plus une menace pour les livres que l’avion n’était une menace pour la voiture. Le livre imprimé gardera son utilité pendant que l’internet se développera, et ces deux vecteurs de connaissance seront en quelque sorte des voies parallèles ayant des fonctions complémentaires.
Cependant, au moins pour les bibliothèques spécialisées, on ne voit plus guère l’utilité d’aligner des documents sur les rayons, alors qu’il est tellement plus pratique de les scanner pour pouvoir les stocker sur un disque dur, les communiquer par voie électronique et les imprimer seulement à la demande. Ces bibliothèques sont en pleine période de transition.
Par contre, les bibliothèques nationales et autres grandes bibliothèques de conservation auront toujours à préserver le patrimoine pluricentenaire constitué par les manuscrits, les incunables, les livres imprimés, les collections de journaux, les partitions musicales, les gravures, les images, les affiches, les photos et les films qui se sont accumulés au fil des siècles par le biais du dépôt légal.
L’avenir des bibliothèques publiques est plus mitigé. Pour le moment, personne n’est prêt à lire à l’écran un roman de Zola ou de Proust. Question de génération peut-être. Les enfants qui jouent avec l’ordinateur familial dès l’âge de trois ans ne verront peut-être aucun problème à lire les classiques à l’écran. Les ordinateurs portables deviennent de plus en plus compacts et légers, et la qualité des écrans s’améliore chaque année. De plus, on nous annonce pour bientôt des livres électroniques, petits ordinateurs de la taille d'un livre, qui permettront de lire et stocker une dizaine d'oeuvres dans un premier temps, et bien davantage ensuite. (En effet, le Rocket eBook et le Softbook Reader, premiers modèles de livres électroniques, sont lancés début 1999 en Amérique du Nord, et d’autres modèles suivent.)
Le métier de bibliothécaire, qui s’est beaucoup transformé avec l’apparition de l’informatique, continue de se transformer avec le développement de l’internet.
L’informatique a permis au bibliothécaire de remplacer ses milliers de fiches sur bristol par des catalogues informatiques consultables à l’écran, avec un classement alphabétique ou systématique effectué non plus par lui-même mais par la machine. Elle a permis aussi le prêt informatisé et la gestion informatisée des commandes, faisant disparaître l’impressionnant stock de fiches et bordereaux nécessaires lors des opérations manuelles.
L’informatique en réseau a permis la naissance de catalogues collectifs permettant de regrouper dans une même base de données les catalogues des bibliothèques de la même région, du même pays ou de la même spécialité, entraînant du même coup des services très facilités pour le prêt inter-bibliothèques et le regroupement des commandes auprès des fournisseurs.
Dans les années 1980, des bibliothèques ouvrent un serveur minitel pour la consultation de leur catalogue, désormais disponible au domicile du lecteur. A partir de 1995, ces catalogues sont progressivement transférés sur l’internet, avec une consultation plus souple et plus attractive que sur minitel. Parallèlement, la mise en ligne de sites web permet d'offrir un ensemble de documents numérisés ou encore un choix de liens hypertextes vers d’autres sites, évitant ainsi aux usagers de se perdre sur la toile.
Nombre de bibliothécaires se spécialisent dans la sélection de ressources internet à destination des lecteurs. Peter Raggett, sous-directeur de la Bibliothèque centrale de l’OCDE (Organisation de coopération et de développement économiques, Paris), relate en juin 1998: "Je dois filtrer l’information pour les usagers de la bibliothèque, ce qui signifie que je dois bien connaître les sites et les liens qu’ils proposent. J’ai sélectionné plusieurs centaines de sites pour en favoriser l’accès à partir de l’intranet de l’OCDE. Cette sélection fait partie du bureau de référence virtuel proposé par la bibliothèque à l’ensemble du personnel. Outre les liens, ce bureau de référence contient des pages de référence recensant les articles, monographies et sites web correspondant aux différents projets de recherche en cours à l’OCDE, l’accès en réseau aux CD-Rom et une liste mensuelle des nouveaux titres."
Comment voit-il l’avenir de la profession? "L’internet offre aux chercheurs un stock d’informations considérable. Le problème pour eux est de trouver ce qu’ils cherchent. Jamais auparavant on n’avait senti une telle surcharge d’informations, comme on la sent maintenant quand on tente de trouver un renseignement sur un sujet précis en utilisant les moteurs de recherche disponibles sur le web. A mon avis, les bibliothécaires auront un rôle important à jouer pour améliorer la recherche et l’organisation de l’information sur le réseau. Je prévois aussi une forte expansion de l’internet pour l’enseignement et la recherche. Les bibliothèques seront amenées à créer des bibliothèques numériques permettant à un étudiant de suivre un cours proposé par une institution à l’autre bout du monde. La tâche du bibliothécaire sera de filtrer les informations pour le public. Personnellement, je me vois devenir de plus en plus un bibliothécaire virtuel. Je n’aurai pas l’occasion de rencontrer les usagers, ils me contacteront plutôt par courriel, par téléphone ou par fax, j’effectuerai la recherche et je leur enverrai les résultats par voie électronique."
6.4. Les catalogues en ligne
= Le catalogue, un outil essentiel
Pourquoi toute une section sur les catalogues? Parce que, dans le domaine du livre, le catalogue correspond au cerveau chez l’être humain.
Par le passé, on a pu reprocher aux catalogues d’être austères, peu conviviaux, et surtout de donner les références du document mais en aucun cas l’accès à son contenu. Depuis qu’ils sont disponibles sur l’internet, les catalogues sont moins austères et plus conviviaux. Et surtout - rêve de tous qui commence à devenir réalité - ils pourront permettre l’accès aux documents eux-mêmes: textes et images dans un premier temps, extraits sonores et vidéos dans un deuxième temps. Ceci est déjà vrai à titre expérimental pour les 2.500 oeuvres de l’Universal Library, accessibles par le biais de l’Experimental Search System (ESS) de la Library of Congress. (Ce système expérimental est ensuite intégré au catalogue en ligne de la Library of Congress.)
De plus en plus de catalogues sont accessibles directement sur le web, moyennant une interface spécifique. L’usager a souvent le choix entre deux types de recherche, simple et avancée, et il peut sélectionner plusieurs critères complémentaires tels que le nombre de notices souhaitées ou bien le mode de classement. A réception du résultat, il peut dérouler plusieurs pages de notices abrégées ou complètes. Les notices sélectionnées peuvent être copiées, imprimées, sauvegardées ou bien envoyées par courriel. Des liens hypertextes permettent de passer facilement d’une requête à l'autre.
Ces catalogues utilisent la norme Z39.50, un protocole standard de communication permettant la recherche d'informations bibliographiques dans des bases de données en ligne. L’utilisateur d’un système peut rechercher des informations chez les utilisateurs d’autres systèmes sans devoir connaître la syntaxe de recherche utilisée par ces derniers. Déjà largement utilisée aux Etats-Unis, cette norme est promue par l’Union européenne pour favoriser son utilisation dans les pays membres.
Deux catalogues, celui de la British Library et celui de la Library of Congress, constituent d’excellents outils bibliographiques à l’échelon mondial. En mai 1997, la British Library lance son OPAC 97 (OPAC: online public access catalogue), un catalogue en ligne permettant l’accès libre aux catalogues de ses principales collections à Londres et à Boston Spa, soit 150 millions de documents rassemblés depuis 250 ans. (Catalogue expérimental, l’OPAC 97 est ensuite remplacé par sa version définitive, le BLPC - British Library Public Catalogue.) Quant au catalogue de la Library of Congress, il s'agit du plus grand catalogue en ligne au monde. Sa consultation est gratuite, avec menus en anglais et en espagnol. On y trouve les notices de documents dans de très nombreuses langues, y compris en français.
= Les catalogues collectifs
L’informatique en réseau permet le développement de catalogues collectifs visant à faire connaître les ressources disponibles à l’échelon régional, national et international. Avantage significatif, le catalogue collectif évite au professionnel de cataloguer à nouveau un document déjà catalogué par une bibliothèque partenaire.
Situé sur le serveur de la Bibliothèque nationale de France (BnF), le Catalogue collectif de France (CCFR) permet de "trouver des informations détaillées sur les bibliothèques françaises, leurs collections et leurs fonds (anciens, locaux ou spécifiques), connaître précisément les services qu'elles rendent et interroger leur catalogue en ligne". A terme, il permettra aussi de "localiser des ouvrages (documents imprimés, audio, vidéo, multimédia) dans les principales bibliothèques et demander le prêt ou la reproduction" de documents qui seront remis à l'usager dans la bibliothèque de son choix. (C’est chose faite en novembre 2002.)
L’internet rend également possible la gestion de catalogues à l’échelon international. Si le catalogueur trouve la notice du livre qu’il doit cataloguer, il la copie pour l’inclure dans le catalogue de sa propre bibliothèque. S’il ne trouve pas la notice, il la crée, et cette notice est aussitôt disponible pour les catalogueurs suivants. La même règle vaut pour les catalogueurs de Paris (France), Tokyo (Japon) ou Canberra (Australie). Ce pari osé est tenté par deux associations américaines, OCLC (Online Computer Library Center) et RLG (Research Libraries Group), qui gèrent de gigantesques bases de données bibliographiques alimentées et utilisées par leurs adhérents, permettant ainsi aux bibliothécaires d’unir leurs forces par-delà les frontières.
OCLC gère l’OCLC Online Union Catalog, débuté en 1971 pour desservir les bibliothèques universitaires de l’Etat de l’Ohio (Etats-Unis), et qui s’étend ensuite à tout le pays, puis au monde entier. Désormais appelé WorldCat, ce catalogue collectif mondial comprend en 1998 38 millions de notices en 370 langues (avec translittération pour les caractères non romains) et 25.000 bibliothèques adhérentes. L'accroissement annuel est de 2 millions de notices. WorldCat utilise huit formats bibliographiques correspondant aux catégories suivantes: livres, périodiques, documents visuels, cartes et plans, documents mixtes, enregistrements sonores, partitions, documents informatiques.
En 1980, le Research Libraries Group (RLG) débute RLIN (Research Libraries Information Network), un catalogue collectif différent de celui d'OCLC puisqu’il accepte plusieurs notices pour un même document. RLIN comprend 82 millions de notices en 1998. Des centaines de dépôts d’archives, bibliothèques de musées, bibliothèques universitaires, bibliothèques publiques, bibliothèques de droit, bibliothèques techniques, bibliothèques d’entreprise et bibliothèques d’art utilisent RLIN pour le catalogage, le prêt inter-bibliothèques et le contrôle des archives et des manuscrits. 365 langues y sont représentées, avec des notices translittérées pour les documents publiés dans les langues JACKPHY (japonais, arabe, chinois, coréen, persan, hébreu et yiddish) et en cyrillique. Une des spécialités de RLIN est l’histoire de l’art. Alimentée par 65 bibliothèques spécialisées, une section spécifique comprend 100.000 notices de catalogues d’expositions et 168.500 notices de documents iconographiques (photographies, diapositives, dessins, estampes ou affiches). Cette section inclut aussi les 110.000 notices de la base bibliographique Scipio, consacrée aux catalogues de ventes. (Le successeur de RLIN, le RLG Union Catalog, devrait être en accès libre et gratuit sur le web en 2004.)
= La nécessité d’une norme commune
L’avenir des catalogues en réseau tient à l’harmonisation du format MARC (machine-readable cataloguing), qui est la norme utilisée pour le stockage et l’échange de notices bibliographiques. Cette norme définit un ensemble de codes correspondant à chaque partie de la notice (auteur, titre, éditeur, etc.) pour permettre son traitement informatique.
Au début des années 1970, une vingtaine de versions MARC voit le jour: INTERMARC en France, UKMARC au Royaume-Uni, USMARC aux Etats-Unis, CAN/MARC au Canada, etc., correspondant chacune aux pratiques nationales de catalogage. Toutes ces versions posent de nombreux problèmes pour les échanges de données, si bien que l’IFLA (International Federation of Library Associations and Institutions) crée en 1977 l’UNIMARC pour disposer d’un format intermédiaire international. Les notices dans le format MARC d’origine sont d’abord converties en UNIMARC avant d’être converties à nouveau dans le format MARC de destination.
Dans le monde anglophone, la British Library (qui utilise UKMARC), la Library of Congress (qui utilise USMARC) et la Bibliothèque nationale du Canada (qui utilise CAN/MARC) décident d’harmoniser leurs formats MARC nationaux. Un programme de trois ans (décembre 1995 - décembre 1998) permet de mettre au point un format MARC commun aux trois bibliothèques.
Parallèlement, en 1996, dans le cadre de son Programme des bibliothèques, l’Union européenne promeut l’utilisation du format UNIMARC comme format commun d’échange entre tous les formats MARC utilisés par les bibliothèques des pays membres. Le groupe de travail correspondant étudie aussi les problèmes posés par les différentes polices de caractères, ainsi que la manière d’harmoniser le format bibliographique et le format du document pour les documents disponibles en ligne.
= Les catalogues de demain
Gérées par des sociétés privées, des bases commerciales telles que Dialog, LexisNexis ou UnCover (intégré ensuite à Ingenta) préfigurent ce que pourraient être les catalogues de demain, en attendant que les organismes publics prennent le relais. Ces bases disposent de moteurs de recherche très performants permettant l’accès aux catalogues et aux documents en ligne. Les avantages de cette recherche automatisée sont énormes si on pense aux centaines de tables des matières ou d’index qu’il faudrait parcourir pour arriver au même résultat. Le seul défaut, et de taille, est le coût de cette recherche, qui devient vite prohibitif pour un particulier ou une bibliothèque peu fortunée. Un compteur permet toutefois de consulter en continu la somme facturée pour éviter les mauvaises surprises.
Sous l’égide de Knight-Ridder, grand groupe de presse américain, la Dialog Corporation comprend plusieurs bases documentaires faisant autorité. La plus connue, Dialog, regroupe elle-même 450 bases de données dans les domaines suivants: affaires, industrie, actualité, droits et brevets, chimie, environnement, sciences et techniques, outils de référence. Une recherche par mots-clés permet d’opérer une sélection dans les dizaines de milliers de documents disponibles. Le serveur fournit une liste bibliographique de tous les documents correspondant à la requête lancée. Cette liste permet de sélectionner quelques documents et de demander leur expédition par voie électronique.
Sous l’égide de Reed Elsevier, grosse société d’édition britannique, LexisNexis est un fournisseur international de services d’information et d’outils de gestion (en ligne, sur l’internet, sur CD-Rom et sur papier) à l’intention de clients répartis dans plus de 60 pays, essentiellement des professionnels du droit, de l’information et des affaires.
Sous l’égide de la CARL Corporation, UnCover (intégré ensuite à Ingenta) permet de se procurer des articles provenant de 17.000 périodiques couvrant tous les domaines depuis 1988. Si l’envoi d’articles est payant, la recherche dans la base de données est gratuite, tout comme la recherche dans les tables des matières des périodiques et dans l’index des mots-clés.
Dans Digital Literacy (paru en 1997 chez Wiley à New York), Paul Gilster se demande si les moteurs de recherche du web seront les catalogues de demain. Ceci ne semble guère possible dans un avenir proche. Contrairement au système commun d’indexation propre aux bibliothèques américaines, chaque moteur de recherche a sa propre méthode d’indexation, et l’usager doit se familiariser avec elle pour en tirer le meilleur parti. Les bibliothèques elles-mêmes auraient un gigantesque effort à fournir pour harmoniser leurs thésaurus ou leurs listes de mots-matière à l’échelon international. Etape intermédiaire, un thésaurus multilingue serait indispensable en Europe, puisque chacun indexe ses publications dans sa propre langue. Le travail est titanesque.
On peut également rêver à des catalogues communs aux bibliothèques, aux librairies et aux éditeurs. Du fait de la rigueur et du professionnalisme qu’il implique, le catalogage est devenu un métier à part entière. La notice minimale (auteur, titre, éditeur) fait maintenant place à une notice plus complexe régie par des normes internationales permettant un meilleur échange de données. Ce n’est d’ailleurs pas un hasard si la réputation d’une bibliothèque s’appuie en partie sur la qualité de son catalogue. Il est sa colonne vertébrale, et le sera de plus en plus avec le développement des bibliothèques numériques.
[7.1. Genèse de la bibliothèque numérique / 7.2. Bibliothèques numériques francophones / 7.3. Autres expériences pilotes]
Appelée aussi bibliothèque électronique ou bibliothèque virtuelle, la bibliothèque numérique est sans doute à ce jour le principal apport de l’internet au monde du livre, et réciproquement. Voilà pourquoi un chapitre entier lui est consacré. Grâce à l’internet, des milliers d’œuvres du domaine public, documents littéraires et scientifiques, articles, travaux universitaires et de recherche, images et bandes sonores sont désormais disponibles à l’écran, et le mouvement va en s’amplifiant avec la poursuite de la numérisation des fonds à la vitesse grand V. Trois exemples parmi tant d'autres.
7.1. Genèse de la bibliothèque numérique
= Bibliothèque traditionnelle et bibliothèque numérique
Si certaines bibliothèques numériques sont nées directement sur le web, la majorité d’entre elles émane de bibliothèques traditionnelles. La Bibliothèque nationale de France (BnF) crée Gallica qui, dans un premier temps, propose des images et textes du 19e siècle francophone. Une sélection de 3.000 livres est complétée par un échantillon de la future iconothèque numérique. La Bibliothèque municipale de Lisieux (Normandie) gère la Bibliothèque électronique de Lisieux, qui regroupe les versions intégrales d’oeuvres littéraires choisies dans les collections municipales. La Bibliothèque municipale de Lyon met les enluminures de 200 manuscrits et incunables à la disposition de tous sur son site web.
Les bibliothèques numériques permettent à un large public d’avoir accès à des documents jusque-là pratiquement impossibles à consulter parce qu’appartenant à des fonds anciens, des fonds locaux et régionaux, ou des fonds spécialisés. Ces fonds sont souvent difficilement accessibles pour des raisons diverses: souci de conservation des documents rares et fragiles, heures d’ouverture réduites, nombreux formulaires à remplir, longs délais de communication, pénurie de personnel, qui sont autant de barrières à franchir et qui demandent souvent au lecteur une patience à toute épreuve et une détermination hors du commun pour arriver jusqu’au document.
Grâce à la bibliothèque numérique, la bibliothèque traditionnelle peut enfin rendre compatibles deux objectifs qui jusque-là ne l’étaient guère, à savoir la conservation des documents et la communication de ceux-ci. D’une part le document ne quitte son rayonnage qu’une seule fois pour être scanné, d’autre part le grand public y a enfin accès. Si le lecteur veut ensuite consulter le document original, il pourra se lancer dans l’aventure évoquée plus haut, mais en connaissance de cause, grâce au "feuilletage" préalable à l’écran.
= Collection numérique et bibliothèque numérique
La bibliothèque numérique peut être définie comme une entité résultant de l’utilisation des technologies numériques pour acquérir, stocker, préserver et diffuser des documents. Ces documents sont soit publiés directement sous forme numérique, soit numérisés à partir d’un document imprimé, audiovisuel ou autre. Une collection numérique devient une bibliothèque numérique quand elle répond aux quatre facteurs suivants: 1) elle peut être créée et produite dans un certain nombre d’endroits différents, mais elle est accessible en tant qu’entité unique; 2) elle doit être organisée et indexée pour un accès aussi facile que possible à partir du lieu de base où elle est produite; 3) elle doit être stockée et gérée de manière à avoir une existence assez longue après sa création; 4) elle doit trouver un équilibre entre le respect du droit d’auteur et les exigences universitaires.
Dans Information Systems Strategy, un document disponible sur le site de la British Library en 1997, Brian Lang, directeur de projet, explique que la future bibliothèque numérique de la British Library n’est pas envisagée comme un secteur à part, mais qu’elle fera partie intégrante d’une vision globale de la bibliothèque. Si certaines bibliothèques pensent que les documents numériques prédomineront dans les bibliothèques du futur, la British Library n’envisage pas une bibliothèque exclusivement numérique. Elle considère comme fondamentale la communication physique des imprimés, manuscrits, partitions musicales, bandes sonores, etc., tout en ayant conscience de la nécessité du développement parallèle de collections numériques. "On ne peut pas, on ne pourra pas tout numériser. A terme, une bibliothèque virtuelle ne sera jamais qu’un élément de l’ensemble bibliothèque", souligne aussi Jean-Pierre Angremy, président de la Bibliothèque nationale de France (BnF), dans un article du Figaro du 3 juin 1998.
Hébergée par l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, Etats-Unis) et reliée au catalogue expérimental (Experimental Search System - ESS) de la Library of Congress, l’Universal Library insiste sur les trois avantages de la bibliothèque numérique: 1) elle occupe moins de place qu’une bibliothèque traditionnelle et son contenu peut être copié ou sauvegardé électroniquement; 2) elle est immédiatement accessible à quiconque sur l’internet; 3) comme toute recherche sur son contenu est automatisée, elle permet une réduction des coûts importante et une plus grande accessibilité des documents.
= Numérisation en mode image et en mode texte
Qui dit bibliothèque numérique dit numérisation, c’est-à-dire conversion des textes et des images en langage informatique, le plus souvent binaire (0 ou 1). Pour pouvoir être consulté à l’écran, un livre doit être numérisé soit en mode image soit en mode texte.
La numérisation en mode image correspond à la photographie du livre page après page. C’est la méthode employée pour les numérisations à grande échelle, par exemple pour le programme de numérisation de la Bibliothèque nationale de France (BnF). Outre un coût peu élevé, l’avantage qu’y voient les bibliothèques est la conservation de la notion de livre, puisque la version informatique est le fac-similé de la version imprimée.
La numérisation en mode texte implique la saisie d’un texte. Les documents sont patiemment scannés ou saisis page après page. C’est le cas des collections d’ABU: la bibliothèque universelle ou du Projet Gutenberg. Contrairement à la numérisation en mode image, la version informatique ne conserve pas la présentation originale du livre ou de la page. Le livre devient texte, à savoir un ensemble de caractères apparaissant en continu à l’écran. A cause du temps passé au traitement de chaque livre, ce mode de numérisation est assez long, et donc nettement plus coûteux que la numérisation en mode image. Dans de nombreux cas, il est toutefois très préférable, puisqu’il permet l’indexation, la recherche et l’analyse textuelles, une étude comparative entre plusieurs textes ou entre plusieurs versions du même texte, etc.
Même si, pour des raisons de coût, le texte est numérisé en mode image, la numérisation en mode texte est souvent utilisée pour les tables des matières, les sommaires et les corpus de documents iconographiques. C'est la solution choisie par Gallica, bibliothèque numérique de la BnF (Bibliothèque nationale de France).
= Le Projet Gutenberg
Projet pionnier à tous égards, le Projet Gutenberg a inspiré bien d’autres bibliothèques numériques depuis. Fondé dès 1971 par Michael Hart, alors étudiant à l’Université de l’Illinois (Etats-Unis), le Projet Gutenberg se donne pour mission de mettre gratuitement le plus grand nombre possible de textes électroniques à la disposition du plus grand nombre possible de lecteurs. A l’automne 1998, le rythme de publication est de 45 nouveaux titres par mois, avec l’aide de nombreux volontaires.
Comme expliqué par son créateur dans History and Philosophy of Project Gutenberg, le projet débute en 1971 quand le centre informatique (Materials Research Lab) de son université lui attribue un compte de 100 millions de dollars de "temps machine". Michael Hart décide de consacrer cet impressionnant crédit au stockage d’oeuvres littéraires du domaine public. Il décide aussi de stocker les textes électroniques de la manière la plus simple possible, en utilisant le format ASCII (American standard code for information interchange), afin que ces textes puissent être lus quels que soient la machine et le logiciel utilisés. Un texte au format ASCII apparaît en continu, sans paramétrage, avec des lettres capitales pour les titres et pour les termes en italique, gras et soulignés de la version d’origine. Cinquante heures environ sont nécessaires pour sélectionner, scanner, dactylographier, corriger et mettre en page une œuvre électronique. Un ouvrage de taille moyenne (par exemple un roman de Stendhal ou de Jules Verne) représente deux fichiers ASCII.
Le Projet Gutenberg propose trois grands secteurs: la littérature de divertissement (Light Literature), comme Alice au pays des merveilles, Peter Pan ou les Fables d’Esope, la littérature "sérieuse" (Heavy Literature) comme La Bible, les oeuvres de Shakespeare ou Moby Dick, et enfin la littérature de référence (Reference Literature), qui regroupe les encyclopédies et les dictionnaires, par exemple le Thesaurus de Roget.
La vocation du Projet Gutenberg est universelle. Son but est de mettre la littérature à la disposition de tout le monde, et pas seulement des étudiants, professeurs et chercheurs. Le secteur consacré à la littérature de divertissement est destiné à amener devant l’écran aussi bien un enfant d’âge pré-scolaire qu’une personne du troisième âge. Des enfants ou des grand-parents recherchent le texte électronique de Peter Pan après avoir vu le film Hook au cinéma, ou bien ils lisent Alice au pays des merveilles après avoir regardé le film à la télévision. Pratiquement tous les épisodes de Star Trek mentionnent des sources existant dans les collections du Projet Gutenberg. L’objectif est que tous les publics, qu’ils soient familiers ou non avec le livre imprimé, puissent facilement retrouver des citations entendues dans des conversations, des films, des musiques, d’autres livres, etc.
En juillet 1997, le Projet Gutenberg fête son 26e anniversaire avec la mise en ligne des Merry Adventures of Robin Hood de Howard Pyle. En septembre 1997, il fête son millième texte électronique avec la version anglaise de la Divine Comédie de Dante. Dans sa lettre d’information d’octobre 1997, Michael Hart annonce son intention de compléter la collection d’Oscar Wilde, de séparer les fichiers des oeuvres complètes de Shakespeare en fichiers individuels pour chaque oeuvre, et de mettre en ligne davantage de livres non anglophones.
Le catalogue comporte déjà quelques titres non anglophones (allemand, espagnol, français, italien et latin), mais ils ne sont pas légion. A titre anecdotique, une recherche lancée en janvier 1998 pour trouver des livres en français donne neuf titres: six romans de Stendhal (L’Abbesse de Castro, La Chartreuse de Parme, La Duchesse de Palliano, Le Rouge et le Noir, Les Cenci, Vittoria Accorambani), deux romans de Jules Verne (De la terre à la lune et Le tour du monde en 80 jours) et French Cave Paintings (titre anglais et texte français), un ouvrage sur les peintures préhistoriques. A part ce dernier titre, mis en ligne en 1995, tous ces livres sont intégrés à la bibliothèque début 1997. Si aucun titre de Stendhal n'est disponible en anglais, il existe trois oeuvres de Jules Verne en langue anglaise : From the Earth to the Moon (mis en ligne en septembre 1993), Around the World in 80 Days (mis en ligne en janvier 1994) et 20,000 Leagues Under the Sea (mis en ligne en septembre 1994). En septembre 1998, la même requête donne deux titres supplémentaires, Cyrano de Bergerac, d’Edmond Rostand (mis en ligne en mars 1998), et La Révolution française, de Thomas Carlyle (mis en ligne en mai 1998).
Interviewé en août 1998, Michael Hart précise: "Nous considérons le texte électronique comme un nouveau médium, sans véritable relation avec le papier. Le seul point commun est que nous diffusons les mêmes oeuvres, mais je ne vois pas comment le papier peut concurrencer le texte électronique une fois que les gens y sont habitués, particulièrement dans les établissements d’enseignement. (…) Mon projet est de mettre 10.000 textes électroniques sur l'internet. Si je pouvais avoir des subventions importantes, j’aimerais aller jusqu’à un million et étendre aussi le nombre de nos usagers potentiels de 1,x% à 10% de la population mondiale, ce qui représenterait la diffusion de 1.000 fois un milliard de textes électroniques au lieu d'un milliard seulement." Michael Hart se définit lui-même comme un fou de travail dédiant toute sa vie à son projet, qu’il voit comme étant à l’origine d’une révolution néo-industrielle. (En avril 2002, le Projet Gutenberg fête son 5.000e texte. En octobre 2003, le catalogue comprend 10.000 oeuvres dans plusieurs langues. Michael Hart espère franchir la barre du million de livres d'ici 2015.)
7.2. Bibliothèques numériques francophones
= ABU: la bibliothèque universelle
Fondée en avril 1993 par l’Association des bibliophiles universels (ABU) dans la lignée du Projet Gutenberg, l’ABU: la bibliothèque universelle est hébergée par le Centre d’études et de recherche informatique (CEDRIC) du Conservatoire des arts et métiers (CNAM) de Paris. Elle est la première bibliothèque numérique francophone du réseau. Fin 1998, ses collections comprennent 223 textes et 76 auteurs.
Ce nom "ABU" est aussi une référence à Aboulafia, petit ordinateur présent dans Le pendule de Foucault, un roman d’Umberto Ecco dans lequel "s’entremêlent savoirs anciens et high tech", et dont l’intrigue se situe justement au CNAM. Quant au nom de l’association, "au départ, il s'agissait de biblioFiles universels, et non de biblioPHiles, mais la préfecture de Paris n'a pas semblé saisir tout le sel de ce néologisme", explique l'ABU sur son site.
Dans sa foire aux questions, l’association donne les neuf conseils suivants aux volontaires souhaitant scanner ou saisir des textes: 1) pas de mise en page, mais un texte en continu avec des lignes d’environ 70 caractères et des sauts de ligne; 2) des sauts de ligne avant chaque paragraphe, y compris pour les dialogues; 3) la transcription du tiret long accompagnant les dialogues par deux petits tirets; 4) des majuscules pour les titres, noms de chapitres et sections, avec un soulignement fait de petits tirets; 5) la transcription des mots en italique par des blancs soulignés; 6) pas de tabulation, mais des blancs; 7) les notes de l’auteur mises entre crochets dans le corps du texte; 8) la pagination de l’édition originale entre crochets (facultatif); 9) l’encodage final en ISO-Latin-1, à savoir en code ASCII (American standard code for information interchange) étendu.
= Athena
Créée en 1994 et hébergée sur le site de l’Université de Genève (Suisse), Athena est l’oeuvre de Pierre Perroud, qui y consacre trente heures par semaine, en plus de son activité de professeur au collège Voltaire (Genève). Pierre-Louis Chantre, journaliste, raconte dans L’Hebdo n°7 du 13 février 1997: "Il numérise des livres, met en page des textes que des correspondants inconnus lui envoient, crée des liens électroniques avec des livres disponibles ailleurs, tout en essayant de répondre le mieux possible aux centaines de lettres électroniques qu'il reçoit (mille personnes consultent Athena chaque jour). Un travail artisanal qu'il accomplit seul, sans grande rémunération. Malgré des demandes répétées, le Département de l'instruction publique de Genève ne lui paie que deux heures par semaine."
En 1997, le site, bilingue français-anglais, donne accès à 3.500 textes électroniques dans des domaines aussi variés que la philosophie, les sciences, la période classique, la littérature, l’histoire, l’économie, etc. En décembre 1998, ces collections se montent à 8.000 textes. Un des objectifs d’Athena est de mettre en ligne des textes français. Une section spécifique regroupe les auteurs et textes suisses (Swiss authors and texts). Athena propose aussi un choix de liens vers d'autres bibliothèques numériques (Athena literature resources), ainsi qu’une table de minéralogie qui est l’oeuvre de Pierre Perroud et qui est consultée dans le monde entier.
Dans un article publié en février 1997 dans la revue Informatique-Informations, Pierre Perroud insiste sur la complémentarité du texte électronique et du livre imprimé. A son avis, "les textes électroniques représentent un encouragement à la lecture et une participation conviviale à la diffusion de la culture", notamment pour l’étude et la recherche textuelles. Ces textes "sont un bon complément du livre imprimé - celui-ci restant irremplaçable lorsqu'il s'agit de lire". S’il est persuadé de l’utilité du texte électronique, le livre imprimé reste "un compagnon mystérieusement sacré vers lequel convergent de profonds symboles: on le serre dans la main, on le porte contre soi, on le regarde avec admiration; sa petitesse nous rassure autant que son contenu nous impressionne; sa fragilité renferme une densité qui nous fascine; comme l'homme il craint l'eau et le feu, mais il a le pouvoir de mettre la pensée de celui-là à l'abri du Temps."
= Gallica
Secteur numérique de la Bibliothèque nationale de France (BnF), Gallica est inauguré en 1997 avec des images et textes du 19e siècle francophone, "siècle de l'édition et de la presse moderne, siècle du roman mais aussi des grandes synthèses historiques et philosophiques, siècle scientifique et technique". Ce serveur expérimental comprend 2.500 livres numérisés en mode image complétés par les 250 volumes saisis en mode texte de la base Frantext de l’INaLF (Institut national de la langue française). Classées par discipline, ces ressources sont complétées par une chronologie du 19e siècle et des synthèses sur les grands courants en histoire, sciences politiques, droit, économie, littérature, philosophie, sciences et histoire des sciences. Le site propose aussi un échantillon de la future iconothèque numérique, à savoir le fonds du photographe Eugène Atget, une sélection de documents sur l’écrivain Pierre Loti, une collection d’images de l'Ecole nationale des ponts et chaussées (sur les grands travaux ayant accompagné la révolution industrielle en France), et enfin un choix de livres illustrés de la bibliothèque du Musée de l'homme.
Fin 1997, Gallica se considère moins comme une banque de données numérisées que comme un "laboratoire dont l'objet est d'évaluer les conditions d'accès et de consultation à distance des documents numériques". Le but est d’expérimenter la navigation dans ces collections, pour que celle-ci permette à la fois le libre parcours du chercheur ou du curieux et des recherches textuelles très pointues.
Début 1998, Gallica annonce 100.000 volumes et 300.000 images disponibles à la fin de 1999, avec accroissement rapide des collections ensuite. Ces collections numériques pourront également être consultées sur place au moyen de 3.000 postes multimédias (dont quelques centaines fonctionnent déjà à cette date). Sur les 100.000 volumes prévus, qui représentent 30 millions de pages numérisées, plus du tiers concerne le 19e siècle. Quant aux 300.000 images fixes, la moitié appartient aux départements spécialisés de la BnF (Estampes et photographie, Manuscrits, Arts du spectacle, Monnaies et médailles, etc.). L'autre moitié provient de collections d'établissements publics (musées et bibliothèques, la Documentation française, l'Ecole nationale des ponts et chaussées, l'Institut Pasteur, l'Observatoire de Paris, etc.) ou privés (agences de presse dont Magnum, l'Agence France-Presse, Sygma, Rapho, associations, etc.).
En mai 1998, la Bibliothèque nationale de France modifie quelque peu ses orientations premières. Jérôme Strazzulla, journaliste, écrit dans Le Figaro du 3 juin 1998 que la BnF est "passée d'une espérance universaliste, encyclopédique, à la nécessité de choix éditoriaux pointus". Interviewé à cette occasion, Jean-Pierre Angremy, président de la BnF, rapporte la décision du comité éditorial de Gallica: "Nous avons décidé d’abandonner l’idée d’un vaste corpus encyclopédique de cent mille livres, auquel on pourrait sans cesse reprocher des trous. Nous nous orientons aujourd’hui vers des corpus thématiques, aussi complets que possibles, mais plus restreints. (…) Nous cherchons à répondre, en priorité, aux demandes des chercheurs et des lecteurs."
Le premier corpus aura trait aux voyages en France, avec une mise en ligne prévue en 2000. Il rassemblera des textes, estampes et photographies du 16e siècle à 1920. Les corpus envisagés ensuite sont: Paris, les voyages en Afrique des origines à 1920, les utopies, et les mémoires des Académies des sciences de province. (En 2003, Gallica propose tous les documents libres de droits du fonds numérisé de la BnF, à savoir 70.000 ouvrages et 80.000 images du Moyen-Age au début du 20e siècle.)
= La Bibliothèque électronique de Lisieux
Créée en juin 1996 par Olivier Bogros, directeur de la Bibliothèque municipale de Lisieux (Normandie), la Bibliothèque électronique de Lisieux suscite un réel intérêt dans le monde francophone parce qu’elle montre ce qui est faisable avec beaucoup de détermination et des moyens limités. Le site propose chaque mois la version intégrale d’une oeuvre littéraire du domaine public. S'y ajoutent les archives des mois précédents, une sélection d’œuvres courtes du 19e siècle, une sélection du fonds documentaire de la bibliothèque (opuscules, brochures, tirés à part), une sélection de son fonds normand (brochures et bibliographies), et enfin un choix de sites normands et de sites littéraires francophones.
La sélection mensuelle de janvier 1998 est: Les Déliquescences, poèmes décadents d'Adoré Floupette (1885), une oeuvre d’Henri Beauclair et Gabriel Vicaire. Les mois précédents voient passer des oeuvres de Théophile Gautier, Vivant Denon, Jean Lorrain, Charles Nodier, Ernest Lavisse, Jean Revel, Charles Rabou, Claire de Duras, Xavier Forneret, Ernest Renan, Joris-Karl Huysmans, Philarète Chasles, Emile Gaboriau, Georges Eekhoud, Prosper Mérimée, Stendhal, Denis Diderot, Gaston Leroux, Marc de Montifaud, etc.
Le rayon littéraire présente une collection de pages consacrées principalement aux auteurs du 19e siècle: des nouvelles de Jean Lorrain, Guy de Maupassant, Alphonse Allais, Octave Mirbeau, Rémy de Gourmont, Jules Barbey d'Aurevilly, Isabelle Eberhardt, Charles Asselineau, Marcel Schwob, Jean Richepin, Eugène Mouton, Jean de La Ville de Mirmont, Léon Bloy, des lettres de Gustave Flaubert, ainsi que des bibliographies et des travaux du lycée Marcel Gambier de Lisieux.
En juin 1998, deux ans après sa mise en ligne, Olivier Bogros relate les débuts de la bibliothèque électronique: "Le site a été ouvert en juin 1996. Hébergé sur les pages personnelles, limitées à 5 Mo (méga-octets), de mon compte CompuServe, il est depuis quelques jours installé sur un nouveau serveur où il dispose d'un espace disque plus important (15 Mo) et surtout d'un nom de domaine. Les frais inhérents à l'entretien du site sont à ma charge, la ville finance de manière indirecte le site en acceptant que tous les textes soient choisis, saisis et relus par du personnel municipal sur le temps de travail (ma secrétaire pour la saisie et une collègue pour la relecture). Ce statut étrange et original fait de la Bibliothèque électronique de Lisieux le site presque officiel de la Bibliothèque municipale, tout en restant sous mon entière responsabilité, sans contrôle ni contrainte.
J'ai déjà rapporté dans un article paru dans le Bulletin des bibliothèques de France (1997, n° 3, ndlr) ainsi que dans le Bulletin de l'ABF (Association des bibliothécaires français) (n° 174, 1997, ndlr), comment l'envie de créer une bibliothèque virtuelle avait rapidement fait son chemin depuis ma découverte de l'informatique en 1994: création d'un bulletin électronique d'informations bibliographiques locales (Les Affiches de Lisieux) en 1994 dont la diffusion locale ne rencontre qu'un très faible écho, puis en 1995 début de la numérisation de nos collections de cartes postales en vue de constituer une photothèque numérique, saisie de nouvelles d'auteurs d'origine normande courant 1995 en imitation (modeste) du projet de l'ABU (Association des bibliophiles universels) avec diffusion sur un BBS (bulletin board service) spécialisé.
L'idée du site internet vient d'Hervé Le Crosnier, enseignant à l'Université de Caen et modérateur de la liste de diffusion Biblio-fr, qui monta sur le serveur de l'université la maquette d'un site possible pour la Bibliothèque municipale de Lisieux, afin que je puisse en faire la démonstration à mes élus. La suite logique en a été le vote au budget primitif de 1996 d'un crédit pour l'ouverture d'une petite salle multimédia avec accès public au réseau pour les Lexoviens (habitants de Lisieux, ndlr). Depuis cette date un crédit d'entretien pour la mise à niveau des matériels informatiques est alloué au budget de la bibliothèque qui permettra cette année la montée en puissance des machines, l'achat d'un graveur de cédéroms et la mise à disposition d'une machine bureautique pour les lecteurs de l'établissement…. ainsi que la création en ce début d'année d'un emploi jeune pour le développement des nouvelles technologies."