Chapter 3

= How do you see the future?

Ultimately all course materials, including lecture notes, exercises, moot and credit testing, grading, and interactive exercises far more effective in conveying concepts that we have not even dreamed of yet. The Web will be an encyclopedia of the world by the world for the world. There will be no information or knowledge that anyone needs that will not be available. The major hindrance to international and interpersonal understanding, personal and institutional enhancement, will be removed. It would take a wilder imagination than mine to predict the effect of this development on the nature of humankind.

*Interview of January 17, 2000

= Can you tell us about yourDictionary.com?

A Web of Online Dictionaries (WOD) is now a part of yourDictionary.com (as of February 15, 2000). The new website is an index of 1200+ dictionaries in more than 200 languages. Besides the WOD, the new website includes a word-of-the-day-feature, word games, a language chat room, the old Web of On-line Grammars (now expanded to include additional language resources), the Web of Linguistic Fun, multilingual dictionaries; specialized English dictionaries; thesauri and other vocabulary aids; language identifiers and guessers, and other features; dictionary indices. YourDictionary.com will hopefully be the premiere language portal and the largest language resource site on the Web. It is now actively acquiring dictionaries and grammars of all languages with a particular focus on endangered languages. It is overseen by a blue ribbon panel of linguistic experts from all over the world.

= What exactly is your activity?

I am now a founder, officer and member of the board of yourDictionary.com, Inc. and will be retiring from Bucknell this spring at which time I must remove my sites from Bucknell's servers. I think the company will generate resources to allow my work to continue and expand.

= Has yourDictionary.com new projects and new ideas?

Indeed, yourDictionary.com has lots of new ideas. We plan to work with the Endangered Language Fund in the US and Britain to raise money for the Foundation's work and publish the results on our site. We will have language chatrooms and bulletin boards. There will be language games designed to entertain and teach fundamentals of linguistics. The Linguistic Fun page will become an on-line journal for short, interesting, yes, even entertaining, pieces on language that are based on sound linguistics by experts from all over the world.

= What do you think of the debate about copyright on the Web?

Open access is never free; someone pays the salaries of those who develop open access, public domain applications. My website has been free and free of commercial activities so long as Bucknell has provided me with a salary and free ISP services. Now that I am retiring and must remove my sites from Bucknell servers, my choices are to take the sites down, sell them, or generate revenue streams that will support the site. I have chosen the latter course. The resources will remain free of charge, only because we will be offering other services for fee. These services will be based on copyrighted properties to guarantee that the funds generated go to the source that generates them.

As for the debate (and court actions) over deep linking and the like, I think this carries copyright too far. Linking should be the decision of the website that carries the hyperlink. Websites are fair game for linking since they are on a public network. If they don't want to be on a public network, let them create a private one. This leads to the conclusion that porn sites may link to family-oriented sites, a conclusion that no doubt worries some. So long as the link does not go in the other direction, however, I see no immediate problem with this.

= How do you see the growth of a multilingual Web?

While English still dominates the Web, the growth of monolingual non-English websites is gaining strength with the various solutions to the font problems. Languages that are endangered are primarily languages without writing systems at all (only 1/3 of the world's 6,000+ languages have writing systems). I still do not see the Web contributing to the loss of language identity and still suspect it may, in the long run, contribute to strengthening it. More and more Native Americans, for example, are contacting linguists, asking them to write grammars of their language and help them put up dictionaries. For these people, the Web is an affordable boon for cultural expression.

= What is your best experience with the Internet?

My own website, whose popularity continues to astound me. I receive a dozen or so letters from visitors each day, at least half of which compliment my work. It is difficult to maintain the size of my ego but the flattery is very good for the soul. I am astounded that only 6 years away from the inception of the Web, I can find over 1200 creditable on-line dictionaries in more than 200 different languages.

= And your worst experience?

The worst experience is finding my website copied with my name removed from it.I have always been able to resolve the problem, however. My experience with theInternet has been very positive and if yourDictionary.com succeeds, it will beeven more positive.

[FR] Robert Beard (Pennsylvanie)

#Co-fondateur de yourDictionary.com, portail de référence pour les langues

Créé par Robert Beard en 1999, dans le prolongement de son ancien site "A Web of Online Dictionaries", intégré à celui-ci le 15 février 2000. Ce portail majeur est consacré aux dictionnaires - 1.500 dictionnaires dans 230 langues - et aux langues en général (vocabulaires, grammaires, apprentissage des langues, etc.). En tant que portail de toutes les langues sans exception, il accorde une importance particulière aux langues minoritaires et menacées.

[Entretien 01/08/1998 // Entretien 17/01/2000]

*Entretien du 1er septembre 1998 (entretien original en anglais)

= Quel est l'apport de l'internet dans votre vie professionnelle?

En tant que professeur de langues, je pense que le web présente une pléthore de nouvelles ressources disponibles dans la langue étudiée, de nouveaux instruments d'apprentissage (exercices interactifs Java et Shockwave) et de test, qui sont à la disposition des étudiants quand ceux-ci en ont le temps ou l'envie, 24 heures / 24 et 7 jours / 7. Aussi bien pour mes collègues que pour moi, et bien sûr pour notre établissement, l'internet nous permet aussi de publier pratiquement sans limitation.

= Comment voyez-vous l'expansion du multilinguisme sur le web?

On a d'abord craint que le web représente un danger pour le multilinguisme, étant donné que le langage HTML et d'autres langages de programmation sont basés sur l'anglais et qu'on trouve tout simplement plus de sites web en anglais que dans toute autre langue. Cependant, les sites web que je gère montrent que le multilinguisme est très présent et que le web peut en fait permettre de préserver des langues menacées de disparition. Je propose maintenant des liens vers des dictionnaires dans 150 langues différentes et des grammaires dans 65 langues différentes. De plus, comme ceux qui développent les navigateurs manifestent une attention nouvelle pour la diversité des langues dans le monde, ceci va encourager la présence de davantage encore de sites web dans différentes langues.

= Comment voyez-vous l'avenir?

L'internet nous offrira tout le matériel pédagogique dont nous pouvons rêver, y compris des notes de lecture, exercices, tests, évaluations et exercices interactifs plus efficaces que par le passé parce que reposant davantage sur la notion de communication. Le web sera une encyclopédie du monde faite par le monde pour le monde. Il n'y aura plus d'informations ni de connaissances utiles qui ne soient pas diponibles, si bien que l'obstacle principal à la compréhension internationale et interpersonnelle et au développement personnel et institutionnel sera levé. Il faudrait une imagination plus débordante que la mienne pour prédire l'effet de ces développements sur l'humanité.

*Entretien du 17 janvier 2000 (entretien original en anglais)

= En quoi consiste exactement yourDictionary.com?

"A Web of Online Dictionaries" (WOD) est maintenant intégré à yourDictionary.com. Le nouveau site indexe 1.200 dictionnaires dans 200 langues différentes. Outre le WOD, il comprend: le mot du jour, des jeux de mots, un groupe de discussion sur les langues, des grammaires en ligne (incluant des grammaires dans de nouvelles langues), des éléments de base sur la linguistique, des dictionnaires multilingues, des dictionnaires spécialisés de langue anglaise, des thésaurus et outils de vocabulaire, des outils permettant d'identifier des langues, des index de dictionnaires, etc.

YourDictionary.com a pour objectif d'être le premier portail et la principale ressource en langues sur le web. Nous sommes en train de rassembler des dictionnaires et grammaires dans toutes les langues, avec un souci particulier pour les langues menacées. Le site est supervisé par un comité d'experts linguistiques du monde entier.

= Quelle est exactement votre activité?

Je suis le fondateur et le gérant du site, et je suis membre du conseil d'administration de la société yourDictionary.com, Inc. Professeur à l'Université de Bucknell, je prends ma retraite au printemps, date à laquelle je dois retirer mes sites des serveurs de l'université. Je pense que la société yourDictionary.com générera les ressources me permettant de continuer mon travail.

= Quoi de neuf depuis notre premier entretien?

Nos nouvelles idées sont nombreuses. Nous projetons de travailler avec le Endangered Language Fund aux Etats-Unis et en Grande-Bretagne pour rassembler des fonds pour cette fondation et nous publierons les résultats sur notre site. Nous aurons des groupes de discussion et des bulletins d'information sur les langues. Il y aura des jeux de langue destinés à se distraire et à apprendre les bases de la linguistique. La page "Linguistic Fun" (éléments de base sur la linguistique) deviendra un journal en ligne avec des extraits courts, intéressants et même amusants dans différentes langues, choisis par des experts du monde entier.

= Que pensez-vous des débats liés au respect du droit d'auteur sur le web?

L'accès libre n'est jamais gratuit, puisque ce sont des personnes salariées qui développent les applications en accès libre appartenant au domaine public. Mon site web est gratuit, et il n'était pas une affaire commerciale tant que l'Université de Bucknell m'a versé un salaire et m'a fait bénéficier de ses propres services d'accès à l'internet. Maintenant que je prends ma retraite et que je dois retirer mes sites des serveurs de Bucknell, j'ai eu le choix entre supprimer mes sites, les vendre ou générer des revenus permettant de continuer cette activité. J'ai choisi la dernière solution. Les ressources disponibles resteront gratuites parce que nous offrirons d'autres services qui seront payants. Ces services seront basés sur les règles du copyright pour garantir le versement des fonds à la bonne source.

En ce qui concerne le débat (et les actions judiciaires) sur les liens, je pense qu'il y a excès dans l'application du copyright. Un lien vers un autre site devrait appartenir au site qui crée le lien. Il est normal de créer des liens vers d'autres sites web appartenant à un réseau public. Si des sites ne souhaitent pas être sur un réseau public, ils peuvent créer un réseau privé. Ceci mène à la conclusion que les sites pornographiques peuvent proposer des liens vers d'autres sites du même type, conclusion qui peut en inquiéter certains. Je ne vois toutefois pas de problème immédiat à cela dans la mesure où les liens ne sortent pas de ce cadre.

= Comment voyez-vous l'évolution vers un internet multilingue?

Si l'anglais domine encore le web, on voit s'accentuer le développement de sites monolingues et non anglophones du fait des solutions variées apportées aux problèmes de caractères. Les langues menacées sont essentiellement des langues non écrites (un tiers seulement des 6.000 langues existant dans le monde sont à la fois écrites et parlées). Je ne pense pourtant pas que le web va contribuer à la perte de l'identité des langues et j'ai même le sentiment que, à long terme, il va renforcer cette identité. Par exemple, de plus en plus d'Indiens d'Amérique contactent des linguistes pour leur demander d'écrire la grammaire de leur langue et de les aider à élaborer des dictionnaires. Pour eux, le web est un instrument à la fois accessible et très précieux d'expression culturelle.

= Quel est votre meilleur souvenir lié à l'internet?

Mon propre site web, dont la popularité continue de me stupéfier. Je reçois quotidiennement une douzaine de lettres de visiteurs, dont la moitié au moins me félicite pour mon travail. Je ne veux pas tomber dans une autosatisfaction démesurée, mais ces compliments me font très plaisir. Je suis également stupéfait du fait que, six ans seulement après les débuts du web, je puisse dénombrer plus de 1.200 dictionnaires en ligne qui soient dignes d'intérêt, dans plus de 200 langues différentes.

= Et votre pire souvenir?

Mon pire souvenir a été de voir mon site web copié sans mention de mon nom. Mais j'ai toujours pu résoudre ce problème. En général, mes souvenirs liés à l'internet sont positifs et ils le seront plus encore si yourDictionary.com a du succès.

[EN] Michael Behrens (Bielefeld, Germany)

#In charge of the digital library of the digital library of the BielefeldUniversity Library

* Interview of September 25, 1998

= When did you begin your digital library?

It depends what you understand this term to mean. To some here, "digital library" seems to be everything even remotely to do with the Internet. The library started its own web server in summer 1995. There's no exact date because it took some time for us to get it to work in a reasonably reliable way. Before that, it had been offering most of its services via Telnet, which wasn't used much by customers, although in theory they could have accessed a lot of material from home. But in those days hardly anybody had Internet access at home. We started digitizing rare prints from our own library, and some that were sent in via library loan, in November 1996.

= How many digitized texts do you have?

In that first phase of our attempts at digitization, starting in November 1996 and ending in June 1997, 38 rare prints were scanned as image files and made available on the Web. In the same period, there were also a few digital materials prepared as accompanying material for lectures held at the university (image files as excerpts from printed works). These are, for copyright reasons, not available outside the campus. The next step, which is just being completed, is the digitization of the Berlinische Monatsschrift, a German periodical from the Enlightenment, comprising 58 volumes — 2,574 articles on 30,626 pages.

A rather bigger project to digitize German periodicals from the 18th and early 19th century is planned. This will involve about a million pages. These periodicals will be not just be from this library's stock, but the project would be coordinated here and some of the technical work done here too.

[FR] Michael Behrens (Bielefeld, Allemagne)

#Responsable de la bibliothèque numérique de la Bibliothèque universitaire deBielefeld

*Entretien du 25 septembre 1998 (entretien original en anglais)

= Quand votre bibliothèque numérique a-t-elle débuté?

Tout dépend de ce qu'on entend par ce terme. Pour certains de mes collègues, "bibliothèque numérique" signifie tout ce qui, de près ou de loin, a trait à l'internet. La bibliothèque a inauguré son propre serveur durant l'été 1995. Je ne peux pas vous donner de date précise parce qu'il nous a fallu du temps pour que tout fonctionne de manière satisfaisante. Auparavant, la plupart des services était accessible par le biais de Telnet, qui n'était pas beaucoup utilisé par nos clients, malgré le fait qu'ils y aient accès à domicile. A cette époque, pratiquement personne n'avait d'accès internet chez soi… C'est en novembre 1996 que nous avons commencé à numériser des livres rares provenant de notre bibliothèque ou du prêt inter-bibliothèques.

= Combien d'oeuvres numérisées avez-vous?

Au cours de la première phase de nos essais - entre novembre 1996 et juin 1997 - 38 imprimés rares ont été numérisés en mode image pour consultation sur le web. Au même moment, on a préparé aussi quelques documents numériques pour accompagner des cours de l'université (des extraits de documents imprimés numérisés en mode image). Pour des raisons liées au droit d'auteur, ces documents ne sont pas disponibles hors du campus. L'étape suivante - que nous venons de terminer - est la numérisation du Berlinische Monatsschrift (Revue mensuelle de Berlin), un périodique allemand datant du Siècle des lumières, qui représente 58 volumes, 2.574 articles et 30.626 pages. On prévoit maintenant une numérisation à plus grande échelle de périodiques allemands des 18e et 19e siècles, ce qui correspond à environ un million de pages. Ces périodiques ne seraient pas seulement ceux de la bibliothèque, mais le projet serait coordonné ici, et une partie de la réalisation technique serait également effectuée sur place.

[FR] Michel Benoît (Montréal)

#Ecrivain, utilise l'internet comme outil de recherche, de communication et d'ouverture au monde

Michel Benoît écrit des nouvelles (polars, récits noirs, histoires fantastiques). C'est un passionné de la vie, avec toutes ses contradictions. Professeur de maths et de sciences, il aime - et pas nécessairement dans le bon ordre - la course de Formule 1, la lecture, ses enfants, l'informatique, la pêche, Rimbaud, la chasse, le jazz, et la nature sous toutes ses formes.

*Entretien du 29 juin 2000

= Pensez-vous créer un jour un site web?

Je ne sais pas si je créerai un jour un site web. Je pense que non. Tout comme je sais que je ne ferai jamais de sculpture ou ne composerai jamais de symphonie. Pour moi, la construction d'un site web est un art du type "arts appliqués". Il y a des millions de sites qui sont créés en ce moment. La très grande majorité prendra éventuellement le chemin de la poubelle de l'histoire. Il est facile d'imaginer un web complètement saturé, et ça me devrait pas tarder. Les fournisseurs pourraient décréter que tout site qui ne reçoit pas plus de (xx) visites par mois soit éliminé. Un peu comme toutes ces oeuvres d'art (???) des siècles passés qui ont disparu du paysage culturel, et on ne peut pas dire que ça a vraiment changé le cours de l'histoire humaine. Donc laissons aux futurs Rembrandt du clavier le soin de charmer nos yeux. Personnellement, je me garderai de m'en mêler.

= Que représente l'internet pour vous?

J'écris. Donc naturellement l'internet s'est imposé à moi comme outil de recherche et de communication, essentiellement. Non, pas essentiellement. Ouverture sur le monde aussi. Si l'on pense: recherche, on pense: information. Voyez-vous, si l'on pense: écriture, réflexion, on pense: connaissance, recherche. Donc on va sur la toile pour tout, pour une idée, une image, une explication. Un discours prononcé il y a vingt ans, une peinture exposée dans un musée à l'autre bout du monde. On peut donner une idée à quelqu'un qu'on n'a jamais vu, et en recevoir de même.

La toile, c'est le monde au clic de la souris. On pourrait penser que c'est un beau cliché. Peut-être bien, à moins de prendre conscience de toutes les implications de la chose. L'instantanéité, l'information tout de suite, maintenant. Plus besoin de fouiller, de se taper des heures de recherche. On est en train de faire, de produire. On a besoin d'une information. On va la chercher, immédiatement. De plus, on a accès aux plus grandes bibliothèques, aux plus importants journaux, aux musées les plus prestigieux. On pense à une toile d'un grand peintre, un instant plus tard, on l'a devant les yeux, on peut l'imprimer pour l'étudier plus en détail. Il y a une guerre quelque part dans le monde, un instant plus tard, on lit les communiqués de propagande d'un côté et de l'autre. La toile, le web, est en train de donner son vrai sens au village global, Gaïa, la terre-mère.

= Comment voyez-vous l'avenir?

En ce moment, juin 2000, il est extrêmement difficile de faire quelque prédiction que ce soit sur le futur d'internet. Toute prospective le moindrement pointue, techniquement par exemple, sur l'évolution du net sera certainement farfelue dans un futur plus ou moins rapproché. On peut y aller d'idées, encore que ça doit être très général. Pas par crainte d'être ridicule, le ridicule ne tue pas, c'est connu. Non, par souci d'honnêteté, tout simplement.

Mon avenir professionnel en inter-relation avec le net, je le vois exploser. Plus rapide, plus complet, plus productif. Je me vois faire en une semaine ce qui m'aurait pris des mois. Plus beau, plus esthétique. Je me vois réussir des travaux plus raffinés, d'une facture plus professionnelle, même et surtout dans des domaines connexes à mon travail, comme la typographie, où je n'ai aucune compétence. La présentation, le transport de textes, par exemple. Le travail simultané de plusieurs personnes qui seront sur des continents différents. Arriver à un consensus en quelques heures sur un projet, alors qu'avant le net, il aurait fallu plusieurs semaines, parlons de mois entre les francophones. Plus le net ira se complexifiant, plus l'utilisation du net deviendra profitable, nécessaire, essentielle.

Parenthèse: est-il si farfelu de penser que les historiens des années 2100 considéreront l'avènement du net comme un événement aussi, sinon plus, important que la révolution industrielle? Le feu, l'agriculture, la révolution industrielle, le net. On en est rendu à la "révolution continue de l'Evolution".

Ça me fait penser à ce merveilleux texte Desiderata, découvert dans l'église Saint-Paul à Baltimore en 1693, je pense. J'en cite de mémoire une phrase qui me hante: "Que vous le compreniez ou non, que vous le vouliez ou non (c'est peut-être de moi), l'univers évolue comme il se doit." J'y crois. Je crois sincèrement qu'au travers l'incroyable désordre de l'Evolution, il n'y a rien qui soit soumis au hasard. "Dieu n'a pas créé un monde soumis au hasard", disait Einstein à Bohr lors d'une de leurs homériques prises de bec.

= Que pensez-vous des débats liés au respect du droit d'auteur sur le web?

Beau noeud de vipères, cette affaire. Non pas les débats sur la reproduction par le net, mais la reproduction elle-même. La musique, le cinéma, la littérature, tout va y passer. Peut-être suis-je trop optimiste, mais je crois que ce qui est un problème aujourd'hui trouvera sa solution demain. Lors de l'avènement de la photocopie, on s'est posé les mêmes questions. C'est évident qu'il y a eu des abus. Beaucoup d'auteurs ont été joyeusement floués par des enseignants à la moralité douteuse qui photocopiaient, sans vergogne, des textes protégés par des droits d'auteur. Les choses se replacent et plusieurs pays ont voté des lois sévères à ce sujet. Idem pour la reproduction électronique, soit d'oeuvres musicales ou visuelles, on ne peut plus faire n'importe quoi sans qu'il en coûte. Je pense qu'il en sera de même pour les documents informatiques, programmes, textes, utilitaires ou autres. Les CD, jeux, musique ou vidéos seront incopiables parce qu'ils auront des programmes autodestructeurs insérés dans leurs trames numériques. Science-fiction? La science-fiction d'aujourd'hui est la réalité de demain, demandez à vos grands-mères.

= Comment voyez-vous l'évolution vers un internet multilingue?

Lorsqu'un problème affecte une structure, quelle qu'elle soit, j'ai toujours tendance à imaginer que c'est techniquement que le problème trouve sa solution. Vous connaissez cette théorie? Si les Romains avaient trouvé le moyen d'enlever le plomb de leur couvert d'étain, Néron ne serait jamais devenu fou et n'aurait jamais incendié Rome. Escusi, farfelu? Peut-être que oui, peut-être que non. E que save? L'internet multilingue? Demain, ou après demain au plus. Voyons, pensez au premier ordinateur, il y a de cela un peu plus que cinquante ans. Un étage au complet pour faire à peine plus que les quatre opérations de base. Dans ce temps-là, un bug, c'était véritablement une mouche - ou autre insecte - qui s'insérait entre les lecteurs optiques. De nos jours (2000), un carte de 3 cm x 5 cm fait la même chose. La traduction instantanée: demain, après-demain au plus.

= Quel est votre meilleur souvenir lié à l'internet?

Les mails que j'échangeais avec les gens de B-52, la radio libre et clandestine de Serbie, pendant le conflit du Kosovo. En 1978, j'ai visité cette région. Je pouvais sentir leurs souffrances, leurs anxiétés, leurs espoirs. C'est vrai que je me sentais impuissant devant le drame qui se jouait à des milliers de kilomètres de chez moi, mais, au moins, je pouvais parler, témoigner.

= Et votre pire souvenir?

Les quelques rares visites que j'ai faites sur les chats. Le vide, l'ennui qui s'y distille. L'inculture qui s'y exprime aussi. Désolant, en même temps paniquant. Quelqu'un qui écrit: "Ya man, yyyyyyeeeeeeesssssss, j't'aim 4 ever my luuuuuuvvvvvvvvvvvv" me semble incroyablement désespéré. Un jour, les travailleurs de rue, qui s'occupent actuellement des itinérants et des drogués, travailleront sur le net à récupérer cette humanité souffrante. Je pense sincèrement que, avec la porno, le chat est la poubelle du net. C'est tout ce que j'en pense, et c'est déjà trop.

= Une citation qui vous est chère?

Harlan Ellison a écrit ces mots magnifiques: "Écris. N'aie pas peur. Ne les laisse pas t'effrayer. Ils ne peuvent rien te faire. Un écrivain écrit toujours. Il est fait pour ça. Si on ne veut pas te laisser écrire ce que tu veux, si on te démolit sur le marché, alors cherche un autre marché. Fais tout ce que tu peux, mais écris. Si tu dis: 'ils me tuent', alors tu es foutu. Parce que tout ce qu'un écrivain a d'essentiel à vendre, c'est son courage. S'il n'en a pas, il est le plus minable des lâches. C'est un foireux et un hérétique, parce qu'écrire est une tâche sacrée."

GUY BERTRAND & CYNTHIA DELISLE [FR, EN]

[FR] Guy Bertrand & Cynthia Delisle (Montréal)

#Respectivement directeur scientifique et consultante au CEVEIL (Centre d'expertise et de veille inforoutes et langues)

Créé en 1995, le CEVEIL est un organisme québécois qui s'intéresse à l'utilisation et au traitement des langues sur les inforoutes dans une optique francophone, via des activités de veille et la création d'un réseau d'échanges et d'expertise. Le CEVEIL s'intéresse également aux industries de la langue en général (reconnaissance vocale, traduction automatique, reconnaissance optique de caractères, etc.) et à des domaines d'activité connexes, tels la gestion stratégique de l'information, la gestion des connaissances, la normalisation, la standardisation, etc. Le CEVEIL fait partie du CEFRIO (Centre francophone d'information des organisations).

[Entretien 23/08/1998 // Entretien 13/03/2000 // Entretien 04/06/2001]

*Entretien du 23 août 1998

= Quel est l'apport de l'internet pour votre organisme?

Mentionnons, tout d'abord, que l'existence du web constitue en soi une des raisons d'être du CEVEIL, puisque nous concentrons nos activités principalement autour de la thématique de l'utilisation et du traitement des langues sur internet.

Par ailleurs, le web est notre principal terrain de cueillette d'information sur les thématiques qui nous préoccupent. Nous procédons notamment à une fréquentation assidue des sites abordant nos thématiques de travail - plus particulièrement des sites diffusant des nouvelles quotidiennes et/ou hebdomadaires. A ce niveau, on peut affirmer sans hésitation que nous exploitons davantage internet que les diverses ressources écrites disponibles pour réaliser nos activités.

Dans un ordre d'idées un peu différent, nous utilisons abondamment le courriel pour entretenir des relations avec les intervenants du milieu et ainsi obtenir des informations et mener à bien divers projets. Le CEVEIL est une structure-réseau qui survivrait difficilement sans internet pour relier toutes les personnes impliquées.

Enfin, il convient de signaler que le web constitue également notre plus important outil pour la diffusion de nos produits aux clientèles-cibles: envoi de bulletins électroniques de nouvelles à nos abonnés, création d'un périodique électronique, diffusion d'information et de documents via notre site web, etc.

= Comment voyez-vous l'expansion du multilinguisme sur le web?

Le multilinguisme sur internet est la conséquence logique et naturelle de la diversité des populations humaines. Dans la mesure où le web a d'abord été développé et utilisé aux Etats-Unis, il n'est guère étonnant que ce médium ait commencé par être essentiellement anglophone (et le demeure actuellement). Toutefois, cette situation commence à se modifier et le mouvement ira en s'amplifiant, à la fois parce que la plupart des nouveaux usagers du réseau n'auront pas l'anglais comme langue maternelle et parce que les communautés déjà présentes sur le web accepteront de moins en moins la "dictature" de la langue anglaise et voudront exploiter internet dans leur propre langue, au moins partiellement.

On peut prévoir que l'on arrivera sans doute, d'ici quelques années, à une situation semblable à ce qui prévaut dans le monde de l'édition en ce qui concerne la répartition des différentes langues. Ceci signifie néanmoins que seul un nombre relativement restreint de langues seront représentées (comparativement aux quelques milliers d'idiomes qui existent). Dans cette optique, nous croyons que le web devrait chercher, entre autres, à favoriser un renforcement des cultures et des langues minoritaires, en particulier pour les communautés dispersées.

Enfin, l'arrivée de langues autres que l'anglais sur internet, si elle constitue un juste rééquilibre et un enrichissement indéniable, renforce évidemment le besoin d'outils de traitement linguistique aptes à gérer efficacement cette situation, d'où la nécessité de poursuivre les travaux de recherche et les activités de veille dans des secteurs comme la traduction automatique, la normalisation, le repérage de l'information, la condensation automatique (résumés), etc.

= Comment voyez-vous l'avenir?

Internet est là pour demeurer. L'apparition de langues autres que l'anglais sur ce médium constitue également un phénomène irréversible. Il sera donc nécessaire de tenir compte de ces nouvelles réalités aux points de vue économique, social, politique, culturel, etc. Des secteurs comme la publicité, la formation professionnelle, le travail en groupes et en réseaux, la gestion des connaissances devront évoluer en conséquence. Cela nous ramène, tel que nous l'avons mentionné plus haut, à la nécessité de développer des technologies et des outils vraiment performants qui faciliteront les échanges dans un Village global terriblement plurilingue…

*Entretien du 13 mars 2000

= Quoi de neuf depuis notre premier entretien?

Le CEVEIL a cessé la production de ses clips d'information hebdomadaires et de son périodique mensuel. Cette situation résulte moins d'un changement d'orientation que d'un manque de ressources humaines et financières. La reprise de ces activités, sans être impossible, n'est pas envisagée pour le moment.

= Que pensez-vous des débats liés au respect du droit d'auteur sur le web?

Guy Bertrand: Il est très important de respecter le droit des auteurs et c'est aux auteurs de décider de ce qu'ils veulent en faire. Le web accorde une place de plus en plus grande à la gratuité des usages. Les auteurs ne sont pas tenus de s'y plier, mais de plus en plus d'auteurs s'y adaptent volontairement et avec profit. Les modèles d'affaires sur le web évoluent très rapidement et n'ont pas fini de le faire. De nouveaux modèles d'affaires se développeront et la place de la gratuité y sera forte, mais les droits des auteurs devront être respectés de façon innovatrice de la part des auteurs et des fournisseurs de services et de contenus.

Cynthia Delisle: Les droits d'auteur devraient idéalement faire l'objet du même respect sur le web que dans d'autres médias, la radio ou la presse par exemple. Cela dit, internet pose à ce niveau des problèmes inédits à cause de la facilité avec laquelle on peut (re)produire et (re)distribuer l'information à grande échelle, et aussi en raison de la tradition de gratuité du réseau. Cette tradition fait, d'une part, que les gens rechignent à débourser pour des produits et services qu'ils trouveraient tout naturel de payer dans d'autres contextes et, d'autre part, qu'ils ont peut-être moins d'états d'âme, dans le contexte du net, à utiliser des produits piratés. La problématique du respect des droits d'auteur constitue, à mon sens, un des enjeux majeurs pour l'évolution du réseau, et il sera certainement très intéressant de voir les solutions qui seront mises de l'avant à cet égard.

= Comment voyez-vous l'évolution vers un internet multilingue?

Guy Bertrand: Depuis 1998, le commerce électronique international s'est beaucoup développé et les vendeurs veulent de plus en plus communiquer dans les langues préférées par les acheteurs, ce qui augmentera encore le caractère multilingue du web. Le commerce électronique ne dominera pas le web, mais son importance augmente ainsi que se marque le caractère multilingue du web. Les outils pour le multilinguisme sur le web sont, hélas!, toujours en retard.

Cynthia Delisle: Je pense que la tendance déjà amorcée en 1998 s'est confirmée depuis et que l'avenir d'internet passe irrémédiablement par le multilinguisme. Internet s'internationalise, et on voit mal comment ce phénomène pourrait se réaliser sans s'accompagner d'une diversification linguistique et culturelle du réseau. Même si l'anglais demeurera sans doute toujours la langue la plus utilisée sur internet, le pourcentage de sites et de documents offerts en d'autres langues continuera régulièrement d'augmenter, jusqu'à ce qu'un certain "équilibre" soit atteint.

Par ailleurs, je suis entièrement d'accord avec M. Bertrand lorsqu'il souligne que les outils aptes à traiter cette diversité linguistique ne sont pas encore au point. La traduction automatique, par exemple, piétine dangereusement depuis nombre d'années… Pourtant, les besoins ne cesseront de croître, d'où la nécessité de multiplier les efforts de R&D (recherche et développement) dans ces secteurs.

= Quel est votre meilleur souvenir lié à l'internet?

Guy Bertrand: Ma première expérience avec le site www.neuromedia.com.

Cynthia Delisle: Le maintien régulier et à moindre coût, grâce au courriel, du contact avec mes proches lors de séjours prolongés à l'étranger.

= Et votre pire souvenir?

Cynthia Delisle: D'avoir vécu des problèmes de harcèlement (envois répétitifs de courriels personnels non sollicités… c'était il y a plusieurs années, avant que les logiciels de messagerie ne soient équipés de fonctions de filtres!).

*Entretien du 4 juin 2001

= Quoi de neuf depuis notre dernier entretien?

Le CEVEIL termine présentement ses mandats des dernières années sur la promotion des normes pour la francisation des technologies de l'information et des communications (TIC). Actuellement, nous n'avons plus d'autres mandats à réaliser par la suite. Le site du CEVEIL affiche, en ce moment, beaucoup de nouveaux contenus (rapports, textes de vulgarisation, etc.) et demeurera en ligne pour au moins une autre année.

Ceci étant dit, et bien que le comité de direction ne soit plus fonctionnel depuis 1999, le CEVEIL demeure apte à remplir (sous la tutelle du CEFRIO) différents mandats sur la thématique des inforoutes et des langues. Nous sommes donc ouverts à toute proposition intéressante!

[EN] Guy Bertrand & Cynthia Deslisle (Montreal)

#Respectively scientific director and consultant at the CEVEIL (Centre d'expertise et de veille inforoutes et langues - Centre for Assessment and Monitoring of Information Highways and Languages)

The CEVEIL, set up in 1995, is a non-profit-making body based in Quebec whose main purpose is to think about the use and processing of languages on information highways, from a French-language viewpoint, through strategic monitoring activity and creating a network of exchanges and evaluation. The CEVEIL also focuses on the language industry in general (voice recognition, machine translation and optical character recognition, for example) and related fields such as strategic management of data, knowledge management, setting norms and standardisation. The CEVEIL is part of the CEFRIO (Centre francophone d'information des organisations - French-language Centre for Information on Organisations).

[Interview 23/08/1998 // Interview 13/03/2000]

*Interview of August 23, 1998 (original interview in French)

= What did using the Internet affect the CEVEIL?

First, the Web is one of the reasons for CEVEIL's existence, because we focus on things like language use and processing on the Internet.

The Web is also where we get most of our information on the topics we're interested in. We regularly monitor sites that supply daily and weekly news. So we definitely make more use of the Internet than we do other written sources.

We also use electronic mail a great deal to keep in touch with our contributors, to obtain information and carry out projects. CEVEIL is a "network structure" which might not survive without the Internet to link all the people involved in it.

The Web is also the most important means for distributing our products to target clients — sending electronic news to our subscribers, creating an online magazine, and distributing information and documents through our website.

= How do you see the growth of a multilingual Web?

Multilingualism on the Internet is the logical and natural consequence of the diversity of human beings. Because the Web was first developed and used in the United States, it's not really surprising it started out as — and still is — essentially Anglophone. But this is beginning to change, because most new users will not have English as their mother tongue and because non-English-speaking communities already on the Web will no longer accept the dominance of English and will want to use their own language to some extent.

We can envisage, in a few years time, a situation similar to the one in publishing concerning use of different languages. This means only a small number of languages will be used (compared to the several thousand that exist). So we think the Web should try to further support minority cultures and languages, particularly in the case of dispersed communities.

The arrival on the Internet of languages other than English, while demanding genuine readjustment and providing undeniable enrichment, emphasizes the need for linguistic tools to cope with the situation. These will emerge from research and promoting awareness in areas such as machine translation, standardization, searching for information, automatic summarizing, and so on.

= How do you see the future?

The Internet is here to stay. The arrival on it of languages other than English is also irreversible. So we have to take that into account from an economic, social, political and cultural point of view. Sectors such as advertising, vocational training, knowledge management, and work in groups or within networks will have to change. This brings us back to the need to develop really effective technology and tools to encourage exchanges in a truly multilingual global village.

*Interview of March 13, 2000 (original interview in French)

= What has happened since our first interview?

Since then, the CEVEIL has stopped putting out weekly news bulletins and its monthly magazine. This is not so much because we've changed direction but rather for want of staff and funding. We don't plan to resume those activities for the moment.

= What do you think of the debate about copyright on the Web?

Guy Bertrand: It's very important to respect copyright and it's up to the authors to decide what they want to do about it. The Web is offering more and more things for free. Authors don't have to accept that, but a growing number of them are choosing to adapt to it and are benefitting. The business models on the Web are changing very rapidly and will continue to. New ones will spring up with a strong free-of-charge content, but copyright will have to be respected in newer and more original ways by authors and providers of services and content.

Cynthia Delisle: Ideally, copyright should be respected on the Web as it is in other media such as the radio and the written press. However, the Internet raises new kinds of problems here because of the ease that data can be (re)produced and (re)distributed on a huge scale and because of the tradition of it being available for free. This tradition means people balk at paying for products and services they'd find it quite normal to pay for in other situations and they also perhaps have fewer qualms, in the context of the Net, about using pirated products. I think respecting copyright is one of the biggest issues for the future of the Net and it'll certainly be very interesting to see what solutions will emerge to deal with it.

= How do you see the growth of a multilingual Web?

Guy Bertrand: Worldwide e-commerce has grown enormously since 1998 and businesses are increasingly keen to use the languages of their potential customers, which is going to boost further this multilingual aspect. E-commerce won't take over the Web, but its importance is growing as multilingualism increases there. But the tools for multilingualism on the Web are unfortunately always one step behind.

Cynthia Delisle: I think the trend which had already begin in 1998 has now established itself and the future of the Internet is definitely going to be a multilingual one. The Net is becoming more international and it's hard to see how this can happen without it becoming linguistically and culturally more diverse. English will probably always be the Net's most frequently-used language, but the proportion of sites and pages available in other languages will steadily increase until a certain equilibrium is reached. I also quite agree with Mr Bertrand when he points out that the tools to handle this linguistic diversity are not yet ready. Machine translation, for example, has made woefully little headway in recent years. Yet the needs are growing all the time, which is why we need to step up research and development in these areas.

= What is your best experience with the Internet?

Guy Bertrand: My first one with the site www.neuromedia.com.

Cynthia Delisle: Being in regular touch with my family at little cost through e-mail while I was abroad for long periods.

= And your worst experience?

Cynthia Delisle: The problem of harrassment, such as constant unsolicited personal e-mails several years ago, before servers installed spam filters.

[FR] Olivier Bogros (Lisieux, Normandie)

#Créateur de la bibliothèque électronique de Lisieux et directeur de la bibliothèque municipale

Le site "La bibliothèque électronique de Lisieux" a été ouvert en juin 1996. D'abord hébergé sur les pages d'un compte personnel CompuServe, il est depuis juin 1998 installé sur un nouveau serveur où il dispose d'un espace disque plus important (30 Mo) et surtout d'un nom de domaine. Comme l'explique Olivier Bogros, directeur de la bibliothèque municipale de Lisieux (Normandie), "ce site est entièrement consacré et exclusivement réservé à la mise à disposition sur le réseau (librement et gratuitement) de textes littéraires et documentaires du domaine public français afin de constituer une bibliothèque virtuelle qui complète celles déjà existantes." Dès sa création, ce site pionnier suscite beaucoup d'intérêt dans la communauté francophone parce qu'il montre ce qui est faisable sur le web avec beaucoup de détermination et des moyens limités.

En 2000, la Bibliothèque électronique de Lisieux aborde une nouvelle étape. LexoTor, lancé officiellement le 27 août 2000, est le résultat d'une collaboration avec le site "Langue du 19e siècle" de l'Université de Toronto (Canada). Il s'agit d'une base de données qui fonctionne sous le logiciel TACTweb et qui permet l'interrogation en ligne des textes de la bibliothèque classés en différentes rubriques: oeuvres littéraires, notamment du 19e siècle; brochures et opuscules documentaires; manuscrits, livres et brochures sur la Normandie; conférences et exposés transcrits par des élèves du Lycée Marcel Gambier. L'interrogation permet aussi les analyses et comparaisons textuelles. L'initiative du projet revient à Russon Wooldridge, professeur au département d'études françaises de l'Université de Toronto, suite à sa rencontre avec Olivier Bogros lors du colloque international relatif aux études françaises valorisées par les nouvelles technologies d'information et de communication (12-13 mai 2000, Toronto).

[Entretien 18/06/1998 // Entretien 27/07/1999 // Entretien 17/08/2000 //Entretien 27/05/2001]

*Entretien du 18 juin 1998

= Quel est l'historique de votre site web?

J'ai déjà rapporté dans un article paru dans le Bulletin des bibliothèques de France (1997, n° 3) ainsi que dans le Bulletin de l'ABF (Association des bibliothécaires français) (1997, n° 174), comment l'envie de créer une bibliothèque virtuelle avait rapidement fait son chemin depuis ma découverte de l'informatique en 1994: création d'un bulletin électronique d'informations bibliographiques locales (Les Affiches de Lisieux) en 1994 dont la diffusion locale ne rencontre qu'un très faible écho, puis en 1995 début de la numérisation de nos collections de cartes postales en vue de constituer une photothèque numérique, saisie de nouvelles d'auteurs d'origine normande courant 1995 en imitation (modeste) du projet de l'ABU (Association des bibliophiles universels) avec diffusion sur un BBS (bulletin board service) spécialisé. L'idée du site internet vient d'Hervé Le Crosnier, enseignant à l'université de Caen et modérateur de la liste de diffusion Biblio-fr, qui monta sur le serveur de l'université la maquette d'un site possible pour la bibliothèque municipale de Lisieux, afin que je puisse en faire la démonstration à mes élus. La suite logique en a été le vote au budget primitif de 1996 d'un crédit pour l'ouverture d'une petite salle multimédia avec accès public au réseau pour les Lexoviens (habitants de Lisieux, ndlr). Depuis cette date, un crédit d'entretien pour la mise à niveau des matériels informatiques est alloué au budget de la bibliothèque qui permettra cette année la montée en puissance des machines, l'achat d'un graveur de cédéroms et la mise à disposition d'une machine bureautique pour les lecteurs de l'établissement…. ainsi que la création en ce début d'année d'un emploi jeune pour le développement des nouvelles technologies.

= Comment voyez-vous l'avenir?

Internet est un outil formidable d'échange entre professsionnels (tout ce qui passe par le courrier électronique, les listes de diffusion et les forums) mais qui est un consommateur de temps très dangereux: on a vite fait si l'on n'y prend garde de divorcer et de mettre ses enfants à la DASS (Direction de l'aide sanitaire et sociale). Plus sérieusement, c'est pour les bibliothèques la possibilité d'élargir leur public en direction de toute la francophonie. Cela passe par la mise en ligne d'un contenu qui n'est pas seulement la mise en ligne du catalogue, mais aussi et surtout la constitution de véritables bibliothèques virtuelles. Les professionnels des bibliothèques sont les acteurs d'un enjeu important concernant la place de la langue française sur le réseau.

*Entretien du 27 juillet 1999

= Quoi de neuf depuis notre premier entretien?

En fait, et pour les deux années à venir, l'essentiel de notre temps est consacré à la mise en place de la nouvelle médiathèque (avec une réelle intégration des nouvelles technologies) qui ouvrira en janvier 2001. Nous réfléchissons, toujours dans le domaine patrimonial, à un prolongement du site actuel vers les arts du livre - illustration, typographie… - toujours à partir de notre fonds. Sinon, pour ce qui est des textes, nous allons vers un élargissement de la part réservée au fonds normand. Le catalogue en ligne n'est pas une priorité.

= Comment choisissez-vous les textes de la bibliothèque électronique?

Les oeuvres à diffuser sont choisies à partir d'exemplaires conservés à la bibliothèque municipale de Lisieux ou dans des collections particulières mises à disposition. Les textes sont saisis au clavier et relus par du personnel de la bibliothèque, puis mis en ligne après encodage (370 oeuvres sont actuellement disponibles en ligne). La mise à jour est mensuelle (3 à 6 textes nouveaux). Par goût, mais aussi contraints par le mode de production, nous sélectionnons plutôt des textes courts (nouvelles, brochures, tirés à part de revues, articles de journaux…). De même nous laissons à d'autres (bibliothèques ou éditeurs) le soin de mettre en ligne les grands classiques de la littérature française, préférant consacrer le peu de temps et de moyens dont nous disposons à mettre en ligne des textes excentriques et improbables.

= Passez-vous beaucoup de temps à la maintenance du site?

La création et la maintenance du site ne sont encore que des activités marginales de la bibliothèque municipale. L'essentiel de notre activité reste l'enrichissement et la communication sur place des ressources locales (c'est-à-dire des informations physiquement localisées à la bibliothèque), le développement de la lecture dans les quartiers… La salle multimédia ouverte en octobre 1996 doit encore trouver son rythme de croisière, la consultation des cédéroms et la bureautique devançant souvent l'utilisation d'internet.

= Que pensez-vous des débats liés au respect du droit d'auteur sur le web?

Effectivement tout cela est très important et la législation doit être respectée. Mais n'accusons pas le réseau de tous les maux.

= Comment voyez-vous l'évolution vers un internet multilingue?

Que chacun s'efforce déjà de s'exprimer correctement dans sa langue.

= Quel est votre meilleur souvenir lié à l'internet?

Les courriers électroniques reçus, à propos des textes que nous mettons en ligne et qui témoignent de la vivacité de la langue française sur le réseau.

= Et votre pire souvenir?

Deux jeunes collégiennes (4e ou 3e) faisant des recherches sur la Résistance en France, à partir de la station internet de la bibliothèque, sont tombées sur un site négationniste. Elles n'ont visiblement pas compris pourquoi nous leur avons interdit toute copie papier ou disquette dudit site et avons effacé les pages à l'écran. Tout simplement les mots "révisionnisme" et "négationnisme" leur étaient totalement inconnus. Moralité: le libre accès au réseau, mais accompagné d'une médiation par le personnel de la bibliothèque. Le pire des maux: l'ignorance!

*Entretien du 17 août 2000

= Quoi de neuf depuis notre dernier entretien?

La médiathèque n'ouvrira ses portes qu'en janvier 2002 et ce chantier va encore mobiliser l'essentiel de mon temps.

Nous poursuivons modestement l'enrichissement du corpus de textes de la bibliothèque électronique.

Une collaboration vient de s'engager entre la bibliothèque électronique de Lisieux et le site "Langue du 19e siècle" à l'Université de Toronto. Les textes en ligne à Lisieux sont interrogeables en ligne à Toronto sous forme de bases de données interactives. L'initiative de ce projet, baptisé LexoTor, revient à M. Russon Wooldridge à la suite d'un colloque organisé en mai dernier par son université. Le lancement "officiel" est prévu pour le 27 de ce mois.

= Utilisez-vous encore beaucoup de documents papier?

Je ne crois pas à la mort annoncée du papier. Je l'utilise encore beaucoup sous toutes ses formes. Mais, au contraire de beaucoup, mon rapport à l'informatique n'a pas entraîné une augmentation de ma consommation de papier, bien au contraire. Je suis dans ce domaine plutôt adepte du zéro papier.

= Quelle est votre opinion sur le livre électronique?

De quoi parle-t-on? Des machines mono-tâches encombrantes et coûteuses, avec format propriétaire et offre éditoriale limitée? Les Palm, Psion et autres hand et pocket computers permettent déjà de lire ou de créer des livres électroniques et en plus servent à autre chose. Ceci dit, la notion de livre électronique m'intéresse en tant que bibliothécaire et lecteur. Va-t-il permettre de s'affranchir d'un modèle économique à bout de souffle (la chaine éditoriale n'est pas le must en la matière)?

Les machines à lire n'ont de mon point de vue de chance d'être viables que si leur utilisateur peut créer ses propres livres électroniques avec (cf. cassettes vidéo).

= Quelles sont vos suggestions pour une meilleure accessibilité du web aux aveugles et malvoyants?

Autant que possible j'essaie de rendre accessible à tous la bibliothèque électronique de Lisieux. Les recommandations du Consortium W3C ne sont pas toujours évidentes à suivre. Les sites textuels ne requièrent pas une charte graphique sophistiquée à base de Java et autres niaiseries (le summum a été atteint cette année par le site officiel du Printemps des poètes).

*Entretien du 27 mai 2001

= Quoi de neuf depuis notre dernier entretien?

La base Lexotor devrait pouvoir bénéficier dès ce mois-ci de la dernière version du logiciel TACTweb, ce qui rendra beaucoup plus riches et pertinentes les interrogations faites.

Pour ce qui concerne Lisieux, le bâtiment de la médiathèque est sorti de terre, le gros oeuvre sera fini fin juin, la livraison est prévue pour novembre. Par contre l'ouverture initialement prévue pour janvier 2002 sera sans doute effective fin mars.

Sur le site de la Bibliothèque électronique, le travail se poursuit chaque mois avec la mise en ligne de textes. J'ai suspendu provisoirement la fabrication de hiboux (e-books, ndlr) au format Microsoft Reader ou Mobipocket. Il faudrait que je trouve un partenariat avec un autre site pour que les textes disponibles en HTML sur notre bibliothèque électronique soient aussi proposés ailleurs dans un format hiboux multi-plateforme.

A titre personnel j'ai ouvert une autre bibliothèque électronique, Miscellanées, encore en devenir.

[FR] Christian Boitet (Grenoble)

#Directeur du GETA (Groupe d'étude pour la traduction automatique), qui participe à l'UNLP (Universal Networking Language Programme)

Au sein du Laboratoire CLIPS (Communication langagière et interaction personne-système) de l'IMAG (Institut d'informatique et mathématiques appliquées de Grenoble), le GETA (Groupe d'étude pour la traduction automatique), dirigé par Christian Boitet, est une équipe pluridisciplinaire formée d'informaticiens et de linguistes. Les thèmes de recherche du GETA concernent tous les aspects théoriques, méthodologiques et pratiques de la traduction assistée par ordinateur (TAO), et plus généralement de l'informatique multilingue.

*Entretien du 24 septembre 1998

= En quoi consiste l'UNLP (Universal Networking Language Programme), auquel leGETA participe?

Il s'agit non de TAO (traduction assistée par ordinateur) habituelle, mais de communication et recherche d'information multilingue. Quatorze groupes ont commencé le travail sur douze langues (plus deux annexes) depuis début 1997.

L'idée est de:

- développer un standard, dit UNL (Universal Networking Language), qui serait le HTML du contenu linguistique,

- pour chaque langue, développer un générateur (dit "déconvertisseur") accessible sur un ou plusieurs serveurs, et un "enconvertisseur".

L'Université des Nations Unies (UNU) (Tokyo) finance 50% du coût. D'après notre évaluation sur la première année, c'est plutôt 30 à 35%, car le travail (linguistique et informatique) est énorme, et le projet passionnant: les permanents des laboratoires s'y investissent plus que prévu.

Un énoncé en langue naturelle est représenté par un hypergraphe dont chaque noeud contient une "UW" (universal word, comme match_with(icl>event) ou match(icl>thing), formés à partir de mots anglais et dénotant des ensembles plus ou moins fins d'acceptions), ou un autre graphe, le tout muni d'attributs booléens (pluralité, modalité, aspects) - chaque arc porte une relation sémantique (agt, tim, objs). On en est à la version 1.5 de ce standard, il reste pas mal à faire, mais au moins douze groupes ont construit chacun une centaine de graphes pour le tester.

La déconversion tourne pour le japonais, le chinois, l'anglais, le portugais, l'indonésien, et commence à tourner pour le français, l'allemand, le russe, l'italien, l'espagnol, l'hindi, l'arabe, et le mongol.

Chaque langue a une base lexicale de 30.000 à 120.000 liens UW - lexème.

L'enconversion n'est pas (si on veut de la qualité pour du tout venant) une analyse classique. C'est une méthode de fabrication de graphes UNL qui suppose une bonne part d'interaction, avec plusieurs possibilités:

- analyse classique multiple suivie d'une désambiguisation interactive en langue source,

- entrée sous langage contrôlé,

- encore plus séduisant (et encore pas clair, au niveau recherche pour l'instant), entrée directe via une interface graphique reliée à la base lexicale et à la base de connaissances.

Les applications possibles sont:

- courriel multilingue,

- informations multilingues,

- dictionnaires actifs pour la lecture de langues étrangères sur le web,

- et bien sûr TA (traduction automatique) de mauvaise qualité (ce qu'on trouve actuellement, mais pour tous les couples à cause de l'architecture à pivot) pour le surf web et la veille.

On travaille actuellement sur les informations sportives sur le web, surtout sur le foot. On construit une base de documents, où chaque fichier est structuré (à la HTML) et contient, pour chaque énoncé, l'énoncé original, sa structure UNL, et autant de traductions qu'on en a obtenu. Un tel document peut être recherché dans une base en traduisant la question en UNL, puis affiché (le UNL viewer existe depuis un an) dans autant de fenêtres d'un navigateur web que de langues sélectionnées.

= Quelles sont les perspectives?

Le projet a un problème de volume: grande surface, pas assez d'épaisseur. Il faudrait trois à cinq fois plus de monde partout pour que ça avance assez vite (pour que Microsoft et d'autres ne finissent par tout reprendre et revendre, alors qu'on vise une utilisation ouverte, du type de ce qu'on fait avec les serveurs et clients web). Les subventions des sociétés japonaises à l'UNU pour ce projet (et d'autres) se tarissent à cause de la crise japonaise. Le groupe central est beaucoup trop petit (quatre personnes qui font le logiciel, le japonais, l'anglais, l'administration, c'est peu même avec de la sous-traitance).

De plus, le plan général est d'ouvrir aux autres langues de l'ONU en 2000. Il faudrait arriver à un état satisfaisant pour les douze autres avant.

Du point de vue politique et culturel, ce projet est très important, en ce qu'il montre pour la première fois une voie possible pour construire divers outils soutenant l'usage de toutes les langues sur internet, qu'elles soient majoritaires ou minoritaires. En particulier, ce devrait être un projet majeur pour la francophonie.

Dans l'état actuel des choses, je pense que l'élan initial a été donné, mais que la première phase (d'ici 2000) risque de retomber comme un soufflé si on ne consolide pas très vite le projet, dans chaque pays participant.

L'UNU cherche donc comment monter un soutien puissant à la mesure de cette ambition. Je pense que, pour la Francophonie par exemple, il faudrait un groupe d'une dizaine de personnes ne se consacrant qu'à ce projet pendant au moins dix ans, plus des stagiaires et des collaborateurs sur le réseau, bénévoles ou intéressés par la mise à disposition gratuite de ressources et d'outils.

[FR] Bernard Boudic (Rennes)

#Responsable éditorial du serveur internet du quotidien Ouest-France

Bernard Boudic, 51 ans, 32 ans de presse écrite régionale, a d'abord été localier à Brest (1969-1978), puis secrétaire de rédaction au service économique et social (1978-1984), puis chef-adjoint de ce service (1984-1987), puis chef de service des informations générales (1987-1996), et enfin chargé de mission internet auprès de TC-Multimédia, filiale d'Ouest-France. Il a mis fin à ses fonctions en décembre 2000.

[Entretien 17/06/1998 // Entretien 19/01/2001]

*Entretien du 17 juin 1998

= Quel est l'historique de votre site web?

A l'origine (en juillet 1996, ndlr), l'objectif était de présenter et relater les grands événements de l'Ouest en invitant les internautes à une promenade dans un grand nombre de pages consacrées à nos régions (tourisme, industrie, recherche, culture). Très vite, nous nous sommes aperçus que cela ne suffisait pas. Nous nous sommes tournés vers la mise en ligne de dossiers d'actualité, puis d'actualités tout court.

= Quelle est son activité présente?

Aujourd'hui nous avons quatre niveaux d'infos: quotidien, hebdo (tendant de plus en plus vers un rythme plus rapide), événements et dossiers. Et nous offrons des services (petites annonces, guide des spectacles, presse-école, boutique, etc.). Nous travaillons sur un projet de journal électronique total: mise en ligne automatique chaque nuit de nos quarante éditions (450 pages différentes, 1.500 photos) dans un format respectant typographie et hiérarchie de l'information et autorisant la constitution par chacun de son journal personnalisé (critères géographiques croisés avec des critères thématiques).

= Quel est l'apport de l'internet dans votre vie professionnelle?

Internet a changé ma vie professionnelle d'abord parce que je suis devenu le responsable éditorial du site… Les retombées sur le travail quotidien des journalistes d'Ouest-France sont encore minces. Nous commençons seulement à offrir un accès internet à chacun (rédaction d'Ouest-France = 370 journalistes répartis dans soixante rédactions, sur douze départements… pas simple). Certains utilisent internet pour la messagerie électronique (courrier interne ou externe, réception de textes de correspondants à l'étranger, envoi de fichiers divers) et comme source d'informations. Mais cette pratique demande encore à s'étendre et à se généraliser. Bien sûr, nous réfléchissons aussi à tout ce qui touche à l'écriture multimédia et à sa rétroaction sur l'écriture imprimée, aux changements d'habitudes de nos lecteurs, etc.

= Comment voyez-vous l'avenir?

Internet est à la fois une menace et une chance. Menace sur l'imprimé, très certainement (captation de la pub et des petites annonces, changement de réflexes des lecteurs, perte du goût de l'imprimé, concurrence d'un média gratuit, que chacun peut utiliser pour diffuser sa propre info, etc.). Mais c'est aussi l'occasion de relever tous ces défis et de rajeunir la presse imprimée.

*Entretien du 19 janvier 2001

= Pouvez-vous décrire l'activité de TC-Multimédia?

TC-Multimédia a été créée en 1986. Elle prennait la suite de l'Association télématique de l'ouest qui avait expérimenté le minitel (créé à Rennes). D'abord spécialisée exclusivement dans les services vidéotex, elle a fait aussi de l'internet à partir de juillet 1996. Elle est chargée d'exploiter sur ce média l'ensemble de la production du journal Ouest-France.

TC-Multimédia exploite sept sites:

http://www.ouest-france.fr

http://www.maville.com

http://www.ouestemploi.com

http://www.ouestfrance-immobilier.com

http://www.ouestfrance-automobile.com

http://www.ouestfrance.affaires.com

http://www.abcvacances.com

Les deux premiers cités sont les plus fréquentés (environ quatre millions de pages vues par mois) bien qu'ils ne proposent qu'une sélection de nos informations.

= En quoi consiste exactement votre activité professionnelle?

J'avais (jusqu'en décembre 2000) la responsabilité éditoriale des sites d'information (www.ouest-france.fr et www.maville.com) et du développement éditorial (accords extérieurs, partenariats).

= Comment voyez-vous l'avenir?

Nous avons la chance de disposer d'un gisement d'informations déjà utilisées pour le papier (Ouest-France publie dans ses 42 éditions 550 pages différentes toutes les nuits) et de petites annonces. Nous avons une marque connue et respectée. Mais le modèle économique n'est pas trouvé. Nous pensons développer un service payant à destination des centres de documentation qui leur permettrait de rechercher dans les 42 éditions n'importe quel article correspondant à une requête par mots-clés.

= Utilisez-vous encore beaucoup de documents papier?

Bien sûr!

= Les jours du papier sont comptés?

Mon avis est que le journal-papier est menacé à terme (vingt ans?) s'il ne se renouvelle pas dans la forme et dans le fond. La prise en mains du journal se fera de plus en plus tard (40-45 ans?). Il y aura des arbitrages avec la télévision (satellite, câble, numérique hertzien), avec l'internet rapide (ADSL, câble, boucle locale radio, satellite?). Il n'y aura pas de publicité disponible pour faire vivre tout le monde.

= Quelle est votre opinion sur le livre électronique?


Back to IndexNext