référence : http://listes.cru.fr/arc/webiblio-l/2007-01/msg00001.html
     Chronologie       
     Conversation       

La numérisation de masse Debbah, Karim



La numérisation de masse

"Mass digitization" : voici un des sujets de cogitation en ce moment aux US. Ils englobent là-dedans les projets googeliens, OCAesques et MSNiques.
Un peu d'historique n'est pas inutile pour rappeler que si en France nous travaillons depuis plus de 10 ans à une numérisation encyclopédique de livres en vue d'atteindre une masse critique (moins critique que celle de Google certes ;-), dans les pays anglosaxons c'est plutôt une logique de collection qui a dominé les initiatives de numérisation, donc avec une forte dimension patrimoniale et dans certains cas éditoriale.
La numérisation de masse, tel que définie par Google&Co, constitue donc pour eux une vraie rupture alors que pour nous ce serait plutôt un changement d'échelle.

Karen Coyle a écrit sur ce sujet un article qui a l'air intéressant mais il est en accès payant. On en trouve des extraits sur OA news et sur Archivalia.

On peut lire également les remarques de J. Esposito, qui propose quatre exigences de base (requirements)à l'égard de ce type de projets :

Pour conclure il remarque qu'aucun des grands projets de numérisation de masse actuels ne respecte ces 4 exigences. Ce que Jill traduit par la question suivante : les projets de numérisation de masse devront-ils être refaits ?

Le problème avec la masse, c'est que plus elle augmente, plus la qualité baisse. Il faudrait pourtant réussir à réconcilier les deux, au moins pour la création des fac-similés image pour ne pas avoir à refaire la numérisation. Les traitements (OCR par exemple) seront refaits de toute façon car leur performance s'améliorera avec le temps. Donc on devrait se focaliser sur deux tâches essentielles qui nous éviteront d'avoir à ressortir les originaux "analogiques" de nos magasins dans 10 ans :

 

 

____________________________________

Karim Debbah

Technologies de l'information

Service des bibliothèques

Université du Québec à Montréal

Tél. (514) 987-3000 poste 6301#

Fax.(514) 987-0285

Courriel debbah.karim@uqam.ca

 

image001.gif

GIF image

image002.gif

GIF image