Externaliser un travail de numérisation

From Tracks
Revision as of 12:40, 4 August 2024 by Juliette Wanlin (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search
Other languages:
English • ‎Nederlands • ‎français

Lorsque vous souhaitez numériser vos archives ou collections, il est souvent conseillé de confier cette tâche à un partenaire externe. Ce dernier possède l'expertise nécessaire pour fournir des fichiers numérisés de haute qualité. Cependant, de nombreux éléments doivent être pris en compte.
Grâce à cet outil, vous apprendrez :

  • Quel est l'avantage de l'externalisation d'un travail de numérisation ?
  • Quels accords conclure avec le fournisseur ?
  • Comment contrôler le processus de numérisation ?
  • Comment effectuer le contrôle de qualité après la numérisation ?

Lorsque vous externalisez, vous vous associez à une société externe pour numériser vos archives ou collections.

Vous avez également plus de chances d'obtenir des reproductions de qualité, parce que des spécialistes le font pour vous. Cette solution est particulièrement conseillée lorsque vous possédez énormément de matériel de valeur, ou lorsqu'il s'agit simplement de documents que vous ne pouvez pas numériser vous-même, par exemple parce qu'ils sont trop volumineux ou qu'ils se présentent sous des formats difficiles, comme les bandes vidéo.

Mais attention : externaliser une numérisation ne consiste pas simplement à appeler une entreprise. De nombreux éléments doivent être pris en compte. Essayez de les établir le mieux possible à l'avance, de demander des prix aux fournisseurs et de les faire figurer dans l'accord que vous concluez avec eux.

Lors de l'externalisation d'une numérisation, il faut tenir compte de trois phases : Avant, pendant et après la numérisation.

  • Avant la numérisation : vous préparez votre matériel, trouvez un fournisseur, prenez des dispositions et effectuez les premiers tests.
  • Pendant la numérisation : vous assurez le suivi des demandes des fournisseurs et effectuez des contrôles intermédiaires.
  • Après la numérisation : vous vérifiez que tout votre matériel a été renvoyé correctement et effectuez un contrôle final de la qualité des reproductions.


Avant-propos

Avant de poursuivre, prenez le temps de revoir les principes généraux d'une numérisation de qualité. Nous les expliquons dans l'outil Numérisation de qualité de textes et d'images. Les exigences générales d'une bonne numérisation (espace de stockage suffisant, description, qualité de reproduction et qualité du format de fichier) s'appliquent également ici.

Avant la numérisation : accords avec le fournisseur

Accords pratiques

Veillez à ce que la logistique, la collecte, la date de livraison, les contacts, la manière dont les fichiers numériques sont livrés, etc. soient clairement organisés.

Droits

Acceptez que le fournisseur ne puisse pas revendiquer de droits de propriété intellectuelle ou de droits d'utilisation sur les reproductions. Si votre collection contient du matériel sensible à la vie privée, demandez une clause de confidentialité.

Dispositions relatives à la logistique et à la conservation

Assurez-vous que le fournisseur décrit clairement où les originaux seront conservés et comment il les transportera. Préparez de préférence un rapport sur l'état de la collection, afin de pouvoir vérifier par la suite que rien n'a été endommagé.

Dispositions relatives à l'exhaustivité

Demandez des garanties que le fournisseur numérise bien l'entièreté des documents. Pour vérifier cela, il est préférable d'avoir décrit et enregistré votre collection de la manière la plus détaillée possible (voir également l'outil Numérisation de qualité de textes et d'images). De cette manière, vous pouvez vérifier non seulement si tout a été numérisé, mais aussi si le fournisseur a renvoyé tous les originaux.

Exemple de fichier tableur pour la numérisation de supports de diapositives. Chaque support reçoit un numéro unique (colonne de gauche) et une indication du nombre de diapositives par support (quatrième colonne). De cette manière, il est possible de vérifier si toutes les diapositives sont numérisées et renvoyées. Le registre fournit également au fournisseur des instructions claires sur le nom de fichier à donner aux reproductions (troisième colonne).

Dispositions relatives à la qualité de la reproduction et au processus de reproduction

  • Mettez-vous d'accord sur la résolution et la profondeur de bit à laquelle la numérisation devra se faire, ainsi que sur le profil de couleurs qui sera utilisé.
  • Assurez-vous que le fournisseur décrit clairement l'équipement d'enregistrement qu'il utilisera.
  • Assurez-vous que le fournisseur indique que l'équipement sera calibré quotidiennement : au début du processus, lorsque l'équipement est redémarré et lorsque les paramètres sont ajustés.
  • Demandez au fournisseur comment il contrôlera la qualité des enregistrements et de l'étalonnage, et qu'il vous fournisse des preuves de son processus de contrôle.

Normes de qualité d'images

Le cahier des charges prévoit que le souscripteur respecte les normes internationales en vigueur, telles que Metamorfoze (disponible en anglais), FADGI (disponible en anglais) ou Guidelines Digitalisation of photographic materials. Par exemple, le fournisseur doit se conformer à une norme internationale et doit également effectuer les contrôles de qualité requis par la norme.

Après le processus

Mettez-vous d'accord sur les finitions et sur la manière dont elles doivent être effectuées (ex. redressement, recadrage, amélioration de la netteté). Souhaitez-vous qu'un certain processus ne soit absolument pas appliqué ? Si c'est le cas, indiquez-le explicitement.

Vous traitez des documents textuels ? Dans ce cas, il est judicieux de les soumettre à une OCR. L'OCR (Optical Character Recognition, ou reconnaissance optique de caractères en français) convertit le texte de votre document en texte lisible par une machine, ce qui vous permet de rechercher des mots dans vos reproductions. Cette opération peut souvent être réalisée sans trop de frais supplémentaires. Convenez de la manière dont les données OCR seront livrées. Un fichier texte par numérisation est le minimum et doit toujours être demandé, mais intégrer l'OCR dans un PDF pour optimiser les possibilités de recherche est également possible.

Fichiers à fournir

Déterminez avec attention si le fournisseur doit fournir un fichier principal, un fichier d'archivage et un fichier de consultation (pour plus d'informations, voir l'outil Numérisation de qualité de textes et d'images). Convenez des formats de fichier à utiliser à cette fin. Uncompressed baseline TIFF v6 pour les fichiers mères et les fichiers d'archivage, JPEG pour les fichiers de consultation (s'il s'agit d'images), PDF pour les fichiers de consultation (s'il s'agit de textes).

Assurez-vous que le fournisseur fournit également les checksums de chaque fichier, afin que vous puissiez vérifier qu'aucune erreur ne s'est produite, par exemple, lors de la copie des fichiers. Le plus simple est que le fournisseur vous fournisse un document texte ou un fichier tableur contenant tous les fichiers et leurs checksums.

Exemple de fichier texte avec des checksums par fichier. Grâce à ces checksums, vous pouvez détecter les erreurs dans le processus de copie. Il est également toujours intéressant de vérifier après coup qu'aucune modification n'a été apportée à vos fichiers.

Les métadonnées

Convenez de la manière dont le fournisseur doit nommer les fichiers et de la structure des dossiers. Idéalement, vous devriez déjà dresser une liste dans un tableur de tout le matériel que le fournisseur doit numériser, en indiquant clairement dans une autre colonne les noms des fichiers. Vous trouverez un exemple de tableur pour la numérisation de revues sur le site web du VAi (disponible en néerlandais et en anglais).

Souhaitez-vous que le fournisseur ajoute d'autres métadonnées au cours du processus de numérisation ? Convenez alors soigneusement de la manière dont il les remplit et les livre, ainsi que de la manière dont il en contrôle la qualité.

Vous pouvez également demander au fournisseur d'intégrer certaines métadonnées techniques et de contenu dans les fichiers. Pour plus d'informations, voir l'outil Métadonnées intégrées aux photos.

La phase de test

Il est recommandé de convenir d'une phase de test avec le fournisseur, au cours de laquelle vous pourrez également aller voir le processus de numérisation sur place. Veillez à ce qu'il numérise d'abord un nombre limité de documents à titre de test. Si vous n'êtes pas satisfait, vous pouvez procéder à d'autres ajustements jusqu'à ce que vous obteniez un "scan de référence" qui vous convienne. Celui-ci servira alors de référence pour la qualité des numérisations ultérieures.

Prévoir un temps de contrôle

Idéalement, vous vérifiez que le fournisseur fait tout ce que vous lui demandez. Vous trouverez ci-dessous plus d'informations sur la manière de procéder au contrôle de la qualité.

Convenez avec votre fournisseur d'un délai durant lequel vous aurez le temps de contrôler le matériel livré. Il est préférable que le fournisseur vous communique les résultats intermédiaires par Internet, afin que vous puissiez les vérifier immédiatement et intervenir en cas de problème. Convenez à l'avance, avec le fournisseur, de la méthode et du logiciel que vous utiliserez pour contrôler le matériel.

Pendant la numérisation

Pendant la numérisation, suivez les questions des fournisseurs et, idéalement, effectuez des contrôles de qualité intermédiaires. Les conseils suivants peuvent vous aider :

  • Passez suffisamment de temps à déterminer le scan de référence.
  • Plus une erreur est détectée rapidement, mieux c'est. Demandez à votre fournisseur de vous fournir des résultats intermédiaires, afin de pouvoir réagir immédiatement en cas d'erreur. Par exemple, les scans cibles, qui testent l'exactitude de l'étalonnage, peuvent être envoyés par Internet immédiatement après l'étalonnage et la vérification. Les fichiers de consultation générés peuvent également être envoyés par Internet, afin que vous puissiez également évaluer immédiatement la qualité de l'image.
  • Si vous avez des questions spécifiques concernant les finitions (ex. l'ajout d'OCR et de métadonnées) en plus de la numérisation du matériel, insérez une étape intermédiaire au cours de laquelle la qualité de la numérisation est d'abord vérifiée. Ce n'est que lorsque vous êtes sûr que la numérisation elle-même a été effectuée correctement que vous donnez l'autorisation de poursuivre les finitions des fichiers. Dans le cas contraire, vous courez le risque que le fournisseur passe du temps à traiter des fichiers incorrects, ce qui peut donner lieu à des discussions par la suite.

Après la numérisation : contrôle de la qualité

En externalisant la numérisation, vous gagnez beaucoup de temps, parce que vous ne devez pas faire les reproductions vous-même. Cependant, si vous voulez faire les choses correctement, vous devez consacrer beaucoup de temps au contrôle de la qualité. Ne le sous-estimez pas, car tout peut mal se passer. D'une manière générale, vous vérifiez les caractéristiques suivantes du matériel :

  • l'exhaustivité
  • la qualité des images
  • l'exactitude du format de fichier
  • la qualité des finitions (ex. OCR)
  • la qualité des métadonnées

L'exhaustivité du matériel

Si vous avez dressé une bonne liste de tout le matériel au préalable, cette opération est très rapide. Vérifiez qu'il y a autant de fichiers par dossier que d'éléments répertoriés (pages, photos, etc.).

Vérifiez également qu'aucune erreur ne s'est glissée dans les fichiers, par exemple lors d'une copie sur Internet. Si vous avez convenu d'un bon fichier de checksums avec le fournisseur, cette vérification peut se faire automatiquement (voir l'outil à propos des checksums).

Enfin, il est toujours bon de vérifier que le matériel original a également été restitué dans son intégralité.

La qualité des images

Essayez de procéder à cette vérification le plus souvent possible au cours du processus de numérisation. Après tout, la seule forme de récupération est la re-numérisation.

Nous avons vu plus haut qu'il est judicieux de demander à votre fournisseur de suivre une norme internationale de numérisation, telle que Metamorfoze (disponible en néerlandais et en anglais), FADGI (disponible en anglais) ou Guidelines Digitalisation of photographic materials. De cette manière, le fournisseur s'engage contractuellement à prendre certaines mesures pour garantir la qualité de la numérisation.

Mais ce n'est pas parce qu'un fournisseur affirme qu'il respectera une norme qu'il le fera. Les normes vous fournissent un cadre dans lequel vous pouvez mesurer par vous-même si cela se produit ou non à l'aide de "targetscans" (pour plus d'informations, voir la norme concernée).

Sachez que ces normes sont destinées à des spécialistes et que les contrôles nécessitent des logiciels spécifiques. Si vous ne pouvez pas le faire, vérifiez toujours soigneusement les images vous-même. Sont-elles suffisamment nettes ? Sont-elles lisibles ? Les images ne présentent-elles pas de décoloration étrange ou d'artéfacts (ex. moiré) ? L'image est-elle utilisable pour des publications dans des livres et sur Internet ?

Si vous souhaitez un soutien pour vérifier de manière intensive si une reproduction a été faite correctement selon les normes, contactez un partenaire de TRACKS.

L'exactitude du format du fichier

Essayez de faire ce contrôle autant que possible pendant le processus de numérisation.

Pour les contrôles de qualité, concentrez-vous principalement sur les fichiers mères et les fichiers d'archivage. Les fichiers de consultation sont moins critiques. De nouveaux fichiers de consultation peuvent toujours être générés à partir des fichiers d'archivage.

Attention ! Ce n'est pas parce qu'un fichier porte l'extension ".tif" qu'il s'agit d'un fichier TIFF. Pour vérifier si votre fichier TIFF est bien un TIFF, vous pouvez utiliser un outil comme Droid. Voir l'outil Identifier les fichiers de vos archives numériques avec DROID.

Pour vérifier si votre fichier TIFF est bien un fichier Uncompressed Baseline TIFF v6.0 (c'est-à-dire le type de fichier TIFF le plus durable), vous pouvez utiliser l'outil DPF Manager. D'après notre expérience, il arrive encore assez souvent qu'un fichier TIFF ne corresponde pas à une norme demandée, alors n'oubliez pas de faire le test. N'hésitez pas à contacter un partenaire de TRACKS pour obtenir de l'aide dans la vérification.

La qualité des finitions (OCR)

L'OCR est rarement, voire jamais, totalement exempte d'erreurs. La qualité de l'OCR dépend du logiciel utilisé, mais surtout de la nature du matériel source. Pour vérifier la qualité, demandez toujours des données d'OCR dans des fichiers texte séparés et pas seulement dans des fichiers PDF. Vous pouvez ensuite ouvrir au hasard un certain nombre de fichiers texte avec le texte OCR et vérifier si la qualité est bonne.

Contactez éventuellement un partenaire de TRACKS pour plus d'informations.

La qualité des métadonnées

Si vous demandez au fournisseur d'ajouter également des métadonnées aux fichiers numérisés (comme les titres), il n'y a pas d'autre moyen de le vérifier que de le faire, éventuellement par échantillonnage aléatoire. Quelle que soit la manière dont le fournisseur fournit les métadonnées, il est préférable de demander également une impression des métadonnées dans un fichier tableur. Cela simplifie le contrôle manuel.

Un fichier numérique contient également des métadonnées techniques intégrées. Si vous le souhaitez, vous pouvez également évaluer la qualité de ces métadonnées. Voir l'outil Métadonnées intégrées aux photos.

Pour en savoir plus

Auteurs : cet article est basé sur un texte de Wim Lowet (VAi), en collaboration avec Nastasia Vanderperren et Bart Magnus (meemoo).