Numérisation de qualité de textes et d'images
La numérisation de textes et d'images analogiques peut offrir de nombreux avantages, notamment en termes d'accessibilité. Cependant, la numérisation est un processus intensif qui nécessite beaucoup de temps et de ressources. Une bonne planification et une bonne approche sont donc cruciales.
Grâce à cet outil, vous apprendrez :
- Où stocker vos images numérisées ?
- Comment décrire les images numérisées ?
- Comment assurer une bonne qualité d'image des images numérisées ?
- Quels formats de fichiers utiliser pour vos images numérisée ?
La numérisation est la conversion d'un matériel analogique, tel que du papier ou des photos, en une forme numérique. Cela peut être aussi simple que de passer une photographie au scanner, mais lorsque vous souhaitez numériser une grande collection sur le plan structurel, il est recommandé d'accorder suffisamment d'attention à la qualité de la numérisation. En effet, la numérisation de collections est un processus qui nécessite beaucoup de temps et de ressources. Il faut donc veiller à ce que le résultat soit durable et puisse être (ré)utilisé à des fins aussi nombreuses que possible à l'avenir. Dans cet outil, nous détaillons les éléments à prendre en compte pour numériser des parties de vos archives et collections de manière qualitative.
La qualité de votre collection numérisée est déterminée par quatre éléments, que nous expliquons plus en détail dans la suite de cet outil :
- l'endroit où vous stockez les éléments de collection numérisés ;
- les données (métadonnées) que vous enregistrez sur le fichier ;
- la qualité visuelle de l'enregistrement ;
- la qualité du format de fichier dans lequel vous stockez les informations de l'image.
Bon à savoir avant la lecture
Dans cette section, vous en apprendrez davantage sur la numérisation de textes et d'images, tels que des photos, des affiches et des dessins. Si vous possédez d'autres types de documents, tels que des bandes audio ou des bobines de film, consultez l'outil Numérisation d'audios et de vidéos.
Pour vos archives d'origine numérique (c'est-à-dire les fichiers créés sur ordinateur), veuillez vous référer aux outils de la Catégorie : 5. Conservation numérique.
Vous pouvez également confier la numérisation à une entreprise professionnelle. Celle-ci dispose souvent d'une plus grande expertise pour réaliser une numérisation de qualité. Mais jugez de leur expertise et de la qualité de cette dernière en vous basant également sur les points mentionnés ci-dessus. Vous trouverez plus d'informations dans l'outil Externaliser un travail de numérisation.
Si vous décidez de vous numériser, réfléchissez bien à la répartition des tâches. Que pouvez-vous faire avec le temps et les compétences de vos employés ? Pour quelles tâches ferez-vous éventuellement appel à des consultants externes ? Travaillerez-vous avec des étudiants ou des bénévoles ? Il est parfois utile de donner la possibilité à d'autres personnes de développer certaines compétences. Si vous envisagez de faire appel à des bénévoles ou à des étudiants, veillez lire l'outil Travail (bénévole) dans le domaine des archives.
Le lieu de stockage
Imaginez que vous passiez des mois à numériser toute votre collection de photos et à les stocker sur votre ordinateur. Puis on vous vole votre ordinateur ! Ou vous renversez du café dessus. Ou encore, après une mise à jour du système, toutes vos images sont effacées.
Tout peut arriver à vos archives numérisées. Veillez donc à ce que vos fichiers numériques soient stockés correctement. Cela inclut au moins une bonne stratégie de back-up. Pour ce faire, consultez l'outil Comment faire un back-up ?
La description
Une reproduction numérique dont vous ne connaissez pas l'original et quand ou par qui la copie a été faite perd beaucoup de valeur. Il convient donc de bien documenter ce qui a été numérisé et de savoir où se trouve l'original.
Il est préférable d'enregistrer ou de décrire votre collection avant de la numériser. Une autre option consiste à le faire pendant la numérisation, mais assurez-vous d'avoir bien réfléchi à l'avance à la manière dont vous allez le faire. Vous pouvez faire la description dans un tableur comme Excel ou (si vous en avez les connaissances) dans une base de données. Il est préférable de ne pas utiliser Word ou des formats de texte non structurés.
Idéalement, il existe déjà une liste d'emplacements ou un inventaire de la collection, que vous pouvez utiliser comme base pour enregistrer votre travail de numérisation. Si cette liste n'est pas disponible, mais que vous souhaitez tout de même numériser une sélection de documents, notez toujours la nature de chaque fichier et l'endroit où se trouve la source analogique dans votre collection. Vous saurez ainsi toujours où se trouve l'original.
Un fichier tableur pour la numérisation
Un fichier tableur permet d'obtenir un aperçu de votre travail de numérisation et de maintenir le lien entre la reproduction numérique et l'original. Pour ce faire, enregistrez au moins les éléments suivants :
Colonne | Contenu de la colonne |
---|---|
Numéro unique | Un numéro unique identifie la reproduction et l'original. Il est très important de noter ce numéro dans le nom de fichier de la reproduction. Il est souvent apposé sur l'original (ex. au crayon). Le numéro unique peut être une combinaison de votre numéro d'inventaire et d'un numéro incrémentiel (ex. pour les albums photos). |
Type de document | Si votre collection se compose de différents types de matériel, vous pouvez l'indiquer ici, ex. "photo", "document texte", "poster", etc. |
Description courte | Une brève description du contenu de l'original, ex. "Photo prise lors d'un voyage d'études à Prague", "Affiche d'un spectacle au Beursschouwburg", etc. |
Code d'emplacement | Si le numéro d'inventaire seul ne vous donne pas suffisamment d'informations sur l'endroit où se trouve l'original, vous pouvez les trouver dans ce champ, ex. le numéro de la boîte dans laquelle se trouve l'original. |
Ces colonnes sont un minimum et sont suffisantes pour commencer une numérisation de qualité. En fonction du matériel ou de vos besoins, vous pouvez bien sûr ajouter les colonnes de votre choix. Les colonnes les plus courantes sont :
- pour les dates de début et de fin ;
- pour le projet auquel la photo est liée (ex. des expositions pour des maisons d'art, des productions pour des organisations scéniques) ;
- pour les personnes figurant sur la photo.
En règle générale, plus l'enregistrement est simple, plus le processus de numérisation en soi sera fluide. N'oubliez pas que vous pouvez également ajouter une description du contenu après la numérisation, sur base des reproductions.
Demandez-vous bien si vous allez enregistrer des métadonnées descriptives supplémentaires dans votre fichier tableur ou dans votre inventaire et votre liste d'emplacements.
Le nom de fichier et la structure de dossiers pour vos reproductions
Outre une description dans un fichier tableur ou une base de données, il est également important de penser au nom de fichier de votre reproduction numérique. Comme indiqué plus haut, il doit toujours y avoir un lien entre le nom de votre fichier et le numéro unique de votre fichier tableur. Le numéro unique doit de préférence figurer en tête (précédé ou non d'un code unique faisant référence à votre organisation). Après un underscore, vous pouvez ajouter du texte si vous le souhaitez.
Consultez également l'outil Nommer des dossiers et des fichiers.
Lorsque vous numérisez des documents qui nécessitent des reproductions multiples (tels que des albums photos, des livres ou des magazines), vous devez accorder une attention particulière au nom du fichier. Assurez-vous que le nom du fichier reflète l'ordre de pagination correct.
Pour un original nécessitant une numérisation recto et verso, les codes "-r" (recto) et "-v" (verso) sont souvent utilisés dans les noms de fichiers.
Les magazines sont encore plus complexes. Ils ont des années, des éditions et parfois des suppléments, etc. Vous devrez donc réfléchir à la manière dont vous conservez cette logique par le biais de votre nom de fichier ou de votre structure de dossiers. En fait, vous pouvez ne pas classer du tout et vous fier entièrement à votre fichier tableur pour construire la structure du journal.
Tout cela n'est pas difficile, mais il faut s'assurer qu'il existe une méthode unique d'organisation des dossiers.
La qualité visuelle de l'enregistrement
La qualité de l'image commence par la qualité de l'équipement d'enregistrement. Plus votre appareil photo ou votre caméra est performant, plus vos images seront de qualité. Mais plus votre équipement est performant, plus vous avez besoin de connaissances en tant qu'utilisateur pour le régler correctement.
La qualité de l'étalonnage de votre scanner ou de votre appareil photo (voir ci-dessous) permet d'obtenir une netteté suffisante et de reproduire fidèlement les couleurs. L'environnement de reproduction joue également un rôle important, en particulier lors de la prise de photos. Il devrait toujours être possible de contrôler correctement l'incidence de la lumière. Enfin, de nombreuses prises de vue devront être soumises à un post-traitement tel que le redressement et le recadrage.
Un bon manuel de base sur l'équipement est disponible (en néerlandais) sur le site web de FARO.
Règles empiriques
Respectez toujours les règles empiriques suivantes :
- Numérisez le document entier avec une bordure d'environ un demi-centimètre autour du document. Vous avez ainsi la preuve que vous avez numérisé l'ensemble du document. Vous pourrez toujours supprimer la bordure ultérieurement, par exemple pour une publication.
- L'image en taille réelle doit avoir une résolution d'au moins 300 ppi. Ppi signifie pixel per inch, ou pixel par pouce. Cela signifie que pour chaque pouce de votre document, 300 pixels sont enregistrés. Plus il y a de pixels, plus la netteté est élevée et plus vous pouvez agrandir l'image sans perte de qualité visible. Si vous numérisez des documents pour lesquels vous savez que vous devez pouvoir zoomer (ex. des photos d'identité ou des diapositives), la valeur par défaut de 300 ppi n'est pas suffisante. Si vous voulez pouvoir agrandir le document de deux fois par défaut, optez pour 600 ppi. Pour un zoom arrière de 4x, calculez 1200 ppi, et ainsi de suite.
- Si vous numérisez ou photographiez en couleur, optez pour une profondeur de 24 bits. Il s'agit du nombre de bits (les zéros et les uns) utilisés pour enregistrer la couleur par pixel. Plus la profondeur de bit est importante, plus la gamme de couleurs pouvant être stockée est étendue.
- Si vous numérisez ou photographiez en niveaux de gris, optez pour une profondeur de 8 ou 16 bits.
- Assurez-vous que la couleur des enregistrements est stockée dans un profil de couleurs suffisamment riche. Dans les projets de numérisation, le profil de couleurs RVB est courant. Dans le monde du patrimoine, les profils de couleurs eciRVBv2 ou Adobe RVB sont généralement choisis. Le profil de couleurs sRVB est également courant. Ne l'utilisez pas pour vos archives ou vos fichiers mères (voir ci-dessous). La gamme de couleurs que sRVB peut stocker n'est pas assez riche. Pour plus d'informations sur les profils de couleurs, voir l'outil Qu'est-ce qu'un profil de couleurs ?.
Calibrer l'équipement d'enregistrement
Si vous suivez les règles empiriques ci-dessus, vous faites déjà du bon travail, mais elles ne suffisent pas. Pour créer des reproductions de haute qualité, il est nécessaire de calibrer correctement votre équipement d'enregistrement et votre moniteur. En outre, les facteurs environnementaux tels que l'éclairage doivent être optimaux.
Pour travailler correctement, vous devez être prêt à vous plonger dans le sujet, à moins que vous ne le confiiez à un professionnel (pour cela, voir l'outil Externaliser un travail de numérisation). Si vous voulez le faire vous-même, lisez les manuels et expérimentez. Suivez un cours si nécessaire. Dans tous les cas, gardez à l'esprit les règles empiriques mentionnées ci-dessus.
L'étalonnage de l'équipement d'enregistrement et la réalisation des normes de numérisation de haute qualité sont des questions assez techniques. Si vous n'avez pas le temps de vous pencher sur cette question et que vous souhaitez simplement réaliser des reproductions d'un niveau décent (sans accorder beaucoup d'importance à la reproduction exacte des couleurs), vous pouvez bien entendu le faire. Mieux vaut un enregistrement numérique que pas d'enregistrement du tout. Essayez de toujours respecter les règles empiriques.
Équipement
Quel équipement devez-vous acheter ? Un scanner ou un appareil photo ? Si vous achetez du matériel de bonne qualité, vous pouvez en principe répondre aux normes d'une numérisation de qualité dans l'un ou l'autre scénario.
Pour les débutants, un scanner est souvent plus facile à utiliser. Avec un bon appareil photo, vous avez généralement plus de chances d'obtenir de bonnes photos car vous pouvez régler davantage de paramètres. Gardez à l'esprit qu'il s'agit d'une courbe d'apprentissage abrupte et qu'il faut un bon environnement où vous pouvez contrôler la lumière. Les photos que vous prenez sans connaissance de la photographie ou dans de mauvaises conditions ne produiront pas d'aussi bonnes images que les scanners.
Si vous achetez un scanner, assurez-vous que le logiciel vous permet de régler au moins la résolution, la profondeur de bit et le profil de couleurs. Assurez-vous également que le scanner peut fournir les fichiers en format TIFF non compressé (voir ci-dessous). Conseil : lisez les commentaires des utilisateurs sur l'appareil, demandez conseil aux vendeurs ou contactez les partenaires de TRACKS.
Logiciel
Un bon logiciel d'édition d'images pour éditer les fichiers et les enregistrer dans le bon format de fichier (voir ci-dessous) est fortement recommandé. Le logiciel très connu et adapté est Adobe Photoshop. Combiné avec Lightroom, un outil qui vous permet d'effectuer des actions Photoshop sur plusieurs images simultanément, vous pouvez déjà faire beaucoup. Un autre logiciel souvent utilisé par les professionnels est Capture One.
Il existe également des alternatives gratuites. Pour Photoshop, il s'agit de Gimp. Des exemples de logiciels gratuits pour éditer des images par lots (sans les recommander en particulier) sont XnView et Faststone Image Viewer.
La qualité du format du fichier
Quel format de fichier choisir : JPEG, TIFF ou PNG ? La réponse est de sauvegarder votre fichier en plusieurs exemplaires. Créez au moins un fichier d'archivage et un fichier de visualisation. Si vous le souhaitez, vous pouvez également enregistrer le fichier mère.
Le fichier d'archivage
Le fichier d'archivage est la copie où vous stockez toutes vos informations dans la meilleure qualité possible, sans risque de perte d'informations. La copie d'archive sert de back-up auquel vous pouvez toujours revenir lorsque vous avez besoin de la meilleure qualité possible.
Comme copie d'archive, choisissez un fichier TIFF non compressé de type Uncompressed Baseline TIFF v6.0. Ce format de fichier occupe plus d'espace de stockage que les autres, mais c'est le format utilisé dans le monde entier pour stocker des données d'image de haute qualité. Veillez à ne pas choisir la compression dans vos fichiers d'archives. La compression est souvent obtenue en coupant certaines informations qui ne sont pas immédiatement visibles à l'œil nu, mais qui le deviennent lorsque vous modifiez le fichier dans Photoshop (ex. dans le cas d'une édition pour la publication d'un livre).
Assurez-vous que les couleurs du fichier d'archivage sont encodées dans l'espace colorimétrique eciRVBv2 ou Adobe RVB. Vous pouvez le faire avec Photoshop.
Vérifiez le fichier TIFF. Tous les TIFF ne sont pas des TIFF bien faits. Le fichier TIFF est créé par le logiciel de votre scanner et ce logiciel est un travail humain. Il peut donc y avoir des problèmes. Pour vérifier si votre TIFF est correctement encodé, vous pouvez utiliser l'outil gratuit DPF Manager.
Le dossier de consultation
Le format TIFF non compressé est généralement trop lourd pour une utilisation quotidienne et une publication sur le web. Pour cela, vous utilisez une copie en JPEG. Nous appelons cette copie le fichier de consultation. La manière la plus simple de créer un tel fichier est d'utiliser un logiciel comme Adobe Lightroom ou des alternatives, qui permettent de convertir des lots de fichiers TIFF en fichiers JPEG.
Le fichier mère
Si vous le souhaitez, vous pouvez également faire la distinction entre le fichier mère (ou master) et le fichier d'archives. Les deux sont des fichiers TIFF de haute qualité, mais votre fichier mère contient l'information brute, telle qu'elle sort du scanner ou de l'appareil photo. Votre fichier d'archives est alors une image éditée, joliment redressée, recadrée sur les bords, etc.
Lorsque vous conservez un fichier mère, un fichier d'archives et un fichier de visualisation, vous êtes sûr de pouvoir utiliser l'enregistrement pour toutes les fonctions possibles. Cela signifie qu'il faut enregistrer deux fois un TIFF lourd.
Pour en savoir plus
- Poppe Jeroen. Handboek digitaliseren van documenten. Technische aspecten en kwaliteitseisen, 2017 (disponible en néerlandais)
- Lignes directrices du CEST sur la numérisation des collections (disponible en néerlandais)
- Doing digitisation on a budget: a guide to low-cost digital projects (disponible en anglais), une publication Heritage Fund UK.
Auteurs : cet article est initialement basé sur un texte de Wim Lowet (Vlaams Architectuurinstituut), en collaboration avec Nastasia Vanderperren et Bart Magnus (meemoo).