Valider des fichiers TIFF avec DPF Manager
En validant les fichiers numériques, vous pouvez vérifier s'ils répondent aux exigences de qualité de leur format de fichier. Pour les fichiers TIFF, vous pouvez utiliser DPF Manager.
Grâce à cet outil, vous apprendrez :
- Pourquoi valider les fichiers numériques et quand le faire ?
- Pourquoi valider les fichiers TIFF ?
- Comment installer et utiliser DPF Manager ?
- Comment corriger les métadonnées intégrées dans les fichiers TIFF ?
La validation de formats de fichiers est le processus par lequel vous vérifiez que le contenu et la structure d'un fichier numérique répondent aux exigences définies dans la spécification du format de fichier.
DPF Manager est un outil open source très facile à utiliser, qui permet de vérifier les fichiers TIFF. Grâce à une interface simple, DPF Manager indique si votre fichier TIFF est conforme à la bonne spécification TIFF. Si votre fichier n'est pas conforme, l'outil indique également pourquoi.
Pourquoi valider ?
La validation des formats de fichiers est très importante pour la conservation à long terme. L'un des principaux obstacles dans l'élaboration d'une stratégie de conservation numérique est que nous n'avons souvent pas une bonne idée des formats de fichiers qui composent nos archives numériques. Il est pourtant important de le savoir afin de vérifier régulièrement si les formats de fichiers qui composent vos archives peuvent encore être ouverts avec les logiciels disponibles. En effet, il est possible qu'ils n'existent plus à l'avenir. Grâce à l'identification et à la validation de fichiers, vous pouvez détecter à temps si un format va devenir obsolète, prendre des mesures en temps utile et transférer ces fichiers vers un autre format.
Même lorsque vous avez externalisé un travail de numérisation, il est important de vérifier si les fichiers fournis répondent aux exigences de qualité fixées.
Quand valider ?
Avant de commencer un projet de numérisation, vous définissez des exigences de qualité, notamment en ce qui concerne le format de fichier à utiliser. Les lignes directrices, telles que décrites dans l'outil Numérisation de qualité de textes et d'images, recommandent d'utiliser le format Uncompressed baseline TIFF v6.0. Une fois les résultats de la numérisation livrés, il est donc préférable de vérifier si les fichiers TIFF reçus sont conformes à cette spécification. Si des erreurs sont découvertes lors de la validation des fichiers, il est toujours possible de les faire convertir au bon format par l'entreprise de numérisation.
Ainsi, vous vérifiez non seulement si les fichiers portant l'extension .tif sont bien des fichiers TIFF, mais aussi s'ils répondent aux exigences imposées par la spécification Uncompressed baseline TIFF v6.0. La structure du fichier est analysée et il est vérifié qu'aucune erreur n'a été commise lors de la création du fichier. En effet, de telles erreurs peuvent signifier que le fichier ne peut pas être lu par tous les logiciels.
DPF Manager pour la validation des fichiers TIFF
Un tutoriel sur l'utilisation de DPF Manager est également disponible sur YouTube (en anglais).
Installez DPF Manager
Téléchargez DPF Manager (disponible en anglais) et installez le programme. DPF Manager est disponible pour Windows et macOS. À noter : les utilisateurs de macOS doivent effectuer une démarche supplémentaire avant d'ouvrir le fichier d'installation. Pour ce faire, lisez les instructions situées dans le dossier contenant le fichier d'installation.
Choisissez les fichiers à valider
Ouvre le programme DPF Manager sur votre ordinateur.
Faites glisser le dossier des fichiers TIFF à valider dans la fenêtre Files/Folders.
ou cliquez sur Select et sélectionnez le dossier des fichiers TIFF à valider.
Cochez l'option Default et cliquez sur Full check.
En bas, la fenêtre Tasks s'ouvre. Vous pouvez y suivre l'évolution de la validation en cours. Lorsque la barre est entièrement verte, la validation est terminée. Vous pouvez fermer la fenêtre en cliquant sur Tasks en bas à gauche.
Analysez les résultats
Lorsque la validation est terminée, vous pouvez accéder au rapport contenant les résultats de la validation en cliquant sur "Reports" dans la barre supérieure.
Vous obtiendrez alors un aperçu qui indique :
- la date à laquelle la validation a été effectuée ;
- le nombre de fichiers TIFF validés ;
- quel dossier a été validé ;
- combien d'erreurs ont été détectées ;
- combien d'avertissements y a-t-il ;
- combien de fichiers TIFF ont été validés ;
- le score.
En cliquant sur l'icône du dossier, vous accédez directement aux rapports. Vous pouvez accéder aux résultats en cliquant sur la ligne.
Vous verrez ensuite un résumé des résultats pour chaque fichier. Dans ce résumé, vous voyez d'abord en haut un résumé du rapport global pour l'ensemble du dossier, puis les résumés des rapports pour les fichiers TIFF individuels. Dans le résumé, vous pouvez voir pour chaque fichier TIFF :
- un code couleur qui indique si la validation a fonctionné ;
- les fichiers qui ont été validés ;
- le nombre d'erreurs détectées ;
- le nombre d'avertissements.
En cliquant sur l'icône HTML, on obtient un résumé visuel concis des résultats de la validation pour l'ensemble du dossier.
Tous les rapports, qu'il s'agisse d'un dossier entier ou de fichiers TIFF individuels, peuvent être récupérés dans quatre formats de fichier : HTML, PDF, XML et JSON. Pour ce faire, cliquez sur les icônes "HTML", "PDF", "XML" et/ou "JSON". Pour obtenir le rapport de validation d'un fichier TIFF individuel, cliquez sur les icônes "HTML", "PDF", "XML" et/ou "JSON" situées après le fichier.
Le rapport de validation HTML pour l'ensemble du dossier
Un exemple de rapport de validation pour un dossier de fichiers TIFF sans erreurs peut être téléchargé (en anglais) au format PDF ici.
Le rapport de validation HTML d'un fichier individuel
Un exemple de rapport de validation pour un fichier TIFF individuel sans erreur peut être téléchargé (en anglais) au format PDF en cliquant ici.
Exemples de messages d'erreur
Toutes les validations de fichiers ne donnent pas lieu à un rapport sans message d'erreur. Nous donnons ci-dessous quelques exemples de messages d'erreur et de solutions pour les corriger.
Exemple 1 : caractères étrangers
Le rapport de validation indique que le fichier TIFF n'est pas conforme aux spécifications baseline TIFF v6.0. Le message d'erreur est Only 7-bits ASCII-codes are accepted. Une explication s'affiche lorsque vous passez votre curseur sur le message d'erreur.
L'ASCII est un codage permettant d'afficher des lettres, des chiffres et des signes de ponctuation sur un écran d'ordinateur. Au total, il se compose de 128 caractères. Un aperçu des 128 caractères appartenant à cette séquence peut être trouvée, entre autres, sur Wikipédia. Le message d'erreur indique un problème avec les métadonnées intégrées du tag 33432 Copyright. Le contenu de ce tag se trouve plus haut dans le rapport, dans la liste des tags IFD : © Rony Vissers. Le signe copyright n'est pas un code ASCII 7 bits, ce qui explique le message d'erreur.
Vous pouvez facilement corriger cette erreur. Si vous ouvrez le fichier avec un programme d'édition d'images (ex. Adobe Photoshop ou GIMP) et que vous visualisez ensuite les métadonnées intégrées, vous pouvez facilement remplacer "© Rony Vissers" par "copyright : Rony Vissers". Dans Adobe Photoshop, vous pouvez accéder aux métadonnées intégrées en cliquant sur "File info" dans le menu "File". Dans GIMP, vous pouvez accéder aux métadonnées intégrées en cliquant sur "Métadonnées" dans le menu "Image", puis sur "Modifier les métadonnées". Après édition, n'oubliez pas d'enregistrer le fichier TIFF modifié. Pour modifier les métadonnées intégrées, voir également l'outil Métadonnées intégrées aux photos.
Lorsque vous vérifiez à nouveau le fichier TIFF modifié avec DPF Manager, vous remarquerez que l'erreur signalée précédemment a disparu et que le fichier est désormais valide.
Si les fichiers TIFF sont le résultat d'un projet de numérisation réalisé par une société de numérisation spécialisée, demandez à cette société de numérisation de corriger ces erreurs au lieu de le faire vous-même.
Exemple 2 : compression
Bien que le format de fichier TIFF soit principalement connu comme un format de fichier sans compression, le format de fichier TIFF offre toujours la possibilité de l'utiliser. Lors de la numérisation, il est recommandé de ne pas utiliser de compression. DPF Manager permet de détecter si une compression a été utilisée dans un fichier TIFF, et laquelle.
Voici le rapport de validation de la même image : sauvegardée sans compression à gauche, sauvegardée avec compression JPEG à droite. Le fichier TIFF dans lequel la compression JPEG a été utilisée donne un message d'erreur.
La seule façon de corriger cette erreur est de recréer (ou de faire recréer) l'image ou le scan, puis de l'enregistrer en Uncompressed baseline TIFF v6.0. Si le fichier RAW à partir duquel le fichier TIFF a été créé a été enregistré, vous pouvez utiliser ce fichier RAW pour créer un Uncompressed baseline TIFF v6.0.