Petra Gomez-Krämer, laboratoire informatique, image et interaction, université de La Rochelle
Un document hybride est un document pouvant être sous forme numérique et sous forme papier dû à des impressions et/ou numérisations du document original.
En conséquence, des différentes versions dégradées d’un document apparaissent, comme par exemple l’original numérique, sa version imprimée, ainsi que sa version imprimée et numérisée.
Indépendamment de sa forme, le document doit être authentifié pour prévenir la fraude. A cause des diverses dégradations provenant du processus d’impression et de numérisation, un hachage cryptographique ne peut pas être appliqué pour authentifier le document. Par contre, les algorithmes de traitement et d’analyse d’images de document peuvent être utilisés pour extraire le contenu visuellement significatif (le texte, les logos, les signatures manuscrites et la mise en page). Ce contenu peut ensuite être haché afin de produire un code de hachage qui est identique pour toutes les versions du document.
Cette conférence introduit les principales méthodes de traitement et d’analyse d’images de document, explique leurs difficultés vis-à-vis des diverses dégradations causées par le processus d’impression et de numérisation et présente les avancées récentes pour l’authentification des documents hybrides.