• Aucun résultat trouvé

Readiris TM Pro 12. Guide Utilisateur

N/A
N/A
Protected

Academic year: 2022

Partager "Readiris TM Pro 12. Guide Utilisateur"

Copied!
88
0
0

Texte intégral

(1)

Readiris TM Pro 12

Guide Utilisateur

(2)
(3)

Table des matières

Copyright ... 1 

Chapitre 1 Présentation de Readiris ... 3 

Gain de temps et élimination du travail de réencodage ... 3 

Famille de produits Readiris ... 6 

Chapitre 2 Installation de Readiris ... 9 

Configuration requise ... 9 

Installation du logiciel ... 9 

Désinstallation du logiciel ... 10 

Enregistrement du logiciel ... 11 

Assistance produits ... 11 

Chapitre 3 Mise en route ... 13 

Exécution de Readiris ... 13 

Interface utilisateur ... 14 

Modification de la langue de l'interface utilisateur ... 16 

Configuration du scanner dans Readiris ... 16 

Chapitre 4 Utilisation de Drop2Read ... 19 

Chapitre 5 Numérisation et ouverture de documents ... 21 

Sélection des options... 21 

Ouverture de fichiers image ... 22 

Numérisation de documents papier ... 24 

(4)

Table des matières

iv

Chapitre 6 Optimisation des documents numérisés ... 29 

Chapitre 7 Zonage des documents ... 35 

Zonage automatique des documents ... 35 

Zonage manuel des documents ... 37 

Utilisation des modèles de zonage ... 43 

Chapitre 8 Reconnaissance des documents ... 47 

Introduction ... 47 

Sélection de la langue du document ... 48 

Définition des caractéristiques du document ... 51 

Utilisation de l'apprentissage interactif ... 53 

Utilisation des dictionnaires de polices ... 56 

Chapitre 9 Formatage et enregistrement de documents ... 59 

Formatage de documents ... 59 

Sélection des options de mise en page ... 62 

Sélection des options d'image ... 65 

Enregistrement des documents en tant que fichiers image ... 67 

Création de documents PDF ... 68 

Sélection des options PDF ... 70 

Adaptation des documents PDF ... 72 

Sélection de la taille de page ... 73 

(5)

Chapitre 10 Enregistrement et chargement des paramètres 75 

Chapitre 11 Reconnaissance de texte manuscrit ... 77 

Index ... 79 

(6)
(7)

Copyright

ReadirisPro12-dgi-290609-01

Copyright ©1987-2009 I.R.I.S. Tous droits réservés.

I.R.I.S. détient les droits d'auteur couvrant le logiciel Readiris, le système d'aide en ligne et la présente publication.

Les informations figurant dans ce document sont la propriété d'I.R.I.S. Elles sont sujettes à modification sans préavis et ne représentent pas un engagement de la part d'I.R.I.S. Le logiciel décrit dans le présent document est fourni sous accord de licence stipulant les conditions d'utilisation de ce produit. Le logiciel peut être utilisé ou copié uniquement conformément aux conditions de cet accord. Aucune partie de la présente publication ne peut être reproduite, transmise, stockée dans un système de récupération ou traduite dans une autre langue sans l'autorisation écrite préalable d'I.R.I.S.

Ce guide utilisateur utilise des noms fictifs à des fins de démonstration. Les références à des personnes, sociétés ou organisations réelles sont strictement fortuites.

Marques commerciales

Le logo Readiris, Readiris et Drop2Read sont des marques commerciales d'Image Recognition Integrated Systems S.A.

Technologies d'OCR, d'ICR et de codes à barres par I.R.I.S.

Technologies AutoFormat et Linguistic par I.R.I.S.

Technologies de BCR et d'analyse de champs par I.R.I.S.

Technologie de compression iHQC par I.R.I.S.

Le segmenteur XML a été développé par Apache. Ce produit comprend le logiciel développé par Apache Software Foundation.

Tous les autres produits mentionnés dans le présent guide utilisateur sont des marques commerciales ou déposées de leurs propriétaires respectifs.

(8)
(9)

C HAPITRE 1

P RÉSENTATION DE R EADIRIS

G

AIN DE TEMPS ET ÉLIMINATION DU TRAVAIL DE RÉENCODAGE

Introduction

Merci d'avoir acheté Readiris. Ce logiciel vous apportera sans nul doute une aide précieuse dans le réencodage de vos textes, tableaux, graphismes, codes à barres et textes manuscrits.

Quelle que soit l'efficacité des ordinateurs, le travail préalable de saisie des informations reste une étape incontournable. Si vous avez déjà retapé un rapport de 15 pages ou un grand tableau de chiffres, vous savez combien cette tâche peut être longue et fastidieuse.

Utilisez ce logiciel d'OCR à la pointe du progrès pour convertir automatiquement des documents papier ou des fichiers image numérisés en documents modifiables et entièrement indexés qu'il est possible d'archiver et de partager.

Numérisez un document imprimé ou dactylographié, indiquez les zones auxquelles Readiris doit appliquer la reconnaissance (ou laissez au système le soin de le faire pour vous), exécutez la reconnaissance des caractères et exportez le document dans votre programme de traitement de texte. Les documents comptant de nombreuses pages sont traités d'une seule traite. Quelques clics de souris vous permettent d'éviter de longues heures de travail tandis que Readiris convertit vos documents papier en fichiers

(10)

Chapitre 1 – Présentation de Readiris

4

électroniques modifiables : il offre des performances 40 fois supérieures à la frappe manuelle.

Pour accélérer encore davantage le processus, vous pouvez recourir à l'utilitaire Drop2Read. Il vous suffit de préciser les paramètres de base (langue de reconnaissance, format de sortie, dossier de

destination et application cible) et de faire glisser vos documents numérisés vers l'icône du Dock. Vos documents seront traités à la volée.

Informations générales

Readiris repose sur les technologies de reconnaissance les plus évoluées. La reconnaissance du texte indépendante de la police est complétée par des techniques d'auto-apprentissage. Le système est capable d'apprendre de nouveaux mots et caractères grâce à une analyse contextuelle et linguistique. En d'autres termes, la précision de l'OCR s'améliore avec le temps et l'utilisation.

Readiris assure également la reconnaissance des données tabulaires et les recrée sous la forme de feuilles de calcul dans votre tableur ou en tant qu'objets tableau dans votre application de traitement de texte. Les données numériques sont directement prêtes à être traitées.

Readiris prend en charge jusqu'à 125 langues : toutes les langues d'Amérique et d'Europe, y compris les langues d'Europe centrale, les langues baltes, le grec, le turc et le cyrillique. Grâce à des modules complémentaires en option, Readiris en capable de lire des documents en hébreu et dans quatre langues asiatiques, à savoir le japonais, le coréen, le chinois simplifié et le chinois traditionnel.

Readiris peut même traiter les documents combinant des alphabets différents : le logiciel détecte les mots « occidentaux » qui

ressortent des documents en grec, en cyrillique, en langue asiatique et en hébreu puisque bon nombre de noms propres intranscriptibles, de noms de marques, etc., sont écrits à l'aide des symboles

occidentaux.

(11)

Pour la reconnaissance des documents, Readiris applique une analyse linguistique au cours de l'étape de reconnaissance et non après. En conséquence, il exécute la reconnaissance de tous les types de documents avec une précision optimale, y compris les documents de piètre qualité, les télécopies et les impressions matricielles. Il n'a aucune difficulté à traiter les documents mal copiés ou numérisés contenant des caractères trop clairs ou trop foncés. Il est en mesure de résoudre des caractères liés et de reconstituer les caractères incomplets ou fragmentés, tels que les symboles matriciels.

En outre, Readiris offre une fonction de vérification utilisateur.

Lorsqu'elle est activée, la fonction de vérification utilisateur (apprentissage interactif) marque les caractères considérés comme douteux par le système de reconnaissance et permet également d'améliorer la précision de la reconnaissance. Toutes les solutions que vous validez sont enregistrées temporairement dans la mémoire du système, ce qui non seulement le rend plus rapide et plus fiable au fil du temps mais également plus intelligent. Ce puissant outil d'apprentissage interactif permet également à Readiris de reconnaître des caractères spéciaux, notamment les symboles mathématiques et les signes typographiques, et de traiter les polices déformées.

Pour accroître encore votre productivité, Readiris, non content d'effectuer la reconnaissance des textes, peut également les formater pour vous. Plusieurs niveaux de formatage sont disponibles.

Lorsque vous utilisez le ”formatage automatique”, Readiris recrée une copie fidèle du document numérisé : le formatage des mots, des paragraphes et des pages du document d'origine est préservé. Le système utilise des types de caractères, des tailles et des styles similaires à ceux utilisés dans le document source pendant la reconnaissance. L'emplacement des colonnes, des blocs de texte et des images respecte également les documents d'origine. Readiris peut même inclure la photo en arrière-plan de la page numérisée dans le document de sortie de la reconnaissance. En outre, puisqu'il prend en charge la numérisation couleur et à niveaux de gris, vous

(12)

Chapitre 1 – Présentation de Readiris

6

pouvez reproduire n'importe quelle image, dessin au trait, photos en noir et blanc et illustrations en couleur. Lorsqu'un document contient des tableaux, Readiris les réorganise dans de véritables cellules et recrée les bordures de cellule des tableaux d'origine.

En d'autres termes, Readiris vous offre la possibilité d'archiver une copie fidèle de vos documents et de les convertir en fichiers texte compacts et modifiables au lieu de simples images numérisées.

Readiris est compatible avec Twain et Image Capture et prend en charge un large éventail de scanners à plat et à feuilles, de

périphériques tout-en-un et multifonctions mais aussi d'appareils photo numériques.

F

AMILLE DE PRODUITS

R

EADIRIS

La famille de produits Readiris se décline en plusieurs versions :

Readiris Pro 12

Readiris Corporate 12

Readiris Pro 12 Asian

Readiris Corporate 12 Asian

Le tableau ci-dessous présente les caractéristiques des différentes versions :

Readiris Pro 12 Readiris Corporate 12 Fonctionnalités de base Fonctionnalités de base 125 langues reconnues 125 langues reconnues Génération de 4 types de fichiers PDF,

de fichiers PDF-iHQC, OpenDocument

Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument

(13)

Text, DOCX, XLSX, HTML, RTF et Unicode.

Text, DOCX, XLSX, HTML, RTF et Unicode.

Génération de sorties PDF/A Reconnaissance d'importants volumes Traitement automatisé

Reconnaissance des codes à barres Reconnaissance des cartes de visite

Readiris Pro 12 Asian Readiris Corporate 12 Asian Fonctionnalités de base Fonctionnalités de base

130 langues reconnues, y compris : 130 langues reconnues, y compris : Japonais

Chinois simplifié et chinois traditionnel Coréen

Hébreu

Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument Text, DOCX, XLSX, HTML, RTF et Unicode

Japonais

Chinois simplifié et chinois traditionnel Coréen

Hébreu

Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument Text, DOCX, XLSX, HTML, RTF et Unicode

Génération de sorties PDF/A Reconnaissance d'importants volumes Traitement automatisé

Reconnaissance des codes à barres Reconnaissance des cartes de visite

(14)

Chapitre 1 – Présentation de Readiris

8

Chinois simplifié et chinois traditionnel Coréen

Hébreu

Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument Text, DOCX, XLSX, HTML, RTF et Unicode

Chinois simplifié et chinois traditionnel Coréen

Hébreu

Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument Text, DOCX, XLSX, HTML, RTF et Unicode

Génération de sorties PDF/A Reconnaissance d'importants volumes Traitement automatisé

Reconnaissance des codes à barres Reconnaissance des cartes de visite

(15)

C HAPITRE 2

I NSTALLATION DE R EADIRIS

C

ONFIGURATION REQUISE

La configuration minimale suivante est nécessaire pour exécuter Readiris :

 Ordinateur Mac OS avec processeur Intel ou G3.

 Système d'exploitation Mac OS X 10.4 ou version ultérieure. Les versions antérieures du système d'exploitation Mac OS ne sont pas prises en charge.

 220 Mo d'espace libre sur le disque.

I

NSTALLATION DU LOGICIEL

Procédure d'installation de Readiris :

 Ouvrez une session dans le logiciel d'exploitation de votre Mac en tant qu'utilisateur de niveau administrateur. Assurez-vous de disposer des droits d'administrateur requis pour installer le logiciel.

 Branchez votre scanner à votre Mac et installez le logiciel qui l'accompagne.

Testez votre scanner. En cas de problème, contactez le fabricant de votre scanner.

(16)

Chapitre 2 – Installation de Readiris

10

 Insérez le CD-ROM de Readiris et double-cliquez sur l'icône du CD-ROM.

 Double-cliquez sur le programme d'installation de Readiris et suivez les instructions s'affichant à l'écran.

Acceptez les conditions du contrat de licence.

 Le type d'installation standard est proposé. Cette option installe Readiris, Drop2Read et les échantillons d'images.

Pour changer de type d'installation, cliquez sur Personnaliser.

 Cliquez sur Installer pour lancer l'installation.

 Une fois l'installation terminée, cliquez sur Terminer.

Le dossier Readiris est créé automatiquement dans le dossier Applications par le programme d'installation.

Les icônes Readiris et Drop2Read sont automatiquement ajoutées dans le Dock.

D

ÉSINSTALLATION DU LOGICIEL

Pour désinstaller Readiris :

 Cliquez sur Finder et ouvrez le dossier Applications.

 Faites glisser le dossier Readiris vers la Corbeille.

Readiris est supprimé de votre ordinateur.

Remarque : les préférences Readiris ne sont pas supprimées lorsque vous faites glisser le dossier Readiris vers la Corbeille, afin que vous

(17)

puissiez réinstaller le logiciel par la suite si vous le souhaitez. Pour supprimer les préférences, faites glisser le dossier Readiris Prefs vers la Corbeille. Ce dossier se trouve dans le chemin Utilisateurs - xxx (votre nom d'utilisateur) - Bibliothèque - Préférences.

E

NREGISTREMENT DU LOGICIEL

N'oubliez pas d'enregistrer votre licence Readiris. Cet enregistrement vous procurera divers avantages :

 Vous serez tenu informé du développement de nouveaux produits et des produits I.R.I.S. associés.

 Vous aurez droit à l'assistance produits.

 Vous bénéficierez d'offres spéciales sur les produits I.R.I.S.

Pour enregistrer le logiciel :

Cliquez sur Enregistrer Readiris dans le menu Aide. Vous serez redirigé sur la page Web d'enregistrement. Suivez simplement les instructions affichées à l'écran.

A

SSISTANCE PRODUITS

Dès que vous avez enregistré votre produit, vous bénéficiez de l'assistance I.R.I.S. pour toutes les fonctionnalités de base du logiciel. Pour contacter I.R.I.S. :

Europe :

www.irislink.com/support Tél. :+32 10 45 13 64

(18)

Chapitre 2 – Installation de Readiris

12

Etats-Unis :

www.irislink.com/support Tél. :+1 800 447 4744 Asie-Pacifique :

www.irislink.com/support Tél. : +852 22646133

(19)

C HAPITRE 3 M ISE EN ROUTE

E

XÉCUTION DE

R

EADIRIS

Pour exécuter Readiris :

 Cliquez sur l'icône Readiris dans le Dock.

 Vous pouvez également double-cliquer sur l'icône de l'application Readiris dans le dossier Readiris sous Applications.

 Si vous avez acheté la version Readiris Corporate, le système vous invite à enregistrer le logiciel. Cliquez sur S'enregistrer par Internet et effectuez la procédure d'enregistrement pour acquérir votre clé logicielle.

 Saisissez ensuite la clé logicielle reçue par e-mail dans le champ requis.

L'interface Readiris s'affiche.

(20)

Chapitre 3 – Mise en route

14

I

NTERFACE UTILISATEUR

L'interface de Readiris se compose des éléments suivants :

Barre d'outils principale (barre d'outils de gauche)

Utilisez les commandes de la barre d'outils principale pour la numérisation et la reconnaissance manuelle des documents.

Barre d'outils Image (barre d'outils de droite)

Utilisez les boutons de la barre d'outils Image pour modifier des documents dans l'interface de Readiris.

Pointez sur les différents boutons pour afficher leur infobulle.

 Barre de menus Readiris (haut de l'écran)

La barre de menus Readiris contient toutes les commandes et options également présentes dans les barres d'outils principale et Image.

La barre de menus Readiris vous permet en outre de définir plusieurs paramètres avancés.

(21)

 Lorsque vous ouvrez ou numérisez un document dans Readiris, vous pouvez voir ses miniatures de page dans le tiroir à images.

Cliquez sur l'icône du tiroir pour l'ouvrir.

Le tiroir peut s'ouvrir tant à droite qu'à gauche de l'interface Readiris, en fonction de sa position à l'écran.

Le tiroir vous permet de déplacer les pages à l'intérieur d'un document : il suffit de cliquer sur les pages à déplacer et de les faire glisser à l'endroit voulu. Il permet de marquer les pages en tant que couvertures et de modifier la langue de reconnaissance par page en appuyant sur la touche Ctrl et en cliquant sur la langue voulue.

(22)

Chapitre 3 – Mise en route

16

Le tiroir vous permet de supprimer des pages en les faisant glisser vers la Corbeille dans le Dock.

M

ODIFICATION DE LA LANGUE DE L

'

INTERFACE UTILISATEUR

Lorsque Readiris s'ouvre, l'interface utilisateur s'affiche dans la langue actuellement sélectionnée dans vos préférences système.

Pour modifier la langue de l'interface utilisateur de Readiris :

 Cliquez sur l'icône Préférences Système dans le Dock.

 Ouvrez ensuite la section International.

 Faites glisser la langue de votre choix en haut de la liste et fermez la fenêtre International.

L'interface utilisateur de Readiris est disponible dans plusieurs langues.

 Redémarrez Readiris pour appliquer les nouveaux paramètres de langue.

C

ONFIGURATION DU SCANNER DANS

R

EADIRIS Readiris prend en charge les scanners compatibles Twain 1.9 et Image Capture.

(23)

Cependant, pour pouvoir utiliser un scanner, ses pilotes doivent être installés sur votre Mac.

Procédure :

 Branchez votre scanner à votre Mac et installez le logiciel et/ou les pilotes qui l'accompagnent.

Testez votre scanner. En cas de problème, contactez le fabricant de votre scanner.

 Exécutez Readiris.

 Dans le menu Readiris, cliquez sur Préférences.

 Une fois les pilotes du scanner installés correctement, une liste des scanners pris en charge s'affiche. Sélectionnez votre modèle de scanner dans cette liste.

Assurez-vous de sélectionner l'option Activer les scanners Image Capture lorsque vous utilisez un scanner Image Capture.

 Différentes options de scanner et de prétraitement sont disponibles.

Reportez-vous à la section Numérisation des documents papier pour plus d'informations.

(24)
(25)

C HAPITRE 4

U TILISATION DE D ROP 2R EAD

Drop2Read est un utilitaire simple mais néanmoins efficace qui permet la reconnaissance instantanée des documents, sans que vous n'ayez à afficher Readiris. L'utilitaire Drop2Read est installé dans le cadre de l'installation par défaut de Readiris.

Pour traiter des documents :

 Il suffit de faire glisser vos documents vers l'icône Drop2Read dans le Dock.

 La fenêtre Drop2Read s'ouvre et Drop2Read traite vos documents en appliquant les paramètres par défaut.

Par défaut, Drop2Read traite les documents comme des documents en anglais, les formate comme des fichiers RTF et les enregistre dans le dossier source des fichiers d'origine.

(26)

Chapitre 4 – Utilisation de Drop2Read

20

Cliquez sur la liste pour modifier les paramètres. Tous les

paramètres modifiés sont enregistrés lorsque vous fermez la fenêtre Drop2Read. La prochaine fois que vous voudrez traiter des

documents au moyen des mêmes paramètres, il suffira de les faire glisser vers l'icône Drop2Read dans le Dock.

Notez que Drop2Read utilise des paramètres de base. Utilisez Readiris si vous souhaitez appliquer des paramètres avancés lors du traitement de documents.

Conseil : pour plus d'informations sur les formats de sortie disponibles, consultez la section Formatage de documents. Pour rappel, toutes les options ne s'appliquent pas à Drop2Read.

(27)

C HAPITRE 5

N UMÉRISATION ET OUVERTURE DE DOCUMENTS

S

ÉLECTION DES OPTIONS

Avant de numériser des documents papier ou d'ouvrir des fichiers image, vous pouvez sélectionner plusieurs options d'optimisation d'images. Lorsqu'elles sont sélectionnées, ces options sont

appliquées lors de l'ouverture et de la numérisation des documents.

Procédure

 Cliquez sur le bouton Options dans la barre d'outils principale pour sélectionner diverses options d'optimisation d'images.

o Cliquez sur Redressement des pages pour corriger l'angle éventuel des pages numérisées.

Si vous avez oublié d'activer cette option, cliquez sur l'icône Redresser la page de la barre d'outils Image ou cliquez sur la commande correspondante du menu Action.

L'image sera redressée et l'analyse de page sera executée à nouveau.

(28)

Chapitre 5 – Numérisation et ouverture de documents

22

o Cliquez sur Détection de l’orientation des pages pour faire pivoter les pages automatiquement afin qu'elles soient orientées correctement.

Notez que ces deux options ralentissent quelque peu la numérisation. Ne les sélectionnez qu'en cas de nécessité.

o Cliquez sur Elimination du bruit et déplacez le curseur pour indiquer la taille des points que vous désirez supprimer des images binarisées.

Les options précitées sont également disponibles dans le menu Configuration.

o L'option Analyse de page est activée par défaut.

De cette façon, les images numérisées ou ouvertes sont automatiquement découpées en zones.

Vous pouvez également utiliser les outils de zonage de la barre d'outils Image pour modifier les résultats de l'analyse de page ou pour appliquer un zonage manuel aux documents. Pour plus d'informations, consultez la section Zonage manuel des documents.

 Lorsque vous avez terminé de sélectionner les options voulues, cliquez sur le bouton Numériser ou Ouvrir pour numériser les documents ou ouvrir les fichiers image.

O

UVERTURE DE FICHIERS IMAGE

Readiris vous permet de traiter des documents papier numérisés avec votre scanner ou de traiter des fichiers image existants de différents formats.

(29)

Pour ouvrir des fichiers image existants :

 Cliquez sur le bouton Ouvrir pour rechercher des fichiers image.

Conseil : vous pouvez également faire glisser les fichiers image vers l'icône Readiris dans le Dock pour les ouvrir.

Conseil : tout en maintenant la touche Ctrl enfoncée, cliquez sur le fichier image à ouvrir, pointez ensuite sur Ouvrir avec et cliquez sur Readiris. Le logiciel Readiris s'ouvre et affiche l'image.

Conseil : lorsque vous chargez des documents PDF et des fichiers image de plusieurs pages (images TIFF), vous pouvez définir l'étendue de pages (dans le cas où vous avez uniquement besoin d'un chapitre spécifique d'un document, par exemple).

 Readiris prend en charge les formats d'image suivants : GIF, JPEG, JPEG 2000, MacPaint, Photoshop, PICT, PNG,

QuickDraw GX, QuickTime, Silicon Graphics, Targa, TIFF (non compressés ou compressés de type PackBits et Group 3), TIFF multipages, Windows Bitmap (BMP), et images de document PDF.

 Sélectionnez le fichier image de votre choix et cliquez sur Ouvrir.

Pour effectuer un zoom avant sur l'image ouverte, utilisez la loupe de la barre d'outils Image ou appuyez sur la touche Commande et cliquez à l'intérieur de l'image.

 Vous pouvez également ouvrir plusieurs fichiers image simultanément :

o Sélectionnez le premier fichier image puis, tout en maintenant la touche Commande enfoncée, sélectionnez les autres images.

(30)

Chapitre 5 – Numérisation et ouverture de documents

24

o Vous pouvez également sélectionner une plage de fichiers image contigus en sélectionnant la première image et la dernière tout en maintenant la touche Maj enfoncée.

Si vous voulez mettre fin au processus de chargement, appuyez sur la touche Echap.

Lorsque vous ouvrez plusieurs fichiers image simultanément, le tiroir s'ouvre et affiche les miniatures de page.

Notez que vous pouvez également faire glisser-déposer les fichiers image du Bureau vers l'icône Readiris dans le Dock pour les ouvrir.

Remarque : lorsque vous cliquez sur le bouton Ouvrir de la barre d'outils principale après avoir enregistré le document actif, vous êtes invité à indiquer si vous voulez supprimer ce document. Cliquez sur Non pour ajouter les fichiers image au document généré suite à la reconnaissance ou sur Oui pour créer un nouveau document.

N

UMÉRISATION DE DOCUMENTS PAPIER

Readiris vous permet de traiter des documents papier que vous pouvez numériser avec votre scanner ou de traiter des fichiers image existants de différents formats.

Pour numériser des documents :

 Sélectionnez les paramètres du scanner. Pour y accéder, dans le menu Readiris, cliquez sur Préférences.

(31)

Assurez-vous que votre scanner est connecté à votre Mac et configuré correctement. Si ce n'est pas le cas, les paramètres du scanner s'affichent.

Numériseur

Sélectionnez votre modèle de scanner dans la liste. Readiris prend en charge les scanners compatibles Twain et Image Capture.

Remarque : certains scanners prenant en charge à la fois les pilotes Twain et Image Capture peuvent apparaître deux fois dans la liste.

Calibrer

Cliquez sur le bouton Calibrer si vous devez effectuer un calibrage de votre scanner.

Format

Vous pouvez sélectionner le format de numérisation automatique ou un format personnalisé, pour lequel vous pouvez indiquer la hauteur et la largeur de page.

Profondeur

Readiris prend en charge les images noir et blanc, couleur et en niveaux de gris.

(32)

Chapitre 5 – Numérisation et ouverture de documents

26

Résolution

Sélectionnez une résolution de numérisation de 300 ppp.

Inverser l'image

Dans certains cas, les scanners Twain affichent du texte blanc sur fond noir lors de la numérisation en noir et blanc. Pour inverser les résultats, sélectionnez l'option Inverser l'image.

Remarque : cette option est disponible uniquement avec les scanners Twain.

 La fenêtre Préférences propose également plusieurs options de prétraitement :

o Vous pouvez choisir de lisser les images en niveaux de gris et en couleurs.

Cette fonction agit pendant la numérisation en lissant les différences d'intensité, de sorte que les images couleur et en niveaux de gris sont plus uniformes. En conséquence, le contraste est plus marqué entre l'avant-plan (texte) et l'arrière-plan (illustration). Le lissage représente parfois la seule solution pour distinguer le texte d'un arrière-plan coloré.

Remarque : cette fonction n'agit pas de la même façon que celle figurant dans les options Ajuster l'image accessible via le menu Action.

o Sélectionnez Traiter comme 300 ppp lorsque vous traitez des images dont la résolution n'est pas correcte ou connue.

Les images seront traitées comme si elles possédaient une résolution de 300 ppp.

La plupart du temps, la résolution des photos numériques est inconnue.

o Sélectionnez Appareil photo numérique lorsque vous utilisez un appareil photo numérique comme source de

(33)

numérisation. Readiris fait appel à des routines de reconnaissance spéciales pour traiter les images obtenues au moyen d'un appareil photo numérique.

Readiris prend en charge les appareils photo Sony, HP, Canon, Casio et Fuji comme sources de numérisation. Notez toutefois que vous pouvez charger des photos TIFF et JPEG existantes provenant de tous types d'appareils photo.

Conseils en cas d'utilisation d'un appareil photo numérique comme source de numérisation :

Calibrez l'appareil en prenant une photo d'un document de couleur blanche.

Sélectionnez toujours la résolution d'image la plus élevée.

Activez le mode macro de l'appareil afin de faire un gros plan.

Utilisez uniquement le zoom optique et non numérique.

Placez l'appareil photo directement au-dessus du document.

Evitez de photographier ce dernier sous un angle quelconque.

Prenez des photos stables. Le cas échéant, utilisez un pied.

Désactivez le flash si vous photographiez un papier brillant.

Evitez d'ouvrir les photos compressées.

Adaptez les paramètres de contraste et de luminosité de Readiris à l'environnement (lumière du jour, artificielle, néon).

Sélectionnez couleur ou niveaux de gris comme mode couleur.

 Une fois les paramètres définis, cliquez sur OK.

 Cliquez ensuite sur le bouton Numériser pour numériser les documents.

(34)

Chapitre 5 – Numérisation et ouverture de documents

28

Remarque : faites attention au désalignement. Un désalignement supérieur à 0,5 augmente le risque d'erreurs de reconnaissance OCR.

(35)

C HAPITRE 6

O PTIMISATION DES DOCUMENTS NUMÉRISÉS

Pendant la reconnaissance, Readiris convertit les images en

couleurs et en niveaux de gris en images en noir et blanc binarisées, puis leur applique la reconnaissance OCR. Lorsque vous ouvrez ou numérisez des images en couleurs ou en niveaux de gris très claires ou très foncées, il est parfois nécessaire d'optimiser leurs

équivalents binarisés avant de procéder à leur reconnaissance afin d'obtenir des résultats OCR satisfaisants.

Pour optimiser les images :

 Ouvrez ou numérisez un document couleur ou en niveaux de gris.

Vérifiez que les paramètres du scanner sont corrects.

 Dans le menu Action, cliquez sur Ajuster l'image. Vous pouvez également cliquer sur l'icône correspondante dans la barre d'outils Image.

Readiris utilise des routines de binarisation intelligentes pour convertir les images couleur ou en niveaux de gris en images en noir et blanc, utilisées pour la reconnaissance OCR.

o Sélectionnez Lisser les images en niveaux de gris et en couleurs pour obtenir une image plus homogène.

(36)

Chapitre 6 – Optimisation des documents numérisés

30

Grâce à cette option, qui lisse les différences d'intensité, les images en couleurs et en niveaux de gris sont plus uniformes. En conséquence, le contraste est plus marqué entre l'avant-plan (texte) et l'arrière-plan (illustration).

Remarque : cette option semble équivalente à celle du menu

Préférences mais elle est appliquée au cours d'une phase différente du processus de reconnaissance.

Remarque : le lissage représente parfois la seule manière de distinguer le texte d'un arrière-plan coloré.

(Image d'origine)

(Image en noir et blanc binarisée)

(Image lissée)

o Utilisez le curseur pour augmenter ou diminuer la valeur de luminosité.

Les paramètres de luminosité déterminent la luminosité globale de l'image. Utilisez-les pour foncer ou éclaircir l'image lorsque le texte est illisible.

Exemple 1 : éclaircir une image sombre afin d'éliminer l'arrière-plan de la page.

(37)

(Image couleur)

(Image numérisée. Les paramètres de binarisation par défaut génèrent une image noire.)

(L'image éclaircie donne des résultats de reconnaissance satisfaisants.) Exemple 2 : foncer une image lorsque le texte est tellement clair qu'il n'apparaît pas dans l'image binarisée.

(Image couleur)

(Image numérisée. Les paramètres de binarisation par défaut génèrent des caractères fragmentés.)

(38)

Chapitre 6 – Optimisation des documents numérisés

32

(L'image plus foncée donne des résultats de reconnaissance satisfaisants.)

o Utilisez le curseur pour augmenter ou diminuer la valeur de contraste.

Les paramètres de contraste déterminent le contraste entre les zones plus claires et plus foncées d'une image. Utilisez-les pour faire ressortir les formes des caractères dans un arrière-plan coloré.

(Image couleur)

(Les paramètres de contraste par défaut génèrent des caractères fragmentés.)

(Des paramètres de contraste plus élevés donnent des résultats de reconnaissance satisfaisants.)

o Utilisez le curseur pour augmenter ou diminuer les valeurs des options Eliminer le bruit.

L'élimination du bruit permet d'enlever des petites taches dans les images en noir et blanc.

(39)

Remarque : cette fonction d'élimination du bruit n'est pas la même que celles du menu Configuration et de la barre d'outils principale (sous Options) ; elle s'applique aux images binarisées tandis que les deux autres sont appliquées pendant la numérisation.

 Cliquez sur Appliquer pour afficher un aperçu des résultats.

 Si les résultats sont satisfaisants, cliquez sur OK pour enregistrer les paramètres et quitter. Dans le cas contraire, cliquez sur Annuler et modifiez à nouveau les paramètres.

 Cliquez sur Reconnaître + Enregistrer pour lancer la reconnaissance du document.

Vous pouvez également utiliser la commande Enregistrer le document du menu Fichier.

Il est également possible d'enregistrer une sélection de pages en cliquant sur Enregistrer les pages sélectionnées dans le menu Fichier.

(40)
(41)

C HAPITRE 7

Z ONAGE DES DOCUMENTS

Z

ONAGE AUTOMATIQUE DES DOCUMENTS

Lorsque vous numérisez ou ouvrez des documents, Readiris exécute automatiquement la fonction Analyse de page pour fractionner les documents en plusieurs zones.

L'option Analyse de page est activée par défaut. Cliquez sur le bouton Options et désactivez Analyse de page si vous souhaitez éviter l'analyse de page automatique.

Les résultats de l'analyse de page peuvent être modifiés manuellement après l'analyse de page automatique. Pour plus d'informations, consultez la section Zonage manuel des documents.

Les résultats de l'analyse de page peuvent également être enregistrés dans un fichier de zonage, que vous pouvez réutiliser en tant que modèle de zonage chaque fois que vous numériser des documents présentant une mise en page similaire. Pour plus d'informations, consultez la section Utilisation des modèles de zonage.

(42)

Chapitre 7 – Zonage des documents

36

Types de zones

Readiris utilise cinq types de zones : zones de texte, zones d'image, zones de tableau, zones de code à barres et zones de texte manuscrit.

L'analyse de page détecte automatiquement les zones de texte, d'image, de tableau et de code à barres. Les zones de texte manuscrit doivent être tracées manuellement.

Pour plus d'informations, consultez la section Zonage manuel des documents.

Chaque type de zone possède sa propre icône :

Les zones sont triées de haut en bas et de gauche à droite. Des numéros indiquent l'ordre de tri des zones. Il est toutefois possible de modifier l'ordre de tri et les types de zones. Pour plus

d'informations, consultez la section Zonage manuel des documents.

Ne pas détecter les zones sur les bords

Lorsque votre scanner génère des bordures noires autour de l'image, l'analyse de page a tendance à détecter des zones là où il n'y a que du bruit.

Pour empêcher ce type de détection, cliquez sur Ne pas détecter les zones sur les bords dans le menu Zones et renumérisez le

document.

Encadrer une région à analyser

En guise d'alternative au zonage automatique des documents, il est possible d'utiliser la fonction Encadrer une région à analyser.

Cette fonction est utile lorsque la reconnaissance OCR ne doit

(43)

s'appliquer qu'à une seule zone spécifique dans les pages du document.

Sélectionnez Encadrer une région à analyser en cliquant sur le bouton correspondant dans la barre d'outils Image.

Dessinez un cadre autour de la partie de la page à laquelle Readiris doit appliquer la reconnaissance. Cliquez ensuite sur Reconnaître + Enregistrer.

Vous êtes invité à indiquer si vous voulez appliquer la même zone de reconnaissance à toutes les pages du document actif.

Z

ONAGE MANUEL DES DOCUMENTS

En plus du zonage automatique des documents réalisé à l'aide de l'analyse de page, Readiris permet d'appliquer un zonage manuel aux documents.

Le zonage manuel est pratique lorsque vous devez modifier les résultats de l'analyse de page automatique. Il permet également de créer des modèles de zonage.

Pour plus d'informations sur les modèles, consultez la section Utilisation des modèles de zonage.

Notez que les zones de texte manuscrit doivent toujours faire l'objet d'un zonage manuel.

Procédure

 Pour appliquer un zonage manuel à un document, commencez par cliquer sur le bouton Options puis désactivez Analyse de page.

(44)

Chapitre 7 – Zonage des documents

38

 Ouvrez ou numérisez le document en cliquant sur le bouton Numériser ou Ouvrir.

 Sélectionnez le type des zones que vous souhaitez définir : cliquez sur l'icône représentant un pointeur dans la barre d'outils de droite et sélectionnez le type de zone voulu.

Readiris utilise cinq types de zones : zones de texte, zones d'image, zones de tableau, zones de code à barres et zones de texte manuscrit.

 Dessinez un cadre autour des zones à analyser.

Pour plus d'informations sur la reconnaissance des codes à barres et du texte manuscrit, consultez les sections Reconnaissance des codes à barres et Reconnaissance de texte manuscrit.

 Pour sélectionner d'autres types de zones, cliquez sur l'icône du type de zone actuellement sélectionné, puis choisissez le type de zone voulu.

 Vous pouvez également cliquer sur le menu Zones, puis pointer sur Mode interactif et sélectionner la zone à définir.

(45)

 Lorsque la définition des zones de reconnaissance est terminée, cliquez sur Reconnaître + Enregistrer pour lancer la

reconnaissance OCR.

Tri des zones

 Pour modifier l'ordre de tri des zones, cliquez sur le bouton Trier dans la barre d'outils Image et cliquez successivement sur les différentes zones dans l'ordre voulu.

 Vous pouvez également cliquer sur le menu Zones puis sur Trier les zones.

 Pour terminer le tri, cliquez à l'extérieur d'une zone.

 Une fois terminé, cliquez sur Reconnaître + Enregistrer pour lancer la reconnaissance.

Les zones non sélectionnées sont exclues de la reconnaissance.

Dessin de polygones

Le zonage manuel de documents n'est pas limité à des formes rectangulaires. Vous pouvez créer des zones polygonales en fusionnant des zones rectangulaires. Chaque fois que deux zones du même type se touchent, elles forment automatiquement un

polygone.

(46)

Chapitre 7 – Zonage des documents

40

Analyse de page automatique

Si la page active est trop complexe pour un zonage manuel, cliquez sur le bouton Analyser la page dans la barre d'outils Image afin de réaliser un zonage automatique de la page.

Notez que les zones de texte manuscrit et de code à barres doivent toujours être délimitées manuellement.

Modification du type de zone

Pour modifier le type de zone, appuyez sur la touche Ctrl et cliquez sur la zone puis sélectionnez le type de zone requis.

Vous pouvez également changer simultanément le type de plusieurs zones :

(47)

 Cliquez sur l'icône représentant un pointeur dans la barre d'outils Image, puis cliquez sur Sélectionner des zones.

Conseil : si l'icône représentant un pointeur n'est pas visible dans la barre d'outils Image, cela signifie que l'un des cinq types de zones est actuellement sélectionné. Cliquez sur les icônes correspondantes dans la barre d'outils, puis cliquez sur Sélectionner des zones.

 Tout en maintenant la touche Maj enfoncée, sélectionnez plusieurs zones.

 Dans le menu Zones, pointez sur Type de zone et cliquez sur le type de zone souhaité.

Modification de la taille d'une zone

 Cliquez dans la zone à modifier.

 Placez le pointeur de la souris sur un marqueur (sur les côtés et dans les angles de la zone).

 Cliquez sur le marqueur et faites glisser le pointeur de la souris afin de modifier la taille de la zone.

Déplacement de zones

 Sélectionnez la zone à déplacer.

(48)

Chapitre 7 – Zonage des documents

42

 Cliquez à l'intérieur de la zone et faites glisser le pointeur de la souris afin de modifier la position de la zone.

Reconnaissance d'une zone spécifique

 Appuyez sur la touche Ctrl et cliquez sur la zone auxquelles appliquer la reconnaissance, puis sélectionnez Copier le texte.

Les résultats sont envoyés au Presse-papiers en tant que texte continu.

Cette commande fonctionne également pour le texte manuscrit.

Il est également possible de copier les zones d'image et les zones de code à barres dans le Presse-papiers.

Reconnaissance de toutes les zones de texte

Pour soumettre toutes les zones de texte d'une page à la

reconnaissance, cliquez sur la commande Copier les zones de texte dans le menu Zones. Ces zones sont copiées dans le Presse-papiers.

Reconnaissance de toutes les zones d'image

Pour soumettre tre toutes les zones d'image d'une page à la

reconnaissance, cliquez sur la commande Copier les zones d'image dans le menu Zones. Ces zones sont copiées dans le Presse-papiers.

Suppression de zones

 Sélectionnez la ou les zones à supprimer ou cliquez sur la commande Supprimer toutes les zones dans le menu Zones.

 Sélectionnez les commandes Couper ou Effacer dans le menu Edition pour couper ou supprimer les zones.

(49)

Suppression de petites zones

Certains documents, les télécopies par exemple, comportent des points « dispersés » sur les pages, ce qui conduit Readiris à créer des zones inutiles qui ne contiennent pas de texte.

Pour effacer toutes ces zones de petite taille, cliquez sur Supprimer les petites zones dans le menu Zones.

Cette option efface toutes les zones de taille inférieure à 0,5" et retrie les zones restantes.

U

TILISATION DES MODÈLES DE ZONAGE

Lorsque vous effectuez une reconnaissance d'un grand nombre de documents présentant une mise en page similaire, il peut être utile d'avoir recours aux modèles de zonage plutôt qu'à l'analyse de page. De cette façon, la même structure de zones est appliquée à tous les documents numérisés ou ouverts, ce qui permet d'accélérer le processus.

Procédure

 Cliquez sur Options dans la barre d'outils principale et désactivez Analyse de page.

Ouvrez votre document et procédez au zonage manuel de la première page du document à l'aide des boutons de la barre d'outils Image.

Pour plus d'informations, consultez la section Zonage manuel des documents.

 Dans le menu Zones, cliquez sur la commande Enregistrer.

(50)

Chapitre 7 – Zonage des documents

44

 Ouvrez ou numérisez les autres pages du document en cliquant sur le bouton Numériser ou Ouvrir dans la barre d'outils principale.

Les zones sont appliquées aux documents ouverts ou numérisés.

Si vous souhaitez appliquer le même modèle de zonage la prochaine fois que vous utilisez Readiris, cliquez sur la commande Ouvrir dans le menu Zones.

Encadrer une région à analyser

En guise d'alternative aux modèles de zonage, il est possible d'utiliser la fonction Encadrer une région à analyser. Celle-ci vous permet de définir la zone spécifique de la page devant faire l'objet de la reconnaissance. Toutes les données à l'extérieur de la zone d'OCR sont exclues de la reconnaissance.

Procédure

 Sélectionnez Encadrer une région à analyser en cliquant sur le bouton correspondant dans la barre d'outils Image.

 Dessinez un cadre autour de la partie de la page à laquelle Readiris doit appliquer la reconnaissance.

Vous êtes invité à indiquer si vous voulez appliquer la même zone de reconnaissance à toutes les pages du document actif.

Pour annuler cette fonction, réexécutez l'analyse de page en cliquant sur le bouton Analyser la page dans la barre d'outils Image.

 Cliquez sur Reconnaître + Enregistrer pour exécuter l'OCR.

(51)

Vous pouvez également utiliser la commande Enregistrer le document du menu Fichier.

Il est possible d'enregistrer une sélection de pages en cliquant sur Enregistrer les pages sélectionnées dans le menu Fichier.

(52)
(53)

C HAPITRE 8

R ECONNAISSANCE DES DOCUMENTS

I

NTRODUCTION

Pour la reconnaissance des documents, Readiris applique une analyse linguistique au cours de l'étape de reconnaissance. Cette méthode lui permet d'effectuer la reconnaissance du texte, des tableaux, des images, des codes à barres et du texte manuscrit dans tous les types de documents. Readiris traite même les documents disposés en colonnes complexes ou de piètre qualité, les télécopies, les impressions matricielles, les documents mal numérisés ou copiés contenant des caractères trop clairs ou trop foncés, etc.

Readiris prend en charge 125 langues : toutes les langues d'Amérique et d'Europe, y compris les langues d'Europe centrale, les langues baltes, le grec, le turc et le cyrillique. Grâce à des modules complémentaires en option, Readiris est capable de lire des documents en hébreu et dans quatre langues asiatiques, à savoir le japonais, le coréen, le chinois simplifié et le chinois traditionnel.

Readiris peut même traiter les documents combinant des alphabets différents : le logiciel détecte les mots « occidentaux » qui

ressortent des documents en grec, en cyrillique, en langue asiatique et en hébreu puisque bon nombre de noms propres intranscriptibles, de noms de marques, etc. sont écrits à l'aide des symboles

occidentaux.

Readiris repose sur les technologies de reconnaissance les plus évoluées. La reconnaissance du texte indépendante de la police est

(54)

ReadirisTM Pro 12 – Guide Utilisateur

47

C HAPITRE 8

R ECONNAISSANCE DES DOCUMENTS

I

NTRODUCTION

Pour la reconnaissance des documents, Readiris applique une analyse linguistique au cours de l'étape de reconnaissance. Cette méthode lui permet d'effectuer la reconnaissance du texte, des tableaux, des images, des codes à barres et du texte manuscrit dans tous les types de documents. Readiris traite même les documents disposés en colonnes complexes ou de piètre qualité, les télécopies, les impressions matricielles, les documents mal numérisés ou copiés contenant des caractères trop clairs ou trop foncés, etc.

Readiris prend en charge 125 langues : toutes les langues d'Amérique et d'Europe, y compris les langues d'Europe centrale, les langues baltes, le grec, le turc et le cyrillique. Grâce à des modules complémentaires en option, Readiris en capable de lire des documents en hébreu et dans quatre langues asiatiques, à savoir le japonais, le coréen, le chinois simplifié et le chinois traditionnel.

Readiris peut même traiter les documents combinant des alphabets différents : le logiciel détecte les mots « occidentaux » qui

ressortent des documents en grec, en cyrillique, en langue asiatique et en hébreu puisque bon nombre de noms propres intranscriptibles, de noms de marques, etc. sont écrits à l'aide des symboles

occidentaux.

Readiris repose sur les technologies de reconnaissance les plus évoluées. La reconnaissance du texte indépendante de la police est

(55)

complétée par des techniques d'auto-apprentissage. Le système est capable d'apprendre de nouveaux mots et caractères grâce à une analyse contextuelle et linguistique. En d'autres termes, la précision de l'OCR s'améliore avec le temps et l'utilisation.

En outre, Readiris offre une fonction de vérification utilisateur.

Lorsqu'elle est activée, la fonction de vérification utilisateur

(apprentissage interactif) marque les caractères considérés comme douteux par le système de reconnaissance et permet également d'améliorer la précision de la reconnaissance. Toutes les solutions que vous validez sont enregistrées temporairement dans la mémoire du système, ce qui non seulement le rend plus rapide et plus fiable au fil du temps mais également plus intelligent. Ce puissant outil d'apprentissage interactif permet également à Readiris de reconnaître des caractères spéciaux, notamment les symboles mathématiques et les signes typographiques, et de traiter les polices déformées.

Les résultats de l'apprentissage interactif peuvent être enregistrés de façon permanente dans des dictionnaires de polices pour utilisation ultérieure.

S

ÉLECTION DE LA LANGUE DU DOCUMENT

Readiris offre des fonctionnalités d'OCR dans 125 langues. Il prend en charge toutes les langues d’Amérique et d’Europe, y compris les langues d’Europe centrale, les langues baltes, le grec, le turc et le cyrillique.

Readiris Pro Asian et Readiris Corporate Asian permettent en outre la reconnaissance des documents en japonais, en chinois simplifié et traditionnel ainsi qu'en coréen.

Pour que Readiris puisse exécuter la reconnaissance d'un document, vous devez préciser sa langue.

(56)

ReadirisTM Pro 12 – Guide Utilisateur

49 Pour ce faire, procédez comme suit :

Cliquez sur l'icône représentant un globe dans la barre d'outils principale et sélectionnez la langue de votre choix dans la liste déroulante.

Important : sélectionnez la langue du document avant d'exécuter l'analyse de page lorsqu'il s'agit de documents asiatiques, hébreux ou arabes. Des routines d'analyse de page spécifiques sont utilisées pour ces documents.

Conseil : au cas où vous voudriez effectuer la reconnaissance de documents multilingues, veillez à sélectionner la langue comportant le jeu de caractères le plus étendu. Par exemple, pour la reconnaissance d'un document contenant du texte en anglais et en français,

sélectionnez le français comme langue du document. De cette façon, les accents seront reconnus correctement.

La reconnaissance peut également être limitée à un jeu de caractères numérique pour optimiser la reconnaissance des tableaux et des chiffres. Readiris reconnaît alors uniquement les chiffres entre 0 et 9 ainsi que les symboles suivants :

+ signe plus

* astérisque

/ barre

% pourcentage

, virgule

(57)

oblique .

point

( parenthèse d'ouverture

) parenthèse de fermeture

- tiret

= signe égal

$ dollar

£ livre sterling

euro

¥ yen

Pour activer le mode numérique, sélectionnez Numérique dans la boîte de dialogue Langue.

Reconnaissance de documents multilingues

Readiris permet également d'activer la reconnaissance de jeux de caractères mixtes. De cette façon, Readiris change automatiquement de langue en milieu de phrase et reconnaît les mots anglais (noms propres, etc.) conservés dans des langues dites "exotiques".

Cliquez sur le bouton représentant un globe dans la barre d'outils principale et sélectionnez la combinaison de langues de votre choix dans la liste déroulante.

Remarque : lors du traitement de documents en arabe ou en hébreu, les jeux de caractères mixtes sont automatiquement utilisés.

Sélection de la langue par page

Si certaines pages utilisent une autre langue que la totalité du document, il n'est pas nécessaire de définir une langue secondaire. Il est possible d'appliquer une langue différente à ces pages.

Sélectionnez la ou les pages en question dans le tiroir, cliquez dessus tout en maintenant la touche Ctrl enfoncée, puis utilisez la commande Langue pour leur affecter une autre langue que la langue du document.

(58)

ReadirisTM Pro 12 – Guide Utilisateur

51

Les pages dont la langue est différente de celle de la langue du document sont marquées en rouge dans le tiroir.

Remarque : une infobulle accompagne chaque page dans le tiroir pour indiquer la langue qui lui est appliquée.

D

ÉFINITION DES CARACTÉRISTIQUES DU DOCUMENT

Outre la langue du document, d'autres caractéristiques de document, le type de police et l'espacement des caractères, jouent

notamment un rôle important dans le processus de reconnaissance.

(59)

Type de police

Readiris distingue les documents dits « normaux » et les documents d'impression matricielle. Les symboles matriciels (du type

9 aiguilles) sont composés de points distincts.

Des techniques de segmentation et de reconnaissance spéciales sont nécessaires pour la reconnaissance des documents d'impression matricielle et doivent être activées.

Pour sélectionner le type de police :

 Dans le menu Configuration, pointez sur Type de police.

 Par défaut, le type de police a la valeur Automatique.

De cette façon, Readiris reconnaît les impressions matricielles « 25 aiguilles » ou « NLQ » (qualité quasi-courrier) ou d'autres types d'impression « normale ».

 Pour que la reconnaissance s'applique uniquement aux documents d'impression matricielle, cliquez sur Matricielle.

Readiris appliquera la reconnaissance aux documents d'impression matricielle de qualité « brouillon » ou à « 9 aiguilles ».

Espacement des caractères

L'espacement des caractères est le nombre de caractères par pouce dans un type de caractère. L'espacement des caractères peut être fixe, auquel cas tous les caractères ont la même largeur, ou proportionnel, auquel cas leur largeur est différente.

Pour sélectionner l'espacement des caractères :

 Dans le menu Configuration, pointez sur Espacement des caractères.

(60)

ReadirisTM Pro 12 – Guide Utilisateur

53

 Par défaut, l'espacement a la valeur Automatique.

 Cliquez sur Fixe si tous les caractères ont la même largeur. C'est souvent le cas dans les documents dactylographiés avec

d'anciennes machines à écrire.

 Cliquez sur Proportionnel si les caractères ont une largeur différente. La vaste majorité des polices utilisées dans les journaux, magazines et livres est proportionnelle.

Important : ces caractéristiques de document ne s'appliquent pas aux documents en langue asiatique, arabe ou hébreu.

U

TILISATION DE L

'

APPRENTISSAGE INTERACTIF Readiris propose une fonction d'apprentissage interactif. Grâce à l'apprentissage interactif, vous pouvez « former » le système à la reconnaissance des polices et des formes des caractères et, le cas échéant, corriger les résultats de l'OCR. Lors de cette phase d'apprentissage interactif, tous les caractères non formellement reconnus par le système sont affichés dans une fenêtre d'aperçu, accompagnés de leur mot parent et de la solution proposée.

Cet apprentissage peut sensiblement améliorer la précision du système de reconnaissance et est particulièrement utile pour la reconnaissance des caractères dégradés et déformés. Il permet également d'apprendre à Readiris à reconnaître les symboles spéciaux qu'il n'arrive pas à identifier de prime abord, notamment les symboles mathématiques et scientifiques ainsi que les signes typographiques.

(61)

Pour activer l'apprentissage interactif :

 Dans le menu Apprentissage, cliquez sur Apprentissage interactif.

 Cliquez sur le bouton Reconnaître + Enregistrer pour effectuer la reconnaissance du document. Readiris passe en phase

d'apprentissage interactif.

Les caractères jugés douteux par le système de reconnaissance sont affichés.

Si les résultats sont corrects :

o Cliquez sur le bouton Apprendre pour enregistrer les résultats confirmés.

Les résultats de l'apprentissage sont stockés temporairement dans la mémoire de l'ordinateur pour la durée de la reconnaissance. Readiris n'affiche plus les caractères préalablement « appris » lorsqu'il effectue la reconnaissance du reste du document.

Lorsqu'un nouveau document fait l'objet d'une reconnaissance, les résultats de l'apprentissage sont effacés.

(62)

ReadirisTM Pro 12 – Guide Utilisateur

55

Pour enregistrer définitivement les résultats de l'apprentissage, utilisez un dictionnaire de polices. Pour plus d'informations, consultez la rubrique Utilisation des dictionnaires de polices.

o Cliquez sur Finir pour enregistrer toutes les solutions proposées par le logiciel.

Si les résultats ne sont pas corrects :

o Entrez les caractères corrects et cliquez sur le bouton Apprendre.

Remarque : lorsque vos documents contiennent des caractères spéciaux, veillez à cliquer sur la commande Caractères spéciaux du menu Edition. Double-cliquez sur le caractère à insérer.

ou

o Cliquez sur le bouton Ne pas apprendre pour enregistrer les résultats comme étant douteux.

Utilisez cette commande pour les caractères endommagés qui pourraient être confondus avec d'autres caractères s'ils étaient enregistrés comme

(63)

étant confirmés, par exemple, le nombre 1 et la lettre I, qui présentent une forme identique dans de nombreuses polices.

o Cliquez sur Supprimer pour supprimer les caractères de la sortie.

Utilisez ce bouton pour éviter que des caractères parasites (bruit) n'apparaissent dans le fichier de sortie.

o Cliquez sur Annuler pour corriger des erreurs.

Readiris peut assurer le suivi des 32 dernières opérations.

o Cliquez sur Interrompre pour interrompre l'apprentissage interactif.

Tous les résultats de l'apprentissage seront supprimés. La prochaine fois que vous cliquez sur Reconnaître + Enregistrer, l'apprentissage interactif est réexécuté.

U

TILISATION DES DICTIONNAIRES DE POLICES Lorsque vous numérisez de nombreux documents de mêmes type, qualité de police et qualité d'impression, vous souhaitez parfois éviter de répéter le processus d'apprentissage. Dans un tel cas, l'emploi de dictionnaires de polices s'avère utile. Les dictionnaires de polices contiennent des informations sur les polices assimilées par le programme lors de l'apprentissage interactif et peuvent améliorer sensiblement les résultats de la reconnaissance.

Notez que les dictionnaires de polices sont limités à 500 formes. Il est recommandé de créer des dictionnaires distincts pour des applications spécifiques.

Pour créer un nouveau dictionnaire de polices :

Références

Documents relatifs

Appuyez deux fois sur l'image de la partie ou l'écran d'ordinateur partagé que vous souhaitez masquer, puis appuyez sur l'icône affichée en haut à droite.. Pour afficher une

§ Pour en savoir plus sur la transmission de votre vidéo à votre enseignant, reportez-vous au tutoriel « Comment transmettre ma vidéo à mon

26 Les dispositifs magnétiques alternatifs, tores ferromagnétiques à partir de 1949, cartes dans les années 1950, disques souples après 1969, retour des bandes avec le « twistor »

Dès que la vidéo est validée, le lien de visionnage en ligne et le lien de téléchargement sont disponibles et peuvent être obtenus en cliquant sur la vidéo souhaitée dans

Avant de vous donner le code de votre fichier .php (qui, je le rappelle, doit afficher une valeur du fichier), nous allons réfléchir à ce qu'il y aura dans ce code.. Tout d'abord,

2) Représenter graphiquement la suite (laisser cette représentation graphique sur la même feuille).

2) Représenter graphiquement la suite (laisser cette représentation graphique sur la même feuille).

L’utilisation des attelles moulées ou des accessoires orthopédiques (généralement support rigide) conçus pour immobiliser une partie du corps pour lui permettre de se reposer