DEMATERIALISATION de DOCUMENTS courrier
formulaires f t
a CEGEKA Group Company
factures
17 mars 2011
•20 Mai 2010: gestion de courrier
•27 Mai 2010: le portail collaboratif Novembre 2010 : MS SharePoint 2010
•Novembre 2010 : MS SharePoint 2010
•Mars 2011 : dématérialiser des documents
•Avril 2011 : Jahia, solution de Content Management System (CMS)
•Mai 2011: la mise en place de dossiers électroniques
•Octobre 2011: la législation documentaire + solutions d’archivage
a CEGEKA Group Company
9 With about 1.450 people and a total turnover of 160 million euro, Cegeka positions itself within the Cegeka positions itself within the top 10 of end-to-end ICT solution providers in the Benelux.
9 Cegeka is a unique and complete supplier that covers all the elements of the ICT value chain;
from consulting and development to ’full’ outsourcing.
OFFICES Hasselt Leuven Antwerpen Waregem Brussel Liège Luxembourg Namur Veenendaal Gorinchem
to full outsourcing. Gorinchem
Rotterdam Paris (Lille) Bucharest/RUO DATA CENTERS Hasselt Leuven Veenendaal
Actionnariat : 100 % capitaux belges
Création en … : 1993
Fonds propresFonds propres : 4 897 000 €: 4.897.000 €
Capital : 2.136.000 €
C.A. 2009 : 24.077.300 €
Estimation 2010 : 24.250.000 €
Effectif : 240 personnes
a CEGEKA Group Company
Progression sur 5 ans de ± 50 %
Infrastructure
Applications
Expertise
a CEGEKA Group Company
Cegeka/NSI
Development &
Modernization (.NET, Java, Oracle RPG ) Enterprise Content
Management & Document
Management Systems ERP
Oracle, RPG, …)
• Fixed price assignments
• Agile Methodology
• Filenet
• Sharepoint
• Alfresco
• Jahia
• …
Heathcare Solutions
• Laboratoring Solutions
• Medical File
• Electronic Medication, N i
• Dynamics AX
• Dynamics NAV
• CMMS (Coswin)
• WMS (SLS)
• BI
GIS B i Nursing
• …
• Business applications
• Oracle Spatial Expertise
APPLICATIONS
Portal
DMS WCM
Workflow
BPM/e-form Interoperability Search to IT systems
D t d
Record Management
Collaboration Integration
a CEGEKA Group Company
ECM
Data, e-doc
Knowledge Management
ECM & GED
DEMAT CMS
SCANNERS STORAGE ARCHIVAGE
Connecteur Outlook – SharePoint Connecteur Outlook – Alfresco Moteur de recherche DocFlow, …..
a CEGEKA Group Company
AGENDA
08h45 Accueil 09h15 Introduction
09h30 Numériser le courrier entrant
10h00 Dématérialiser des formulaires et classer ses dossiers 10h30 Break café
11h00 Dématérialiser les factures + Témoignage de CORA 12h00 Questions et réponsesQ p
12h15 Cocktail et Lunch (clôture vers 13h30)
DEMATERIALISATION … kesako …
Papier ‐> computer
Scanning (numérisation)
S i i t lli t
Scanning « intelligent »
Extraction de données
Préparation d’indexation
Structurée
Non structurée (texte in extenso)
a CEGEKA Group Company
Industrialisation du processus de numérisation et d’indexation
‐> data processing
‐> document management
DEMATERIALISATION : la chaîne de traitement
numérisation (scanning) & extraction
Numérisation Î ICR-IWR Î Analyse ÎVidéo-codage Î vers GED/ECM
Imaging process OCR-OMR ERP
Image Î Texte Î Données Î Corrections & Î Processing logique métier
lecture analyse
Digital mailroom :
Dématérialiser et automatiser le traitement des flux entrants
a CEGEKA Group Company
Gestion multi‐canaux du courrier entrant
Capture
Scan Email eForms Spooling Processus
Traitement
Indépendant du canal d’entrée Dépendant du canal interne
Classement, Indexation en étape Traitement Traitement Diffusion Archivage Suivi
…
Finances
Courrier HR
Processus classique dématérialisation
Préparation Prépare les pages Séparation en « tas »
•Code barre
•Séparateurs
•(patch code,
•Cover sheet)
Export PDF/A Image + text Export vers le processus de gestion de documents entrants Scan
Local ou distant
Import de Fax, Multifonction,..
Amélioration matérielle de la qualité (VRS)
Reconnaissance Processus 100%
automatique Form ID
OCR/ICR
Validation / Indexation Valeur Index <-> Image
Validation, correction, encodage
a CEGEKA Group Company
documents entrants OMR
Bar code
QC / Rescan Détection des pages en double,…
Gestion du « Hors format »
??
->
Reconnaissance automatique
Imprimé (OCR) Code Barre
Logo (Form id)
Manuscrit (ICR)
Règles de Marques
(OMR)
Validation
Modules Spécifiques
<-
Digital mailroom :
Fonctions principales:
Dématérialisation
Qualifier (indexation), quelles informations ?( ), q
Informations liées à l’événement (Nature, Type de demande, Dates, Objet, Réf)
Informations liées au correspondant(Nom société/Expéditeur/interlocuteur,… Æ enrichissement possible (CRM/ERP/DB) infos : Adresse complète, Téléphone, Fax, Email, dossier)
Informations liées au traitement (Accusé de réception (OUI – NON), Confidentialité, Urgence, Délai de traitement)
Informations liées à la Diffusion / Validation (Liste de diffusion (par ligne) Destinataire, Action, Date de diffusion, Délai traitement)
Flux « Diffusion/ Distribution » lid ti i i
a CEGEKA Group Company
Flux « Diffusion/ Distribution » validation, courrier in, traitement demande, … (modèle, ad‐hoc…)
Classements dynamiques:
Systèmes cibles : GEIDE, ECM, DMS, ERP, CRM…
Intégration GED dossier et application métier
Digital mailroom :
un système de gestion adaptés aux besoins Avantages
Disponibilité
Fiabilité / Exhaustivité
Meilleur contrôle de gestion (processus, prise en charge, gestionMeilleur contrôle de gestion (processus, prise en charge, gestion des rôles…)
Gestion/amélioration des délais
Historisation
Liste des tâches
Notion de délégation, « out of office »
Archivage
La solution est fortement dépendante du contextep
Nombre d’utilisateurs
Types d’événements (courriers, fax, mails, …)
Nombre d’événements
Localisation des points d’entrée et de sortie
…
Démo
Préparation
Scan
Page de séparation par secteur ou nature de courrier ÆEtiquette d’identification non équivoque
Page de séparation par secteur ou nature de courrier ÆEtiquette d’identification non équivoque
Page de séparation par secteur ou nature de courrier ÆEtiquette d’identification non équivoque
a CEGEKA Group Company
Processus Courriers GED/ECM e-dossier
Dématérialisation de formulaires :
Dématérialiser et automatiser via le traitement d’une « cover‐sheet » d’indexation.
Numérisation Î ICR-IWR Î Analyse ÎVidéo-codage Î vers GED/ECM
Imaging process OCR-OMR ERP
DEMATERIALISATION : la chaîne de traitement
numérisation (scanning) & extraction
Image Î Texte Î Données Î Corrections & Î Processing logique métier
lecture analyse
a CEGEKA Group Company
Numérisation
La première étape de la chaîne de traitement
Qualité est primordiale et impacte le process completimpacte le process complet
300 DPI B&W VRS traitement image (amélioration qualité)300 DPI, B&W, VRS, traitement image (amélioration qualité), contrôle qualité (opérateur)
D’autres caractéristiques en fonction de la volumétrie
& autres spécifications (par ex. couleur, taille, …)
Requiert la préparation des documents à numériser :
Ajouter une étiquette code‐barres (recommandé)Ajouter une étiquette code barres (recommandé)
Insertion d’un page de séparation de documents
Retirer les agrafes
… Préparation des Documents
Error free
Ergonomie et robustesse
OCR Barcode
ANALYSE d’un FORMULAIRE
Form-Id.
Hand-Print recognition
Validation Rules
a CEGEKA Group Company
OMR
Rules
CUSTOM MODULES
ANALYSE d’un FORMULAIRE
Transformer l’ image en texteimage en texte
Î Informations exploitables
OMR : Optical Mark Recognition
IWR‐ICR / OCR / OMR (1/2)
OMR : Optical Mark Recognition
Détection des cases à cocher
OCR : Optical Character Recognition ‐> zone
Reconnaissance optique de caractères (dactylographiés)
ICR : Intelligent Character Recognition ‐> zone
Reconnaissance de l’écriture manuscrite, casée, cursive …
a CEGEKA Group Company
au niveau de la lettre
IWR : Intelligent Word Recognition
A2iA Technology
Intelligence Artificielle pour la détection des mots et des phrases
Les performances sont basées sur:
la combinaison de 4 moteurs OCR A2iA différents
la possibilité d’utiliser un contexte (dictionnaire )
IWR‐ICR / OCR / OMR (2/2)
la possibilité d utiliser un contexte (dictionnaire…)
l’expérience de la segmentation cursive
Module de Décision
Le module de décision est le module dans lequel, en fonction des éléments de contrôle intégrés, il est déterminé
l d l d ê d
Data, Décision
si le document est valide et peut‐être transmis directement à la GED, ECM, dB … (mode « silence), ou si une fonction de vidéo‐codage est nécessaire.
La décision est basée sur (par ex.):
Présence de données obligatoires;
Score de l’extraction I’OCR;
Structure de certaines données + logique de contrôle
a CEGEKA Group Company
g q
Espace de programmation pour inclure / intégrer la logique de contrôle métier, par ex:
Cohérence entre les données
Connexion sur un référentiel complémentaire
« Check digit » le cas échéant, …
Vidéo‐codage (1/2)
Le design de l’interface de vidéo‐codage a été adapté pour la production et le traitement de masse
Interconnexion avec des systèmes (sources de
Interconnexion avec des systèmes (sources de données) externes: enrichissement de fonctions et contrôles métier
Nombreux raccourcis‐clavier et fonction de “copier‐
coller” par clic sur l’image
Organisation selon plusieurs formulaires de saisie en
a CEGEKA Group Company
Organisation selon plusieurs formulaires de saisie en fonction de la nature du document
Interface entièrement configurable ‐> espace ouvert de programmation.
Corrections can be made in these fields
Real time indication of possible errors
Modulo error:
a CEGEKA Group Company
1.Verify polis number 2.Verify modulo
Le résultat produit par le vidéo‐codage (output) est automatiquement envoyé / pris en charge à l’application de GED/ECM, ERP, dB … ou toute autre
Injection dans la GED/ECM
app cat o de G / C , , d … ou toute aut e application métier de l’organisation (intégration).
SPOT SPOT
Apps Apps extext..
SPOT SPOT
Dématérialisation de factures :
Dématérialiser et automatiser via le traitement des factures entrantes.
a CEGEKA Group Company
DEMATERIALISATION : la chaîne de traitement
numérisation (scanning) & extraction
Numérisation Î ICR-IWR Î Analyse ÎVidéo-codage Î vers GED/ECM
Imaging process OCR-OMR ERP
Image Î Texte Î Données Î Corrections & Î Processing logique métier
lecture analyse
Numérisation
La première étape de la chaîne de traitement
Qualité est primordiale et impacte le impacte le processprocess completcomplet
300 DPI, B&W, VRS, traitement image (amélioration qualité),300 DPI, B&W, VRS, traitement image (amélioration qualité), contrôle qualité (opérateur)
D’autres caractéristiques en fonction de la volumétrie
& autres spécifications (par ex. couleur, taille, …)
Requiert la préparation des documents à numériser :
Ajouter une étiquette code‐barres (recommandé)
a CEGEKA Group Company
j q ( )
Insertion d’un page de séparation de documents
Retirer les agrafes
… Préparation des Documents
Error free
Ergonomie et robustesse
.
Date et num
facture Fournisseur
ANALYSE d’une FACTURE
Ligne commande
Montant total.
Num TVA Montant TVA.
IWR‐ICR / OCR / OMR
Transformer l’ image en texteimage en texte
Î Informations exploitables
OMR : Optical Mark Recognition
OMR : Optical Mark Recognition
Détection des cases à cocher
OCR : Optical Character Recognition
Reconnaissance optique de caractères (dactylographiés)
ICR : Intelligent Character Recognition
Reconnaissance de l’écriture manuscrite, casée, cursive …
a CEGEKA Group Company
, ,
au niveau de la lettre
IWR : Intelligent Word Recognition
A2iA Technology
Intelligence Artificielle pour la détection des mots et des phrases
Analyse (1/4)
Sémantique, supervision des modes d’apprentissage et de base de connaissance
Analyse fonctionne essentiellement sur 2 modes :
Analyse fonctionne essentiellement sur 2 modes :
Phase d’ identification
L’analyse, en mode “sémantique” ou en mode « Patterns » (patrons), dépendant de la phase d’identification
Le but de la phase d’identification est de déterminer si cette facture est en provenance d’un expéditeur si cette facture est en provenance d un expéditeur connu (du point de vue de SPOT).
Il en résultera le mode de fonctionnement suivant
« nouvel expéditeur » Îapproche sémantique
Déjà répertorié Îapproche “pattern”
Le moteur sémantique « comprend » le document et en extrait automatiquement les informations (intelligence artificielle)
Analyse (2/4)
(intelligence artificielle)
a CEGEKA Group Company
Total HT 7 769,30
En traduisant l’image en texte, l’OCR permet l’analyse du contenu en une information pertinente
Lorsque que le document est déjà connu (au niveau du “pattern”), SPOT utilise alors sa base de
connaissance des “patterns” (patrons) Analyse (3/4)
connaissance des patterns (patrons).
La base de connaissance des “patterns” prend en charge:
La gestion des décalages (horizontaux et verticaux)
La problématique du redimensionnement de la taille des documents
La gestion de la localisation des blocs d’information qui peuvent varier sur le document (par ex. le corps des factures et la zone des totaux qui peut varier pour un même émetteur).
Productivité Analyse (4/4)
Productivity Training
%
0 100
Time Semantic approach + SPOT training
Productivity 50 Setting-up
%
0 100
Time Classical approach
a CEGEKA Group Company
Module de Décision
Le module de décision est le module dans lequel, en fonction des éléments de contrôle intégrés, il est déterminé
l d l d ê d
Data, Décision (1/2)
si le document est valide et peut‐être transmis directement à la GED, ECM, ERP (mode « silence), ou si une fonction de vidéo‐codage est nécessaire.
La décision est basée sur (par ex.):
Présence de données obligatoires;
Score de l’extraction I’OCR;
Structure de certaines données + logique de contrôleg q
Espace de programmation pour inclure / intégrer la logique de contrôle métier, par ex:
présence d’un bon de commande
Structure de ce nr. de commande
Connexion sur un référentiel complémentaire
Module d’apprentissage
“On” utilise les résultats corrigés issus du vidéo‐codage pour que le système apprenne de ses erreurs ‐> on est dans un processus
t t d’ éli ti ti
Data, Décision + Apprentissage (2/3)
transparent d’amélioration continue.
Il n’est pas nécessaire de définir des zones d’extraction avec sa règle cm; il suffit de corriger le résultat de manière à ce que le moteur s’améliore automatiquement.
En moyenne, il faut de 3 à 5 “passes” d’un même fournisseur afin que
a CEGEKA Group Company
le logiciel produise un modèle “mature” qui puisse être pris en charge par la fonction “pattern” de l’application (sortie de la phase d’apprentissage)
Possibilité de gérer plusieurs “patterns” pour un même fournisseur = une empreinte
Diagramme fonctionnel
Vidéo‐codage (1/2)
Le design de l’interface de vidéo‐codage a été adapté pour la production et le traitement de masse
Interconnexion avec des systèmes (sources de
Interconnexion avec des systèmes (sources de données) externes: enrichissement de fonctions et contrôles métier
Nombreux raccourcis‐clavier et fonction de “copier‐
coller” par clic sur l’image
Organisation selon plusieurs formulaires de saisie en
a CEGEKA Group Company
Organisation selon plusieurs formulaires de saisie en fonction de la nature du document
Interface entièrement configurable ‐> espace ouvert de programmation.
Vidéo‐codage (2/2)
Injection dans la GED/ECM
Le résultat produit par le vidéo‐codage (output) est automatiquement envoyé / pris en charge à l’application de GED/ECM, ERP … ou toute autre app cat o de G / C , … ou toute aut e application métier de l’organisation (intégration).
SPOT SPOT
a CEGEKA Group Company
Apps Apps extext..
SPOT SPOT