• Aucun résultat trouvé

A principal motivação deste trabalho é a necessidade de automatização devido ao grande volume de documentos e, portanto, uma das formas de automatizar é evitar o uso de parâmetros nos filtros aplicados. Neste trabalho, apenas o filtro de remoção de borda preta ainda apresenta a necessidade de ajustar parâmetros. Portanto, o cálculo automático dos

parâmetros do filtro de remoção de borda preta é proposto como trabalho futuro. O parâmetro LINE pode ser removido do filtro se outros métodos de classificação do bloco segmentado forem utilizados, como por exemplo, redes neurais. O parâmetro SEGMENT pode ser estimado através da medição da espessura dos componentes textuais do documento.

Um método quantitativo de medição de degradação do algoritmo de detecção e remoção de borda preta pode ser proposto e funcionaria da seguinte forma: (1) seria aplicada a um documento “limpo” (figura 57a) uma borda preta retirada de outro documento (figura 57b) formando um documento sintético (figura 57c); (2) o algoritmo de remoção de borda preta seria aplicado ao documento sintético e; (3) a imagem filtrada seria sobreposta com o documento “limpo” e então, seria contado o número de pixels pertencentes à borda preta que não foram removidos e o número de pixels pertencentes à informação que foram removidos; (4) o nível de degradação do algoritmo seria dado em função desses dois números.

(a) (b) (c)

Figura 57 – Método quantitativo de medição de degradação do algoritmo de detecção e

remoção de borda preta: (a) documento “limpo”; (b) borda preta extraída; (c) documento sintético.

O método de detecção de rotação pode ser melhorado se apenas aplicado aos componentes textuais do documento. Isto aumentaria o desempenho e diminuiria a taxa de erros. O uso de pré-processamento de união de fragmentos e separação de componentes melhoraria o desempenho da detecção da rotação para documentos manuscritos e de línguas orientais. Um fator de confiança pode ser proposto para evitar estimar a orientação invertida em linhas de texto com apenas letras maiúsculas.

O método de correção de rotação pode ser integrado com um suavizador de componentes. A vetorização utilizada para a representação dos objetos do documento pode

ser do tipo com perdas. Deste modo, os pixels que tornam as bordas do objeto acidentadas já podem ser removidos. Portanto, ao invés do método de correção degradar a imagem após a rotação, a imagem rotacionada poderá estar com melhor qualidade que a original. Além disso, a tempo de processamento do documento seria diminuída uma vez que dois filtros foram aplicados de uma vez.

O balanceador de carga do cluster poderá extrair características da imagem comprimida de forma a estimar o tempo de processamento e, portanto, melhorar o balanceamento das imagens, principalmente para ambientes heterogêneos. Além disso, o controle de fluxo pode ser melhorado aumentando-se ou diminuindo o tamanho do pacote de modo a aumentar a vazão do servidor. A arquitetura Grid também poderia ser implementada.

8. PUBLICAÇÕES

Segue abaixo a relação das publicações, em ordem alfabética pelo sobrenome do primeiro autor e em ordem cronológica, gerados por esta dissertação:

[1] Ávila, B.T., Lins, R.D. A New Algorithm for Removing Noisy Borders from Monochromatic Documents. In: 20th ACM Symposium on Applied Computing, v. 2, p. 1219-1225, ACM Press, Nicósia, Chipre, 2004;

[2] Ávila, B.T., Lins, R.D. Efficient Removal of Noisy Borders from Monochromatic Documents. In: International Conference on Image Analysis and Recognition, LNCS, Springer, Porto, Portugal, 2004;

[3] Ávila, B.T., Lins, R.D. A New and Fast Orientation and Skew Detection Algorithm for Monochromatic Document Images. In: ACM International Conference on Document

Engineering, ACM Press, Bristol, Inglaterra, 2005;

[4] Ávila, B.T., Lins, R.D., Neto, L.A.O. A New Rotation Algorithm for Monochromatic Images. In: XXII Simpósio Brasileiro de Telecomunicações (SBrT), Campinas, São Paulo, 2005;

[5] Ávila, B.T., Lins, R.D., Neto, L.A.O. A New Rotation Algorithm for Monochromatic Images. In: ACM International Conference on Document Engineering, ACM Press, Bristol, Inglaterra, 2005;

[6] Lins, R.D., Ávila, B.T. A New Algorithm for Skew Detection in Images of Documents.

In: International Conference on Image Analysis and Recognition, LNCS, Springer,

Porto, Portugal, 2004;

[7] Lins, R.D., Ávila, B.T. BigBatch - A Toolbox for Monochromatic Documents. In: ACM

International Conference on Document Engineering, ACM Press, Bristol, Inglaterra,

2005;

[8] Lins, R.D., Ávila, B.T., Formiga, A.A. BigBatch: An Environment for Processing Monochromatic Documents. In: International Conference on Image Analysis and

9. REFERÊNCIAS

[1] Akiyama, T., Hagita, N. Automated entry system for printed documents. Pattern

Recognition, v. 23, p. 1141-1154, 1990;

[2] Alves, N.F. Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres. Dissertação de Mestrado em Engenharia Elétrica, Departamento de Eletrônica e Sistemas, Universidade Federal de Pernambuco, 2003; [3] Amin, A., Fisher, S. A Document Skew Detection Method Using the Hough Transform.

Pattern Analysis & Applications, v. 3(3), p. 243-253, setembro, 2000;

[4] Ávila, B.T., Lins, R.D. A New Algorithm for Removing Noisy Borders from Monochromatic Documents. In: 20th ACM Symposium on Applied Computing, v. 2, p. 1219-1225, ACM Press, Nicósia, Chipre, 2004;

[5] Ávila, B.T., Lins, R.D. Efficient Removal of Noisy Borders from Monochromatic Documents. In: International Conference on Image Analysis and Recognition, LNCS, Springer, Porto, Portugal, 2004;

[6] Ávila, B.T., Lins, R.D. A New and Fast Orientation and Skew Detection Algorithm for Monochromatic Document Images. In: ACM International Conference on Document

Engineering, ACM Press, Bristol, Inglaterra, 2005;

[7] Ávila, B.T., Lins, R.D., Neto, L.A.O. A New Rotation Algorithm for Monochromatic Images. In: XXII Simpósio Brasileiro de Telecomunicações (SBrT), Campinas, São Paulo, 2005;

[8] Ávila, B.T., Lins, R.D., Neto, L.A.O. A New Rotation Algorithm for Monochromatic Images. In: ACM International Conference on Document Engineering, ACM Press, Bristol, Inglaterra, 2005;

[9] Baird, H.S. The Skew Angle of Printed Documents. Proc. Conf. Society of Photographic

Scientists and Engineers, p. 14-21, 1987;

[10] Berger, M. Computer Graphics with Pascal. The Benjamin/Cummings Publishing Company Inc., 1a edição, 1986;

[11] Bloomberg, D.S. Image analysis using threshold reduction. SPIE Conference on Image

Algebra and Morphological Image Processing II, v. 1568, San Diego, California, p. 38-

52, julho, 1991;

[12] Bloomberg, D.S., Kopec, G.E., Dasari, L. Measuring document image skew and orientation. SPIE Conference on Document Recognition II, p. 302-316, San Jose, Califórnia, EUA, fevereiro, 1995;

[13] Bottou, L., Haffner, P., Howard, P.G., Simard, P., Bengio, Y., LeCun, Y. High Quality Document Image Compression with DjVu. Journal of Electronic Imaging, v. 7(3), p. 410-425, SPIE,1988;

[14]

Cattoni, R., Coianiz, T., Messelodi, S., Modena, C.M. Geometric Layout

Analysis Techniques for Document Image Understanding: a review. ITC_IRST,

janeiro, 1998;

[15] Cheng, H.D., Tang, Y.Y., Suen, C.Y. Parallel image transformation and its VLSI implementation. Pattern Recognition, 23, 1113-1129, 1990;

[16] Chien, S., Baek, Y. A fast black run rotation algorithm for binary images. Pattern

Recognition Letters, Elsevier Science Inc., New York, NY, EUA, v. 19, p. 455-459,

1998;

[17] Chien, S., Baek, Y. Hierarchical block matching method for fast rotation of binary images. IEEE Transactions on Image Processing, v. 10(3), p. 483-489, 2001;

[18] Ciardiello, G., Scafuro, G., Degrandi, M.T., Spada, M.R., Roccotelli, M.P. An experimental system for office document handling and text recognition. In Proc. of the

9th International Conference on Pattern Recognition, v. 2, p. 739-743, Roma, Itália,

novembro, 1988;

[19] Cormen, T.H., Leiserson, C.E., Rivest, R.L., Stein, C. Introduction to algorithms, MIT Press, Second Edition, 2001;

[20] Danielsson, P., Hammerin, M. High accuracy rotation of images. CVGIP: Graphical

Model and Image Processing, v. 54(4), p. 340-344, 1992;

[21] Davies, E.R. Machine Vision: Theory, Algorithms, Practicalities. Academic Press, 1992; [22] Dillencourt, M.B., Samet, H., Tamminen, M. A General Approach to Connected- Component Labeling for Arbitrary Image Representations. Journal of the Association

for Computing Machinery, v. 39(2), p. 253-280, abril, 1992;

[23] Fan, K.C., Wang, Y.K., Lay, T.R. Marginal noise removal of document images. Pattern

Recognition, v. 35, p. 2593-2611, 2002;

[24] Hashizume, A., Yeh, P.S., Rosenfeld, A. A method of detecting the orientation of aligned components. Pattern Recognition Letters, v. 4, p. 125-132, 1986;

[25] Hinds, S., Fisher, J., D'Amato, D. A document skew detection method using run-length encoding and the Hough transform. In Proc. of the 10th International Conference on

Pattern Recognition, p. 464-468, Atlantic City, NJ, junho, 1990;

[26] Hough, P.V.C. Methods and means for recognizing complex patterns. US Patent #3.069.654, dezembro, 1962;

[27] Inglis, S. Lossless Document Image Compression. PhD thesis, University of Waikato, Hamilton, Nova Zelândia, março, 1999;

[28] Ishitani, Y. Document Skew Detection Based on Local Region Complexity. In Proc. of

the 2nd International Conference on Document Analysis and Recognition, IEEE

Computer Society, p. 49-52, Tsukuba, Japão, outubro, 1993;

[29] Jiang, H.D., Han, C.C., Fan, K.C. A fast approach to the detection and correction of skew documents. Pattern Recognition Letters, v. 18, p. 675-686, 1997;

[30] Le, D.S., Thoma, G.R., Wechsler, H. Automated Page Orientation and Skew Angle Detection for Binary Document Images. Pattern Recognition, v. 27(10), p. 1325-1344, 1994;

[31] Le, D.X., Thoma, G.R., Wechsler, H. Automated Borders Detection and Adaptive Segmentation for Binary Document Images. 13th International Conference on Pattern

Recognition (ICPR'96), v. 3, p. 737, 1996;

[32] Lins, R.D., Ávila, B.T. A New Algorithm for Skew Detection in Images of Documents.

In: International Conference on Image Analysis and Recognition, LNCS, Springer,

Porto, Portugal, 2004;

[33] Lins, R.D., Ávila, B.T. BigBatch - A Toolbox for Monochromatic Documents. In: ACM

International Conference on Document Engineering, ACM Press, Bristol, Inglaterra,

2005;

[34] Lins, R.D., Ávila, B.T., Formiga, A.A. BigBatch: An Environment for Processing Monochromatic Documents. In: International Conference on Image Analysis and

Recognition, v. 41142. p. 886-896, LNCS, Springer, Póvoa de Varzim, Portugal, 2006;

[35] Lins, R.D., Machado, D.S.A. A comparative study of file formats for image storage and transmission. Journal of Electronic Imaging, v. 13(1), p. 175-183, 2004;

[36] Mello, C.A.B., Lins, R.D. Image Segmentation of Historical Documents. Visual 2000, México, agosto, 2000;

[37] Mowbray, M. OurGrid: a Web-based Community Grid. In Proc. of the IADIS

International Conference on Web Based Communities, 2006;

[38] O’Gorman, L. The Document Spectrum for Page Layout Analysis. IEEE Transactions

on Pattern Analysis and Machine Intelligence, v. 15(11), p. 1162-1173, 1993;

[39] O’Gorman, L., Kasturi, R. Document Image Analysis. IEEE Computer Society Executive Briefing, IEEE, 1997;

[40] Paeth, A.W. A fast algorithm for general raster rotation. In Proceedings of the Graphics

Interface '86 / Vision Interface '86, Vancouver, Canada, Canadian Information

[41] Pal, U., Chaudhuri, B.B. An improved document skew angle estimation technique.

Pattern Recognition Letters, v. 17(8), p. 899-904, julho, 1996;

[42] Peerawit, W., Kawtrakul, A. Marginal Noise Removal from Document Images Using Edge Density. In Proceeding of Information and Computer Engineering Workshop, janeiro, 2003;

[43] Postl, W. Detection of Linear Oblique Structures and Skew Scan in Digitized Documents. Proc. 8th Int’l Conf. Pattern Recognition (ICPR), IEEE CS Press, Los Alamitos, Califórnia, p. 687-689, 1986;

[44] Ronse, C., Divijver, P.A. Connected Components in Binary Images: The Detection Problem. Research Studies Press Ltd., Letchworth, England, 1984;

[45] Sezgin, M., Sankur, B. Survey over Image Thresholding Techniques and Quantitative Performance Evaluation. Journal of Eletronic Imaging, v. 13(1), p. 145-165, janeiro, 2004;

[46] Shah, S., Aggarwal, J.K. Intrinsic parameter calibration procedure for a (high-distorced) fish-eye lens camera with distortion model and accuracy estimation. Pattern

Recognition, v. 29, p. 1775-1778, 1996;

[47] Shapiro, L.G., Stockman, G.C. Computer Vision, março, 2000 – http://www.cse.msu.edu/~stockman/Book/book.html;

[48] Smith, R. A Simple and Efficient Skew Detection Algorithm via Text Row Accumulation. In Proc. of the 3th International Conference on Document Analysis and

Recognition, p. 1145-1148, Montreal, Canadá, agosto, 1995;

[49] Srihari, S.N., Govindaraju, V. Analysis of Textual Images Using the Hough Transform.

Machine Vision and Applications, v. 2(3), p. 141-153, 1989;

[50] Teh, C.H., Chin, R.T. On the Detection of Dominant Points on Digital Curves. IEEE

Trans. Pattern Anal. Mach. Intell., IEEE Computer Society, v. 11(8), p. 859-872, 1989;

[51] Vailaya, A., Zhang, H., Jain, A. Automatic Image Orientation Detection. IEEE

International Conference on Image Processing, Kobe, Japão, outubro, 1999;

[52] Zhang, L., Li, M., Zhang, H. Boosting Image Orientation Detection with Indoor vs. Outdoor Classification. IEEE Workshop on Applications of Computer Vision, 2002; [53] Wang, Y.M., Zhang, H. Detecting image orientation based on low-level visual content.

In Proc. Computer Vision and Image Understanding, Elsevier, v. 93, p. 328-346, 2004;

[54] Wen-Yen, W., Mao-Jiun, J.W. Document image analysis. Detecting the dominant points by the curvature-based polygonal approximation. IEEE Computer Society Press, 1995;

[56] BlackIce Document Imaging SDK 10. BlackIce Software Inc – http://www.blackice.com; [57] BRACELPA – Associação Brasileira de Celulose e Papel – http://www.bracelpa.org.br; [58] CENADEM – http://www.cenadem.com.br;

[59] ClearImage 5. Inlite Research Inc. – http://www.inliteresearch.com;

[60] How much information 2003? – http://www.sims.berkeley.edu/research/projects/how- much-info-2003;

[61] Kodak Digital Science Scanner 1500 –

http://www.kodak.com/global/en/business/docimaging/1500002; [62] Leadtools 13. Leadtools Inc. – http://www.leadtools.com; [63] ICP Brasil – http://www.icpbrasil.gov.br/legisla.htm;

[64] ScanFix Bitonal Image Optimizer 4.21. TMS Sequóia – http://www.tmsinc.com;

APÊNDICE A – CÓDIGO FONTE DOS ALGORITMOS E

Documents relatifs