Bons indicateurs des prairies très sèches, sèches et semi - sèches
1. PERIMETRE DU TERRITOIRE «DIOIS» (RA_DIOI)
Outro experimento interessante foi na identificação de escritores entre texto-dependente e texto-independente utilizando a QUWI. Pela abordagem escritor-dependente não ter dado taxas que permitam uma boa análise (os resultados variaram de 0,84% até 6,95%), será somente discutida a abordagem escritor-independente. As taxas de acerto são mostradas na Tabela 4.6.
Tabela 4.6. Taxas de Identificação (%) da QUWI entre textos copiados e textos livres.
Bases Script Escritor-dependente
Treino Teste LBP RLBP LPQ QUWI (475) Árabe-Cópia Árabe-Livre 73,89 76,84 80,63 Árabe-Cópia Inglês-Livre 77,26 77,05 74,32 Inglês-Cópia Árabe-Livre 62,32 62,11 74,32 Inglês-Cópia Inglês-Livre 70,95 71,79 72,42 Árabe-Livre Árabe-Cópia 94,11 95,37 96,63 Árabe-Livre Inglês-Cópia 98,95 98,74 97,47 Inglês-Livre Árabe-Cópia 90,95 94,11 93,89 Inglês-Livre Inglês-Cópia 98,11 99,37 98,53
Com estes dados é fácil perceber que existe uma grande diferença entre a utilização de texto-dependente e texto-independente. Com o treino sendo realizado em texto-dependente e o teste em texto-independente, a média das taxas foi de 75,42% (com LPQ), no experimento oposto, treinando em texto-independente e testando em texto-dependente, a média foi de 96,89% (com RLBP).
Esta é uma diferença considerável, já que todos os autores estão em todos os casos. Para explicar essa diferença seria necessário outro estudo, com foco em quais as diferenças na escrita quando uma pessoa copia um texto, e quando escreve um texto livre, além de avaliar se em diferentes línguas ou culturas acontece o mesmo.
5
Conclusões
Existem muitas pesquisas na área de Identificação de Escritores, principalmente com abordagens escritor-dependente e single-script. Seu alcance é conhecido, porém limitado. Nos últimos anos, começou-se a publicar pesquisas em cenário multi-script, área que ainda está em seu começo. Além disso, a técnica de dissimilaridade (escritor-independente) vem se mostrando promissora na área.
Considerando isso, esta monografia buscou abordar os temas de dissimilaridade,
multi-script e expandir o estudo da área. Além disso, o uso da dissimilaridade possibilitou
uma exploração breve na área de transferência de conhecimento.
Para o embasamento deste trabalho, foram pesquisadas as áreas citadas, além de suas definições. Após o embasamento, buscou-se sobre o estado da arte, onde encontrou-se estudos que mostram progresso na área, mas que deixam brechas para trabalhos futuros. Posteriormente, foram selecionados as bases de dados disponíveis para cenários multi-script. Então, foram realizados os experimentos, começando com a geração de textura das imagens, sua divisão em blocos, a extração das características dos blocos, cálculo das dissimilaridades, e por fim a classificação dos escritores em diferentes cenários e casos.
Com as taxas de acerto na identificação de escritores calculadas, foi possível notar que existe uma grande influência quando o problema passa a ser multi-script, pois as taxas caem consideravelmente. Por exemplo, com a LAMIS, a queda foi de aproximadamente 30%, enquanto que na ICDAR2013 a queda média foi de quase 40%. Foi possível também analisar a aplicação da técnica de dissimilaridade neste caso, que mostrou oferecer taxas de identificação de alto desempenho e constância. Em todos os casos de teste, tanto single-script quanto multi-script, a taxa de acerto aumentou, chegando a 100% em diversos casos. A melhora nos resultados não foi tão proeminente apenas na ICDAR2013, possivelmente devido a similaridade da escrita dos escritores na base, já que todos são falantes nativos de grego. Por outro lado, a base que mais se beneficiou com o uso de dissimilaridade foi a QUWI, pois
35
possui muitos escritores de diversas culturas e nacionalidades, o que dificulta a identificação na abordagem escritor-dependente.
Nos experimentos com multi-script, notou-se que nos casos em que haviam sistemas de escrita diferentes, a taxa de identificação caiu para escritor-dependente, enquanto que para escritor-independente as taxas se mantiveram estáveis.
Foi possível ainda verificar a aplicação da dissimilaridade em transferência de conhecimento, que também proveu excelentes taxas. Quando os modelos foram treinados nas bases da ICDAR e testados na LAMIS, o melhor resultado chegou a 100% em quase todas as instâncias. O mesmo se repetiu quando o modelo foi treinado na ICDAR2013 e testado na ICDAR2011. No caso em que o treino da LAMIS foi testado na ICDAR2011, as taxas de acerto foram inferiores que nos demais casos. Isso pode ser devido ao fato dos escritores da LAMIS variarem a própria escrita dentro da base, o que cria vetores de dissimilaridades destoantes, dificultando os testes em outras bases.
Na transferência de conhecimento, além da base de treino afetar os resultados, o descritor também afeta o desempenho da classificação. O LPQ obteve o melhor resultado em 85% dos testes, chegando a taxas de acerto de 100% em mais da metade dos casos.
O LPQ também foi o que mais se destacou na abordagem escritor-dependente, enquanto que para dissimilaridade o desempenho entre os três foi mais homogêneo em cenários single-script e multi-script.
Dissimilaridade também foi usada brevemente para testar o desempenho da identificação em texto-dependente e em texto-independente. Com treino no primeiro e teste no segundo, a taxa média de acerto foi de 75,42%. No cenário oposto, a média chegou em quase 97%. Com escritor-dependente, estes cenários não chegaram nem a 7% de acerto, o que novamente mostra a superioridade da técnica de dissimilaridade.
Com base nos experimentos, foi possível confirmar que a técnica de dissimilaridade de fato melhora as taxas de identificação, tanto em cenário single-script quanto em cenário
multi-script. Além disso, mostrou-se que modelos treinados em uma base podem ser usados
para classificar outras bases de forma satisfatória. A combinação dos descritores usados e dissimilaridade proveu ainda resultados similares ou melhores que de outros estudos. Ademais, as análises revelaram algumas nuances que devem fazer o pesquisador avaliar o que é realmente importante na classificação com dissimilaridade. O modelo de treino, por exemplo, pareceu ser de extrema importância, assim como a presença de textos copiados ou livres.
Para pesquisas futuras, é possível analisar outras bases de dados com o uso de transferência de conhecimento, inclusive bases single-script. É possível também avaliar a razão do impacto que determinadas bases de dados têm, como os casos com a QUWI e a LAMIS que obtiveram taxas menores de acerto. Também seria interessante estudar o motivo da diferença de desempenho dos descritores e a influência de texto-dependente e texto-independente na classificação de escritores.
ADAK, C.; CHAUDHURI, B. B.; BLUMENSTEIN, M. Writer identification by training on one script but testing on another. In: 23rd International Conference on Pattern Recognition
(ICPR). [S.l.: s.n.], 2016. p. 1153–1158.
BERTOLINI, Diego et al. Reducing forgeries in writer-independent off-line signature verification through ensemble of classifiers. Pattern Recognition, Elsevier, v. 43, n. 1, p. 387–396, 2010.
BERTOLINI, Diego et al. Texture-based descriptors for writer identification and verification.
Expert Systems with Applications, v. 40, n. 6, p. 2069 – 2080, 2013. ISSN 0957-4174.
BERTOLINI, D.; OLIVEIRA, L. S.; SABOURIN, R. Multi-script writer identification using dissimilarity. In: 23rd International Conference on Pattern Recognition (ICPR). [S.l.: s.n.], 2016.
CHANG, Chih-Chung; LIN, Chih-Jen. LIBSVM: A library for support vector machines.
ACM Transactions on Intelligent Systems and Technology, v. 2, p. 27:1–27:27, 2011. Software
disponível em: <http://www.csie.ntu.edu.tw/~cjlin/libsvm>.
CHEN, Jie et al. Rlbp: Robust local binary pattern. In: BMVC. [S.l.: s.n.], 2013.
CHRISTLEIN, Vincent; BERNECKER, David; ANGELOPOULOU, Elli. Writer identifi- cation using vlad encoded contour-zernike moments. In: 13th International Conference on
Document Analysis and Recognition (ICDAR). [S.l.: s.n.], 2015. p. 906–910.
CORTES, Corinna; VAPNIK, Vladimir. Support-vector networks. Machine Learning, v. 20, n. 3, p. 273–297, 1995.
DJEDDI, Chawki et al. ICDAR 2015 competition on multi-script writer identification and gender classification using ‘QUWI’ database. In: 13th International Conference on Document
Analysis and Recognition (ICDAR). [S.l.: s.n.], 2015. p. 1191–1195.
DJEDDI, Chawki et al. LAMIS-MSHD: A multi-script offline handwriting database. In: IEEE.
14th International Conference on Frontiers in Handwriting Recognition (ICFHR). [S.l.], 2014.
p. 93–97.
DJEDDI, Chawki et al. Text-independent writer recognition using multi-script handwritten texts. Pattern Recognition Letters, Elsevier, v. 34, n. 10, p. 1196–1202, 2013.
DUIN, Robert P.W.; PĘKALSKA, Elżbieta. The dissimilarity space: Bridging structural and statistical pattern recognition. Pattern Recognition Letters, v. 33, n. 7, p. 826 – 832, 2012. ISSN 0167-8655. Special Issue on Awards from ICPR 2010.
37
GARAIN, Utpal; PAQUET, Thierry. Off-line multi-script writer identification using AR coefficients. In: 10th International Conference on Document Analysis and Recognition. [S.l.]: IEEE, 2009. p. 991–995.
GHIASI, Golnaz; SAFABAKHSH, Reza. Offline text-independent writer identification using codebook and efficient code extraction methods. Image and Vision Computing, v. 31, n. 5, p. 379 – 391, 2013. ISSN 0262-8856.
HANUSIAK, Regiane Kowalek et al. Writer verification using texture-based features.
International Journal on Document Analysis and Recognition (IJDAR), Springer, v. 15,
n. 3, p. 213–226, 2012.
HSU, Chih-Wei; LIN, Chih-Jen. A comparison of methods for multiclass support vector machines. IEEE transactions on Neural Networks, IEEE, v. 13, n. 2, p. 415–425, 2002. HUSSAIN, Raashid et al. A comprehensive survey of handwritten document benchmarks: structure, usage and evaluation. EURASIP Journal on Image and Video Processing, 2015. JUSTINO, Edson; BORTOLOZZI, Flávio; SABOURIN, Robert. A comparison of svm and hmm classifiers in the off-line signature verification. Pattern recognition letters, Elsevier, v. 26, n. 9, p. 1377–1385, 2005.
KNERR, Stefan; PERSONNAZ, Léon; DREYFUS, Gérard. Single-layer learning revisited: a stepwise procedure for building and training a neural network. In: SOULIÉ, Françoise Fogel- man; HÉRAULT, Jeanny (Ed.). Neurocomputing: Algorithms, Architectures and Applications. Berlin, Heidelberg: Springer Berlin Heidelberg, 1990. p. 41–50.
LIU, Li et al. Local binary features for texture classification: Taxonomy and experimental study. Pattern Recognition, Elsevier, v. 62, p. 135–160, 2017.
LOULOUDIS, Georgios; GATOS, Basilios; STAMATOPOULOS, Nikolaos. ICFHR 2012 competition on writer identification challenge 1: Latin/greek documents. In: International
Conference on Frontiers in Handwriting Recognition (ICFHR). [S.l.: s.n.], 2012. p. 829–834.
LOULOUDIS, Georgios; STAMATOPOULOS, Nikolaos; GATOS, Basilios. ICDAR 2011 writer identification contest. In: IEEE. International Conference on Document Analysis and
Recognition. [S.l.], 2011. p. 1475–1479.
MAADEED, Somaya Al et al. QUWI: an arabic and english handwriting dataset for offline writer identification. In: International Conference on Frontiers in Handwriting Recognition
(ICFHR). [S.l.]: IEEE, 2012. p. 746–751.
OJALA, Timo; PIETIKÄINEN, Matti; MÄENPÄÄ, Topi. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns. IEEE Transactions on
pattern analysis and machine intelligence, IEEE, v. 24, n. 7, p. 971–987, 2002.
OJANSIVU, Ville; HEIKKILÄ, Janne. Blur insensitive texture classification using local phase quantization. In: SPRINGER. International conference on image and signal processing. Berlin, Heidelberg: Springer Berlin Heidelberg, 2008. p. 236–243.
OTSU, Nobuyuki. A threshold selection method from gray-level histograms. IEEE Transacti-
PAN, S. J.; YANG, Q. A survey on transfer learning. IEEE Transactions on Knowledge and
Data Engineering, v. 22, n. 10, Oct 2010.
PĘKALSKA, Elżbieta; PACLÍK, Pavel; DUIN, Robert PW. A generalized kernel approach to dissimilarity-based classification. Journal of machine learning research, v. 2, n. Dec, p. 175–211, 2001.
RIVARD, Dominique. Multi-feature approach for writer-independent offline signature verifi-
cation. Dissertação (Mestrado) — École de technologie supérieure, 2010.
SHARMA, Mona; SINGH, Sameer. Evaluation of texture methods for image analysis. In: IEEE. The Seventh Australian and New Zealand Intelligent Information Systems Conference. [S.l.], 2001. p. 117–121.
SIDDIQI, Imran et al. Automatic analysis of handwriting for gender classification. Pattern
Analysis and Applications, v. 18, n. 4, p. 887–899, 2015. ISSN 1433-755X.
SUYKENS, Johan AK; VANDEWALLE, Joos. Least squares support vector machine classifiers. Neural processing letters, Springer, v. 9, n. 3, p. 293–300, 1999.
VAPNIK, Vladimir. Estimation of Dependences Based on Empirical Data. [S.l.]: Springer- Verlag, 1982. Addendum 1.
VAPNIK, Vladimir. An overview of statistical learning theory. IEEE transactions on neural
networks, IEEE, v. 10, n. 5, p. 988–999, 1999.
YIN, Wotao; GOLDFARB, Donald; OSHER, Stanley. A comparison of three total variation based texture extraction models. Journal of Visual Communication and Image Representation, Elsevier, v. 18, n. 3, p. 240–252, 2007.
ZERNIKE, Frits; MIDWINTER, John E. Applied nonlinear optics. [S.l.]: Courier Corporation, 2006.
ZHOU, Dongxiao. Texture analysis and synthesis using a generic Markov-Gibbs image model. Tese (Doutorado) — University of Auckland, 2006.
Apêndices
A
Resultados detalhados
A.1.
Taxas de Identificação em cenário single-script
Tabela A.1. Taxas de identificação (%) detalhadas para ICDAR 2011 em cenário single-script
Bases Script Escritor-dependente Escritor-independente
Treino Teste LBP RLBP LPQ LBP RLBP LPQ ICDAR 2011 (26) Alemão 1 Alemão 2 84,62 88,46 69,23 100,00 100,00 100,00 Alemão 2 Alemão 1 84,62 80,77 80,77 100,00 100,00 100,00 Francês 1 Francês 2 88,46 96,15 92,31 96,15 96,15 100,00 Francês 2 Francês 1 96,15 96,15 100,00 96,15 92,31 100,00 Inglês 1 Inglês 2 84,62 84,62 84,62 100,00 100,00 100,00 Inglês 2 Inglês 1 92,31 84,62 96,15 100,00 100,00 96,15 Grego 1 Grego 2 84,62 80,77 57,69 100,00 92,31 100,00 Grego 2 Grego 1 80,77 76,92 80,77 100,00 100,00 100,00
Tabela A.2. Taxas de identificação (%) detalhadas para ICDAR 2013 em cenário single-script
Bases Script Escritor-dependente Escritor-independente
Treino Teste LBP RLBP LPQ LBP RLBP LPQ ICDAR 2013 (250) Inglês 1 Inglês 2 56,4 52,4 55,6 68,00 70,80 72,80 Inglês 2 Inglês 1 57,2 49,6 55,2 67,20 64,00 71,20 Grego 1 Grego 2 67,6 66,4 64,8 75,60 69,60 78,80 Grego 2 Grego 1 67,6 70,4 64,8 74,00 77,60 75,60 40
41
Tabela A.3. Taxas de identificação (%) detalhadas para LAMIS em cenário single-script
Bases Script Escritor-dependente Escritor-independente
Treino Teste LBP RLBP LPQ LBP RLBP LPQ LAMIS (100) Árabe 1 Árabe 2-6 44,80 44,20 58,80 96,60 96,00 96,80 Árabe 2 Árabe 1, 3-6 53,00 51,60 57,00 95,40 95,80 96,20 Árabe 3 Árabe 1-2, 4-6 30,60 31,40 41,00 98,20 98,40 98,40 Árabe 4 Árabe 1-3, 5-6 54,00 54,00 63,20 96,20 95,40 96,60 Árabe 5 Árabe 1-4, 6 53,20 53,40 59,80 97,00 96,20 96,80 Árabe 6 Árabe 1-5 53,40 51,40 60,80 97,00 97,00 97,60 Francês 1 Francês 2-6 57,60 55,80 61,60 98,60 99,00 97,80 Francês 2 Francês 1, 3-6 41,00 41,40 47,60 97,80 97,60 97,20 Francês 3 Francês 1-2, 4-6 57,40 54,20 61,80 98,60 98,80 98,60 Francês 4 Francês 1-3, 5-6 61,60 60,40 65,20 99,00 99,40 99,20 Francês 5 Francês 1-4, 6 58,60 58,00 64,40 99,00 99,20 98,80 Francês 6 Francês 1-5 49,60 48,20 58,80 99,40 99,00 99,40
Tabela A.4. Taxas de identificação (%) detalhadas para QUWI em cenário single-script
Bases Script Escritor-dependente Escritor-independente
Treino Teste LBP RLBP LPQ LBP RLBP LPQ
QUWI (475)
Árabe Cópia Árabe Livre 4,84 4,63 6,74 73,89 76,84 80,63 Árabe Livre Árabe Cópia 6,95 6,95 1,31 94,11 95,37 96,63 Inglês Cópia Inglês Livre 4,42 4,84 6,11 70,95 71,79 72,42 Inglês Livre Inglês Cópia 4,84 4,42 8,84 98,11 99,37 98,53
A.2.
Taxas de Identificação em cenário multi-script
Tabela A.5. Taxas de identificação (%) detalhadas para ICDAR 2013 em cenário multi-script
Bases Script Escritor-dependente Escritor-independente
Treino Teste LBP RLBP LPQ LBP RLBP LPQ ICDAR 2013 (250) Inglês 1 Grego 14,60 15,20 15,60 73,40 69,40 82,00 Inglês 2 Grego 23,20 24,80 31,60 75,60 65,00 78,00 Grego 1 Inglês 27,00 24,80 26,20 64,80 62,00 70,40 Grego 2 Inglês 15,00 13,80 20,20 62,60 65,60 69,00
Tabela A.6. Taxas de identificação (%) detalhadas para LAMIS em cenário multi-script
Bases Script Escritor-dependente Escritor-independente
Treino Teste LBP RLBP LPQ LBP RLBP LPQ LAMIS (100) Árabe 1 Francês 10,83 14,83 10,17 89,17 91,00 90,67 Árabe 2 Francês 9,00 10,17 8,17 89,00 91,33 92,00 Árabe 3 Francês 10,33 17,17 10,67 90,83 92,00 92,00 Árabe 4 Francês 8,33 17,33 10,33 88,33 89,67 93,67 Árabe 5 Francês 9,17 18,00 11,00 92,50 94,00 95,17 Árabe 6 Francês 10,83 17,67 10,83 92,67 92,00 94,00 Francês 1 Árabe 16,17 22,17 16,17 98,67 98,83 99,33 Francês 2 Árabe 16,50 24,00 17,33 98,33 98,33 97,50 Francês 3 Árabe 10,17 15,83 10,17 98,50 99,67 98,17 Francês 4 Árabe 13,50 23,00 16,33 98,67 97,67 99,00 Francês 5 Árabe 15,50 20,17 14,67 99,17 98,83 99,00 Francês 6 Árabe 12,50 17,33 11,33 98,83 98,50 99,17
Tabela A.7. Taxas de identificação (%) detalhadas para QUWI em cenário multi-script
Bases Script Escritor-dependente Escritor-independente
Treino Teste LBP RLBP LPQ LBP RLBP LPQ
QUWI (475)
Árabe Cópia Inglês Cópia 2,53 2,74 5,68 96,21 96,21 96,42 Árabe Cópia Inglês Livre 2,95 3,37 3,58 77,26 77,05 74,32 Árabe Livre Inglês Cópia 1,05 1,05 2,74 98,95 98,74 97,47 Árabe Livre Inglês Livre 2,11 2,53 4,21 87,37 85,47 78,11 Inglês Cópia Árabe Cópia 1,68 1,89 3,79 79,37 79,58 84,84 Inglês Cópia Árabe Livre 1,05 0,84 0,84 62,32 62,11 74,32 Inglês Livre Árabe Cópia 1,05 1,26 2,95 90,95 94,11 93,89 Inglês Livre Árabe Livre 2,74 2,95 5,05 79,58 78,53 86,32
43
A.3.
Transferência de conhecimento
Tabela A.8. Taxas de identificação (%) detalhadas para ICDAR2011 com modelos da ICDAR2013
Base Script Escritor-independente
Treino Teste LBP RLBP LPQ ICDAR 2013 (250) Inglês 1 Alemão 100,00 98,08 100,00 Inglês 1 Francês 94,23 94,23 100,00 Inglês 1 Inglês 98,08 98,08 100,00 Inglês 1 Grego 100,00 100,00 98,08 Inglês 2 Alemão 98,08 73,08 100,00 Inglês 2 Francês 96,15 67,31 100,00 Inglês 2 Inglês 100,00 76,92 100,00 Inglês 2 Grego 100,00 84,62 100,00 Grego 1 Alemão 98,08 96,15 100,00 Grego 1 Francês 98,08 96,15 100,00 Grego 1 Inglês 98,08 100,00 100,00 Grego 1 Grego 98,08 100,00 98,08 Grego 2 Alemão 98,08 98,08 100,00 Grego 2 Francês 100,00 94,23 100,00 Grego 2 Inglês 98,08 100,00 100,00 Grego 2 Grego 98,08 100,00 98,08
Tabela A.9. Taxas de identificação (%) detalhadas para ICDAR2011 com modelos da LAMIS
Base Script Escritor-independente Treino Teste LBP RLBP LPQ LAMIS (100) Árabe 1 Alemão 94,23 96,15 100,00 Árabe 1 Francês 80,77 84,62 96,15 Árabe 1 Inglês 94,23 92,31 100,00 Árabe 1 Grego 88,46 88,46 98,08 Árabe 2 Alemão 94,23 84,62 98,08 Árabe 2 Francês 90,38 88,46 92,31 Árabe 2 Inglês 90,38 90,38 98,08 Árabe 2 Grego 80,77 82,69 98,08 Árabe 3 Alemão 96,15 94,23 96,15 Árabe 3 Francês 92,31 82,69 92,31 Árabe 3 Inglês 92,31 88,46 98,08 Árabe 3 Grego 86,54 86,54 100,00 Árabe 4 Alemão 86,54 90,38 100,00 Árabe 4 Francês 82,69 80,77 94,23 Árabe 4 Inglês 94,23 96,15 98,08 Árabe 4 Grego 80,77 82,69 96,15 Árabe 5 Alemão 92,31 78,85 98,08 Árabe 5 Francês 88,46 80,77 90,38 Árabe 5 Inglês 84,62 90,38 96,15 Árabe 5 Grego 84,62 80,77 96,15 Árabe 6 Alemão 67,31 73,08 44,23 Árabe 6 Francês 50,00 63,46 44,23 Árabe 6 Inglês 67,31 75,00 44,23 Árabe 6 Grego 46,15 53,85 36,54 Francês 1 Alemão 94,23 86,54 100,00 Francês 1 Francês 82,69 84,62 96,15 Francês 1 Inglês 84,62 84,62 98,08 Francês 1 Grego 84,62 78,85 98,08 Francês 2 Alemão 94,23 88,46 100,00 Francês 2 Francês 82,69 84,62 96,15 Francês 2 Inglês 84,62 84,62 98,08 Francês 2 Grego 84,62 78,85 100,00 Francês 3 Alemão 96,15 88,46 100,00 Francês 3 Francês 82,69 84,62 98,08 Francês 3 Inglês 84,62 84,62 98,08 Francês 3 Grego 84,62 78,85 96,15 Francês 4 Alemão 92,31 84,62 100,00 Francês 4 Francês 82,69 84,62 96,15 Francês 4 Inglês 84,62 84,62 98,08 Francês 4 Grego 84,62 78,85 98,08 Francês 5 Alemão 94,23 88,46 100,00 Francês 5 Francês 82,69 84,62 94,23 Francês 5 Inglês 84,62 84,62 98,08 Francês 5 Grego 84,62 78,85 96,15 Francês 6 Alemão 96,15 86,54 100,00 Francês 6 Francês 82,69 84,62 96,15 Francês 6 Inglês 84,62 84,62 100,00 Francês 6 Grego 84,62 78,85 100,00
45
Tabela A.10. Taxas de identificação (%) detalhadas para ICDAR2011 com modelos da QUWI
Base Script Escritor-independente
Treino Teste LBP RLBP LPQ
QUWI (475)
Árabe Cópia Alemão 98,08 92,31 96,15 Árabe Cópia Francês 92,31 84,62 100,00 Árabe Cópia Inglês 96,15 92,31 100,00 Árabe Cópia Grego 98,08 94,23 100,00 Árabe Livre Alemão 100,00 100,00 98,08 Árabe Livre Francês 94,23 90,38 94,23 Árabe Livre Inglês 98,08 98,08 98,08 Árabe Livre Grego 98,08 90,38 98,08 Inglês Cópia Alemão 92,31 94,23 100,00 Inglês Cópia Francês 82,69 86,54 96,15 Inglês Cópia Inglês 88,46 84,62 100,00 Inglês Cópia Grego 88,46 94,23 98,08 Inglês Livre Alemão 100,00 98,08 100,00 Inglês Livre Francês 96,15 92,31 100,00 Inglês Livre Inglês 100,00 94,23 100,00 Inglês Livre Grego 92,31 96,15 100,00
Tabela A.11. Taxas de identificação (%) detalhadas para LAMIS com modelos da ICDAR2013
Base Script Escritor-independente
Treino Teste LBP RLBP LPQ ICDAR 2013 (250) Inglês 1 Árabe 92,33 85,33 100,00 Inglês 1 Francês 95,17 89,50 100,00 Inglês 2 Árabe 68,50 85,33 100,00 Inglês 2 Francês 71,00 94,00 100,00 Grego 1 Árabe 78,00 80,67 100,00 Grego 1 Francês 80,50 83,17 100,00 Grego 2 Árabe 53,50 63,50 100,00 Grego 2 Francês 51,33 63,00 100,00
Tabela A.12. Taxas de identificação (%) detalhadas para LAMIS com modelos da ICDAR2011
Base Script Escritor-independente
Treino Teste LBP RLBP LPQ LAMIS (100) Alemão 1 Árabe 81,33 71,50 99,33 Alemão 1 Francês 86,17 76,67 100,00 Alemão 2 Árabe 82,83 40,83 99,33 Alemão 2 Francês 87,67 48,50 100,00 Francês 1 Árabe 79,17 72,33 99,33 Francês 1 Francês 80,83 75,17 100,00 Francês 2 Árabe 46,83 50,67 99,33 Francês 2 Francês 51,50 52,17 100,00 Inglês 1 Árabe 53,00 47,67 99,33 Inglês 1 Francês 59,67 49,50 100,00 Inglês 2 Árabe 85,17 76,83 99,33 Inglês 2 Francês 84,83 84,67 100,00 Grego 1 Árabe 48,33 88,33 99,67 Grego 1 Francês 50,67 95,83 100,00 Grego 2 Árabe 66,50 70,83 99,67 Grego 2 Francês 72,67 73,67 100,00
Tabela A.13. Taxas de identificação (%) detalhadas para LAMIS com modelos da QUWI
Base Script Escritor-independente
Treino Teste LBP RLBP LPQ
QUWI (475)
Árabe Cópia Árabe 95,33 94,83 95,33 Árabe Cópia Francês 99,17 98,67 99,33 Árabe Livre Árabe 97,17 96,67 95,33 Árabe Livre Francês 99,50 99,67 98,83 Inglês Cópia Árabe 90,00 91,00 93,33 Inglês Cópia Francês 97,83 98,00 98,50 Inglês Livre Árabe 95,67 96,67 96,50 Inglês Livre Francês 99,33 99,83 99,00