A Análise Classificatória na caracterização da produção e consumo de produtos de origem animal a nível mundial
Introdução Metodologia
Resultados
Conclusões
Desde a década de 60 do século passado que a produção de alimentos de origem animal regista crescimento superior ao verificado a nível demográfico, o que permitiu forte aumento no consumo per capita daqueles produtos a nível mundial. Este trabalho tem por objectivo analisar a evolução da produção e do consumo dos principais produtos de origem animal destinados à alimentação humana nos últimos 50 anos. Os produtos considerados foram o leite de vaca, ovos e as carnes de suíno, de bovino e de aves.
Minhoto, M. 1 e Fernandes, L. 2
Universidade de Évora. Escola de Ciências e Tecnologia
1 Departamento de Matemática, 2 Departamento de Zootecnia
Seleccionaram-se 70 países pelo critério de maior população (no seu conjunto representam cerca de 80% da população mundial) e com produção e consumo sem fortes condicionamentos de natureza religiosa para qualquer desses produtos. A partir do website da Food and Agriculture Organization of the United Nations (FAO) recolheram-se os dados nos três primeiros anos de cada uma das décadas desde 1960, a fim de se obterem valores médios de triénio para produção e consumo por habitante .
Começou-se por efectuar uma Análise Classificatória Hierárquica Ascendente (ACHA) para as seis décadas em separado, tendo em vista seleccionar o número de grupos mais adequado que se pretendia que fosse o mesmo para todas as décadas. Passou- se a uma Análise Classificatória não Hierárquica (algoritmo das K-Médias), para afectar cada país ao seu grupo e caracterizar cada um dos grupos. A comparação multivariada entre as matrizes de dados observados foi realizada com recurso aos índices RV de Robert & Escoufier (1976) e GCD (Generalized Coeficient of Determination, Ramsey et al. 1984)). A partir da matriz de distâncias efectuou-se uma ACHA, com obtenção do respectivo dendograma, cuja análise permite agrupar as 6 décadas e verificar a continuidade e eventuais quebras na produção/consumo.
Os dendogramas da análise classificatória das variáveis mostram fortes semelhanças entre períodos ao nível da produção; no consumo verificou-se maior alteração na última década. Na análise classificatória não hierárquica surge na década de 60 um grupo superior a 40 países com muito baixos níveis de produção e de consumo, e com o decorrer dos anos formaram-se dois grupos de baixa produção, o pior dos quais se foi reduzindo cerca de 20 países, que sempre se mantiveram no escalão mais baixo de produção e de consumo. Na comparação multivariada dos períodos, os resultados dos índices GCD agrupam os períodos em três pares de décadas contínuas para a produção, isolando as décadas de 60 e 90 no consumo. Os resultados relativos ao índice RV (não incluídos neste poster) são semelhantes aos do GCD para o consumo, mas na produção os períodos mais antigo e mais recente surgem isolados. Apesar do constante crescimento da produção e do consumo, o principal destaque foi a tendência para continuidade quer de posições relativas entre países, quer nos seus agrupamentos.
XXIII Jornadas de Classificação e Análise de Dados (JOCLAD2016), 31 de Março a 2 Abril de 2016, Universidade de Évora
Evolução dos grupos em função das variáveis observadas na Análise Classificatória não hierárquica para os países, pelo método das k-médias Dendogramas da Análise Classificatória das variáveis
Bibliografia principal
Cadima, J., Cerdeira, J. O. & Minhoto, M.
(2004). Computational aspects of algorithms for variable selection in the contexto of
principal componentes. Computational Statistics & Data Analysis, 47, 225-236.
Ramsay, J. O., ten Berge, J. & Styan, G. P.
H. (1984). Matrix correlation. Psychometrica.
49(3), 403-423.
Robert P. & Escoufier. (1976). A Unifying Tool for Linear Multivariate Statistical Methods:
The RV-Coeficient. Applied Statitics. 25, 257-266.
Golub, G. & Van Loan, C. (1996). Matrix Computations. Johns Hopkins University Press, Baltimore, MD.
ovos
bovino aves suíno
leite
Produção 1961 62 63
ovos bovino
aves suíno
leite
Produção 2011 12 13
ovos
bovino aves suíno
leite
Consumo 1961 62 63
ovos bovino
aves
suíno leite
Consumo 2009 10 11
Comparação multivariada dos períodos – Matriz de coeficientes GCD
Produção Consumo
Comparação multivariada dos períodos – Dendograma CGD Consumo
Produção
Períodos 616263 717273 818283 919293 10203 91011 616263 1 0,830 0,732 0,646 0,491 0,436
717273 0,830 1 0,879 0,756 0,547 0,474
818283 0,732 0,879 1 0,834 0,623 0,544
919293 0,646 0,756 0,834 1 0,756 0,653
10203 0,491 0,547 0,623 0,756 1 0,891
91011 0,436 0,474 0,544 0,653 0,891 1
1 2 3 4 5 6
bovino -0,432 2,720 0,390 1,420 -0,147 3,570 ovos -0,588 0,593 1,809 3,074 0,551 1,825 leite -0,484 0,606 0,578 2,847 0,474 5,808 suíno -0,455 0,148 1,007 6,486 0,507 0,185 aves -0,408 0,036 2,259 4,372 0,002 -0,179
Nº de países 44 5 6 1 13 1
Cluster
Produção 1961 62 63 Consumo 1961 62 63
Produção 2011 12 13 Consumo 2009 10 11
1 2 3 4 5 6
bovino -0,463 -0,095 3,564 3,861 -0,126 0,132 ovos -1,014 0,415 0,251 0,268 4,656 0,630 leite -0,347 -0,111 0,960 7,499 0,902 1,255 suíno -0,392 -0,001 0,011 -0,312 2,331 7,005 aves -0,965 0,380 0,704 1,257 2,391 0,877
Nº de países 21 43 3 1 1 1
Cluster
1 2 3 4 5 6
bovino -0,468 3,282 0,184 2,156 1,294 0,167 ovos -0,597 0,066 1,078 1,825 1,825 0,965 leite -0,608 0,264 0,636 1,171 1,457 1,930 suíno -0,590 -0,168 1,576 0,139 1,341 1,000 aves -0,414 -0,172 0,967 0,163 3,426 -0,163
Nº de países 45 3 10 2 3 7
Cluster
1 2 3 4 5 6
bovino -0,881 2,265 0,781 0,323 0,259 -0,528 ovos -1,270 0,283 0,815 0,569 -0,247 1,060 leite -0,975 0,577 -0,498 1,266 -0,168 -0,500 suíno -0,883 -0,041 2,388 1,069 -0,658 0,170 aves -1,080 1,478 3,310 0,033 0,606 0,034
Nº de países 19 6 1 19 12 13
Cluster
010203 111213 818283 919293 616263 717273
0.30.40.50.60.70.80.9
Cluster Dendrogram
hclust (*, "complete") ct_matdis(matrizgcd)
Height 010203 091011 616263 919293 717273 818283
0.40.50.60.70.80.91.0
Cluster Dendrogram
hclust (*, "complete") ct_matdis(matrizgcd)
Height
01 02 03 01
02 03
11 12 13
09 10 11 81
82
83 81
82 83 71
72 73 71
72 73
61 62 63 61
62 91 63
92 93
91 92 93
Períodos 616263 717273 818283 919293 10203 111213 616263 1 0,770 0,756 0,718 0,622 0,576
717273 0,770 1 0,813 0,739 0,656 0,598
818283 0,756 0,813 1 0,851 0,731 0,683
919293 0,718 0,739 0,851 1 0,873 0,809
10203 0,622 0,656 0,731 0,873 1 0,936
111213 0,576 0,598 0,683 0,809 0,936 1
Final Cluster Centers Final Cluster Centers
Final Cluster Centers Final Cluster Centers