Partie 1 : Revue de littérature
2.4 Evaluation et recommandations de prise en charge du risque cardiovasculaire chez le
Conforme visto na seção anterior, o modelo de entrada para nossos algoritmos é aquele apresen- tado na Tabela 5.4, página 88, correspondente a uma matriz binária; nos nossos testes optamos por não mostrar essas matrizes por questão de espaço e ilegibilidade; assim, as colunas iniciais da Tabela 5.5 será a forma utilizada para apresentação das instâncias.
Tabela 5.5 Modelo de uma instância e matriz binária correspondente
4 5 Táxon c1 c2 c3 c4 c5
t1 2 1 3 Alpha 1 0 1 0 0
t2 1 4 Matriz Beta 0 0 0 1 0
t3 4 1 2 3 5 Binária Gamma 1 1 1 0 1
t4 2 1 4 Delta 1 0 0 1 0
5.7.2 Resultados dos Testes Computacionais
1. Instância: m=8, n=10 7−→ Figura 5.11 2. Instância: m=12, n=15 7−→ Figura 5.12
Figura 5.11 Árvore logenética com m=8 táxons e n=10 características
Figura 5.12 Árvore logenética sem raiz com m=12 táxons e n=15 características, sem identicação do conteúdo das arestas
5.7 EXPERIMENTOS COMPUTACIONAIS I 97
3. Instância: m=23, n=30 7−→ Figura 5.13
Figura 5.13 Árvore logenética sem raiz com m=23 táxons e n=30 características, sem identicação do conteúdo das arestas
4. Instância: m=35, n=55 7−→ Figuras 5.14 e 5.15
5. Instância: m=12 a partir de uma matriz de distâncias 7−→ Figuras 5.16 e 5.17
Optamos por desenvolver um algoritmo próprio (Algoritmo 2) [VGM+06]) para desenhar as árvores logenéticas resultantes da solução do algoritmo de reconstrução de logenias.
Existem, entretanto, diversas ferramentas desenvolvidas para desenhar árvores logenéticas como Spectrum [Cha98], PhyloDraw [CJC00], DrawTree [Fel93], TreeView [Pag01], entre outras; todas, porém, com a necessidade de instalação na máquina do usuário onde requerem recursos computacionais especícos.
Também existe o servidor Web PHYml [GGLD05] que utiliza o método de máxima veros- similhança [BGP05, KNT+05, SLMW02, SHB+01] para a inferência de árvores logenéticas.
Figura 5.14 Filogenia do Methionyl-tRNA synthetases, adaptação parcial com 35 táxons fonte [SWB+99]
5.7 EXPERIMENTOS COMPUTACIONAIS I 99
Figura 5.16 a) Matriz de distâncias para a Filogenia da Figura 5.17, instância gerada pela ferramenta PhyloTree [VBB+06] para o gene ATP6 protein (selecionando estes doze táxons). b) String corres-
Figura 5.17 Árvore logenética com doze táxons gerada pelo Algoritmo 2 a partir da matriz de distân- cias apresentada na Figura 5.16. Os identicadores das espécies foram representados pelos dez primeiros caracteres.
5.7 EXPERIMENTOS COMPUTACIONAIS I 101
5.7.3 Estudo de caso em que a Filogenia não é Perfeita
Os experimentos a seguir têm por objetivo apresentar um caso em que a logenia não é perfeita. A Figura 5.18 contém uma instância com oito táxons e doze características; o resultado que aparece na gura é a saída do Algoritmo 3 que indica que a logenia não é perfeita para a matriz dada; isto porque não é satisfeita o critério do Lema-1, ou seja: ∃k 6= j ∈ {1,...,n} tal que (ck∩cj6=∅) e (ck*cj) e (ck+cj); neste caso diz-se que existe uma incongruência entre as colunas k e j.
As duas últimas colunas da matriz apresentada na Figura 5.18 mostra ∑c (número de congruências) e ∑i (número de incongruências); com base nessas informações, e usando um critério guloso, eliminamos a característica 1 que é aquela com maior valor de ∑i. Exe- cutando novamente o Algoritmo 3 para a instância dada sem a característica 1 obtivemos os resultados apresentados na Figura 5.19. Repetindo o processo, eliminamos seguidamente a ca- racterística 8, com resultados na Figura 5.20 e após eliminar a característica 11 foi possível transformar a instância dada numa Filogenia Perfeita com resultados mostrados na Figura 5.21. Isso no entanto, não pode ser generalizado, pois conforme citado anteriormente trata-se de um método guloso, em geral não ecaz.
Este critério é conhecido como critério da compatibilidade o qual Day & Sankoff [DS86] mostram que não são conhecidos algoritmos polinomiais para resolvê-lo de forma exata; no caso, este é um problema de otimização que consiste em encontrar o número máximo de ca- racterísticas que admitem uma logenia perfeita, ou seja, excluindo o menor número de carac- terísticas possíveis.
A Figura 5.22 mostra a forma nal da árvore logenética considerando primeiramente so- mente as características da instância reduzida e incluindo aquelas que foram retiradas de acordo com os critérios de convergência e reversão, discutido na Seção 2.7.
Uma das técnicas para inferir logenias, tratada no capítulo seguinte, foi utilizada para este exemplo obtendo como resultado a árvore da Figura 5.22.
Para que seja possível utilizar os algoritmos descritos neste capítulo para obter a forma da árvore logenética inferida com indicação nas arestas das características, sugerimos que seja
Figura 5.18 Instância para o caso de uma Filogenia não Perfeita com oito táxons e doze características; as duas últimas colunas da matriz de saída (∑c e ∑i) indicam, respectivamente para cada característica, o número de congruências e de incongruências com as demais características
5.7 EXPERIMENTOS COMPUTACIONAIS I 103
Figura 5.19 Instância para o caso de uma Filogenia não Perfeita obtida a partir da Figura 5.18 excluindo a característica 1 (oito táxons e onze características)
Figura 5.20 Instância para o caso de uma Filogenia não Perfeita obtida a partir da Figura 5.19 excluindo a característica 8 (oito táxons e dez características)
5.7 EXPERIMENTOS COMPUTACIONAIS I 105
Figura 5.21 Instância obtida a partir da Figura 5.20 excluindo a característica 11 (oito táxons e nove características) - transformada em Filogenia Perfeita
Figura 5.22 Árvore nal inferida com duas convergências e uma reversão; exemplo adapatado de [Amo97]
5.7 EXPERIMENTOS COMPUTACIONAIS I 107
feito o seguinte procedimento. Para cada característica repetida por causa das transformações realizadas pode ser atribuído uma identicação de uma nova característica.
Por exemplo, no caso da árvore da Figura 5.22 a característica 11R seria denominada como 13; um dos 1∗seria a característica 14 (o outro continuaria sendo 1) e nalmente um dos 8∗seria 15 (o outro 8). Assim, a forma desta instância convertida seria a apresentada na Figura 5.23 com sua árvore correspondente na Figura 5.24.
Figura 5.23 Instância convertida após inferência. As características 13, 14 e 15 correspondem respec- tivamente aos rótulos 11R, 1∗e 8∗
Figura 5.24 Filogenia corresponde à instância da Figura 5.23. Observa-se que é a mesma árvore da Figura 5.22 com a respectiva substutição dos rótulos 11R, 1∗e 8∗
Daqui em diante, as logenias serão representadas sem a indicação das características nas arestas pois, conforme foi visto, uma vez que um método determina qual a melhor topologia da árvore para uma dada instância, a atribuição destas em seus ramos pode ser feita de forma simples.