DISPOSITIONS APPLICABLES A LA ZONE UC - Caroline QUAY-THEVENON Adèle CHAIZE-RIONDET

Até ao momento nenhum trabalho exaustivo tinha sido desenvolvido para estudar o contexto dos codões nas zonas codificantes. Com este trabalho foi possível efectuar vários estudos a nível contextual e relacionar essa informação com outros índices já disponíveis na comunidade científica.

A aplicação encontra-se em exploração nos laboratórios do departamento de biologia da Universidade de Aveiro tendo sido obtidos resultados promissores sobre as leis gerais que governam a fidelidade de descodificação do código genético. Actualmente a informação obtida está a ser validada in vivo no laboratório de genómica funcional.

A arquitectura do Anaconda foi desenhada de forma a suportar novas funcionalidades que iriam sendo adicionadas consoante as necessidades. No entanto, permite ainda adicionar outras funcionalidades que poderão tornar-se necessárias.

O Anaconda foi desenvolvido baseado em paradigmas visuais conhecidos, tornando a interacção com os utilizadores acessível.

125 Vários métodos estatísticos foram incluídos na aplicação, como clustering, biclustering,

valores residuais, entre outros.

O Anaconda é uma aplicação que permite efectuar caracterizações de genes, obtendo vários índices, podendo também efectuar comparações entre ambos. É possível também redesenhar genes, com base nos vários valores estatísticos obtidos através da aplicação. Várias publicações e participações em congressos foram conseguidas com base nos resultados obtidos com o Anaconda.

Com este modelo foi possível obter várias associações entre codões, quer nas regiões onde o DNA codifica proteínas como nas regiões não codificantes. Disponibiliza também variada informação sobre a estrutura primária dos genes, nomeadamente índices CAI, codões raros, distribuição de codões nas zonas codificantes ou aminoácidos sequencialmente repetidos, entre outros resultados. Os resultados são visualizados através de um paradigma bastante familiar, facilitando a interacção com o utilizador.

Várias regras foram obtidas em resultado de análises efectuadas em diversos organismos. Uma regra que é realçada com os grupos formados através de análise de clustering no

mapa do organismo S.cerevisiae é a xxU-Ayy, contendo algumas excepções. Por exemplo,

com o padrão xxU-Ayy que evidencia a rejeição, os pares de codões AAU-AGC, AAU- AGU, AAU-AAU, AAU-AAC e o conjunto AGU-AGC, AGU-AGU, AGU-AAU, AGU- ACA, AGU-AUA tem resíduos positivos indicando que estes pares são preferidos pelo genoma.

A análise de clustering nos mapas de contexto mostra também que alguns dos grupos

formados são criados com base em regras de dinucleótidos, nomeadamente xxU-Ayy, xxC- Ayy e xxU-Gyy.

Uma das importantes características que evidencia tendências de mutação no contexto de codões são as percentagens de GC, em particular o GC3. O GC tem uma forte influência no codon usage e em casos extremos consegue reduzir o número, ou mesmo eliminar,

certos codões presentes nas zonas codificantes. Os resultados mostram claramente que o GC3 afecta o contexto, no entanto este efeito é mais visível para pares de codões que têm baixos valores residuais.

126 Além dos casos mencionados anteriormente outras características contribuem para o contexto, tendo sido evidenciadas pela aplicação Anaconda para diferentes organismos. Por exemplo, o contexto nas leveduras evidenciou características nos organismos eucariotas que não está relacionado com a tradução dos genes, mais concretamente, a preferência dele mesmo para seu vizinho, originando uma diagonal verde nos mapas de contexto. Ainda está por comprovar em laboratório experimentalmente se estas repetições melhoram a eficiência ou precisão no processo de tradução nas leveduras, pois não existem até ao momento testes específicos que indiquem o aumento de eficácia nestas regiões. Nas análises comparativas demonstrou-se que o processo de replicação assim como o processo de tradução influenciam o contexto dos codões. Com esta aproximação ficou comprovada a importância da influência das zonas codificantes para o contexto, mas comprovou-se também que o processo de tradução também influência o contexto.

Os estudos realizados, tanto para as regiões codificantes como para as regiões não codificantes, produziram semelhantes padrões estando em conformidade com estudos anteriormente apresentados [154]. Estes resultados implicam que muitos dos constrangimentos detectados nas regiões codificantes não são impostos pela maquinaria de tradução, mas resultam da pressão selectiva da replicação do DNA.

A tendência do codon usage é principalmente mantida pela pressão imposta pela mutação e

em segundo plano está a influência imposta pelo processo de tradução, confirmando assim a relevância da replicação do DNA na influência do contexto de codões [155].

A análise efectuada aos 119 organismos em relação à influência dos dinucleótidos confirma uma clara rejeição da metilação nas sequências C-G codificantes nos eucariotas. A metilação do DNA torna-o indisponível para a transcrição e consequentemente para a tradução [156]. Por outro lado, os dinucleótidos U-A são extremamente reprimidos no conjunto dos 119 organismos.

Como anteriormente foi afirmado, somente uma única regra geral foi detectada para os 119 organismos analisados, rejeitando os pares de codões com a combinação xxU-Ayy. Claramente, esta tendência é o resultado da repressão do dinucleótido U-A nas sequências dos organismos. No entanto, outros contextos que têm o dinucleótido U-A não são fortemente rejeitados. Por exemplo, o contexto xUA-Ayy é geralmente preferido nas sequências, indicando que existem diferenças entre contextos que contêm o dinucleótido

127 U-A. Este facto sugere que o processo de tradução influencia a escolha dos pares de codões.

O estudo da evolução é uma das áreas onde a sequenciação proporcionou grandes avanços, pois recorre às sequências genéticas para efectuar essas análises. Com esse objectivo em mente, foi desenvolvido um método para efectuar estudos de evolução recorrendo ao contexto de codões. Através do Anaconda já foi possível efectuar um estudo de evolução entre organismos, recorrendo aos seus genes homólogos, pertencendo aos três reinos da vida e estando em fase de submissão para publicação.

Na parte de alteração das regiões codificantes uma solução foi proposta, tendo sido desenhada de forma a proporcionar a aplicação da informação obtida. No entanto, os resultados ainda terão de ser testados em laboratório para poderem ser posteriormente publicados.

No campo dos algoritmos de biclustering, o algoritmo ISA foi analisado em detalhe,

encontrando algumas desvantagens e propondo algumas alterações de forma a melhorar o seu desempenho em matrizes de menor dimensão. O novo algoritmo foi implementado com sucesso estando disponível para ser utilizado pela comunidade científica através da aplicação desenvolvida. Efectuou-se também um estudo exaustivo de comparação entre o algoritmo proposto e o algoritmo original tendo o trabalho sido submetido a uma revista científica.

Vários índices já disponíveis para caracterizar as zonas codificantes foram também inseridos no modelo, como os valores de tRNA e codon usage, possibilitando relacioná-los

com os valores residuais.

Com este novo modelo, suportado pela aplicação Anaconda, é possível caracterizar exaustivamente vários genomas possibilitando ainda correlacioná-los entre si, algo que não era possível até à presente aplicação. A informação é ainda passível de ser exportada podendo ser utilizada por outras aplicações em posteriores análises.

Dans le document Caroline QUAY-THEVENON Adèle CHAIZE-RIONDET (Page 43-52)