FORECASTING PERFORMANCE
1. Related Literature
pos complexos
Luciana Correia de Almeida Regitano, Bruno Gabriel Nascimento Andrade
As ciências “ômicas” se dedicam-se ao estudo em larga escala de dados biológicos de diferentes naturezas (bioquímica, genética, fi siológica, micro- biológica), sendo o termo “ômica” derivado do sufi xo “-oma”, que signifi ca “conjunto de”.
Apesar do termo genômica ter sido concebido por Thomas H. Roderick em 1986, já em 2007, eram relatados mais de 829 termos com o sufi xo “-ômica” (Yadav, 2007). Essas ciências foram alavancadas pelos desenvolvimentos de métodos analíticos aplicados a moléculas como ácidos nucleicos, proteínas, lipídeos e metabólitos alcançados nos últimos 25 anos, e foram marcadas historicamente pela publicação dos resultados do Projeto Genoma Humano, em 2001.
A genômica é o estudo da sequência completa ou parcial do genoma de um organismo, do ponto de vista de estrutura e função dos genes, interações com moléculas regulatórias, como os RNAs não codifi cadores e Fatores de Transcrição, as modifi cações epigenéticas (Epigenômica), as variações de sequência e suas consequências, o material genético (genomas, plasmíde- os) de uma comunidade de micro-organismos presentes em amostras do ambiente (Metagenômica). O sequenciamento total ou parcial de genomas permite também inferir sobre as relações fi logenéticas entre espécies e po- pulações dentro de espécies, assim como, sobre a origem e evolução dos genes.
À exceção dos vírus de RNA, a expressão das características genéticas ocor- re por meio da transcrição da mensagem contida, sob a forma de DNA, no genoma, em moléculas intermediárias de RNAm, que serão traduzidas em proteínas. Assim, a simples informação sobre a sequência do genoma não permite inferir sobre o seu funcionamento, o que pode ser alcançado pela Transcriptômica, que descreve o conjunto de moléculas de RNA, e pela Pro- teômica, dedicada à caracterização em larga escala do conjunto de proteínas expressas em uma amostra biológica, permitindo inferir sobre a expressão do genoma em um determinado momento. Já a Metabolômica, que descreve os produtos do metabolismo de uma determinada molécula em uma amostra, 1Embrapa Pecuária Sudeste, [email protected], Bruno Gabriel Nascimento Andra- de.
fornece informações sobre o resultado fi nal dos processos bioquímicos de um ou mais sistemas biológicos presentes na amostra.
O conjunto de abordagens que nos permite acessar o material genético de populações de microrganismos (dos quais muitos são completamente des- conhecidos pela ciência) é chamado de Metaômica (Metagenômica, meta- transcriptômica, metaproteômica, etc). Meta signifi ca “Além” sendo, portanto, abordagens como a Metagenômica traduzidas de forma literal como “Além da genômica”. Abordagens metaômicas permitem identifi car novos genes, trans- critos, proteínas e enzimas com grande potencial para as ciências da vida, da terra e biotecnologia, de microrganismos antes desconhecidos, por exemplo, pela impossibilidade de cultivo em laboratório.
Em 2015, a metagenômica reescreveu os livros de biologia ao identifi car, pela primeira vez, um fi lo de arqueias em uma chaminé hidrotermal conhe- cida como “Castelo de Loki”, sendo nomeadas como Lokiarchaeota. Essas arqueias possuíam um maquinário molecular estranhamente parecido com o de Eucariotos, sugerindo um ancestral comum. Usando abordagens mo- dernas de fi logenômica, as arqueias recém descobertas foram classifi cadas como os organismos mais próximos dos Eucariotos, provando que a árvo- re da vida não possui três galhos de tamanhos iguais para as 3 ordens da vida, mas sim que os eucariotos são descendentes diretos de uma arqueia ancestral (Spang et al., 2015). Utilizando 800 Gb de sequenciamento com- pleto de amostras de líquido ruminal de 43 bovinos escoceses, Stewart et al. (2018) publicaram o rascunho de 913 genomas de bactérias e arqueias. A partir desses genomas, foi possível predizer 69.000 proteínas das quais 90% representavam sequências com algum grau de dissimilaridade em relação às existentes em bancos de dados.
Apesar do enorme potencial que cada uma dessas ciências tem isoladamen- te de contribuir para o conhecimento de uma ampla diversidade de molécu- las, é importante lembrar que os fenótipos são geralmente resultantes de complexa interação entre o DNA e diferentes categorias de RNA, bem como com proteínas como, por exemplo, os fatores de transcrição e as histonas, que muitos metabólitos possuem papel de regulação sobre o metabolismo. Quando se atem à população de microrganismos em um dado ecosistema, é relevante saber que a abundância de microrganismos de um determinado
taxa pode infl uenciar o sucesso no desenvolvimento de outro, assim como
regular a expressão gênica de espécies hospedeiras ou simbiontes. A biolo- gia de sistemas surge como a ciência que conecta dados produzidos pelas diferentes ciências -ômicas, integrando as informações sobre a estrutura e expressão dos genes, relacionando a diversidade quantitativa e qualitativa de moléculas com a manifestação de fenótipos de interesse, ou ainda, como preditora da diversidade e funcionalidade de microrganismos, como é o caso da integração de estudos de metagenômica e metatranscriptômica.
A disponibilidade simultânea de dados de variação de sequência do genoma, quer obtida por sequenciamento completo ou por genotipagem de SNPs, e de abundância de RNA, permite, por exemplo, o estudo dos Locos de Contro- le Quantitativo da Expressão Gênica (eQTLs - Expression Quantitative Trait
Loci), no qual se estima o efeito de SNPs dispersos pelo genoma sobre a
abundância de cada transcrito presente em um ou mais tecidos. Por exem- plo, utilizando essa abordagem, Cesar et al. (2018) identifi caram as regiões responsáveis pela variação no perfi l de RNAm de músculo de bovinos Nelore. Da mesma forma, é possível relacionar variações estruturais, como as varia- ções de número de cópias de segmentos do genoma (CNVs - Copy Number Variation), com os níveis de expressão de genes e com a expressão de fe- nótipos de interesse, como realizado por Geistlinger et al. (2018), ou ainda identifi car a relação entre os níveis de expressão de proteínas, RNAm e de miRNAs presentes em determinado tecido ou organismo, estágio do desen- volvimento ou condição ambiental.
Um desafi o importante advém do volume de dados produzido pelas ciências ômicas, geralmente da ordem de Gigabytes por dia, requerendo infraestru- tura computacional tanto para processamento quanto para armazenamento (D’Argenio, 2018). Além disso, métodos de análise sofi sticados precisam ser aplicados a tais conjuntos de dados, de forma a permitir extrair a informação relevante, identifi car as moléculas de interesse, relacionar as diversas molé- culas encontradas a processos relevantes para o problema em questão, ou seja, a interpretação desses dados, o que não é tarefa trivial. À medida que aumenta o número de “camadas” de informação “ômica” disponíveis, mais complexa é a tarefa de integrar essas informações, em função de hetero- geneidade de escalas, variâncias, tamanhos amostrais, entre outros. Além disso, os resultados das análises de dados referentes à identidade de uma sequência de DNA, à abundância de uma proteína ou RNAm são geralmente relativos ao estado da arte da espécie em questão, pois são obtidos pelo ali- nhamento de pequenas sequências com bancos de dados da própria espécie ou de espécies relacionadas. Portanto, a riqueza e semelhança fi logenética dos bancos de dados utilizados são determinantes para o resultado.
Apesar desses desafi os, o enorme potencial das abordagens ômicas permite antever impactos importantes na caracterização e conservação da variabili- dade, no desenvolvimento de protocolos nutricionais e fármacos dirigidos a perfi s individuais, identifi cação de mutações causais, entre outras aplicações.
Referências
CESAR, A. S. M.; REGITANO, L. C. A.; REECY, J. M. Identifi cation of putative regulatory re- gions and transcription factors associated with intramuscular fat content traits. BMC Genomics, v. 19, p. 499, jun. 2018.
D’ARGENIO, V. The high-throughput analyses era: are we ready for the fata struggle? High-Throughput, v. 7, n. 1, mar. 2018.
GEISTLINGER, L.; SILVA, V. H. da; CESAR, A. S. M.; TIZIOTO, P. C.; WALDRON, L.; ZIMMER, R.; REGITANO, L. C.; COUTINHO, L. L. Widespread modulation of gene expression by copy number variation in skeletal muscle. Scientifi c Reports, v. 8, p. 1399, 2018.
SPANG, A.; SAW, J. H.; JORGENSEN, S. L.; ZAREMBA-NIEDZWIEDZKA, K.; MARTIJN, J.; LIND, A. E.; VAN EIJK, R.; SCHLEPER, C.; GUY, L.; ETTEMA, TJG. Complex archaea that bridge the gap between prokaryotes and eukaryotes. Nature, v. 521, n. 7551, p. 173-179, 2015. doi:10.1038/nature14447.
STEWART, R. D.; AUFFRET, M. D.; WARR, A.; WISER, A. H.; PRESS, M. O.; LANGFORD, K. W.; LIACHKO, I.; SNELLING, T. J.; DEWHURST, R. J.; WALKER, A. W.; ROEHE, R.; WATSON, M. Assembly of 913 microbial genomes from metagenomic sequencing of the cow rumen. Na- ture Communications, v. 9, p. 870, 2018.
YADAV, S. P. The Wholeness in Suffi x -omics, -omes, and the Word Om. Journal of Biomole- cular Techniques, v. 18, n. 5, p. 277. 2007.