• Aucun résultat trouvé

Agent-based modelling and population dynamics

Abordagens experimentais em larga escala para a identificação dos primeiros miRNAs ficou limitada às técnicas de clonagem que enfrentaram grandes dificuldades em virtude do pequeno tamanho dos miRNAs, efeitos fenotípicos muitas vezes discretos e expressão em condições ou tipos celulares específicos (MENDES; FREITAS; SAGOT, 2009).

O desenvolvimento da tecnologia de RNA-Sequencing (RNA-Seq), aliado ao advento das tecnologias de alto rendimento por NGS, permitiu a identificação e caracterização de novos transcritos a um baixo custo e alta eficiência (MENDES; FREITAS; SAGOT, 2009).

Ambros et al. apresentaram a identificação e anotação de novos miRNAs de diversos organismos. A construção do banco de dados denominado de “Rfam de famílias de RNA”, forneceu uma compreensão on-line para as atribuições dos miRNAs (AMBROS, 2003).

Essas tecnologias impulsionaram o implemento de um banco de dados chamado miRBase (http://www.mirbase.org), que assumiu a funcionalidade de registro de microRNAs, expandido com funções principais, o qual atua como um repositório independente da nomenclatura de genes de miRNAs, fornecendo interfaces integradas, anotações e alvos previstos (GRIFFITHS-JONES et al., 2006).

Na sua versão atual, o miRBase versão 22, disponibiliza os dados mais recentes e atualizados no endereço (ftp://mirbase.org/pub/mirbase/), acessível com 38.589 loci de genes de miRNA de 271 espécies, expressando 48.885 miRNAs maduros, 10.031 novas sequências de hairpins e 13.149 miRNAs maduros que foram adicionados em relação a versão anterior (http://www.mirbase.org/).

A identificação correta dos miRNAs pelo método de RNA-Seq depende fundamentalmente das características próprias que os distinguem de outros pequenos RNAs. Nesse tipo de experimento, produz-se dezenas ou centenas de milhões de sequências em forma de leituras (reads) dos precursores de miRNAs que precisam ter a sua posição e localização genômica devidamente anotados

FIGURA 9: AS SEQUÊNCIAS DE miRNAs MADUROS GERADAS PELO EXPERIMENTO DE RNA-SEQ. Essas sequências exibem padrão típico de mapeamento, precisão e abundância em

uma das possíveis regiões maduras (-5p ou -3p) do precursor. Dessa forma, a maioria dos reads correspondem a uma sequência predominante, proveniente de uma das regiões maduras que foram mapeadas em regiões -5p ou -3p do precursor que origina o miRNA.

(PRITCHARD; CHENG; TEWARI, 2012). Esses procedimentos são feitos por meio de algoritmos computacionais (SUN et al., 2014).

Caso as sequências geradas, reads, forem provenientes de miRNAs maduros, após o mapeamento contra o genoma de referência, as sequências mais abundantes devem conter entre 18-24 nt. Além disso, devem exibir um padrão de mapeamento consistente com a estrutura da molécula precursora e, também, pelos processamentos feitos por Drosha e Dicer, com a predominância da cadeia madura do miRNA cobertas em regiões 5p ou 3p de miRNAs precursores (FIGURA 9) (GUO et al., 2015; MENDES; FREITAS; SAGOT, 2009).

Essas variantes de miRNAs são denominados isomiRs, termo usado por Morin et al. para se referir aos miRNAs que exibem variações de suas sequências causadas pelo processamento pós-transcricional (MORIN et al., 2008). Como os isomiRs contêm sequências diferentes, eles podem ter diferentes alvos e, portanto, diferentes funções biológicas (DESVIGNES et al., 2015).

Os reads dos miRNAs também podem ser mapeados para os fragmentos de RNA de cadeia simples, liberados da porção do loop do hairpin de miRNAs chamados miRNAs de origem do loop, (FIGURA 10). Esses miRNAs foram observados abundantes e localizados no citoplasma incorporados em RISCs, contendo Ago2 (WINTER et al., 2013).

Essas variantes são reguladas independentemente e podem desempenhar papéis cooperativos, complementares ou alternativos na função celular e na regulação gênica (DESVIGNES et al., 2015). Os seguintes miRNAs são exemplares conhecidos dessa variante: hsa-mir-182, hsa-mir-147a, hsa-mir-300, hsa-mir-507, hsa-mir-3609.

FIGURA 10: ESTRUTURAS DE LOOP-miR. (A) Os precursores de miRNA podem ser processados

em três moléculas curtas de RNA de cadeia simples, a partir da região localizadas na cadeia madura do miRNAs em regiões 5p, 3p ou do loop-miR. (B) Exemplares selecionados de estruturas de pre- miRNA geradoras de loop-miR. As setas pretas mostram os pontos de clivagem feitos por Dicer, a partir das quais são verificadas as regiões de loop na cadeia do miRNA.

Após a identificação ou caracterização de novos miRNAs, existe uma etapa seguinte que consiste na quantificação da expressão gênica, a qual se utiliza o número de reads que mapearam nas respectivas regiões genômicas anotadas como miRNAs. Então, são aplicados métodos de normalização de reads que levam em conta o fator de normalização e a quantidade de reads mapeados, para comparar a expressão do miRNA entre as amostras (MOTAMENY et al., 2010). Os métodos mais usados são implementados nos pacotes DESeq e edgeR, (ANDERS; HUBER, 2010; ROBINSON; MCCARTHY; SMYTH, 2009)

Esses métodos assumem que a maioria dos genes não são diferencialmente expressos. No método com DESeq o fator de normalização para cada amostra (ex. tecido ou linhagem celular) é dado pela mediana da razão do número de reads correspondentes de cada gene sobre a média geométrica da contagem de reads do respectivo gene em todas as amostras. Enquanto que, no método edgeR o fator de normalização chamado TMM (Trimmed Mean of M-values) é calculado para cada amostra, tomando-se uma delas como referência e as demais como teste (SEYEDNASROLLAH; LAIHO; ELO, 2013).

O TMM é calculado, pela média ponderada das razões do número de reads entre a amostra teste e a referência em escala logarítmica, após a exclusão dos genes mais e menos expressos. O procedimento de normalização da expressão gênica para miRNAs é obtido, dividindo-se o número de reads mapeados do miRNA por este fator de normalização. Para os miRNAs não diferencialmente expressos, o fator de normalização deve ser próximo de 1 (SEYEDNASROLLAH; LAIHO; ELO, 2013).

Outro método usado em experimentos de expressão diferencial é a análise da distribuição de Poisson, quando se tem repetições para diferentes bibliotecas (AUDIC; CLAVERIE, 1997). Nessa análise, quanto menor a probabilidade, mais diferencialmente expresso será o gene analisado entre ambas as bibliotecas, de modo que as comparações serão sempre duas a duas. Emprega-se, também, a correção de Bonferroni, caso o mesmo teste estatístico seja aplicado repetidamente para um mesmo conjunto de dados, onde o nível α é ajustado conforme análise

(AUDIC; CLAVERIE, 1997). O algoritmo IDEG6 é usado para essa finalidade (ROMUALDI et al., 2003).

Assim, os resultados de normalização e da análise da expressão diferencial podem variar bastante de acordo com a metodologia usada, principalmente, em casos onde os experimentos são planejados sem repetições.