• Aucun résultat trouvé

Note on trusts concerning the récognition and enforcement of

A bioinformática, apresentou maior importância na área genômica na segunda metade da década de 80, com a geração de uma quantidade expressiva de sequências, devido aos primeiros projetos de sequenciamento em larga escala, aumentando a demanda por recursos computacionais, cada vez mais eficientes, no armazenamento e suas ferramentas para interpretação dos dados biologicos (ROUZÉ, et al., 1999; PROSDOCINI et al., 2002). De forma sucinta, a bioinformática é definida como sendo uma área multidisciplinar que engloba diversas áreas como, biologia, matemática, física, tecnologia da informação entre outras disciplinas (SABBATINI, 1999).

Informações sobre 7.262 genomas completos e 10.809 incompletos até 2014, podem ser acessados no banco do GOLD (Genome OnLine Database, disponível em https://gold.jgi-psf.org/). Tais projetos envolvem representantes da área ambiental, médica, industrial e organismos modelos importantes para desenvolvimento de pesquisa científica. Essa maior disponibilidade de dados gerados a partir de sequenciamento tem tornado a bioinformática cada vez mais essencial na manipulação e análise rápida deste grande volume de informação.

A concretização da bioinformática e da biologia computacional nos últimos anos tem favorecido aos pesquisadores acesso a um grande número de dados, propiciando abordagens globais e inovadoras no que diz a respeito ao estudo da organização, estrutura e evolução de genomas (BINNECK, 2004; ABBY e DAUBIN, 2007) da predição de função de proteínas, interações e estrutura tridimensional (GINALSKI, 2006; LEE et al., 2007; SKRABANEK et al., 2008).

Focando no armazenamento desses grandes volumes de dados, além de permitir o acesso rápido e de forma eficiente, vários bancos de dados foram sendo criados, tanto de acesso público como privado, além de redes de acesso que admitissem a interação desses grupos (PROSDOCINI et al., 2002). Embora ainda existam muitos bancos de acesso restrito, é notória a tendência que dados gerados sejam disponibilizados e sejam acessíveis a toda comunidade cientifica, onde alguns bancos já disponibilizam seus dados como o GenBank, do NCBI (National Center for Biotechnology Binformation) dos EUA, que se destaca como um dos bancos mais consultados, uma vez que inclui aproximadamente 181.336.445 milhões de sequências (NCBI, 2015). O GenBank está integrado com duas organizações, o EMBL (European Molecular Biology Laboratory; Laboratório de Biologia Molecular Europeu) e o DDBJ (DNA DataBank of Japan; Banco de Dados de DNA do Japão), sendo que as três trocam dados diariamente. (NCBI, 2015).

Outro banco de dados criado para facilitar os estudos de genômica comparativa de plantas é o Phytozome (http://phytozome.jgi.doe.gov/pz/portal.html), o qual abriga mais de 41 genomas de plantas sequenciados e anotados, agrupados em 20 famílias de genes e, frequentemente anotados com auxílio de outros bancos de proteínas, tais como: o PFAM e o KEGG (Kyoto Encyclopedia of genes and Genomes) (PHYTOZOME, 2015). Informações acerca de estruturas 3D de proteínas e de ácidos nucleicos

apresentam-se, também, disponíveis em bancos como o PDB (Protein Data Bank, http://www.rcsb.org/pdb/) o qual tem sido fundamental no entendimento dos aspectos moleculares (PDB, 2015).

Com o campo dos peptídeos antimicrobianos crescendo rapidamente por causa da demanda por novos agentes antimicrobianos e, para melhor entender a função destes peptídeos, novos bancos de dados foram desenvolvidos para reunir informações sobre tais peptídeos. Informações sobre peptídeos em geral podem ser encontradas no APD - The Antimicrobial Peptide Database (http://aps.unmc.edu/AP/about.php), no qual estão disponibilizados 2.513 peptídeos antimicrobianos de diversos organismos (bactérias, fungos, plantas e animais); o CAMP - Collection of Anti-Microbial Peptides (http://www.camp.bicnirrh.res.in/dbStat.php), composto por 6.756 sequências de AMPs (das quais, 2.602 validadas experimentalmente, 1.716 patentes e 682 estruturas de vários organismos). Ainda, dentre os outros bancos de AMPs, destacam-se: aqueles isolados de bactérias (BAGEL http://bagel2.molgenrug.nl/; BACTIBASE http://bactibase.pfba-lab-tun.org/main.php), Peptídeos inibidores de HIV (HIPdb http://crdd.osdd.net/servers/hipdb/), Defensinas base de conhecimento (http://defensins.bii.a-star.edu.sg/), de plantas (PhytAMP http://phytamp.pfba-lab- tun.org/main.php), além do banco com acesso a informações sobre abordagens recombinantes de AMPs (RAPD - Recombinantly-produced Antimicrobial Peptides Database, http://faculty.ist.unomaha.edu/chen/rapd/).

Dentre os AMPs conhecidos, os peptídeos cíclicos vêm se destacando devido ao seu interesse pela indústria farmacêutica e agrícola, sua estabilidade térmica e enzimática, sua conformação (cíclica), trazendo novas perspectivas de uso. Interessantemente, os ciclotídeos tem se apresentado um excelente candidato a inseticidas, como confirmado em estudos no combate insetos causadores de doenças e pragas em plantas cultivadas (PINTO et al, 2012).

Um banco de dados direcionado a tais peptídeos cíclicos é o Cybase (The Database of Cyclic Proteins), desenvolvido pelo grupo do Instituto de Biociências Moleculares da Universidade de Queensland, Austrália e liderado pelo professor David Craik. Este grupo se dedica à descoberta e caracterização de proteínas circulares, em especial da família que nomearam de ciclotídeos. O interesse envolve a determinação da estrutura por Ressonância Magnética Nuclear de uma gama de proteínas ricas em

ligações dissulfeto, que apresentam aplicações no planejamento de fármacos, incluindo organismos como cobras, aranhas, rãs e plantas. Este banco possui acesso a mais de 800 proteínas de 103 espécies, dentre estas 532 são ciclotídeos de 55 espécies, além de acesso a sequências nucleotídicas e estruturas.

Além do armazenamento e disponibilização de um grande número de informações, um banco de dados também disponibiliza várias ferramentas destinadas ao processamento e análise desta grande quantidade de dados. Estas ferramentas permitem, por exemplo, a análise de predição in silico de sequências desconhecidas e novos genes, por meio de análises de alinhamentos comparativos (KENT et al., 2002).

O alinhamento local (BLAST – Basic Local Alignment Search Tool), ferramenta mais popular e acessível (ALTSCHUL et al., 1990), permite comparar e alinhar uma sequência de DNA ou proteína “query” com todas as sequências, retornando assim, aquelas sequências (DNA ou proteína) com maior homologia encontradas no banco de dados pesquisado.

O BLAST é dividido em várias funcionalidades, o que depende do tipo de busca e retorno que é desejado. Por exemplo, o BLASTn compara sequências de nucleotídeos contra o banco de dados de nucleotídeos; o BLASTp, compara sequências de aminoácidos com o banco de proteínas; o BLASTx, traduz a sequência de DNA para proteína e a compara com banco de dados proteico; o tBLASTn, compara sequências proteicas com o banco de dados de nucleotídeos traduzido; e o tBLASTx traduz tanto a sequência nucleotídica quanto o banco de dados de nucleotídeos e os compara.

As sequências nucleotídicas também podem ser traduzidas, sendo possível analisar sua sequência proteica. Um exemplo de ferramenta que traduz as sequências nucleotídicas e encontra todos os quadros abertos de leitura (NCBI, 2015) é o ORF- Finder (Open Reading Frame Finder).

Para uma análise comparativa de sequências, seja DNA ou proteína, a ferramenta de alinhamentos múltiplos mostra a homologia posicional entre as bases nucleotídicas ou aminoácidos presentes nas sequências, que podem ser de espécies diferentes, o CLUSTAL (THOMPSON et al., 1997) é um dos softwares mais utilizados para efetuar estes alinhamentos múltiplos.

Outras ferramentas e software podem ser acessados no ExPASy (Bioinformatics Resource Portal) que foi disponibilizado pelo SIB (Swiss Institute of Bioinformatics) e

podem ser acessados para análises em diversas áreas das ciências da vida como proteômica, genômica, biologia de sistemas, filogenia, transcriptômica e genética de populações, entre outras. Entre as ferramentas disponíveis está o Swiss Model - utilizada para modelagem por homologia de proteínas. A modelagem por homologia é um método no qual que se obtém a estrutura tridimensional de uma sequência proteica, a partir da similaridade desta com uma ou mais estruturas proteicas já conhecidas (ROST et al., 1996; KOLINSKI et al., 1999).

Os recursos e bancos de dados descritos são uma pequena parte do que se tem disponível na internet de forma gratuita, além dos recursos que podem ser baixados e utilizados localmente, a depender de que análise se busca. Tais ferramentas e abordagens têm auxiliado o estudo em diversas áreas da comunidade cientifica.