Revista - biotecnologia ed 12 - encarte

Revista - biotecnologia ed 12 - encarte

(Parte 1 de 2)

Biotecnologia CiŒncia & Desenvolvimento - Encarte Especial 123

Encarte ESPECIAL

O Brasil na era da Genomics

A Ærea de genomics vive hoje uma fase histórica sem precedentes. Vinte e dois genomas bacterianos jÆ se encontram totalmente sequenciados, os genomas de levedura e C. elegans foram completados e os genomas de Drosophila e de Arabdopsis thaliana devem estar finalizados em poucos meses. Recentemente foi publicada a seqüŒncia do primeiro cromossomo 2 do homem e tudo indica que, atØ o final do ano 2000, estaremos muito próximos de atingir a seqüŒncia completa do genoma humano, fornecendo a base de toda a futura pesquisa na Ærea de genØtica humana, a pedra fundamental da medicina dos próximos anos.

Graças ao esforço feito pela diretoria científica da FAPESP, que pela rede ONSA (Organisation for Nucleotide Sequence and Analysis) tem financiado projetos científicos de larga escala na Ærea de genomics, o Brasil ainda pode surgir como um centro de excelŒncia para a execuçªo de trabalhos arrojados nessa Ærea. O programa brasileiro de genomas nasceu com a iniciativa extremamente bem sucedida de sequenciar totalmente o genoma da bactØria Xylella fastidiosa. Apesar de os resultados de sequenciamento terem demonstrado que o genoma dessa bactØria Ø cerca de 30% maior que o esperado, o projeto chegou ao seu final cerca de seis meses antes do prazo determinado. Atualmente este genoma (o pri-

LUDWIG/FAPESPESPECIAL O Projeto Genoma e a EstratØgia Orestes

Emmanuel Dias Neto, PhD

Laboratório de GenØtica do Câncer, Ludwig Institute for Cancer Research emmanuel@compbio.ludwig.org.br

Fotos cedidas pelo autor meiro fitopatógeno a ser completamente sequenciado no mundo) encontra-se em fase de publicaçªo e, sem a menor dœvida, constitui um dos mais importantes marcos da ciŒncia nacional.

O impacto do programa ONSA vai muito alØm do fechamento do genoma de Xylella. Um dos principais frutos da iniciativa na Ærea de genomas foi a criaçªo de uma massa crítica respeitÆvel com a capacitaçªo de dezenas de pesquisadores e laboratórios para executar tØcnicas avançadas de biologia molecular. A difusªo da ciŒncia genômica foi fundamental para o surgimento de novos e ousados projetos dentro da rede ONSA. A rede jÆ conta hoje com outros trŒs importantes projetos de pesquisa em larga escala: o SUCEST (Sugar Cane EST project), o projeto genoma de um segundo fitopatógeno, a Xanthomonas campestris e o Projeto Genoma do Câncer Humano Ludwig/FAPESP (HCGP). Este œltimo Ø um dos mais ambiciosos projetos da rede ONSA, pois pretende contribuir para a descoberta gŒnica e anotaçªo do genoma humano, sem dœvida a Ærea de pesquisa mais competitiva a nível mundial. A entrada do Brasil em um projeto tªo competitivo, apenas foi possível com o disponibilidade de aplicaçªo de uma tØcnica de descoberta gŒnica desenvolvida no Brasil. Um outro diferencial fundamental foi a parceria entre uma instituiçªo privada de pesquisas (o Instituto Ludwig de Pesquisas sobre o Câncer

124 Biotecnologia CiŒncia & Desenvolvimento - Encarte Especial

Biotecnologia CiŒncia & Desenvolvimento - Encarte Especial 125

ILPC) e um órgªo estadual de financiamento à pesquisa (a FAPESP), que financiaram em proporçıes iguais um projeto de cerca de 12 milhıes de dólares.

Grupos e estratØgias no Genoma Humano

Estimativas atuais indicam que o genoma humano deva ter algo entre 3 a 3,5 bilhıes de nucleotídeos com algo entre 80 e 150 mil genes expressos. Com o objetivo comum de desvendar a sequŒncia de todos os genes humanos, diversas estratØgias vŒm sendo usadas hoje no Projeto Genoma Humano, as trŒs mais importantes sªo:

1) O sequenciamento ordenado de grandes porçıes genômicas definidas estratØgia adotada por grupos como Sanger Centre e Washington University. Esta abordagem permitiu o tØrmino do sequenciamento do cromossomo

2 humano publicado recentemente.

2) O sequenciamento completo do genoma por shot-gun . EstratØgia ainda polŒmica, aplicada com sucesso em genomas bacterianos que consiste na quebra do genoma humano em fragmentos pequenos que sªo sequenciados ao acaso atØ fecharem o genoma com o auxílio de um pesado sistema computacional. Vem sendo adotada pela Celera, uma empresa norte-americana comandada pelos maiores especialistas em genomas bacterianos.

3) Uma abordagem paralela tenta uma identificaçªo prioritÆria dos genes expressos, pela estratØgia de geraçªo de etiquetas de seqüŒncias expressas ou ESTs. Esta estratØgia vem sendo usada em larga escala nos laboratórios ligados ao CGAP (Cancer Genome Anatomy Project), financiado pelo Instituto Nacional do Câncer, nos USA e se concentra apenas nos 3% do genoma que representam os genes expressos, permitindo uma grande reduçªo dos custos e um aumento na velocidade de obtençªo dos resultados finais.

A estratØgia de sequenciamento prioritÆrio dos genes humanos foi escolhida pelo HCGP, adotando a metodologia denominada ORESTES (Open Reading frame ESTs). Nossos resultados indicam que ORESTES permite a obtençªo preferencial de regiıes codificadoras do genoma humano, favorecendo uma normalizaçªo dos genes obtidos. Estes dois fatores sªo cruciais e vŒm determinando o grande sucesso do projeto. A obtençªo de ESTs centradas na porçªo interna dos genes facilita a descoberta gŒnica, pois as seqüŒncias de DNA podem ser traduzidas e similaridades a nível de proteína sªo possíveis de serem observadas. Esta característica torna as ORESTES ainda muito mais œteis pois estas se

Laboratórios de seqüenciamento

LocalizaçªoCentros e laboratórios de sequenciamento

Maria InŒs Moura Campos PardiniIL2Fac. de Medicina de Botucatu/UNESP - Hemocentro Marina Pasetto NóbregaIL3Inst. de Pesquisa e Desenvolvimento - UNIVAP Silvia Regina RogattoIL5Depto de GenØtica, Instituto de BiociŒncias/UNESP - Botucatu Fernando Ferreira CostaCM0Hemocentro, Fac. de CiŒncias MØdicas, UNICAMP Christine HackelCM1Depto de GenØtica MØdica, UNICAMP Helaine Carrer e Dirce Maria CarraroCM2CEBTEQ - ESALQ Depto de Química Maria de FÆtima SonatiCM3Fac. de CiŒncias MØdicas Depto de Morfologia, UNICAMP Gonçalo Guimarªes PereiraCM4Depto de GenØtica e Evoluçªo, UNICAMP Marcelo Ribeiro da Silva BrionesPM0Depto de microbiologia, imunologia e parasitologia, UNIFESP, SP, SP Rui Monteiro de Barros MacielPM1Depto de Endocrinologia, UNIFESP Luis Eduardo Coelho AndradePM2Depto de Reumatologia Ismael Dale Cotrim Guerreiro da SilvaPM3Depto de Biofísica Joªo Bosco PesqueroPM4Depto de Ginecologia e Obstetrícia SØrgio Verjovski de AlmeidaQV0Inst. de Química USP, SP, SP Arthur GruberQV1Fac. de Medicina VeterinÆria e Zootecnia USP, SP, SP Mari Cleide SogayarQV2Instituto de Química USP, SP, SP Edna Teruko KimuraQV3Instituto de CiŒncias BiomØdicas, USP, SP, SP Hamza Fahmi Ali El-DorryQV4Instituto de Química USP, SP, SP Marco Antônio ZagoRC0Fac. de Medicina, Depto de Clínica MØdica, Ribeirªo Preto, SP Enilza Maria EspreaficoRC1Depto de Morfologia, FMRP Gustavo Henrique GoldmanRC2Fac. de CiŒncias FarmacŒuticas de Ribeirªo Preto Maria Luisa Paçó-LarsonRC3Depto de Morfologia, FMRP Vanderlei RodriguesRC4Depto de Parasitologia, Microbiologia e Imunologia, FMRP Eloiza Helena Tajara da SilvaRC5Instit. BiociŒncias, Letras e CiŒncias Exatas Sªo JosØ do Rio Preto/UNESP Sandro Roberto ValentiniRC6Faculdade de CiŒncias FarmacŒuticas de Araraquara/UNESP Maria Aparecida NagaiMR0Fac. de Medicina, Depto de Radiologia, USP, SP, SP Angelita Habr-GamaMR1Depto Gastroenterologia, FMUSP Daniel Giannella NetoMR2Hosp. das Clínicas SSSP Depto de Clínica MØdica Suely Kazue Nagahashi MarieMR3Depto de Neurologia, FMUSP Elizabeth Martins e Paulo Lee HoMR4Centro de Biotecnologia, Instituto Butantan

Tabela I Centros e laboratórios de sequenciamento do Projeto Genoma do Câncer Ludwig/FAPESP

126 Biotecnologia CiŒncia & Desenvolvimento - Encarte Especial mostram complementares às centenas de milhares de ESTs humanas, geradas por grupos como CGAP, Universidade de Washington e outros. Esta complementaridade se dÆ pois as ESTs destes grupos sªo derivadas das extremidades 3 e 5 dos genes, permitindo, com o uso de ORESTES, a formaçªo de contigs e a eventual obtençªo da seqüŒncia completa dos transcritos humanos. Por outro lado, a capacidade de normalizaçªo faz com que genes raros ou pouco expressos, normalmente um ponto fraco das bibliotecas de cDNA, estejam presentes nas bibliotecas e possam ser sequenciados.

Base de ORESTES, tumores estudados e resultados parciais

Para a obtençªo das ORES-

TES nos baseamos na complementaridade parcial entre oligonucleotídeos e seqüŒncias de mRNAs/cDNAs. Sob condiçıes de baixo rigor de hibridizaçªo, uma complementaridade parcial entre um oligonucleotídeo e algumas molØculas de diferentes mRNAs jÆ Ø suficiente para gerar uma interaçªo produtiva, capaz de permitir a síntese de molØculas de cDNA. Estas molØculas de cDNA sªo entªo amplificadas, tendo como base o mesmo princípio de complementaridade parcial. Conforme esperado, o uso de iniciadores nestas condiçıes, favorece a prevalŒncia de porçıes centrais (codificadoras) dos genes expressos, gerando dados de seqüŒncia œnicos, nªo disponíveis com outras metodologias usuais. Se avaliarmos a distribuiçªo posicional de ESTs derivadas de genes conhecidos, podemos avaliar se estas realmente sªo derivadas da porçªo central. Esta avaliaçªo Ø feita tomandose individualmente cada ORESTES derivada de um gene humano conhecido, e avaliando a regiªo da molØcula de mRNA que se encontra representada na EST. Se temos uma molØcula de mRNA com 3.0 nucleotídeos e esta apresenta um alinhamento correspondente à base 1.500, sabemos que esta EST representa o ponto de 50% do gene, a sua porçªo mØdia. Quando esta distribuiçªo posicional foi avaliada em 7 mil ESTs correspondentes a genes humanos, temos o grÆfico mostrado na figura 1. O mesmo padrªo foi observado quando avaliamos esta mesma distribuiçªo usando ESTs correspondentes a 20 mil genes humanos.

No HCGP, optamos por utilizar, como a base biológica de descoberta gŒnica, alguns tumores epidemiologicamente importantes no Brasil. Sendo assim, temos hoje um enfoque principal em tumores de cabeça e pescoço, cólon, mama e estômago. Ao mesmo tempo, temos um enfoque secundÆrio em tumores mais raros, onde o potencial de descoberta gŒnica deve ser maior.

Entre estes estudamos tumores renais do tipo Wilm s, leiomiosarcoma, testículo, PNET (tumor neuroectodØrmico primitivo), tumores de sistema nervoso central (gliomas e meningiomas), tumores de cólo de œtero e leucemias. JÆ contamos hoje com mais de 170 mil ESTs disponíveis no banco de dados do projeto e mais de 25.0 diferentes genes jÆ identificados. Quando comparado ao CGAP (Cancer Genome Anatomy Project) americano, lançado em meados de 1997, vemos que o HCGP possui um nœmero mais de 10 vezes maior de ESTs derivadas de tumores de cabeça e pescoço. TambØm jÆ superamos o CGAP americano em termos de nœmero de ESTs derivadas de tumores de mama, estômago, Wilms, leiomiosarcoma, testículo e PNET.

Estrutura do projeto

O projeto tem toda a sua coordenaçªo no Instituto Ludwig de Pesquisas sobre o Câncer em Sªo Paulo. Sob a coordenaçªo geral de Andrew Simpson, que tambØm coordenou o sequenciamento de Xylella fastidiosa, trabalham as coordenaçıes de RNA, de bibliotecas, cinco coordenaçıes de sequenciamento e a coordenaçªo de bioinformÆtica. A coordenaçªo de RNA Ø feita pela equipe de Luis Fernando Reis, responsÆvel pela obtençªo de RNA mensageiro com as qualidades requeridas pela tØcnica (ausŒncia de contaminaçªo com DNA genômico ou degradaçªo de mRNA). Após a assinatura de termo de consentimento informado pelos pacientes, o material tumoral obtido na cirurgia Ø imediatamente acondicionado em N 2, de modo a evitar a degradaçªo do

RNA a ser extraído. O tecido Ø dissecado pela equipe do Departamento de Anatomia Patológica do Hospital do Câncer (coordenado por Fernando Soares) e tratado com DNAse, a fim de remover contaminaçıes com DNA genômico. Após passar por rigorosos controles, que devem demonstrar a ausŒncia de contamina-

Figura 1 Distribuiçªo posicional mØdia de ORESTES similares a genes humanos. O ponto zero corresponde à extremidade 5 e o ponto 100 à extremidade 3

Biotecnologia CiŒncia & Desenvolvimento - Encarte Especial 127 Geraçªo de mensal de ESTs dentro do HCGP çªo com DNA genômico e a ausŒncia de degradaçªo, o mRNA Ø repassado à coordenaçªo de bibliotecas.

A coordenaçªo de bibliotecas, sob responsabilidade de Emmanuel Dias Neto, co-inventor da tØcnica ORESTES juntamente com Andrew Simpson, Ø responsÆvel pela execuçªo da parte tØcnica que assegura as duas maiores vantagens da metodologia: a normalizaçªo da populaçªo de genes expressos (permite a obtençªo de sequŒncias derivadas de genes raros) e a obtençªo de fragmentos de cDNA derivados da porçªo central, codifica- dora, dos genes expressos. Esta coordenaçªo Ø responsÆvel pela síntese e posterior amplificaçªo por PCR das molØculas de cDNA, gerando perfis complexos de bandeamento de cDNAs. Após a avaliaçªo destes perfis e a anÆlise de controles das reaçıes, os perfis de bandeamento sªo repassados às coordenaçıes de sequenciamento, para a distribuiçªo dos perfis, obtençªo das bibliotecas de ORESTES e sequenciamento. A coordenaçªo de bibliotecas tambØm Ø responsÆvel pelo monitoramento diÆrio dos resultados e pelo constante desenvolvimento de melhorias no processo.

Os cinco centros de sequenciamento de DNA se encontram em algumas cidades do estado de Sªo Paulo. Em Sªo Paulo, capital, temos os coordenadores Maria Aparecida Nagai,

Marcelo Ribeiro da Silva Briones e SØrgio Verjovski de Almeida . Em Ribeirªo Preto, temos o grupo de Marco Antônio Zago e em Campinas, o grupo de Fernando Ferreira Costa. Ao redor dos centros, temos os laboratórios de sequenciamento, conforme a tabela 1.

Tecnologia de sequenciamento

Uma outra inovaçªo do HCGP foi a utilizaçªo de sequenciadores automÆticos de DNA de œltima geraçªo, que empregam a tecnologia capilar. Tais aparelhos apresentam uma sØrie de vantagens sobre os sequenciado- res de DNA da geraçªo anterior. As principais vantagens sªo uma automaçªo quase total no processo de sequenciamento, nªo havendo a necessidade de preparo de gØis de sequenciamento ou do tracking das amostras sequenciadas. Estes sequenciadores sªo tambØm extremamente rÆpidos, atingindo o sequenciamento de 96 amostras simultâneamente, em apenas 2 horas de operaçªo, com cerca de 700 bases de leitura por amostra. Com o bom desempenho de seis aparelhos MegaBace 1000 adquiridos junto à empresa Molecular Dynamics/Pharmacia, o HCGP estÆ atu-

Sequenciador capilar de DNA - Megabace 1000 - Seis destes aparelhos sªo usados na geraçªo de ESTs no HCGP

Detalhes dos dados processados do sequenciamento de uma amostra

128 Biotecnologia CiŒncia & Desenvolvimento - Encarte Especial almente com um ritmo diÆrio de cerca de 1400 ESTs validadas dentro dos critØrios de qualidade adotados pelo projeto. Em breve, este valor deve subir para pouco mais de 2.0 novas ESTs/dia. A evoluçªo mensal do projeto pode ser acompanhada no grÆfico 1.

Deposiçªo e anÆlise de dados

Após a procedimento das reaçıes de sequenciamento, os dados sªo enviados na forma de cromatogramas para o Centro de BioinformÆtica do projeto, tambØm localizado no Instituto Ludwig, em Sªo Paulo, sob a coordenaçªo de Sandro JosØ de Souza. Esta coordenaçªo desenvolveu programas que permitem a avaliaçªo da qualidade das ESTs recebidas e a retirada de regiıes de baixa qualidade, vetores e iniciadores usados nas reaçıes. As regiıes de alta qualidade sªo entªo submetidas a anÆlises de similaridade a nível de nucleotídeos e aminoÆcidos, permitindo a avaliaçªo dos resultados em termos de expressªo de genes conhecidos nos tecidos estudados, observaçªo de formas alternativas de splicing, polimorfismos (SNPs), mutaçıes, descoberta gŒnica e etc... Os SNPs sªo de grande valor e importância, e vŒm sendo estudados sistematicamente pelo grupo de Ribeirªo Preto. JÆ os dados relativos à descoberta gŒnica, compıe um percentual significativo dos achados. Mais de 45 mil de nossas ESTs nªo apresentam similaridades nos bancos de dados, enquanto que outras cerca de 2.500 ESTs apresentam similaridades com genes descritos em outros organismos ou novos membros de famílias gŒnicas humanas. Sendo assim, este projeto vem contribuir de maneira significativa para a descoberta de novos genes humanos. Algumas destas ESTs jÆ estªo sendo estudadas mais a fundo e deverªo representar, em breve, alguns dos primeiros genes humanos identificados no Brasil.

A importância da geraçªo de ESTs reveste-se de uma nova importância à medida que o sequenciamento do genoma se completa. Os dados do cromossomo 2 tornaram claro que as informaçıes derivadas de ESTs sªo cruciais para a identificaçªo de exons e prediçªo de formas alternativas de splicing, informaçªo nem sempre óbvia com os programas disponíveis na atualidade. Diante da pequena disponibilidade de ESTs derivadas da porçªo central dos genes, os dados de ORESTES tŒm seu valor ainda mais aumentado. Como ficou claro com a avaliaçªo feita na seqüŒncia do cromossomo 2, em diversas ocasiıes foi possível fazermos a chamada anotaçªo de um gene, graças à natureza œnica dos dados gerados pelo programa brasileiro.

A importância dos dados foi reconhecida pelo comitŒ externo de avaliaçªo do projeto. Pessoas de grande importância na pesquisa mundial vŒm ao Brasil 2 ou 3 vezes por ano e avaliam a qualidade dos dados gerados e a conduçªo geral do projeto. Alguns dos pesquisadores que avaliam o projeto sªo Phillip Sharp (PrŒ-

A parte superior da figura mostra uma visªo geral do sequenciamento simultâneo de 96 amostras. A porçªo inferior mostra em detalhe o cromatograma de uma amostra individual

Fotografia de um dos seis conjuntos (cada um com 16 capilares) de capilares de vidro onde Ø feita a eletroforese dos fragmentos de DNA durante o sequenciamento

Biotecnologia CiŒncia & Desenvolvimento - Encarte Especial 129 mio Nobel de Medicina, pela descoberta dos introns); John Sgouros (coordenador de bioinformÆtica do projeto genoma de levedura); Marcelo Bento Soares (autoridade mundial na produçªo de bibliotecas de cDNA) e Victor Jongeneel (especialista em bioinformÆ- tica do Ludwig Institute, na Suíça).

(Parte 1 de 2)

Comentários