03/12/2019

Concluído o maior sequenciamento do genoma da cana-de-açúcar comercial

Concluído o maior sequenciamento do genoma da cana-de-açúcar comercial

Um grupo internacional liderado por pesquisadores brasileiros concluiu o sequenciamento mais completo já feito do genoma da cana-de-açúcar comercial. No total, foram mapeados 373.869 genes, o que corresponde a 99,1% do total.

O trabalho é resultado de quase 20 anos de pesquisas apoiadas pela FAPESP e abre caminho para o melhoramento genético da cultura mais produzida no mundo em toneladas, segundo a Organização das Nações Unidas para a Alimentação e a Agricultura (FAO).

artigo publicado na revista GigaScience tem como primeiras autoras Glaucia Mendes Souza, professora do Instituto de Química da Universidade de São Paulo (IQ-USP) e coordenadora do Programa BIOEN da FAPESP, e Marie-Anne Van Sluys, professora do Instituto de Biociências da USP e membro da Coordenação Adjunta de Ciências da Vida da FAPESP.

“É a primeira vez que a grande maioria dos genes da cana é visualizada. Em projetos anteriores, de vários grupos de pesquisa, as sequências estavam montadas de maneira colapsada, por falta de uma ferramenta de montagem adequada. Portanto, eram apenas uma aproximação”, disse Souza, que coordena o Projeto Temático “Redes regulatórias e sinalização associadas à cana energia”.

“Esse conhecimento abre diversas possibilidades, desde aplicações em biotecnologia e melhoramento genético até edição gênica [substituição ou eliminação de genes com funções específicas]”, disse Van Sluys, que coordena o Projeto Temático “Contribuição de genes, genomas e elementos de transposição na interação entre plantas e micro-organismos: estudo de caso em cana-de-açúcar”.

Desafios

Como explicaram as pesquisadoras, sequenciar o genoma da cana não é uma tarefa fácil e ainda não há previsão de quando será possível mapear a parte que ficou faltando no estudo (0,9%). Resultado de cruzamentos realizados ao longo de alguns milênios entre diferentes variedades de duas espécies – Saccharum officinarum e S. spontaneum, a cana-de-açúcar cultivada hoje tem um material genético bastante complexo.

Composto por 10 bilhões de pares de bases, distribuídos entre 100 e 130 cromossomos, o genoma da cana demanda uma grande capacidade computacional para, de um lado, unir os pedaços sequenciados de DNA e, do outro, manter separados os cromossomos homólogos (pares com informações genéticas semelhantes às herdadas dos progenitores). Para se ter uma ideia, o genoma do trigo tem 17 bilhões de pares de bases divididos em 46 cromossomos. O genoma humano, por sua vez, tem 3,2 bilhões de pares de bases também organizados em 46 cromossomos.

Embora a tecnologia disponível no início do projeto já permitisse a produção de sequências longas, estas eram produzidas a partir de fragmentos menores. Para fazer a montagem do genoma a partir dessas sequências, foi necessária uma grande capacidade de processamento computacional, fornecida pela Microsoft.

O desafio de sequenciar o genoma completo da cana foi determinado ainda no início do Programa BIOEN, em 2008. Depois de assistir a uma palestra de Souza, em uma conferência promovida pela Microsoft e pela FAPESP em 2014, David Hackerman, pesquisador do Microsoft Research Institute, em Los Angeles, ficou fascinado com os desafios computacionais envolvidos na iniciativa e propôs à empresa uma colaboração com a FAPESP, que veio na forma do projeto “Desenvolvimento de um algoritmo para a montagem do genoma poliploide de cana-de-açúcar”, coordenado por Souza e apoiado no âmbito do Programa Pesquisa em Parceria para Inovação Tecnológica (PITE-FAPESP). O projeto possibilitou a entrada de outros parceiros como Bob Davidson, à época pesquisador da Microsoft sediado na unidade de Seattle e, atualmente, na Amazon.

Com o sequenciamento publicado agora, pela primeira vez foi possível identificar a diversidade nas sequências dos promotores – regiões dos genes que controlam sua expressão.

“Apesar de em alguns casos os genes serem 99,9% idênticos, podemos observar diferenças em seus promotores, que ajudam a determinar se as cópias são originárias do ancestral S. officinarum ou S. spontaneum”, disse Souza.

A revelação permite estudos, por exemplo, das funções das diferentes cópias no aumento da produtividade e no aumento de açúcar e de fibra. Além disso, possibilita verificar quais cópias podem estar conferindo vantagens aos diferentes genótipos selecionados pelos programas de melhoramento de variedades de cana para açúcar e para energia.

“O resultado confirma a liderança do Brasil e do Estado de São Paulo na pesquisa sobre essa planta tão importante para o país. Reflete também a antecipação da comunidade de pesquisa em São Paulo e da FAPESP quanto ao desafio de aprender sobre o genoma da cana, de modo a extrair um conhecimento que leve a um aumento de eficiência e de produtividade. Sempre é bom lembrar que a pesquisa sobre cana é um dos fatores que levaram o Brasil a realizar algo que nenhum país de tamanho similar conseguiu até hoje: ter 40% de sua energia total produzida de forma renovável e com baixa emissão de carbono”, afirmou Carlos Henrique de Brito Cruz, diretor científico da FAPESP.

Histórico

A variedade SP80-3280 foi escolhida para sequenciamento por ser a que tem a maior quantidade de dados disponíveis na literatura científica. Durante o Projeto Genoma Cana – conhecido como Projeto FAPESP Sucest, que durou de 1999 a 2002 –, 238 mil fragmentos de genes funcionais dessa variedade já haviam sido parcialmente sequenciados (leia mais em: revistapesquisa.fapesp.br/2012/08/22/o-mapa-da-cana).

Atualmente, a SP80-3280 está entre as 20 variedades de cana mais cultivadas no Estado de São Paulo. Além disso, faz parte da genealogia de diversas variedades comerciais, pois é usada nos novos cruzamentos. Esse cultivar apresenta boa produtividade agrícola e brotação de soqueira (raízes que sobram após o corte), sendo uma das opções para colheita tardia no final da safra no Estado de São Paulo.

“O conhecimento obtido para essa variedade pode ser aplicado no estudo de outros genótipos, principalmente na descoberta de genes que controlam o acúmulo de biomassa”, explicou Augusto Lima Diniz, coautor do estudo que, atualmente, realiza estágio no Cold Spring Harbor Laboratory (CSHL), nos Estados Unidos, como parte de seu pós-doutorado no IQ-USP.

Recentemente, Souza e Van Sluys participaram de uma equipe internacional que sequenciou o genoma da S. spontaneum, ancestral que corresponde a cerca de 10% a 15% do genoma da cana-de-açúcar comercial – S. officinarum contribuiu com os outros 80% a 85%. Os 5% restantes são cromossomos recombinantes desses dois progenitores. O estudo foi publicado na Nature Genetics.

Em 2018, Van Sluys foi uma das autoras de um artigo com os resultados do mapeamento de cerca de metade do genoma monoploide da cana (apenas um cromossomo de cada par).

A partir das informações obtidas no sequenciamento atual, o grupo da USP desenvolve ferramentas para o melhoramento genético da cana e testa diferentes genes candidatos em plantas transgênicas. Também realiza estudos de genômica comparativa de grandes famílias de genes, com o objetivo de compreender sua contribuição nas diversas variedades de cana usadas nos programas de melhoramento do país. O objetivo é encontrar genes que possam aumentar a produtividade e a tolerância à seca, além de possibilitar o desenvolvimento de novos compostos a partir da cana.

“Estamos ainda disponibilizando para a comunidade um Genome Browser, ferramenta que permite buscar os genes de interesse e analisar as sequências em comparação com os sequenciamentos anteriores. Será algo de grande valia para projetos de biotecnologia não somente de cana, mas também de outras plantas cultivadas”, disse Souza.

O artigo Assembly of the 373K gene space of the polyploid sugarcane genome reveals reservoirs of functional diversity in the world’s leading biomass crop (doi: https://doi.org/10.1093/gigascience/giz129), de Glaucia Mendes Souza, Marie-Anne Van Sluys, Carolina Gimiliani Lembke, Hayan Lee, Gabriel Rodrigues Alves Margarido, Carlos Takeshi Hotta, Jonas Weissmann Gaiarsa, Augusto Lima Diniz, Mauro de Medeiros Oliveira, Sávio de Siqueira Ferreira, Milton Yutaka Nishiyama-Jr., Felipe ten Caten, Geovani Tolfo Ragagnin, Pablo de Morais Andrade, Robson Francisco de Souza, Gianlucca Gonçalves Nicastro, Ravi Pandya, Changsoo Kim, Hui Guo, Alan Mitchell Durham, Monalisa Sampaio Carneiro, Jisen Zhang, Xingtan Zhang, Qing Zhang, Ray Ming, Michael C. Schatz, Bob Davidson, Andrew Paterson e David Heckerman, pode ser lido em: academic.oup.com/gigascience/article/8/12/giz129/5647371 (Agência Fapesp, 2/12/19)