Em um trabalho inédito, um grupo de 69 cientistas de 18 países conseguiu sequenciar o genoma referência do café arábica (Coffea arabica), espécie mais consumida no mundo e que corresponde a 70% de toda a produção brasileira. A pesquisa foi publicada em abril na revista Nature Genetics. Esse tipo resulta do cruzamento de outras duas espécies, a Coffea canephora – conhecida no Brasil pelas variedades conilon e robusta – e a Coffea eugenioides. A mescla confere ao arábica características genéticas que, até o momento, dificultavam seu sequenciamento completo.
Com a descoberta, pesquisadores poderão trabalhar em melhoramentos genéticos para tornarem o café arábica mais resistente a pragas e a condições climáticas adversas, além de aumentarem seu valor agregado. “Agora, com um conhecimento genético mais detalhado da planta, poderemos analisar quais genes estão relacionados com cada uma de suas características, como acidez, aroma e sabor, e fazer alterações gênicas para obtermos um produto de maior qualidade”, aponta João Meidanis, professor do Instituto de Computação (IC) da Unicamp, pesquisador em bioinformática e um dos autores do estudo.
Quebra-cabeça
Sequenciar o genoma de uma espécie consiste em decodificar a sequência de bases nitrogenadas que compõem uma molécula inteira de DNA – adeninas, timinas, citosinas e guaninas. Ao “traduzir” uma sequência, os pesquisadores conseguem analisar quais trechos podem ser responsáveis por uma determinada característica do portador dessa carga genética. Como são muito extensos, os sequenciamentos são divididos por trechos e depois montados, como em um quebra-cabeça. As tecnologias da bioinformática evoluíram —, a contar do início desse tipo de pesquisa, ainda nos anos 1980 —, e tornou-se possível decodificar quantidades cada vez maiores de genes e montar sequências mais longas e complexas.
“No entanto, a montagem da sequência não é tudo. Talvez antes esse fosse o passo
principal de uma pesquisa, mas hoje não é mais”, afirma Meidanis. “Há uma série de outras
etapas realizadas pela bioinformática que também são relevantes, como a análise
estatística das características encontradas e a comparação dos genomas, entre outras.”
O docente afirma que outro fato complicador envolvido nos sequenciamentos são as
repetições de genes que podem aparecer ao longo da sequência. Segundo Meidanis, o
aumento da capacidade de sequenciamento reduz os riscos de confusões para os
cientistas. “Conforme as novas tecnologias dão conta de decodificar sequências cada vez
maiores, mais fácil se torna o processo, porque o problema da repetição é resolvido.”
No caso da pesquisa, o objetivo foi sequenciar amostras de café arábica e comparar seu DNA com o de amostras de C. canephora e de C. eugenioides, verificando o que há de comum entre elas. A técnica também permite mapear os caminhos genéticos trilhados pelo café arábica até os dias de hoje. Foram sequenciadas 46 amostras, sendo três de C. canephora, duas de C. eugenioides e 41 de exemplares de C. arabica, todas vindas de diferentes regiões e de cruzamentos com outras variedades.
O número de exemplares analisados representou apenas um dos desafios enfrentados pelos pesquisadores. Diferentemente das duas espécies originais, que possuem células diplóides, com dois conjuntos de cromossomos, o C. arabica apresenta células tetraplóides, com quatro cópias de cada cromossomo. “Isso torna o sequenciamento muito mais complexo”, diz o pesquisador.
A partir do sequenciamento e da comparação do genoma das três espécies, os cientistas descobriram que o cruzamento entre o C. canephora e o C. eugenioides ocorreu de forma natural entre 350 mil e 600 mil anos atrás e passou por gargalos responsáveis por reduzir sua população, resultando em uma espécie com baixa variabilidade genética. Os pesquisadores também mapearam o movimento migratório do café arábica, da região do Grande Vale do Rift, onde hoje se localiza a Etiópia, até o atual Iêmen, na Península Arábica – daí o nome C. arabica.
O grupo identificou ainda conjuntos de genes em uma variedade híbrida natural da ilha de Timor, descoberta em 1927 e derivada de um cruzamento espontâneo de C. arabica e C. canephora, que podem explicar a resistência do café arábica a doenças como a ferrugem do café. Outras análises das interações genéticas identificaram aspectos sensoriais dessa espécie. “As pessoas tinham muita curiosidade de saber quais características do café arábica consumido hoje vieram do C. canephora e quais do C. eugenioides e de saber, entre essas variedades de café, em que elas diferem geneticamente e o quanto isso se traduz, por exemplo, em aromas e sabores”, explica Meidanis.
Próxima parada: cana-de-açúcar
O café é uma das principais commodities exportadas pelo Brasil, maior produtor no mundo do grão. Em 2023, a safra brasileira atingiu 55,1 milhões de sacas de 60 kg do produto, correspondente a 38% da produção global, segundo dados da Companhia Nacional de Abastecimento (Conab). Cerca de 70% de todo o volume cultivado no país é arábica, seguido de 30% de variedades C. canephora, entre conilon e robusta. Os cafezais do país ocupam cerca de 1,87 milhão de hectares de terra.
Além de viabilizar melhoramentos genéticos importantes para gerar plantas mais resistentes, como ocorre naturalmente com o híbrido do Timor, por exemplo, o sequenciamento do café arábica abre caminhos para que outras espécies, ainda mais complexas do ponto de vista genético, possam também ser sequenciadas. A cana-de- açúcar é um desses casos: enquanto o café arábica possui quatro cópias de cada cromossomo, a cana é um poliplóide, ou seja, suas células podem apresentar entre 10 e 14 cópias dos cromossomos. O último grande sequenciamento da espécie terminou em 2019, com 99,1% dos genes mapeados. “Quando concluirmos o sequenciamento da cana-de-açúcar, esse será um grande dia para a genômica mundial”, afirmou Meidanis.
Siga o canal “Governo de São Paulo” no WhatsApp:
https://bit.ly/govspnozap
Mín. 15° Máx. 24°
Mín. 14° Máx. 29°
Parcialmente nubladoMín. 17° Máx. 30°
Tempo nublado