Montagem do transcriptoma De Novo e descoberta do gene de Cistanche Deserticola Fleshy Stem-Ⅱ
Sep 18, 2024
Classificação funcional de todas as transcrições expressas com base na ontologia genética e nos bancos de dados KEGG
A anotação Gene Ontology (GO) foi obtida da anotação UniProt e do arquivo de associação de identidades. No total, 20.907 transcrições, representando 32,69% do total de sequências expressas, foram atribuídas a 1.745 termos funcionais. Do total de termos funcionais do GO, as atribuições ao processo biológico constituíram a maioria (1.116, 63,95%), seguidas pelo componente celular (329, 18,85%) e função molecular (300, 17,20%). As funções atribuídas de transcrições expressas cobriram uma ampla gama de categorias GO, e os 10 principais termos GO com as transcrições mais anotadas foram listados na Tabela 3. Fornecemos toda a distribuição de transcrições expressas em três categorias de Ontologia Genética (Função Molecular, Componente Celular e processo biológico) no arquivo suplementar (S3 Dataset). Os termos GO relacionados com funções de ligação e atividade de transferase foram predominantemente representados na categoria de função molecular. Em relação às funções de ligação, a ligação catiônica (4.394 transcritos) representou a mais abundante, seguida pela ligação nucleotídeo/nucleosídeo (3.404 transcritos em média) e ligação a proteínas (2.422 transcritos). Enquanto no grupo de atividade transferase, a maioria são aqueles com transferência de grupos contendo fósforo (2.256 transcritos, 65,77%). Entre a categoria de componentes celulares, os transcritos estavam mais localizados intracelularmente (10.581 transcritos em média), enquanto na categoria de processos biológicos, os transcritos estavam mais envolvidos no processo metabólico do biopolímero (6.683 transcritos em média), seguido pela regulação do processo celular (4.841 transcritos ), expressão gênica (4.678 transcrições) e transporte (3.512 transcrições).

CISTANCHE TUBULOSA NATURAL PARA PREVENÇÃO DA DOENÇA DE ALZHEIMER PHGS75% ECH 30% ACT 12%
Para extrair genes envolvidos na biossíntese de lignina e PhG, 21.358 sequências proteicas potenciais não redundantes foram pesquisadas contra sequências genéticas de 13 organismos vegetais no banco de dados KEGG, e foram atribuídas a 275 vias KEGG com pelo menos 5 ocorrências. As 10 principais vias com sequências mais alinhadas estão listadas na Tabela 4. A maioria das vias estava envolvida em processos metabólicos primários, como metabolismo de aminoácidos ou proteínas (ko01230, ko04141 e ko04120), metabolismo de carboidratos (ko01200 e ko00500) e nucleotídeos ou metabolismo de nucleosídeos (ko03018, ko00230 e ko00240). Além disso, existem 27 vias relacionadas ao metabolismo secundário (Fig. 2), como a biossíntese da espinha dorsal dos terpenóides, a biossíntese dos fenilpropanóides, a biossíntese dos carotenóides, a biossíntese dos alcalóides isoquinolina e a biossíntese dos alcalóides tropano, piperidina e piridina. Estes resultados fornecem indicação adicional de que processos metabólicos ativos estavam em andamento noC. deserticolatecido do caule. Todas as transcrições expressas associadas às vias KEGG foram listadas no arquivo suplementar (S4 Dataset). Embora existam algumas vias significativamente alteradas entre C. deserticola e outras plantas, como o arroz (conjunto de dados S5), nosso principal objetivo neste estudo é revelar todo o perfil do transcriptoma do caule de C. deserticola e retratar as vias relacionadas à biossíntese de PhGs o que pode ser útil para orientar o cultivo.

Genes candidatos que codificam enzimas envolvidas na biossíntese de lignina
A lignina é o segundo polímero terrestre natural mais abundante no reino vegetal, compondo até um terço do material encontrado nas paredes celulares das plantas. Como um componente importante das paredes celulares, as ligninas ajudam no transporte de água, fornecem suporte mecânico e integridade estrutural e defendem contra patógenos e herbívoros. Essas funções da lignina são muito valiosas no apoio ao crescimento ereto subterrâneo de C. deserticola no deserto. Neste estudo, apresentamos o quadro completo das vias de biossíntese da lignina em C. deserticola (Fig. 3), nas quais os monômeros de lignina são biossintetizados a partir da fenilalanina através de uma série de reações enzimáticas, incluindo hidroxilação, metilação, redução e processo de polimerização oxidativa. Enzimas relacionadas à biossíntese de lignina foram detectadas para três formas sintetizadas principalmente em tecido vascular (p-hidroxil-fenil (H), guaiacil (G) e siringil (S) lignina) e 5-hidroxil-guaiacil lignina que foi identificada apenas em plantas deficientes em COMT (ácido cafeico 3-O-metiltransferase, EC 2.1.1.68) (como knock-down).

A fenilalanina amônia-liase (PAL, EC 4.3.1.24) é a primeira enzima chave na via de biossíntese da lignina (Fig. 3) que transforma a fenilalanina em ácido cinâmico por desaminação não oxidativa. Um total de 6.297 leituras PAL foram sequenciadas e 7 transcrições PAL foram montadas em C. deserticola (Tabela 5). Pela comparação de semelhanças de sequências, descobrimos que 4 delas (comp28550_c1_seq1/2/3/5) tinham mais de 95% de similaridade com a sequência de mRNA conhecida de C. deserticola (gi| 289595227|gb|ADD12041.1|), enquanto comp28550_c1_seq4 e comp25940_c0_seq1 tiveram 77% e 82% de semelhanças, respectivamente. A previsão de ORF revelou que 5 transcritos tinham potenciais de codificação de proteínas e eram transportados com domínio de aminoácido liase aromático (PF00221.14). Entre eles, apenas o transcrito comp28550_c1_seq4 poderia codificar uma sequência proteica completa de 718 resíduos de aminoácidos. Foi relatado que PAL foi codificado por uma pequena família multigênica na maioria das espécies de plantas, como 4 em Arabidopsis thaliana, 5 em Populus trichocarpa, 3 em Scutellaria baicalensis e 7 Cucumis sativus, etc. Genes que codificam PAL em C.


deserticola e os nomeamos CdPAL1, CdPAL2, CdPAL3 e CdPAL4, respectivamente (S2 Fig). 4-cumarato-CoA ligase (4CL, EC 6.2.1.12) e trans-cinamato 4-monooxigenase (CYP73A, EC 1.14.13.11) são duas enzimas responsáveis pela transformação do ácido cinâmico em dicoumarol-CoA em duas etapas reversas ordens. Eles também estão em backbones e seus valores de expressão FPKM são 39,57 e 51,93, respectivamente.

Os quatro tipos de ligninas foram biossintetizados por diferentes vias que foram controladas por três enzimas principais, cinamoil-CoA redutase (CCR, EC 1.2.1.44), chiquimato o-hidroxicinamoiltransferase (HCT, EC 2.3.1.133) e ferulado{{1{ {56}}}}hidroxilase (F5H, EC 1.14.-.-). O CCR foi relatado como um ponto de controle da via das ligninas [50, 51] que catalisou X-CoA (X incluindo dicoumarol, cafeoil, feruloil, 5-hidroxil-feruloil e sinapoil) em Y-aldeído (Y incluindo p -puma, cafeoil, coniferil, 5-hidroxil-coniferil e snap), enquanto o HCT catalisou p-cumaroil-CoA em ácido p-cumaroil chiquímico/ácido p-coumaroil quínico. As duas enzimas, assim como um interruptor, regulavam a biossíntese das ligninas P-hidroxil-fenil ou dos outros três tipos de ligninas. F5H foi outro interruptor de ramificação que regulou a lignina siringil e a lignina 5-hidroxil-guaiacil. Outras enzimas importantes, incluindo ácido cafeico 3-O-metiltransferase (COMT, EC 2.1.1.68), cafeoil-CoA O-metiltransferase (CCoAOMT, EC 2.1.1.104) e álcool cinamílico desidrogenase (CAD, EC 1.1.1.195 ) também foram detectados expressos. Informações detalhadas sobre expressão estão listadas na Tabela 6. Esses genes enzimáticos identificados neste estudo fornecerão um recurso valioso para estudos genômicos funcionais nesta importante planta medicinal. 10 genes relacionados à via de biossíntese de ligninas na Tabela 6 foram selecionados para verificação RT-qPCR para confirmar nossos resultados de RNAseq (Fig. 4), e suas altas correlações (coeficiente de correlação de Pearson: 0,90343) indicaram alta precisão e reprodutibilidade de nossa análise do transcriptoma. S1 Dataset lista as sequências de primers usadas nesta análise.

CISTANCHE TUBULOSA NATURAL PARA MELHORAR A FUNÇÃO SEXUAL PHGS75% ECH 30% ACT 12%
Genes candidatos que codificam enzimas envolvidas na biossíntese de PhGs
Os glicosídeos feniletanóides (PhGs) são conhecidos por serem os principais ingredientes ativos da C. deserticola, com atividades de melhoria da potência sexual, eliminação de radicais livres e antienvelhecimento. Três componentes químicos dos PhGs são ácido orgânico, sacarídeo e feniletanol aglicona (Fig. 3). Os ácidos orgânicos, incluindo ácido caféico, ácido ferúlico e ácido cumálico, são produtos da via de biossíntese dos fenilpropanóides. Os componentes do sacarídeo, incluindo glicose e ramnose, são produtos das vias do metabolismo dos carboidratos, como metabolismo do amido e da sacarose, metabolismo dos aminoácidos e açúcares nucleotídeos, metabolismo da frutose e manose, etc. No entanto, a via de biossíntese da parte do feniletanol ainda não está clara. Aqui, propusemos duas possíveis vias de biossíntese de feniletanol com base em nossos dados de sequência. Uma delas é a via relatada do ácido cafeico ou do ácido ferúlico, também conhecida como via do ácido cinâmico, que é semelhante à via principal da biossíntese da lignina. Outra é baseada na via do metabolismo da fenilalanina (Fig. 3), na qual a fenilalanina em feniletanol foi alcançada por uma conhecida “via Enrlich” que foi encontrada pela primeira vez em leveduras há um século e validada em flores de petúnia, tomate e rosa. Quatro genes enzimáticos que codificam aspartato/tirosina aminotransferase, histidina-fosfato aminotransferase e amina oxidase primária responsáveis pela conversão de fenilalanina em feniletanol foram detectados expressos no caule de C. deserticola. O produto do fenil etanol pode ser posteriormente oxidado pela monooxigenase ou metilado pela metiltransferase em seus derivados (fenil etanol aglicona) que participam da biossíntese do PhG. Em resumo, duas vias putativas de biossíntese de feniletanol aglicona foram propostas paraC. deserticolamas ainda precisa de mais estudos.
Discussões
Nos últimos anos, a genómica das plantas desenvolveu-se rapidamente com a aplicação da tecnologia de sequenciação de última geração, enquanto poucas pesquisas se concentraram na genómica das plantas medicinais do deserto. É urgentemente necessário realizar pesquisas genômicas ou transcriptômicas para compreender sua adaptação aos ambientes de seca e salinidade e a via de biossíntese dos principais componentes bioativos. A descoberta do transcriptoma de novo para algumas plantas medicinais,


como Panax ginseng, Ginkgo biloba e Glycyrrhiza uralensis foram explorados pela primeira vez usando a plataforma Roche 454 por seu longo comprimento de leitura. Devido à capacidade eficaz de montagem com leituras curtas, especialmente as leituras de extremidade emparelhada vantajosas, o sequenciamento e a montagem do transcriptoma baseado em Illumina também têm sido amplamente utilizados para organismos modelo e não modelo. No presente estudo, geramos cerca de 8G de leituras de pares de 101 pb e produzimos sequências unigênicas mais longas com comprimento médio de 725 pb. Dados de transcriptoma específicos do caule em larga escala poderiam fornecer dados de referência úteis e ser usados para explorar o metabolismo secundário de componentes bioativos de C. deserticola. Há 81,62% do total de leituras brutas que passaram por filtros de qualidade rigorosos (incluindo corte do adaptador e descarte de leituras de baixa qualidade) antes da montagem, sugerindo a alta qualidade de nossos dados de sequenciamento, e 82,08% das leituras de alta qualidade foram úteis para montagem. Outras leituras que não foram usadas para montagem podem ser provenientes de erros de sequenciamento, parâmetros de montagem e outros. Essas leituras de alta qualidade não utilizadas permaneceram úteis para melhorar a montagem de novo, combinadas com leituras mais longas de outra plataforma (como Roche 454) no futuro.

CISTANCHE TUBULOSA NATURAL PARA MELHORAR A FUNÇÃO SEXUAL PHGS75% ECH 30% ACT 12%
Um grande número de transcrições montadas (30.098) mostrou altas semelhanças de sequência com genes conhecidos em bancos de dados públicos, sugerindo que nossos dados de pares emparelhados baseados em Illumina cobriram uma fração substancial de transcrições de C. deserticola. As transcrições sem ocorrências do BLAST podem ser devidas a regiões não traduzidas 3' ou 5', RNA não codificante ou novas sequências genéticas de C. deserticola. As transcrições expressas foram anotadas para uma ampla gama de categorias GO e vias KEGG (Tabelas 3 e 4), nas quais muitas transcrições foram atribuídas a vias relacionadas ao metabolismo secundário. Como sabemos, o fenilpropanóide pode funcionar como um composto antimicrobiano indutível com grande salutar para um estilo de vida subterrâneo [1], e também atuar como uma molécula sinalizadora nas interações planta-micróbio, além de sua utilidade medicinal [68, 69]. O terpenóide é usado para a biossíntese de componentes bioativos (como 6- desoxicatalpol) [70]. Descobrimos que genes envolvidos na via de biossíntese da estrutura fenilpropanóide e terpenóide eram altamente abundantes em C. deserticola. Mais importante ainda, a descoberta de vias bem representadas de biossíntese de lignina (Fig. 3) indicou o processo metabólico ativo da lignina no caule de C. deserticola. Todos os genes de enzimas conhecidos envolvidos na biossíntese de lignina (Fig. 3) foram detectados expressos, e quatro enzimas principais, incluindo PAL, CCR, HCT e F5H, tiveram menor abundância de expressão (FPKM 26,47, 3,89, 3,4 e 3,83, respectivamente) em comparação com outros genes enzimáticos (Tabela 6). Se a mudança na expressão desses três genes poderia ou não influenciar a produção de lignina em C. deserticola é digno de um estudo mais aprofundado. PAL é uma enzima chave na biossíntese de lignina e também está envolvida na biossíntese de fenilpropanóide, resveratrol, flavonóide e cumarina [71–74]. Detectamos quatro genes PAL distintos no genoma de C. deserticola (S2 Fig), que coincide com o fato de PAL ter sido codificado por uma pequena família multigênica (39, 43, 45-49) e provou ainda que pode desempenhar papéis importantes no fluxo metabólico de carbono .
PhG é o principal ingrediente ativo da C. deserticola. Os genes envolvidos na biossíntese do feniletanol são importantes para a qualidade de C. deserticola. Deduzimos duas vias diferentes de biossíntese de fenil etanol e 17 genes enzimáticos envolvidos na biossíntese de PhG no caule de C. deserticola. Os possíveis processos pós-ácido caféico/ferúlico (Fig. 3) também foram deduzidos pela primeira vez com base em uma fórmula estrutural de intermediários e propriedades catalíticas das enzimas correspondentes, nas quais o ácido caféico/ferúlico seria primeiro oxidado em derivado de fenilpiruvato; então, o grupo carboxila foi privado pelas descarboxilases; finalmente, o grupo aldeído foi convertido novamente no grupo álcool pela desidrogenase. Esta é a primeira aplicação da tecnologia de sequenciamento emparelhado da Illumina para investigar todo o transcriptoma de C. deserticola e montar leituras de RNA-seq sem um genoma de referência. Este estudo fornecerá recursos úteis e sequências genéticas para pesquisas genômicas e proteômicas funcionais em C. deserticola no futuro.
Conclusões
Neste estudo, traçamos o perfil do transcriptoma do caule de C. deserticola com base em dados de sequenciamento de alto rendimento, identificamos genes envolvidos nas vias de biossíntese da lignina e também inferimos pela primeira vez a potencial via de biossíntese de PhGs, o que certamente acelerará a compreensão dos processos fisiológicos ambíguos e do grande valor medicinal em nível molecular. Até agora, esta é a primeira tentativa de montar de novo todo o transcriptoma do caule de C. deserticola e detectar a via de biossíntese de componentes medicinais usando conjuntos de dados de sequenciamento baseados em Illumina. Nosso estudo poderá promover o desenvolvimento de medicamentos naturais e a seleção de cultivares com características medicinais.

CISTANCHE TUBULOSA NATURAL PARA MELHORAR A FUNÇÃO SEXUAL PHGS75% ECH 30% ACT 12%







