Aprimorando a proteômica de cima para baixo do tecido cerebral com FAIMS Parte 2
Aug 27, 2024
Análise de dados
A identificação da proteoforma foi realizada com TopPIC versão 1.3.53. Configurações para TopPIC incluíram uma janela precursora de 3 m/z (para levar em conta o envelope isotópico), uma tolerância a erros de massa de 15 ppm, um deslocamento de massa desconhecido máximo/min de 500 Da e um máximo número de modificações desconhecidas permitidas de 1.
Nos últimos anos, cada vez mais estudos têm mostrado que existe uma estreita relação entre a morfologia das proteínas e a memória. As proteínas são as moléculas mais básicas nas atividades vitais. Eles podem controlar as atividades vitais das células e manter o funcionamento normal do corpo humano. Estudos descobriram que a morfologia das proteínas não só desempenha um papel importante nas atividades vitais das células, mas também tem uma relação inseparável com a função de memória no cérebro. Uma vez que a morfologia das proteínas muda, isso afetará a conexão entre os neurônios, afetando assim a capacidade de memória das pessoas.
Nas primeiras fases da vida, as alterações na morfologia das proteínas desempenham um papel vital no desenvolvimento e função do cérebro. Se a morfologia das proteínas não for como deveria, causará uma série de problemas neurológicos, levando eventualmente à perda de memória, comprometimento cognitivo e assim por diante.
No entanto, não há necessidade de se preocupar. A tecnologia médica moderna permitiu que as pessoas ajustassem a morfologia das proteínas através da dieta para melhorar a memória. Uma dieta rica e variada é rica em proteínas, mas ao escolher proteínas, tente escolher alimentos com baixo teor de gordura, colesterol e carboidratos para evitar os efeitos adversos da ingestão excessiva no organismo.
Em suma, a morfologia e a memória das proteínas são inseparáveis. Devemos prestar atenção a uma dieta saudável e a uma ingestão equilibrada de proteínas para manter uma boa saúde e, ao mesmo tempo, manter uma boa memória. Percebe-se que precisamos melhorar a memória, e Cistanche pode melhorar significativamente a memória porque tem efeitos antioxidantes, antiinflamatórios e antienvelhecimento, que podem ajudar a reduzir a oxidação e as reações inflamatórias no cérebro, protegendo assim a saúde do sistema nervoso. Além disso, Cistanche também pode promover o crescimento e a reparação das células nervosas, melhorando assim a conectividade e a função das redes neurais. Esses efeitos podem ajudar a melhorar a memória, a capacidade de aprendizagem e a velocidade de pensamento, e também podem prevenir a ocorrência de disfunções cognitivas e doenças neurodegenerativas.

Clique em Saber para melhorar a memória de curto prazo
Os espectros MS2 foram pesquisados em um banco de dados concatenado com entradas de Homo sapiens Swiss-Prot (20.352), variantes de emenda Swiss-Prot (22,000) e TrEMBL (54.436), bem como contaminantes comuns. As proteoformas identificadas foram filtradas para uma taxa de descoberta falsa (FDR) de 1% através do TopPIC.
A análise de dados downstream foi realizada no ambiente R para computação estatística e geração de figuras.54 Na análise downstream, proteoformas do mesmo gene com os mesmos aminoácidos iniciais e finais que estavam dentro de ± 5 Da foram combinadas como uma única proteoforma para aumentar o rigor. de nossas atribuições.
Embora o limiar de 5Da seja arbitrário, esta abordagem compensou picos monoisotópicos atribuídos incorretamente, ambiguidade em mudanças de massa desconhecidas e outros desvios artefactuais. Para determinar o desvio padrão relativo (RSD) das proteoformas nas réplicas, utilizamos a saída de "intensidade de recurso" do TopPIC.
Mapas de cobertura de sequência de fragmentação e espectros associados foram gerados usando o software LCMsSpectator.55
Configurações específicas para LCMsSpectator incluíram uma tolerância de íons precursores de 10 ppm, uma tolerância de produção de 10 ppm, um limite S/N mínimo de 1,5, um limite de correlação de Pearson de 0,7, uma suavização padrão de 9 pontos, e um limiar de intensidade relativa do isótopo precursor de 0,1.
RESULTADOS E DISCUSSÃO
A adição de FAIMS aumenta robustamente a cobertura do proteoma
A amostra de tecido do córtex de um paciente com diagnóstico de Alzheimer foi processada seguindo o fluxo de trabalho, conforme mostrado na Figura 1. Primeiro procuramos analisar o desempenho do FAIMS em vários CVs em comparação com aqueles sem FAIMS (referidos como "Sem FAIMS").
Vale lembrar que a interface FAIMS produz uma perda modesta de transmissão de íons, presumivelmente devido ao caminho mais longo do íon através da fonte.56 Portanto, para representar melhor as condições típicas e garantir comparações equitativas, os dados "No FAIMS" foram coletados usando a mesma amostra sem a unidade FAIMS instalada.
Esses dados "Sem FAIMS" foram coletados em triplicata e analisados de acordo com o fluxo de trabalho, conforme mostrado na Figura 1 com uma análise dos 6 principais DDA MS2. Os conjuntos de dados "Sem FAIMS" identificaram em média 754 ± 35 proteoformas (Figura 2A e Tabela S1) e identificaram coletivamente 1.073 proteoformas únicas (não redundantes) (Figura 2B) derivadas de 293 genes únicos (Figura 2C), cobrindo 29.359 aminoácidos através do proteoma (Figura 2D).
A métrica "cobertura proteômica" (Figura 2D) é definida como aminoácidos não redundantes cobertos pela sequência de cada proteoforma. Essencialmente, esta métrica leva em conta tanto o comprimento quanto a diversidade das proteoformas identificadas.
Consideramos que esta é uma métrica mais equilibrada em comparação com o número bruto de proteoformas e genes, pois evita preconceitos em direção a proteoformas menores. Embora contagens simples de proteoformas ou genes sejam intuitivas, essas métricas parecem ser fortemente influenciadas por fragmentos proteolíticos curtos. Os conjuntos de dados FAIMS foram coletados de -50 a -20 CV escaneados em etapas de 5 V.
Cada um dos 7 CVs resultantes foi coletado em triplicado. Em relação às proteoformas e genes, o FAIMS superou "No FAIMS" para todos os CVs testados na faixa de -50 a -30 CV (Figura 2A-C).
Por exemplo, os três conjuntos de dados a -50 CV identificaram 1833 ± 17 proteoformas, um aumento médio de ∼140% por execução em comparação com "Sem FAIMS". Coletivamente, esses três conjuntos de dados a -50 CV identificaram 2.564 proteoformas únicas de 530 genes únicos, cobrindo um total de 43.437 aminoácidos, um aumento de 95, 69 e 69% em relação aos três conjuntos de dados "NoFAIMS", respectivamente (Figura 2B-D e Tabela S1).

Além disso, embora FAIMS em −25V observe menos proteoformas e genes únicos em comparação com "Sem FAIMS", as próprias proteoformas são muito mais longas, em média. Assim, ao considerar o comprimento da proteoforma (Figura 2D), os conjuntos de dados de −25 V cobrem quase tantos aminoácidos do proteoma (28.398) em relação a "No FAIMS" (29.359), fazendo isso com apenas metade das proteoformas (Figura 2B ).
Também investigamos se o FAIMS poderia fornecer uma análise tão robusta e reprodutível em comparação com o FAIMS. Avaliamos a reprodutibilidade da quantificação calculando o RSD (equivalente ao coeficiente de variação) da intensidade da característica de cada proteoforma, desde que a proteoforma atendesse ao critério de ser observada em todos os três conjuntos de dados replicados para cada configuração de CV.
Como os conjuntos de dados FAIMS e "No FAIMS" foram todos coletados de uma única amostra biológica, a variação entre as réplicas deve ser atribuída exclusivamente a fatores instrumentais.
O boxplot na Figura 3 (bem como os histogramas individuais na Figura S1) demonstra como as distribuições de RSDs se comparam entre os conjuntos de dados FAIMS e "No FAIMS".
Com base no RSD mediano, a adição de FAIMS resultou numa qualidade de quantificação semelhante ou ligeiramente melhorada em relação a "Sem FAIMS". A melhoria nos RSDs entre tensões mais baixas (-20 a -30 CV) pode estar relacionada à observação de que menos proteoformas são transmitidas dentro dessa faixa, fornecendo espectros MS1 de maior qualidade e, portanto, melhores estimativas da intensidade da característica.
Além disso, vale a pena notar que os RSDs determinados a partir dessas réplicas são semelhantes aos experimentos anteriores de cima para baixo55 e de baixo para cima57,58 realizados com instrumentação semelhante.
Tomados em conjunto, estes dados demonstram que a adição de FAIMS ao TDP aumenta robustamente as identificações de proteoformas, sem qualquer sacrifício da qualidade de quantificação.
Em seguida, investigamos a sobreposição nas identificações entre os CVs, o que poderia fornecer o maior conjunto não redundante de observações.
Utilizando coeficientes de sobreposição, definidos como a interseção entre dois conjuntos dividida pelo menor dos dois conjuntos, determinamos a similaridade entre cada conjunto de dados. O coeficiente de sobreposição médio geral para ambas as identificações do gene proteoformand dentro de cada CV FAIMS foi 0,76.
Isso é comparável ao coeficiente de sobreposição dos conjuntos de dados "No FAIMS" (00,77), sugerindo que as réplicas técnicas mostram reprodutibilidade semelhante. Um mapa de calor exibindo os coeficientes de sobreposição FAIMS de proteoformas e genes é mostrado nas Figuras 4 e S2, respectivamente.
Notavelmente, a sobreposição de identificações genéticas através do espaço CV é muito maior em relação às proteoformas, embora seja particularmente perceptível quando se comparam as distâncias CV mais longas.
Por exemplo, a sobreposição entre −50 e −20 CV é 0,64 no nível do gene e 0,06 no nível da proteoforma. Isto era esperado, pois cada gene pode ser potencialmente representado por múltiplas proteoformas.

A Figura 4 demonstra que enquanto uma diferença de 5−10 V no CV produz coeficientes de sobreposição principalmente acima de 0,5, distâncias maiores que 15 V produzem maiores graus de dissimilaridade e são, portanto, melhor espaçadas para capturar conjuntos de proteoformas suficientemente diferentes.
Com esses conjuntos de dados, em seguida, buscamos determinar quais combinações de CVs são ideais para alcançar identificações máximas de genes, identificações de proteoformas e cobertura de sequência com restrições no número de CVs para cada combinação.
Primeiro, estabelecemos as combinações ideais para qualquer número de CVs de 1 a 7 usando as métricas de proteoformas únicas, genes e cobertura de sequência proteômica (Figura 5).
Usando combinações limitadas a três CVs como exemplo, a Figura 5A, B detalha como −35, −40 e −50 V são ideais se se deseja maximizar o número de proteoformas ou genes.
As proteoformas e genes identificados nestes três CVs (nove conjuntos de dados) cobrem 84% do total de proteoformas únicas e 92% do total de genes em todo o conjunto de 21 conjuntos de dados.
Ao pesar o comprimento de uma proteoforma com cobertura de sequência como métrica, a combinação ideal está em -30, -40 e -50 CV, cobrindo 88% dos aminoácidos únicos de todos os 21 conjuntos de dados FAIMS com apenas uma perda modesta de proteoforma e identificações genéticas ( 4221 proteoformas e 723 genes, Figura 5C). Entretanto, essas combinações incluem todas as réplicas e representam o máximo de identificações que poderiam ser alcançadas para uma determinada combinação de CVs. Portanto, para demonstrar a vantagem da revisão externa de CV, decidimos investigar quais números poderiam ser razoavelmente alcançados em média com apenas três execuções, onde cada execução representa um CV diferente.
Usando os conjuntos de dados de −50, −40 e −30 V como exemplo, determinamos as proteoformas únicas médias, genes únicos e coberturas de sequências de proteoma com base nas 27 combinações únicas das três réplicas diferentes dentro de cada CV.
Com base nesta análise, poderíamos alcançar 2.986 (± 46) proteoformas únicas e 618 (± 12) genes únicos cobrindo em média 64.534 (± 1.089) aminoácidos. Em comparação com os conjuntos de dados triplicados "No FAIMS", que identificaram 1.073 proteoformas únicas e 293 genes únicos cobrindo 29.359 aminoácidos, o CV externo pisando em -50, -40 e -30 V poderia mais que dobrar cada métrica.
No entanto, a combinação ideal de CVs provavelmente também dependerá do organismo e do tecido do qual a amostra é derivada, das etapas de preparação da amostra aplicadas, bem como de qualquer fracionamento off-line adicional implementado antes da análise por LC-MS.
No geral, quando tomado em conjunto com a análise de sobreposição (Figura 4), sugere que distâncias de 15 V ou maiores entre CVs fornecem a menor quantidade de sobreposição entre proteoformas, enquanto a separação de 5-10 V dentro de -50 a -30 CV maximiza genes, proteoformas e proteoma cobertura de sequência.
Para determinar ainda mais o impacto do FAIMS na profundidade da cobertura do proteoma, comparamos os genes identificados em nossos conjuntos de dados de cima para baixo com uma análise típica de baixo para cima do cérebro humano.
Conjuntos abrangentes de dados ascendentes de tecido cerebral humano nos permitiram estimar a abundância de 8.528 proteínas usando contagem espectral ponderada.59-61 As proteínas foram agrupadas em 10 percentis de abundância diferentes com base em contagens espectrais compiladas a partir de vários conjuntos de dados ascendentes do cérebro humano.
Ao cruzar referências com nossos conjuntos de dados de cima para baixo, fomos capazes de determinar de onde os genes e as proteoformas são derivados e classificados em termos de abundância estimada de proteínas (usando contagens espectrais normalizadas por conjunto de dados) no cérebro humano (Figura 6).

Os genes que foram encontrados em nossa análise de cima para baixo, mas não no conjunto de referência de baixo para cima, foram classificados como "NA".
For more information:1950477648nn@gmail.com






