Detecção de doença renal crônica a partir de amostras de sangue usando redes neurais
Mar 10, 2022
Para mais information:Ali.ma@wecistanche.com
Mohamed Ghassan Latheef*, Rajasvaran Logeswaran e Nurul Haniza Mohtar
Universidade de Tecnologia & Inovação da Ásia-Pacífico, Bukit Jalil, 57000 Kuala Lumpur, Malásia
* e-mail:TP047492@mail.apu.edu.my autor correspondente,
Abstrair.
Este artigo propõe uma abordagem de rede neural artificial para detectar automaticamenteDoença Renal Crônicaatravés de amostras de fluidos colhidas de pacientes. A lógica para o desenvolvimento tal sistema é dado, bem como possíveis benefícios para os pacientes e para a indústria médica. Semelhante sistemas propostos na indústria e para o diagnósticodoença renal crônicaatravés de outros abordagens como algoritmos de classificação são exploradas. Um conjunto de dados para treinar a rede neural é coletado e recursos analisados, bem como metodologia e ferramentas a serem utilizadas no desenvolvimento da rede neural.
Termos de Índice. ArtificialRedes Neurais, Diagnóstico Médico, Análise de Dados,Rim Crônico Doença(CKD).
1. Introdução
Estima-se que cerca de 1 em cada 10 adultos sofre de algum tipo de dano renal, com milhões morrendo anualmente com complicações relacionadas aDoença Renal Crônica(CKD) [1]. O Fardo Global de Estudo sobre doenças teve DRC em 27º lugar na lista de causas de um número total de mortes em todo o mundo 1990, mas subiu para o 18º lugar em 2010 – um grau de lista que classifica o movimento ascendente, perdendo apenas para o do HIV e aids. CKD (Doença Renal Crônica)é extremamente prejudicial e incurável, mas se pego cedo seu progresso pode ser interrompido através medicação e um regime de dieta adequado.
No entanto, é difícil pegar a doença precocemente, devido à falta de sintomas de alerta que é externamente visível nos estágios iniciais. Portanto, a menos que alguém tenha outras condições que os tornariam mais suscetível a danos nos rins, se a pessoa é muito cautelosa e faz check-ups regulares do corpo completo, ou se eles fizeram o exame de sangue ou urina por outra razão e coincidentemente também encontraram DRC, normalmente CKD(Doença Renal Crônica) É só encontrado em estágios médios e tardios.
CKD(Doença Renal Crônica) é determinado como quando por mais de três meses, os rins são observados para ser incapaz de efetivamente executar suas funções pretendidas, como limpar o sangue de resíduos e excesso de produtos e ajudar controlar a pressão arterial [2]. Isso pode levar a um acúmulo de resíduos no corpo do paciente, levando a inchaço e inchaço dos tornozelos, insônia, falta de ar e fraqueza. Até mesmo estes sintomas são observados, pode já ser tarde demais. A DRC precoce não mostra sinais ou sintomas externos, às vezes até o ponto em que a pessoa já tinha perdido 90% de suas funções renais [3].
Os métodos atuais de diagnóstico de DRC(Doença Renal Crônica) incluem a medição dos resultados da creatinina séum no sangue, níveis de glicose no sangue para ver se o paciente é diabético (como pacientes diabéticos têm uma prevalência muito alta para sendo acometido com DRC), bem como medição para albumina, ou a presença de proteína na urina, que seria filtrado em rins saudáveis.
No entanto, estes geralmente requerem três meses de monitoramento dos níveis de creatinina, bem como outros critérios como hematúria, malformações congênitas, etc. De acordo com o Instituto Nacional de Diabetes dos EUA e Doenças Digestivas e Renais (NIDDK), a última pesquisa sugere que um sistema de encenação/classificação identifica o risco de DRC a partir da análise de dados de pacientes com maior precisão em suas previsões, requer múltiplos fatores e não apenas níveis de eGFR, creatinina ou albumina, mas todos os três, idade e estado de diabetes [4]. Portanto, este projeto visa usar um conjunto semelhante de dados de pacientes com múltiplos recursos para treinar uma rede neural para ser capaz de identificar padrões que indicam a presença de DRC e fazer binário classificação. Ao fazer isso, este projeto visa facilitar o processo de testes para CKD(Doença Renal Crônica) e diminuir os vários meses de espera tempo para determinar se o problema é crônico, simplesmente usando os resultados de um exame de sangue e outro observações e amostras feitas/colhidas, com maior confiança no diagnóstico com base em múltiplos fatores em vez de um único fator, que teria maiores chances de ser um outlier devido a fatores externos. Isso é especialmente vital, uma vez que qualquer progressão de DRC é irreversível e, portanto, está no melhor dos pacientes interesses para tê-lo rapidamente e precisamente diagnosticado, a fim de iniciar o tratamento e tomar o apropriado medidas para retardar o dano imediatamente.

Clique em orgânicoCistanche para tratar doença renal crônica
2. Revisão da Literatura
2.1 Pesquisa de Domínio
Diagnóstico médico e tomada de decisão é um campo de alto risco de alta prioridade, estavam fazendo com que fossem precisos diagnósticos são absolutamente críticos para a saúde dos pacientes. ArtificialRedes Neurais(ANNs) e outros técnicas de aprendizado de máquina estão sendo cada vez mais utilizadas para casos de diagnóstico de doenças, com promessa níveis de precisão.
Al-Shaya apresentou dois casos de ANNs sendo utilizados para diagnóstico de (1) doença de nefrite aguda, que ocorre quando os rins de repente ficam inflamados e levam à insuficiência renal se não tratados, bem como (2) doença cardíaca [5]. A pronúndia de alimentação foi usada, com o modelo de nefrite aguda relataram 99% e doenças cardíacas 95% de precisão no diagnóstico. O modelo para o primeiro tinha 6 entradas, 20 neurônios ocultos, 2 camadas, e usaram a retropagação de Levenberg-Marquardt como algoritmo de treinamento, com treinamento baseado na melhoria do erro médio-quadrado (MSE). Esta última rede usou 2 camadas, 22 entradas, 20 neurônios ocultos com outros fatores sendo os mesmos do anterior.
Šter e Dobnikar testaram cinco diferentes bancos de dados médicos (Doença Arterial Coronariana, Câncer de Mama, Hepatite, Índio Pima Diabetes e Doenças Cardíacas) com ANN e métodos mais simples de discriminação linear [6]. O desempenho foi relativamente o mesmo, implicando, eles alegaram, que os dados eram simples com o valores sendo atributos independentes. Como tal, eles afirmam que sistemas de classificação complexos ou ANN são desnecessário no diagnóstico médico, como os resultados são altos para métodos lineares discriminantes e ingênuos Bayes como poço. No entanto, deve-se notar que eles testaram os métodos com configurações padrão e sem ajuste fino, e como eles próprios aceitam que mesmo um ganho de alguns por cento de imprecisões no diagnóstico de pacientes é vital como quantitativamente que poderia ser até centenas de milhares de pessoas. Este foi um estudos anteriores e ANNs cresceram significativamente depois disso, especialmente com o aprendizado profundo. No entanto, um problema persistente com ANNs é a falta de transparência – é incapaz de ser visto como a ANN fez o decisão que produziu e o que valoriza a decisão dependia. O paciente não estaria convencido se o médico não sabia por que eles estão dando ao paciente o medicamento específico e tratamento por simplesmente seguindo a prescrição de um ANN. A falta de explicação também significa que os médicos humanos são deixados em o escuro e não pode aprender com as decisões tomadas pela ANN.
Liu et al. empreendeu a tarefa de testar a precisão dos profissionais de saúde em comparação com profundas técnicas de aprendizagem como ANN [7]. A fim de obter o maior conjunto de dados possível, eles vasculharam existentes artigos e análises para a realização de uma meta-análise, em estudos de 1 de janeiro de 2012 a 6 de junho de 2019, para estudos que comparam o desempenho diagnóstico para qualquer doença de modelos de aprendizagem profunda em comparação aos profissionais de saúde. Comparação de desempenho para 14 desses estudos mostrou 87% agrupados sensibilidade e 92,5% reuniram especificidade para os modelos de aprendizagem profunda, com 86,4% e 90,5%, respectivamente, para profissionais de saúde. Embora os resultados sejam semelhantes, modelos de aprendizagem profunda em geral desempenho melhor, mesmo que marginalmente, e qualquer pequeno aumento no percentual ainda é um reflexo de incontáveis vidas salvas ou melhoradas extrapolando essa figura para o valor quantitativo daqueles aflito por tais condições de saúde.
2.2 Sistemas similares
Há muitos artigos detalhando o diagnóstico de DRC(Doença Renal Crônica) usando ANN ou outros métodos, como utilizar Suporte Vetor Machines (SVM) e Naïve Bayes.
Kriplani et al. usaram deep neural network para prever CKD usando 18 parâmetros na camada de entrada, embora o número de neurônios de camada oculta, camadas e arquitetura de rede não foi mencionado no papel [8]. A Rede Neural Profunda teve uma taxa positiva real de 95,2%, e uma taxa negativa verdadeira de 100%, que também foi comparado com outros métodos de classificação, como Logística, Floresta Aleatória, Adaboost, SVM e Ingênua Bayes. O jornal alegou que sua Rede Neural Profunda tinha a maior precisão entre todos os métodos destacados acima. No entanto, na análise mais aprofundada dos resultados de desempenho dados no papel, embora a mesma taxa negativa verdadeira tenha sido obtida por todos os outros métodos de classificação, ingênuo Bayes e Random Forest, algoritmos relativamente mais simples, realizados bem como o ANN com 95,2% verdadeira precisão positiva. Além disso, tanto a Adaboost quanto a SVM alcançaram uma taxa de precisão positiva real de 96,2%, que é maior do que a Rede Neural Profunda. Em outra tabela fornecida, Ingïve Bayes e Deep Neural A rede foi mostrada com uma precisão de 97,7679%, enquanto Adaboost e SVM tiveram 98,2143% precisão e Floresta Aleatória tiveram 99,1071% de precisão. Assim, sua conclusão de que de todos os modelos comparado, a Rede Neural Profunda foi o melhor parece errado de acordo com os números fornecidos em seu papel, como não só é mais lento e maior em recursos computacionais consumidos, Naïve Bayes, realizado igualmente, com Adaboost, SVM e Random Forest obtendo uma maior precisão.
Ahmad et al. usaram a SVM para propor uma ferramenta auxiliar de apoio à decisão para situações de emergência, utilizando 5 insumos: pressão arterial, creatinina sémica, volume celular embalado, fator hipertensão e anemia fator [9]. O SVM foi codificado em linguagem de programação R, com uma precisão de 98,34%. Eles também concluiu em seu artigo que a importância dos atributos estava ligada à Diminuição Média de Gini, ou a média da diminuição total da impureza do nó da variável, com maior o valor maior do papel do atributo. Usando isso, eles descobriram que o volume de células embaladas era o atributo mais importante no diagnóstico CKD(Doença Renal Crônica) a partir dos dados. Como apenas os níveis de creatinina sérico são uma das maneiras como a DRC é diagnosticada agora, este cria alguma incerteza sobre se pode ser mais preciso confiar nos valores de volume de células embaladas em vez de.
Ravindra et al. também usaram SVM para realizar a classificação e identificar CKD(Doença Renal Crônica) pacientes [10]. O os valores de entrada foram distribuídos em quatro casos diferentes com base na estreita associação entre eles, com:
Caso 1 - pressão arterial, gravidade específica e creatinina séum;
Caso 2 -albumina, açúcar, glicemia aleatória e hemoglobina;
Caixa 3 volume de células embaladas, contagem de glóbulos brancos e contagem de glóbulos vermelhos;
Caso 4 -albumina, açúcar, glicose no sangue aleatória, creatinina séum, sódio, potássio e hemoglobina.
Cada um dos quatro casos foi testado separadamente com o classificador SVM sem os outros fatores, e verificou-se que o Caso 2 tinha a maior precisão de 93,75%. No entanto, a precisão é menor do que outras artigos anteriormente, que usavam um maior número de insumos. Portanto, enquanto albumina, açúcar, sangue glicose aleatória e hemoglobina parecem produzir bons resultados por conta própria, outros insumos têm demonstrou um aumento na precisão quando incluído ao lado.
Salekin e Stankovic usaram Random Forest e alcançaram 99,3% de precisão e 0,1084 Root Mean Square Erro (RMSE) usando 24 entradas [11]. No entanto, eles então usaram uma variedade de métodos, como uma máquina método de envoltório de aprendizagem e regularização lasso, para selecionar 5 recursos do original 24:
.gravidade específica,.albumina.diabetes mellitus,.hipertensão, e.hemoglobina.

Cistanche pode melhorar a função renal
O artigo destacou um método de detecção automática econômico e, portanto, reduzindo o número de fatores necessários, mantendo a precisão o mais nivelado possível, aumentaria o custo-efetividade devido a menos testes necessários e tempo necessário para obter os resultados dos testes. Eles estimam que com os EUA de 2016 taxa de inflação e preços de testes médicos, não seria necessário mais do que USD 45,05 para um teste de paciente. Com os 5 atributos, eles alcançaram 98% de precisão com 0,11 RMSE, uma redução de apenas 1,3% de precisão após descartando 19 das 24 características originais.
Vijayarani e Dhayanand usaram o MATLAB para comparar o desempenho da SVM e de uma ANN (feedforward com retropagação) em um conjunto de dados de pacientes com Doença Renal [12]. O ANN tinha um índice de precisão de 87,70%, com o SVM tendo uma precisão de 76,32%. No entanto, a SVM levou 3,22 segundos, enquanto o ANN levou quase o dobro desse tempo em 7,26 segundos. A precisão foi marcadamente abaixo dos sistemas mencionados anteriormente. No entanto, este sistema também tinha mais do que o binário classificação de CKD(Doença Renal Crônica) ou Rins Saudáveis, em vez disso, foi classificado em 5 casos diferentes: Normal, Agudo Síndrome nefrítica, DRC, Insuficiência Renal Aguda ou Glomerulonephrite Crônica, que fez a tarefa mais complexo.
2.3 Resumo da revisão
O artigo de Liu et al. mostra a viabilidade de ANN e outros substitutos de aprendizagem de máquina para substituir o olho treinado dos profissionais de saúde, por simplesmente ser mais preciso. No entanto, como Šter e Dobnikar destaque, há um problema com a transparência das decisões ANN, pois não há como identificar quais fator jogado nessa decisão, e quão pesadamente. Os fatores podem ser identificados fora da ANN através de vários métodos de mineração e análise de dados semelhantes à abordagem por Salekin e Stankovic em o CKD(Doença Renal Crônica) características para ver quais desempenham um papel maior. No entanto, há contradições quando diferentes métodos são usados para identificar prioridade de recurso, como aquele conjunto de 5 apenas compartilhando 1 recurso com o caso de maior precisão nas descobertas de Ravindra et al., albumina. Além disso, Ahmad et al.'s Mean Decrease in A abordagem de Gini encontrou o volume de células embaladas como sendo o fator mais significativo, no entanto, nenhum dos papéis anteriores tinham qualquer significado atribuído a esse fator nas características finais que eles escolheram para a sua Sistemas.
Há problemas com a forma como as ANNs tomam decisões, e de certa forma, essas decisões têm algum elemento de viés humano, como os desenvolvedores decidem quais insumos descartar como desnecessários e que manter. Rio Salekin e Stankovic, no entanto, tem um bom ponto; temos os meios e é hora de desenvolver um mais solução econômica precisa para identificar CKD(Doença Renal Crônica) pacientes mais rápido, de tal forma que as pessoas evitam indevidas dor, angústia e morte.
3.0 Materiais e Métodos
3.1 Programação da ANN
O MATLAB foi usado para prototipagem rápida, pois permite a criação nativa de ANNs através de seu Deep Learning Caixa de ferramentas sem qualquer codificação adicional. Figura 1 fornece um instantâneo da ferramenta de treinamento ANN do Caixa de ferramentas de Deep Learning. Seguindo Kanban, todas as tarefas para o projeto são colocadas em um quadro virtual, como Trello, com colunas diferentes para tarefas que já foram concluídas (como decidir sobre funcionalidade do sistema, coleta de dados, cronograma de planejamento, acabamento do relatório preliminar, preenchimento de ética forma, etc.), tarefas no processo de ser concluído (acabamento do relatório investigativo) e tarefas a serem concluídas no futuro (dados limpos, treine a IA com dados, resultados de documentos, etc.). O princípio básico é manter um limite de trabalho em andamento e ficar com ele, sendo o mais constante possível sem exceder o limite e tomando muitas tarefas ao mesmo tempo, e continuar até que o projeto esteja concluído.
3.2 Obtenção dos dados de treinamento e teste
Para o treinamento e teste do modelo, foram consideradas duas opções. Um deles foi entrar em contato com o local hospitais para informações anônimas do paciente para uso puramente acadêmico, e o outro foi encontrar um conjunto de dados disponível para uso online. Online foi a preferência, e um conjunto de dados foi encontrado com 400 registros de pacientes, 250 CKD(Doença Renal Crônica) pacientes, e 150 pacientes não-DRC, coletados dos Hospitais Apollo em Tamilnadu, Índia, ao longo de 2 meses. Havia 24 características diferentes, como mostrado na Tabela 1. No entanto, os registros estavam incompletos, com dados faltando ou corrompidos em muitos casos, como é muitas vezes o caso. Se todos os registros com um valor vazio fossem removidos, os registros utilizáveis só seriam ligeiramente mais 200. Assim, métodos alternativos de limpeza dos dados e retenção dos registros incompletos tinham que ser olhou, como substituir os valores vazios pelo modo, ou o valor mais visto no característica, mas com consideração adicional para o valor mais comum visto em outros registros para que característica, entre os registros que são mais semelhantes ao registro com o recurso faltando.

Cistanche para doença renal
Figura 1. Ferramenta de treinamento de rede neural, uma característica da Caixa de Ferramentas de Deep Learning

Mesa 1. Lista de recursos


10 dos valores também foram texto representando valores booleanos, que também tiveram que ser limpos para 0 e 1 valores como apenas valores numéricos são aceitos para treinar o ANN. Além disso, é difícil para artificial inteligência (IA) sem contexto de linguagem para fazer a associação que "sim" é o oposto de "não" em oposição a "1" e "0". Dependendo dos resultados da limpeza dos dados e dos registros retidos, é possível que outras fontes de dados devem ser confiadas, como entrar em contato com hospitais para anônimos dados do paciente.
4. Resultados e Discussão
Em média, a idade típica da DRC(Doença Renal Crônica) os pacientes foram encontrados entre 55 e 75 anos, enquanto a idade dos pacientes não drcD foi distribuída de forma mais uniforme. Isso mostra que a DRC é mais prevalente em idosos, o que é razoável considerando a falta de problemas genéticos, pois leva tempo e danos sustentados ao rins para desenvolver DRC.
Diabetes Mellitus, também comumente conhecido como Diabetes, é um fator de risco que aumenta a chance de ficando CKD. De fato, de acordo com a American National Kidney Foundation [13], cerca de 30% do Tipo 1 e 40% dos diabéticos tipo 2 recebem DRC mais tarde na vida. Se pacientes diabéticos não regularem seu sangue níveis de glicose através de medicação, injeções de insulina e dieta, os altos níveis de glicose entupindo o sangue minúsculo capilares nos rins, danificando os rins. Todos os pacientes diabéticos no conjunto de dados também foram Pacientes com DRC, com mais da metade do DRC(Doença Renal Crônica) pacientes sendo diabéticos.
A contagem de Glóbulos Vermelhos em média em pacientes com DRC é menor do que a de pacientes não-DRC, variando de 2 a 6 milhões em vez dos saudáveis 4 a 7 milhões de glóbulos vermelhos por microliter de sangue. Um vermelho baixo a contagem de células sanguíneas é indicativo de anemia. Os rins produzem um hormônio chamado Eritropoietina (EPO), que faz com que o corpo produza células sanguíneas, o suficiente das quais não é produzida quando a função renal diminui devido aos danos causados pelo DRC [14]. Como tal, os níveis de EPO caem, fazendo com que a contagem de glóbulos vermelhos caia por sua vez, causando anemia. Isso leva a menos oxigênio transportado ao longo do corpo, fadiga geral, falta de ar, extremidades frias (mãos e pés), e nos piores casos, morte.
Sódio e potássio são sais minerais essenciais necessários para o corpo humano. No entanto, é possível exceder o limite diário de ingestão, como acontece com a água. Normalmente, os rins limpam o excesso de sais e fluidos, mas um problema surge quando eles não funcionam mais como deveriam. Isso leva a um acúmulo de fluidos em tecidos e corrente sanguínea, causando pressão alta, bem como náusea, fraqueza e coração anormal ritmos [15]. O potássio está na faixa de 3,3 a 5,25 para pacientes não drCH com alta variância e sódio entre 135 e 151. No entanto, os valores de potássio de CKD(Doença Renal Crônica) pacientes podem atingir o pico até 48,4, cerca de 10 vezes maior do que a quantidade normal, com o sódio atingindo 170,4.
Existem muitos valores nos dados de entrada que têm atributos vinculados semelhantes, como hemoglobina, vermelho contagem de células sanguíneas, e anemia. Naturalmente, baixa contagem de glóbulos vermelhos e baixa hemoglobina correlaciona-se com o desenvolvimento da anemia. Da mesma forma, há uma correlação entre os níveis de potássio e sódio com pressão alta, bem como níveis de glicose no sangue, açúcar e ser diabetes. Células pus e pus aglomerados, bem como valores de bactérias também se correlacionam como a presença de bactérias causa pus, que precede aglomerados de células pus. Isso pode ser usado para reduzir o número de entradas ou ser levado em consideração quando limpar os dados e adicionar os valores incompletos. Os pesos que o ANN coloca em cada indivíduo entrada será através do treinamento e não ser definido manualmente, então se a análise corresponde com o O próprio processo de tomada de decisão da rede neural ainda não foi visto.
5. Conclusão
Os dados analisados dos pacientes mostram um padrão claro através da análise manual de dados até mesmo para o humano olho. Uma ANN pode ser capaz de ver padrões muito mais sutis nos dados numéricos, e pode, portanto, apresentar um alto nível de precisão em termos de diagnóstico de DRC(Doença Renal Crônica) em pacientes através da observação dos valores de características presentes em seus fluidos corporais. Na verdade, rever artigos sobre um assunto semelhante mostra que o o número de características pode ser reduzido e os testes e fluidos coletados de um paciente serão reduzidos. Portanto, com uma redução de custo e esforço, é possível efetuar uma redução mínima no resultado precisão devido à correlação consistentemente alta mostrada entre alguns valores.

Cistanche para doença renal
