Identificação Radiométrica de Sinais por Transformada de Branqueamento Correspondente Parte 1
Apr 13, 2023
Abstrato:A identificação radiométrica é o problema de atribuir um sinal a uma fonte específica. Neste trabalho, um algoritmo de identificação radiométrica é desenvolvido usando a transformação de branqueamento. A abordagem se destaca dos métodos mais estabelecidos, pois funciona diretamente nos dados brutos de QI e, portanto, não possui recursos. Como tal, os algoritmos de redução de dimensionalidade comumente usados não se aplicam. A premissa da ideia é que um conjunto de dados é "mais branco" quando projetado em sua matriz de branqueamento do que em qualquer outro. Na prática, os dados transformados nunca são estritamente brancos, pois os dados de treinamento e teste diferem. A medida de Förstner-Moonen que quantifica a similaridade de matrizes de covariância é usada para estabelecer o grau de brancura. A transformação de branqueamento que produz um conjunto de dados com a distância mínima de Förstner-Moonen para um processo de ruído branco é o sinal de origem. A fonte é determinada pela saída da função de modo operada nas decisões do Classificador de Voto da Maioria. O uso da medida de Förstner-Moonen apresenta uma perspectiva diferente em comparação com a máxima verossimilhança e as métricas de distância euclidiana. A transformação de branqueamento também é contrastada com as abordagens de aprendizado profundo mais recentes que ainda dependem de vetores de recursos com grandes dimensões e longas fases de treinamento. É mostrado que o método proposto é mais simples de implementar, não requer vetores de características, precisa de treinamento mínimo e por causa de sua estrutura não iterativa é mais rápido que as abordagens existentes.
De acordo com estudos relevantes,cistancheé uma erva comum conhecida como "a erva milagrosa que prolonga a vida". Seu componente principal écistanósido, que tem vários efeitos, comoantioxidante, anti-inflamatório, epromoção da função imunológica. O mecanismo entre a cistanche e o clareamento da pele está no efeito antioxidante dacistancheglicosídeos. A melanina na pele humana é produzida pela oxidação da tirosina catalisada portirosinase, e a reação de oxidação requer a participação de oxigênio, de modo que os radicais livres de oxigênio no corpo se tornam um fator importante que afeta a produção de melanina. Cistanche contém cistanósido, que é um antioxidante e pode reduzir a geração de radicais livres no corpo, assiminibindo a produção de melanina.

Clique em Como usar Cistanche Tubulosa
Para mais informações:
david.deng@wecistanche.com WhatApp:86 13632399501
1. Introdução
A identificação radiométrica é o problema de atribuir um sinal à fonte; muitas vezes marca ou modelo. A identificação da fonte é realizada pela impressão digital de RF dos dispositivos, procurando por assinaturas que possam surgir de tolerâncias de fabricação, imperfeições ou variações estatísticas normais na produção. Há um trabalho considerável na classificação de sinal e reconhecimento de modulação [1,2]. No entanto, a identificação radiométrica não se encaixa perfeitamente em nenhuma das duas categorias. De muitas maneiras, a identificação radiométrica é um problema mais difícil, pois os sinais originados de diferentes fontes podem ter características semelhantes, como modulação, taxas de bits, formas de pulso, etc. Esse fato torna variações sutis do dispositivo a principal assinatura para identificação radiométrica. Tais variações, no entanto, são pequenas, imperceptíveis e difíceis de modelar. Por que a identificação radiométrica é de interesse, há muitas dobras. Os militares têm se interessado por essa capacidade há algum tempo como um meio de identificar radares amigáveis de hostis [3,4]. A comunicação por satélite pode enfrentar interferências intencionais ou não intencionais de fontes não autorizadas. Conhecer a fonte e a marca do interferente pode ajudar a identificar a fonte ofensiva. A identificação radiométrica também é uma ferramenta valiosa na proteção de dispositivos sem fio. As tentativas de falsificação em redes sem fio e dispositivos IoT podem ser frustradas se a fonte do sinal puder ser identificada e bloqueada [5,6]. É mais difícil imitar as características do dispositivo incorporadas aos sinais do que replicar a modulação ou modelagem de pulso.
A identificação radiométrica pode ser formulada no contexto de um classificador estatístico. A abordagem clássica segue extração de características e redução de dimensionalidade por técnicas como PCA e, finalmente, classificador de análise discriminante múltipla [7,8]. Em [9], Square Integral Bispectra (SIB) é usado para extrair as características únicas de sinais individuais transmitidos, seguido por PCA para extrair um vetor de característica de baixa dimensão. Observou-se que as feições retidas após a redução da dimensionalidade não são necessariamente ótimas para a classificação.

A otimização combinada de redução de dimensionalidade e classificação de impressões digitais é proposta em [10]. A ideia é conduzir a redução de dimensionalidade minimizando o erro de classificação e maximizando a informação mútua entre os recursos de dimensionalidade reduzida e o rótulo de classe simultaneamente. Os recursos de impressão digital de RF são extraídos das estatísticas da amplitude instantânea normalizada, fase e frequência do sinal, resultando em vetores de recursos com até 960 dimensões. O problema de redução de dimensionalidade permanece, no entanto. A extração de características para algoritmos de identificação de transmissores foi desenvolvida para operar em fases transitórias [11] ou de estado estacionário [12]. A fase transiente é um estado analógico do sinal que ocorre logo após o transmissor ser ativado, enquanto a fase estável é caracterizada pela modulação.
Trabalhos mais recentes sobre identificação radiométrica foram influenciados pelo surgimento de ferramentas de aprendizado profundo (DL). Exemplos são impressão digital de RF [13], impressão digital de dispositivo IoT [14], detecção de espectro [15] e identificação de dispositivo de RF em redes cognitivas [16]. O que ainda é necessário em todo esse trabalho é a extração de vetores de recursos seguida de redução de dimensionalidade que consome tempo. Os vetores de características extraídos em [10], por exemplo, possuem 960 dimensões antes da redução de dimensionalidade. Em outras palavras, o principal problema permanece. O uso de DL geralmente é realizado pela programação de ferramentas prontas para uso ou pelo uso de várias rotinas de redes neurais convolucionais (CNN) implementadas no Matlab. Por exemplo, o bispectro comprimido é identificado como o recurso e então usado para treinar uma CNN de três camadas [17]. O que difere são o número de camadas, toques, filtros, funções de ativação, etc. Outro exemplo nesse sentido aparece em [18] onde a API Keras é usada com TensorFlow no backend para distinguir motoristas distraídos. Em [15], DL é implementado para identificação de dispositivos de RF nas redes cognitivas Zigbee usando o sinal de erro de banda de base complexa no domínio do tempo como dados de treinamento e teste. Os resultados mostram boa precisão (≈90 por cento), mas em alto SNR (maior ou igual a 20 dB). Em [19], os dados de entrada são pré-processados como imagens em escala de cinza do espectro de Hilbert e alcançam precisão aceitável sob níveis moderados de SNR (taxa de precisão média de 70% para SNR de 15 dB). Uma comparação abrangente de desempenho é mostrada para vários algoritmos DL em [13], relatando uma precisão média de 98 por cento medida para 12 transmissores.
O fato de o ML operar em conjuntos de dados muito menores e exigir muito menos tempo de treinamento em comparação com o DL (horas de treinamento [15]), fornece mais versatilidade para sinalizar mudanças de características que ocorrem em diferentes circunstâncias ambientais (superaquecimento, excesso de corrente, etc.) , o que pode afetar fortemente o recurso de classificação selecionado. Essa propriedade do ML (orientada a dados) permite atualizações rápidas de recursos e, consequentemente, resulta em uma classificação mais precisa a longo prazo. Além disso, a complexidade reduzida em comparação com o DL permite uma implementação de hardware mais fácil e uma classificação rápida em tempo real.

Identificação de Emissor Específico (SEI) é outro paradigma para identificação radiométrica [20-22]. A abordagem SEI tenta identificar o único transmissor de um sinal usando apenas medições de características externas [22]. O SEI é implementado em dois estágios, (1) estado de sinal transitório e (2) estado de sinal de estado estacionário. A abordagem transitória aplica-se às assinaturas particulares embutidas no sinal quando o transmissor liga ou desliga [23,24]. Abordagens transitórias são mais difíceis de implementar devido à indisponibilidade ou natureza transitória dos dados que muitas vezes não são acessíveis ou salvos. A abordagem de estado estacionário refere-se ao período em que os transientes se estabilizaram. Os recursos disponíveis incluem modulação e preâmbulo [25,26], entre outros. Em técnicas baseadas em modulação, as constelações recebidas e de destino são comparadas onde a diferença cria uma impressão digital de RF [27]. Um algoritmo de identificação de decisão rápida aparece em [28]. A identificação é baseada na semelhança de um vetor de sinal e sua comparação com padrões disponíveis em um banco de dados. A abordagem é classificada como um exemplo de SEI aplicado à identificação por radar. O algoritmo foi aplicado a centenas de registros de sinais de radar provenientes de diversos tipos de radares. Em alguns casos, foram investigadas cópias do mesmo tipo de radar. Pesando todos os recursos igualmente, uma taxa de reconhecimento correto de 85% é relatada para os tipos de radar. Um método misto de identificação de radar baseado em emissão eletromagnética e análise intrapulso aparece em [29]. A premissa é que os dispositivos eletrônicos conferem características elétricas ao pulso transmitido. O modelo de sinal é N pushes não sobrepostos de K transmissores. A Análise Discriminante Linear é usada. Quatro métricas de distância são usadas para classificar o pulso desconhecido. É relatado que três cópias do mesmo tipo de radar são reconhecidas com sucesso.
A identificação radiométrica de protocolos de comunicação também é de interesse. A identificação de fontes que usam o protocolo LTE é relatada em [30,31]. A identificação é baseada em características únicas de modulação exibidas pelos transmissores, resultantes de pequenas imperfeições introduzidas durante a fabricação do hardware do rádio. As imperfeições do dispositivo têm sido usadas como uma assinatura para identificação radiométrica, incluindo clock jitter [32], erros de conversores digital para analógico (DAC) [33], sintetizador de frequência local [34], a não linearidade do amplificador de potência [35–37] . As imperfeições do amplificador de potência também são usadas para identificação da fonte [38]. Sinais de radar reais são usados para identificação do emissor [39].
Uma aplicação totalmente diferente para a identificação radiométrica é o radar. Mesmo que os transmissores pertençam ao mesmo tipo de radar, eles podem apresentar diferenças sutis em seus pulsos transmitidos. Em [33], 18 feições são usadas para identificar três classes de radares. São comparadas cinco impressões digitais de identificação de emissor de radar com base em transientes de sinal de radar. As técnicas tradicionais incluem radiofrequência (RF), amplitude de pulso, largura de pulso, tipo de modulação de pulso intencional ou intervalos de repetição de pulso. Em [40], as informações de modulação não intencional na forma de onda do emissor são usadas como impressões digitais de RF, para amarrar o sinal recebido e seu emissor correspondente. Unintentional Modulation on Pulse (UMoP) é um método que explora variações devido a diferenças de fabricação do hardware do transmissor, incluindo os amplificadores de potência UMoP é como uma impressão digital de um emissor e pode identificar transmissores do mesmo modelo [41]. A Decomposição do Modo Variacional para a identificação do radar é relatada em [42]. O conjunto de dados consiste em 47 emissores. Alguns desses emissores eram produções do mesmo radar. Os resultados demonstram que o valor efetivo de SNR deve estar em torno de 47 dB para se obter uma probabilidade de classificação correta maior que 0,9.

2. Estrutura para Identificação Radiométrica
O sinal recebido é primeiro corrigido para deslocamento de fase, deslocamento de frequência do oscilador e erros de temporização de símbolo antes da aplicação da transformação de branqueamento. A transformação de branqueamento é uma projeção ortogonal baseada em uma variação do PCA e está relacionada à projeção ortogonal do subespaço [43]. Uma matriz de transformação de branqueamento por fonte é estimada a partir dos dados de treinamento. Não há necessidade de saber o tipo de modulação, frequência, fase ou qualquer outra coisa sobre o sinal. A identificação da fonte desconhecida é baseada na observação de que um conjunto de dados é "mais branco" quando projetado em sua matriz de branqueamento do que em qualquer outro, portanto, branqueamento combinado. A projeção dos dados desconhecidos no clareamento transforma e clareia os dados somente se houver uma correspondência entre a matriz de clareamento e os dados. Mesmo quando os dados correspondem à sua transformação de branqueamento, os dados projetados nunca são verdadeiramente brancos. Uma medida de "brancura" é desenvolvida escolhendo uma métrica de divergência para a comparação de matrizes de covariância. Essa medida é a soma dos logaritmos ao quadrado dos autovalores conjuntos das matrizes de covariância de referência e de teste; a distância de Förstner-Moonen. O branqueamento é bem conhecido na detecção de sinais e muitas vezes é formulado como o filtro de branqueamento combinado. O objetivo é correlacionar as amostras de ruído na saída do filtro. Uma implementação 3D do WMF é usada para estudos de impacto ambiental em imagens hiperespectrais [44]. A detecção de objetos usando branqueamento/desbranqueamento para transformar assinaturas de alvo em hiperespectrais multitemporais aparece em [45]. Exemplos de tais abordagens de branqueamento se aplicam principalmente à detecção de sinais e objetos e não são relevantes para a identificação radiométrica conforme proposto aqui.
2.1. A transformação do clareamento
Seja X ∈ Rp×n a matriz de dados que consiste em n medições de p variáveis com a matriz de covariância Σ. O branqueamento estatístico é uma transformação linear que transforma os dados de forma que a matriz de covariância de Y=WX seja a matriz de identidade. A matriz de transformação de branqueamento não é única. De fato, [46] menciona quinze diferentes matrizes de projeção que clareiam os dados, sendo as mais proeminentes PCA e ZCA whitening [47]. Especificamente,
![]()
onde U e Λ são as matrizes de autovetores e autovalores na decomposição da matriz de covariância Σ=UΛU T. As transformações de branqueamento produzem dados relacionados à decoração, mas para quê? Mais importante, que papel o branqueamento desempenha na identificação radiométrica? É aqui que a transformada de clareamento correspondente se desvia do uso existente de PCA na identificação radiométrica. O PCA é mais conhecido por compactação de dados, orientando a remoção dos componentes de Y com energia insignificante. As características que permanecem não são necessariamente as melhores para classificação. No entanto, quase todas as técnicas de classificação radiométrica baseadas em PCA usam os recursos que sobrevivem à compressão em uma função de discriminação subsequente para classificar os dados. O ZCA tem a propriedade adicional de fase zero ao desfazer a rotação causada pelo PCA. Nenhum dos dois é aplicável aqui. A produção de dados não correlacionados é uma etapa de pré-processamento da qual os vetores de recursos de dimensionalidade inferior são extraídos. A redução de dimensionalidade não se aplica a amostras de QI, pois existem apenas duas dimensões, para começar, e já estão amplamente relacionadas à decoração. O PCA também tem sido usado em aprendizado profundo, acelerando a convergência em redes neurais convolucionais [48].
2.2. Classificação por clareamento compatível
Os dados são organizados em uma matriz N × M X=[x1, x2, . . . , xM], xi ∈ RN×1 onde M é o número de medições e N é o número de variáveis ou dimensões. Para os dados de QI, N=2 e M é o número de símbolos no registro. Seja Wi , i=1, 2, . . . , m são as matrizes de transformação de branqueamento para m sinais de fonte {c1, c2, . . . , cm}. As matrizes de branqueamento dependentes de classe são calculadas offline a partir dos dados de treinamento. Como os dados de QI são afetados por compensações de fase e frequência, os dados precisam ser corrigidos antes que as matrizes de branqueamento sejam calculadas. Os dados de teste são particionados em blocos usados para gerar estatísticas. Não existe um comprimento de bloco "correto". Depende da taxa de mudança de fase, deslocamento de frequência ou deslocamento Doppler. No caso de deslocamento de fase não linear, os comprimentos de bloco são escolhidos curtos o suficiente para garantir uma fase quase estacionária durante a estimativa de fase. Mais informações sobre como escolher o comprimento do bloco para reverter o deslocamento de frequência aparecem na Seção 3.

Para ilustrar este ponto, três populações normais multivariadas são criadas e mostradas na Figura 1a. O terceiro conjunto de dados (em preto) é usado como a fonte "desconhecida" e é repetidamente projetado em Wi, i=1, 2, 3. Após cada projeção, o diagrama de dispersão é traçado e mostrado na Figura 1 bd. Quando os dados do grupo 3 são branqueados por W1, Figura 1b, o eixo maior dos dados projetados aparece em ângulo com o eixo principal da matriz de projeção. Isso indica que os dados e a matriz de clareamento são incompatíveis. Projeções repetidas produzem a Figura 1b–d. É apenas na Figura 1d que a transformação de branqueamento produz um diagrama de dispersão circular. A projeção que produz os dados menos correlacionados identifica a marca. Essa propriedade indica que a fonte dos dados desconhecidos corresponde à transformada de branqueamento do grupo 3. O detector pode ser implementado como um banco de filtros combinados paralelos mostrados na Figura 2.


2.3. Desenvolvimento de uma Medida de Branqueamento
Existem vários problemas em vincular os dados desconhecidos à sua matriz de branqueamento. Primeiro, os componentes de QI dos dados reais já estão bastante desrelacionados, de modo que o clareamento pode não trazer decorrelação adicional significativa. Em segundo lugar, o subespaço definido em (1) é criado off-line a partir dos dados de treinamento. No entanto, os dados de teste são diferentes mesmo vindos da mesma população que os dados de treinamento. Se forem utilizados dados diferentes do conjunto de treinamento, o branqueamento dos dados será aproximado. A propriedade central é que a matriz de covariância dos dados desconhecidos se assemelhará à matriz de identidade se projetada em seu subespaço mais do que em qualquer outro. Terceiro, como medir a "brancura". Este é um problema no casamento de matrizes de covariância [49].
Existe uma série de métricas para medir as distâncias entre duas matrizes de covariância simétricas e positivas definidas. Eles incluem divergência KL, distância euclidiana, norma quadrada de Frobenius, distância Bhattacharyya, divergência da matriz Bregman e LogDet [50], entre outros. Neste trabalho, usamos a métrica de Förstner-Moonen [49] como medida de similaridade de duas matrizes de covariância. Como ponto de referência, a conhecida métrica Correlation Matrix Distance (CMD) [51] e as medidas de Kullback-Leibler são estudadas. Não há uma definição para similaridade, mas três são monotônicas com correlação e, portanto, são medidas válidas. Nós temos gráficos sobrepostos de CMD, KL e Förstner-Moonen para comparação. Os gráficos aparecem mais adiante na Figura 3a. Como esperado, a distância entre pares aumenta com o aumento da correlação, o que significa que a matriz de covariância de variáveis correlacionadas está a distâncias maiores de uma matriz de covariância diagonal. Vale ressaltar que a medida KL é praticamente coincidente com a métrica de Förstner-Moonen, justificando seu uso como índice de similaridade.


onde λi(A, B), os autovalores conjuntos de A e B, são as raízes de |λA − B|=0. No contexto da transformada de branqueamento, a matriz de covariância de referência é a matriz de identidade A=I e B=cov(Yi) é a matriz de covariância dos dados desconhecidos branqueados por Wi. Portanto, os autovalores conjuntos reduzem-se simplesmente aos autovalores da matriz de covariância medida B dos dados desconhecidos.
O classificador baseado em (3) é um Classificador de Votos de Maioria ou Pluralidade [52] regido pelas regras h1, h2, . . . , hum. As regras são funções de pertinência. Dadas as medições Xi de uma fonte desconhecida,

![]()
![]()
onde p é o número de blocos. A função modo é o número que ocorre com mais frequência no conjunto, ou seja, hj(Xi) é o número de vezes que Xi é votado para pertencer a JC. A medida desconhecida Xi é classificada como a classe que recebe mais votos. Esse processo é retratado na Figura 2. Esse é um exemplo de votação "dura". A alternativa é a votação "suave", em que a frequência das atribuições às classes é mantida.
A complexidade computacional do algoritmo consiste na matriz de branqueamento, transformação de branqueamento e decomposição de autovalor. Se X ∈ Rd×M, onde d é o número de variáveis e M é o número de medições, as complexidades da transformada de clareamento são O(d2M mais d3), a transformação de clareamento é O(d2M) e a autodecomposição é O(d3) . Com representação de sinal de QI, d=2 e é constante por toda parte. Portanto, cada uma das complexidades acima reduz a complexidade geral para O(M). ou seja, linear com o número de medições.
3. Desvios de fase e frequência reversíveis
O primeiro desafio é a identificação radiométrica das superfícies antes que o algoritmo seja implementado. Os sinais geralmente são disponibilizados com rotações de fase não corrigidas. Existem dois tipos de rotações. A rotação fixa é causada por um deslocamento de fase constante da portadora de referência. A rotação variável no tempo é causada pela incompatibilidade de frequência da portadora de referência. A incompatibilidade pode estar relacionada ao hardware ou causada pelo Doppler. De qualquer forma, é uma quantidade desconhecida. A incompatibilidade de frequência, denominada frequência de deslocamento fd, causa uma fase de variação de tempo correspondente que resulta em manchas de constelação. Isso é diferente daquele deslocamento de fase fixo que faz com que toda a constelação gire. A Figura 4 mostra o deslocamento de fase variável no tempo sob dois níveis de SNR. As rotações fixas e variáveis no tempo devem ser invertidas antes da identificação radiométrica.

3.1. Fundo
A correção de offset de fase e frequência antes da identificação da fonte nem sempre é abordada na literatura de identificação radiométrica [17]. A abordagem tradicional para a recuperação da fase da portadora é o método da lei de potência [53]. Aumentar o sinal para a potência Mth cria um tom em M vezes a frequência de deslocamento que pode ser usada para derrogar a constelação. No entanto, este método só funciona para compensações de fase fixa. A abordagem aqui apresentada extrai trajetórias de fase arbitrárias ajustando um modelo à estimativa de probabilidade máxima de pontos de fase medidos em vários segmentos de sinal. A trajetória da fase é inicialmente estimada a partir de segmentos de sinal que são curtos o suficiente para que a fase seja considerada estacionária; essencialmente um instantâneo da fase no tempo. A inclinação da linha ajustada aos ângulos de fase usando mínimos quadrados é proporcional à frequência de deslocamento. Além disso, o método de ajuste de mínimos quadrados lida com trajetórias de fase não linear causadas pelo efeito de frequência de deslocamento de segunda ordem. Isso não é possível com o método da lei de potência.
3.2. Modelo de sinal
![]()
![]()
O modelo discreto para o deslocamento de fase é {θk=2π fd t, t=kTs, k=1, 2, . . . K} onde Ts é o comprimento do símbolo e K é o número de símbolos no bloco usado para estimar a rotação de fase. Símbolos sucessivos giram em 2π e se ajustam em radianos a partir de suas posições nominais. Esse movimento forma um arco ao longo do tempo, causando assim um efeito de mancha mostrado na Figura 4. Para corrigir essa rotação, uma estimativa de θk, ˆθk deve ser encontrada e usada para recuperar fd e derrogar o bloco de símbolos. A rotação máxima do símbolo em um bloco é T=KTs.
A estimativa de frequência de deslocamento pode ser obtida estimando primeiro a trajetória de fase. A estimativa de θ(t) é realizada sobre blocos curtos de comprimento T para assegurar a estacionaridade de fase, ou seja, {θ(t) ≈ θk, t ∈ T}. Portanto, há uma estimativa de fase por bloco de dados. A quantidade fdT é a fração de rotação da constelação sobre 2π para o comprimento do bloco T. Essa quantidade deve ser mantida pequena por dois motivos. Um, fdT menor significa uma amostragem mais fina da curva de fase. Isso é importante na captura da não linearidade de fase por modelagem linear por partes. Dois, grande fdT empurra os símbolos além de seu quadrante de símbolo original. Esse efeito pode ser visto na Figura 4b, onde os símbolos do primeiro quadrante foram empurrados para o segundo quadrante. O que constitui segmentos curtos ou longos é explicado na seção a seguir.
Para mais informações: david.deng@wecistanche.com WhatApp:86 13632399501






