Redes neurais fotônicas programáveis ​​combinando WDM com óptica linear coerente

blog

LarLar / blog / Redes neurais fotônicas programáveis ​​combinando WDM com óptica linear coerente

Aug 13, 2023

Redes neurais fotônicas programáveis ​​combinando WDM com óptica linear coerente

Scientific Reports volume 12, Artigo número: 5605 (2022) Citar este artigo 4884 Acessos 19 Citações 1 Detalhes das métricas altmétricas A fotônica neuromórfica tem se baseado até agora apenas em dados coerentes ou

Scientific Reports volume 12, Artigo número: 5605 (2022) Citar este artigo

4884 Acessos

19 citações

1 Altmétrico

Detalhes das métricas

A fotônica neuromórfica tem dependido até agora apenas de designs coerentes ou de multiplexação por divisão de comprimento de onda (WDM) para permitir a multiplicação de produto escalar ou vetor por matriz, o que levou a uma impressionante variedade de arquiteturas. Aqui, vamos um passo além e empregamos WDM para enriquecer o layout com capacidades de paralelização entre estágios de fan-in e/ou ponderação, em vez de servir ao propósito computacional e apresentamos, pela primeira vez, uma arquitetura de neurônios que combina óptica coerente com WDM para uma plataforma de rede neural programável multifuncional. Nossa plataforma reconfigurável acomoda quatro modos operacionais diferentes no mesmo hardware fotônico, suportando camadas multicamadas, convolucionais, totalmente conectadas e de economia de energia. Validamos matematicamente o desempenho bem-sucedido ao longo de todos os quatro modos operacionais, levando em consideração crosstalk, espaçamento de canais e dependência espectral dos elementos ópticos críticos, concluindo uma operação confiável com erro relativo MAC \(< 2\%\).

O crescimento explosivo da Inteligência Artificial (IA) e do Aprendizado Profundo (DL), juntamente com o amadurecimento da integração fotônica, criaram uma nova janela de oportunidade para o uso da óptica em tarefas computacionais1,2,3,4,5. Prevê-se que o uso de fótons e tecnologias ópticas relevantes em hardware de Rede Neural (NN) ofereça um aumento significativo nas operações Multiply-Accumulate (MAC) por segundo em comparação com as respectivas plataformas eletrônicas NN, estimando-se que a energia computacional e a eficiência de área atinjam < fJ/MAC e > TMAC/s/mm\(^{2}\), respectivamente6,7. O caminho para a realização desta mudança de paradigma de hardware NN visa explorar as altas taxas de linha suportadas por tecnologias fotônicas integradas, juntamente com a função de ponderação de tamanho pequeno e baixo consumo de energia que pode ser oferecida em escala de chip . Até agora, a grande maioria dos dispositivos fotônicos utilizados para fins de ponderação enfatizou elementos lentamente reconfiguráveis, como deslocadores de fase termo-ópticos (T/O)9,10 e estruturas de memória não voláteis baseadas em material de mudança de fase (PCM)4,8 , o que implica que as aplicações de inferência são atualmente consideradas o principal alvo na área da fotônica neuromórfica3.

Na verdade, os mecanismos de inferência exigem uma arquitetura de neurônios bastante estática e um gráfico de conectividade de camada que geralmente é definido para executar de maneira ideal uma determinada tarefa de IA. O rastreamento de objetos e a classificação de imagens, por exemplo, são normalmente realizados por meio de uma série de camadas convolucionais seguidas por uma ou mais camadas totalmente conectadas (FC), enquanto os codificadores automáticos requerem estágios em cascata de camadas FC . Embora as camadas convolucionais e FC incluam elementos arquitetônicos críticos em quase todas as plataformas de inferência, um grande conjunto de parâmetros – como o número de camadas e/ou neurônios por camada e o gráfico de conectividade – pode variar significativamente dependendo da arquitetura e aplicação DL alvo. Implementações eletrônicas podem concluir-se em Circuitos Integrados de Aplicação Específica (ASICs) customizados para uma tarefa de inferência específica, mas o uso de GPUs, TPUs ou mesmo FPGAs torna-se inevitável quando a reprogramação e a reconfigurabilidade são necessárias para utilizar o mesmo hardware para múltiplas aplicações .

Transferir a capacidade de reconfiguração para implementações fotônicas (P) -NN requer uma plataforma que possa suportar com flexibilidade diferentes layouts funcionais no mesmo hardware neural. A programabilidade em fotônica tem feito progressos significativos nos últimos anos14,15,16 e os Circuitos Integrados Fotônicos (PICs) programáveis ​​demonstraram oferecer vantagens importantes para o lançamento de plataformas fotônicas econômicas, flexíveis e multifuncionais que podem seguir de perto o conceito de FPGAs eletrônicos17. Nesse esforço, também foi destacado que apenas o uso de interruptores interferométricos Mach-Zehnder (MZI) lentamente reconfiguráveis ​​​​(2 \ vezes 2 \) dentro de um esquema arquitetônico apropriado pode gerar um grande conjunto de conectividades de circuito e opções de funcionalidade 14,15 . No entanto, a idiossincrasia das arquiteturas NN tem que prosseguir ao longo de funcionalidades alternativas que atualmente ainda não são oferecidas por implementações fotônicas programáveis. Embora a reconfiguração do valor do peso possa de fato ser oferecida pela tecnologia de ponderação fotônica de última geração e uma mudança na perspectiva em direção a funções de ativação programáveis ​​também tenha começado a surgir , arquiteturas fotônicas neuromórficas demonstradas até agora não suportam nenhum mecanismo de reconfiguração para seus estágios neuronais lineares. Até agora, os PNNs progrediram ao longo de duas categorias arquitetônicas principais para a realização de camadas neurais lineares, onde plataformas Wavelength-Division-Multiplexed (WDM) e coerentes parecem seguir roteiros discretos e paralelos: (i) layouts incoerentes ou baseados em WDM, onde um comprimento de onda discreto é usado para cada axônio dentro do mesmo neurônio3,4,20, e (ii) esquemas interferométricos coerentes, onde um único comprimento de onda é utilizado em todo o neurônio, explorando a interferência entre campos elétricos coerentes para operações de soma ponderada9,10.

4\) and \(N>2\) is imposed, respectively). Index n in the implementation (a) is set to \(n \le 4\) to denote that the lit nth branch carries a non-zero input. Similarly, if the number of available wavelengths M exceeds the number of required ones, the excess LDs are powered off./p> 90\%\) of analyzed random sets./p>