banner
Maison / Blog / Réseaux de neurones photoniques programmables combinant WDM et optique linéaire cohérente
Blog

Réseaux de neurones photoniques programmables combinant WDM et optique linéaire cohérente

Oct 09, 2023Oct 09, 2023

Rapports scientifiques volume 12, Numéro d'article : 5605 (2022) Citer cet article

4379 accès

16 Citations

1 Altmétrique

Détails des métriques

Jusqu'à présent, la photonique neuromorphique s'est appuyée uniquement sur des conceptions cohérentes ou sur le multiplexage par répartition en longueur d'onde (WDM) pour permettre la multiplication de produits scalaires ou vecteur par matrice, ce qui a conduit à une variété impressionnante d'architectures. Ici, nous allons un peu plus loin et utilisons WDM pour enrichir la mise en page avec des capacités de parallélisation à travers les étapes de fan-in et/ou de pondération au lieu de servir l'objectif de calcul et présentons, pour la première fois, une architecture neuronale qui combine une optique cohérente avec WDM vers une plate-forme de réseau de neurones programmable multifonctionnelle. Notre plate-forme reconfigurable prend en charge quatre modes de fonctionnement différents sur le même matériel photonique, prenant en charge des couches multicouches, convolutionnelles, entièrement connectées et économes en énergie. Nous validons mathématiquement les performances réussies dans les quatre modes de fonctionnement, en tenant compte de la diaphonie, de l'espacement des canaux et de la dépendance spectrale des éléments optiques critiques, concluant à un fonctionnement fiable avec une erreur relative MAC \(< 2\%\).

La croissance explosive de l'intelligence artificielle (IA) et de l'apprentissage en profondeur (DL) ainsi que l'intégration photonique mature ont créé une nouvelle fenêtre d'opportunité pour l'utilisation de l'optique dans les tâches de calcul1,2,3,4,5. L'utilisation de photons et de technologies optiques pertinentes dans le matériel de réseau neuronal (NN) devrait offrir une augmentation significative des opérations de multiplication-accumulation (MAC) par seconde par rapport aux plates-formes électroniques NN respectives, l'énergie de calcul et l'efficacité de surface étant estimées pour atteindre < fJ/MAC et > TMAC/s/mm\(^{2}\), respectivement6,7. La voie vers la réalisation de ce changement de paradigme matériel NN vise à exploiter les débits de ligne élevés pris en charge par les technologies photoniques intégrées ainsi que la fonction de pondération de petite taille et de faible puissance qui peut être offerte à l'échelle de la puce4,8. Jusqu'à présent, la grande majorité des dispositifs photoniques utilisés à des fins de pondération ont mis l'accent sur des éléments lentement reconfigurables, comme les déphaseurs thermo-optiques (T/O)9,10 et les structures de mémoire non volatile à base de matériau à changement de phase (PCM)4,8 , ce qui implique que les applications d'inférence sont actuellement considérées comme la principale cible dans le domaine de la photonique neuromorphique3.

Les moteurs d'inférence nécessitent en effet une architecture de neurones plutôt statique et un graphe de connectivité de couche qui est généralement défini pour effectuer de manière optimale une certaine tâche d'IA. Le suivi d'objets et la classification d'images, par exemple, sont généralement effectués via un certain nombre de couches convolutionnelles suivies d'une ou plusieurs couches entièrement connectées (FC), tandis que les auto-encodeurs nécessitent des étapes en cascade de couches FC11,12. Bien que les couches convolutionnelles et FC comprennent des éléments architecturaux critiques dans presque toutes les plates-formes d'inférence, un grand nombre de paramètres, tels que le nombre de couches et/ou de neurones par couche et le graphe de connectivité, peuvent varier considérablement en fonction de l'architecture et de l'application DL ciblées. Les implémentations électroniques peuvent conclure à des circuits intégrés spécifiques à l'application (ASIC) personnalisés pour une tâche d'inférence spécifique, mais l'utilisation de GPU, de TPU ou même de FPGA devient inévitable lorsque la reprogrammabilité et la reconfigurabilité sont requises afin d'utiliser le même matériel pour plusieurs applications13.

Le transfert de la capacité de reconfiguration aux implémentations photoniques (P)-NN nécessite une plate-forme capable de prendre en charge de manière flexible différentes dispositions fonctionnelles sur le même matériel neuronal. La programmabilité en photonique a fait des progrès significatifs au cours des dernières années14,15,16 et il a été démontré que les circuits intégrés photoniques programmables (PIC) offrent des avantages importants pour la mise en place de plates-formes photoniques rentables, flexibles et multifonctionnelles qui peuvent suivre de près le concept de FPGA électroniques17. Dans cet effort, il a également été souligné que la simple utilisation de commutateurs interférométriques Mach-Zehnder (MZI) lentement reconfigurables \ (2 \ fois 2 \) dans un schéma architectural approprié peut produire un large éventail de connectivités de circuit et d'options de fonctionnalité14,15 . Cependant, l'idiosyncrasie des architectures NN doit procéder avec des fonctionnalités alternatives qui ne sont actuellement pas encore offertes par les implémentations photoniques programmables. Bien que la reconfiguration de la valeur pondérale puisse effectivement être offerte par la technologie de pointe de pondération photonique4,8,9,10 et qu'un changement de perspective vers des fonctions d'activation programmables ait également commencé à émerger16,18,19, les architectures photoniques neuromorphiques démontrées jusqu'à présent ne prennent en charge aucun mécanisme de reconfiguration pour leurs étages de neurones linéaires. Les PNN ont jusqu'à présent progressé selon deux grandes catégories architecturales pour réaliser des couches neuronales linéaires, où les plateformes multiplexées en longueur d'onde (WDM) et cohérentes semblent suivre des feuilles de route discrètes et parallèles : (i) les dispositions incohérentes ou basées sur le WDM, où une longueur d'onde discrète est utilisé pour chaque axone dans le même neurone3,4,20, et (ii) des schémas interférométriques cohérents, où une seule longueur d'onde est utilisée sur l'ensemble du neurone, exploitant les interférences entre les champs électriques cohérents pour des opérations de somme pondérée9,10.

Ici, nous présentons une nouvelle architecture qui peut combiner efficacement le WDM et la photonique cohérente pour prendre en charge les PNN programmables (PPNN) avec quatre modes de fonctionnement linéaires différents de la couche neurale. À partir de notre architecture de neurones linéaires cohérents à double QI récemment proposée21, qui a été récemment démontrée également en tant que PIC avec des taux de calcul révolutionnaires par axone22,23, nous étendons l'architecture de neurone unique en utilisant plusieurs canaux de longueur d'onde et WDM De/Multiplexing respectif (DE/MUX) en vue de créer des étages de fan-in (entrée) et de poids à plusieurs et à un seul élément pour chaque axone. La programmabilité est ensuite appliquée via \(2 \times 2\) commutateurs MZI qui peuvent définir de manière flexible la connectivité entre les étapes de fan-in et de pondération, permettant ainsi des topologies de couche neurale définies par logiciel. Nous formulons le cadre mathématique de cette architecture neuromorphique programmable et procédons à une étude approfondie des dégradations de performances anticipées provenant de l'utilisation de plusieurs longueurs d'onde dans le même arrangement interférométrique. Nous concluons à un mécanisme simple pour contrecarrer le comportement dépendant de la longueur d'onde des modulateurs et des déphaseurs à l'étape de fan-in et de pondération, respectivement, montrant que notre disposition programmable fonctionne aussi bien pour n'importe quel nombre de canaux optiques utilisés dans l'un des 4 modes distincts de fonctionnement, tous les neurones pris en charge offrant toujours une erreur relative inférieure à \(2\%\) tant que la diaphonie inter-canal est maintenue à des valeurs typiques inférieures à \(-\,20 \, \mathrm {dB} \).

Dans notre étude récente21, nous avons démontré comment des neurones linéaires cohérents, offrant une fonctionnalité de produit scalaire, peuvent être construits à partir de blocs modulateurs IQ, permettant de préserver les informations de signe (codées dans la phase du signal) en introduisant le signal de polarisation, \( \Sigma w_i x_i + b\), rendant le neurone compatible avec les fonctions d'activation non linéaires tout-optiques, \(f_\mathrm {NL}(\cdot )\), adaptées soit au champ électrique, soit à la puissance optique, sans subir d'information perte. Le domaine de la longueur d'onde étant inexploité, nous faisons progresser notre architecture neuronale d'origine afin de prendre en charge plusieurs canaux et d'obtenir une parallélisation, comme illustré à la Fig. 1.

(a) Représentation schématique de PPNN montrant M diodes laser (LD), un MUX, un séparateur X 3dB suivi d'une branche de polarisation (\(W_\mathrm {b}\)) et un OLAU reconfigurable englobant 1 à N étage de séparation, bancs de modulateurs d'entrée (\(X_n\)) et de pondération (\(W_n\)) et un étage de combinaison N vers 1, dont la sortie est amenée à interférer avec le signal de polarisation dans le coupleur X 3dB et envoyé au DEMUX. Examinons de plus près (b) la division 1 à N et (d) son étage de couplage N à 1 à rotation \(\pi\). Zoom avant sur (c) les poids sélectifs de la longueur d'onde de la branche de polarisation et les modulateurs de phase et (e) un axone de l'OLAU composé de commutateurs pour le routage du signal et de modulateurs pour les entrées (\(x_{n,m}\)) et les poids ( \(w_{n,m}\)).

Comme le révèle la figure 1a, l'épine dorsale de notre couche neuronale reste similaire à celle de l'in21, les principales différences étant : (i) un seul signal optique d'entrée à onde continue (CW) est maintenant remplacé par M signaux CW multiplexés, chacun centré sur \(\ lambda _m\) et supportant un neurone virtuel indépendant, et (ii) les modulateurs d'entrée et de poids sont maintenant remplacés par des bancs de modulateurs plus élaborés donnés sur les Fig. 1c, e, délimités par des commutateurs contrôlables par logiciel dans le cas de ces derniers. Le signal multicanal d'entrée est d'abord divisé par un coupleur X 3dB vers la partie dirigée vers la branche de polarisation et la partie restante entrant dans l'unité algébrique linéaire optique (OLAU). Au sein de l'OLAU, le signal est ensuite divisé de manière égale en termes de puissance par un séparateur 1 à N, dont un exemple est donné à la Fig. 1b, et, après avoir été modulé de manière appropriée par les entrées \(x_{n,m} \) et pondéré par les poids \(w_{n,m}\), est envoyé au combinateur N vers 1, illustré à la Fig. 1d. À ce stade, le signal de sortie interfère avec la polarisation dans un coupleur X 3dB et est transmis au DEMUX pour générer les sorties \(y_m\). Enfin, chaque canal m aura sa propre addition algébrique des entrées pondérées avec un biais désigné, aboutissant à un total de M neurones N-fan-in indépendants.

Selon la configuration des commutateurs, dont un aperçu est donné dans le tableau 1, les canaux d'un même axone de la figure 1e peuvent être contrôlés soit individuellement, soit par un modulateur commun, permettant au réseau de fonctionner comme :

multi-neurone (M neurones N-to-1 indépendants), permettant un graphe d'interconnexion logique arbitraire, prenant même en charge une opération multicouche en désignant différents neurones à différentes couches du NN ;

convolutif (M entrées N-éléments indépendantes avec un seul noyau de taille N), où tous les vecteurs d'entrée différents passent par le même ensemble de poids, Fig. 2c, réalisant une utilisation simultanée M fois du même noyau, accélérant l'opération de convolution à partir de figure 2b;

entièrement connecté (FC) (entrée unique à N éléments sur M neurones), où une seule entrée traverse tous les M ensembles de poids disponibles, chacun de taille N, permettant une connectivité complète entre toutes les entrées et sorties, Fig. 3a, c;

l'économie d'énergie (neurone N vers 1 unique), qui, même s'il ne s'agit pas d'un mode de fonctionnement principalement ciblé en raison d'une grande pénalité d'empreinte et d'un faible débit agrégé, permet toujours la conservation des ressources en éteignant les canaux excédentaires et peut être utile si NN doit parfois fonctionner de manière séquentielle (un neurone à la fois).

(a) CNN simplifié inspiré de LeNet-5, utilisé dans la classification d'images. (b) Schéma d'une couche convolutive avec des paires d'entrée/sortie codées par couleur et (c) sa mise en œuvre sur PPNN en mode #2 où chaque canal m correspond à une paire d'entrée/sortie.

(b) Schéma d'un auto-encodeur et (a), (c) ses deux couches FC implémentées sur PPNN en mode #3 où les canaux correspondent à des vecteurs de poids uniques et des sorties \(y_m\). Sur la base du graphique de connectivité de (b), l'implémentation suppose l'utilisation de (a) 4 branches et 2 longueurs d'onde dans la première couche et (c) 2 branches et 4 longueurs d'onde dans la seconde. Si le nombre de branches disponibles N est plus grand que nécessaire, toutes les branches en excès auront les entrées mises à 0 (observez la Nième branche dans (a), (c), où la condition \(N>4\) et \( N>2\) est imposé, respectivement). L'indice n dans l'implémentation (a) est défini sur \(n \le 4\) pour indiquer que la nième branche allumée porte une entrée non nulle. De même, si le nombre de longueurs d'onde disponibles M dépasse le nombre de longueurs d'onde requises, les LD en excès sont mises hors tension.

Une cartographie détaillée entre l'architecture de la Fig. 1 et les modes de fonctionnement enrôlés peut être trouvée dans la Section 1, Document supplémentaire, avec quelques exemples également donnés dans les Fig. 2 et 3. Les modes de fonctionnement convolutif et FC sont particulièrement importants en raison de leur présence omniprésente dans les NN profonds, en particulier dans les NN convolutifs (CNN) largement utilisés, Fig. 2a11. Dans les couches de convolution et de mise en commun, un noyau unique (fenêtre de filtrage ou de pondération) est appliqué aux entrées de manière balayée avec une certaine foulée, produisant une valeur de sortie unique, comme illustré schématiquement sur la Fig. 2b et implémenté sur PPNN sur la Fig. 2c. D'autre part, la couche FC, illustrée implémentée sur PPNN sur les Fig. 3a, c, a un seul ensemble d'entrées passant par plusieurs ensembles de poids pour produire les sorties et c'est le principal élément constitutif des auto-encodeurs, Fig. 3b, le long étant nécessaire dans les CNN, Fig. 2a. Ces deux opérations consomment du temps et de l'énergie si elles sont abordées de manière séquentielle, ce qui implique qu'elles bénéficient grandement de la parallélisation.

Bien que les commutateurs de différents axones puissent être contrôlés indépendamment, la couche NN de type mixte résultante n'a aucune application prévue pour le moment. Par conséquent, nous supposons que les commutateurs de toutes les branches sont synchronisés de la manière suivante \(S_{\mathrm {X},n} = S_\mathrm {X}\), \(S_{\mathrm {W},n} = S_\mathrm {W}\) et \(S_{\mathrm {O},n} = S_\mathrm {O}, \forall n\). Les matrices encapsulant les valeurs des entrées, \(X_n\), et les poids, \(W_n\), pour différents modes de fonctionnement sont résumées dans le tableau 2 où \(I_M\) signifie \(M \times M\) matrice d'identité. Les entrées ne nécessitent pas plus d'un modulateur d'amplitude par valeur, puisqu'elles sont définies sur le domaine positif \(x_{n,m} \in [0,1]\), alors que, dans le cas des poids, qui peuvent être à la fois positifs et négatif, \(w_{n,m} \in [-1,1]\), deux modulateurs sont nécessaires, un pour l'amplitude, qui sera proportionnelle à la magnitude du poids, \(|w_{n,m}| \), et le reste pour la phase, qui portera le signe du poids, \(\varphi _{n,m} = [1 - \mathrm {sgn}(w_{n,m})]\pi /2\).

La branche de polarisation, donnée sur la figure 1c diffère de la branche d'axone, figure 1e, sous deux aspects : (i) elle n'a pas de modulateur(s) de séquence d'entrée ; (ii) il n'a qu'un seul chemin possible pour le signal, avec un contrôle séparé de la phase et de l'amplitude de chaque canal. Ce dernier vient comme une mesure de neutralisation de la variation anticipée dépendante de la longueur d'onde des amplitudes d'entrée et de poids lorsqu'un seul modulateur de phase et d'amplitude est utilisé dans chaque axone de l'OLAU. De plus, il permet de compenser les coefficients de transmission et les décalages de phase potentiellement différents qui seront accumulés par différents canaux au sein de l'OLAU, répondant ainsi aux conditions d'interférence constructive au niveau du dernier coupleur 3dB du PNN. La matrice de biais reste la même pour tous les modes de fonctionnement et lit \(W_\mathrm {b} = \mathrm {diag} [w_{\mathrm {b},1}, \ldots , w_{\mathrm {b},M }]\), où \(w_{\mathrm {b},m} = |w_{\mathrm {b},m}| \exp ( i\varphi _{\mathrm {b},m} )\) .

Supposons que la porteuse optique se compose de M canaux \(\lambda _m\), et est représentée par un vecteur-colonne \(M \times 1\) de champs électriques \(\mathrm {E}_\mathrm {LD } = [E_{\mathrm {LD},1}, \ldots , E_{\mathrm {LD},M}]^\mathrm {T}\), qui sont normalisés de sorte que leur amplitude au carré donne une puissance optique, c'est-à-dire , \(E_{\mathrm {LD},m} = \sqrt{P_{\mathrm {LD},m}} \exp (je \varphi _{\mathrm {LD},m})\). En suivant l'architecture donnée à la Fig. 1 et la dérivation détaillée présentée à la section 2 du document supplémentaire, nous trouvons le vecteur colonne des champs électriques à la sortie de PPNN comme

où, afin d'assurer une interférence constructive au niveau du dernier coupleur X 3dB de la figure 1a, une adaptation de phase entre la polarisation et le signal provenant de l'OLAU est effectuée. Le premier se fait via \({\widetilde{W}}_\mathrm {b} = W_\mathrm {b} \exp (-i \pi /2)^{\log _2 N}\), qui dénote le matrice de transfert par canal de branche de polarisation tenant compte de l'alignement de phase, son mème élément étant \({\widetilde{w}}_{\mathrm {b},m} = |w_{\mathrm {b},m}| \ exp ( i\varphi _{\mathrm {b},m} ) \exp (-i \pi /2)^{\log _2 N}\). Sans tenir compte du déphasage accumulé et des pertes qui sont identiques pour tous les canaux, la matrice de transfert du PPNN, \(\mathrm {Q}_\mathrm {t}\), peut être écrite comme

Le mème élément de la matrice \(\mathrm {Q}_\mathrm {t}\), \(q_{\mathrm {t},m}\), donné par l'équation. (2b) pour le mode de fonctionnement multi-neurones (#1), révèle le principe de fonctionnement sous-jacent de notre PPNN, démontrant comment le produit scalaire normalisé entre les vecteurs à N éléments représentés sur les axones, \([w_{1,m} , \ldots , w_{N,m}]\) et \([x_{1,m}, \ldots , x_{N,m}]\), peuvent être obtenus à la sortie du neurone du mième canal avec un biais \( {\widetilde{w}}_{\mathrm {b},m}\) en superposition. La reconfigurabilité de PPNN est dissimulée dans l'équation. (2a), où le choix des matrices \(X_n\) et \(W_n\) est régi par le mode de fonctionnement selon le Tableau 2, conduisant à des fonctionnalités alternatives. En mode convolutif (#2), un seul noyau comme dans la Fig. 2b, c'est-à-dire un seul ensemble de poids sur différents canaux \([w_{1,0}, \ldots , w_{N,0}]\), appelle un modulateur de poids commun par axone puisque \(w_{n,m} = w_{n,0}, \forall m\), alors que les vecteurs d'entrée restent différents à travers les canaux, \([x_{1,m}, \ldots , x_{N,m}]\), concluant à la parallélisation M-fold, et par conséquent à l'accélération, de l'opération de convolution. D'autre part, en mode FC (#3), un seul vecteur d'entrée \([x_{1,0}, \ldots , x_{N,0}]\), appelant un modulateur d'entrée \(x_{n ,0}\) par nième axone, passe par plusieurs poids sélectifs de canal, \([w_{1,m}, \ldots , w_{N,m}]\), produisant une connectivité complète entre toutes les N entrées \ (x_{n,0}\) et toutes les sorties M \(y_m\), comme illustré à la Fig. 3b. Enfin, en mode d'économie d'énergie (#4), poids unique et vecteurs d'entrée, \([w_{1,0}, \ldots , w_{N,0}]\) et \([x_{1,0} , \ldots , x_{N,0}]\), permettent d'utiliser un seul canal et d'éteindre les autres, offrant les mêmes fonctionnalités que notre moteur de produit scalaire à double QI à partir de21 sans pénalités supplémentaires en termes de puissance la consommation ou le débit par canal, bien que souffrant de la pénalité d'empreinte imposée par la programmabilité PPNN et la conception multicanal. Ce mode de fonctionnement n'est certainement pas le préféré, mais, dans le cas où la reconfigurabilité est une caractéristique nécessaire du système, comme dans les étapes de prototypage, on peut économiser de l'énergie face à des opérations séquentielles, englobant généralement les opérations parallèles, sous la forme de procédures de configuration et d'analyse.

Comme indiqué précédemment, l'éq. (2b) est donné pour le mode #1, mais peut être mis à jour vers n'importe quel autre en remplaçant le \(x_{n,m}\) et/ou \(w_{n,m}\) spécifique au canal, par un joint \(x_{n,0}\) et/ou \(w_{n,0}\). Dans ce qui suit, sauf indication contraire explicite, nous utiliserons les notations \(x_{n,m}\) et \(w_{n,m}\) pour un mode de fonctionnement arbitraire par souci de simplicité et de clarté.

Dans certains scénarios d'application, tels que la classification d'images, Fig. 2a, b, il est pratique de choisir le nombre d'axones comme un carré de la dimension du filtre linéaire (noyau) qui est généralement un nombre impair, ce qui donne, par exemple, \( N = 3 \fois 3\) ou \(N = 5 \fois 5\). Certaines autres applications peuvent demander un N arbitraire, pas nécessairement un carré. Dans ce cas, deux approches peuvent être adoptées pour exploiter l'architecture PPNN de la Fig. 1, en gardant à l'esprit que le séparateur et le combineur de la Fig. 1b, d ont été conçus en supposant que N est une puissance de 2. La première approche est simple et suppose en utilisant les N axones nécessaires et en ignorant les autres qui complètent le nombre de puissance de 2 le plus proche supérieur à N. Dans ce cas, une certaine quantité de puissance optique sera perdue, mais étant proportionnelle à \(N/ 2^{ \lceil \log _2 N \rceil }\), la perte ne dépassera jamais 3dB. La deuxième approche vise à éliminer les pertes de puissance au détriment de la refonte du séparateur et du combineur, en affirmant un déphasage identique sur tous les trajets, ce qui permet de préserver la cohérence entre les signaux voyageant le long de différents axones. L'algorithme de conception d'un tel séparateur et le combineur correspondant sont présentés dans la section 3 du document supplémentaire.

Le fonctionnement du PPNN en mode d'économie d'énergie avec un seul canal actif, ouvre la possibilité de contourner les DE/MUX dans les axones et de centrer tous les composants passifs (séparateurs, combinateurs) et actifs (commutateurs, modulateurs d'entrée et de poids) sur la longueur d'onde centrale du canal, ne laissant aucune place à la dégradation de la sortie due aux propriétés dépendantes de la longueur d'onde des composants optiques. D'autre part, avoir un PPNN multicanal (modes 1 à 3) soulève à juste titre la question de savoir si tous les canaux fonctionneront de la même manière, avec une erreur relative similaire entre la sortie ciblée, donnée par l'élément de matrice \(q_{\mathrm {t},m}\) dans l'Éq. (2b), et la valeur obtenue expérimentalement \(q_{\mathrm {e},m}\). La perte dépendante de la longueur d'onde et l'accumulation de phase ainsi que la diaphonie dans les DE / MUX pourraient entraîner une dégradation des performances de certains canaux dans une plus grande mesure que les autres, mesurée par l'augmentation de l'absolu, \(\Delta q_m = q_{\mathrm {e} ,m} - q_{\mathrm {t},m}\), et erreur relative, \(\delta q_m = |\Delta q_m|/q_{\mathrm {t},m}\), entre les éléments de la matrice . Définir la limite de l'erreur relative tolérable peut être une tâche difficile car la tolérance aux erreurs du réseau dépend de l'affectation dans laquelle il est utilisé et de l'algorithme de formation. En règle générale, une erreur PPNN acceptable doit être inférieure à l'erreur de formation, qui est généralement de l'ordre de quelques pour cent21,22,23. De plus, l'utilisation d'algorithmes de formation sensibles au bruit s'est avérée augmenter la résilience des modèles NN même dans l'environnement bruyant24, où le bruit doit être compris comme un terme large encapsulant tout écart distribué de manière aléatoire par rapport à la sortie ciblée. Suite à ce qui précède, dans cette section, nous cherchons à déterminer dans quelle mesure la matrice de transfert PPNN expérimentale, \(\mathrm {Q}_\mathrm {e}\), s'écartera de celle ciblée, \(\mathrm {Q} _\mathrm {t}\), et si cet écart peut être contrecarré.

Nous commençons notre analyse en examinant l'effet de la dépendance à la longueur d'onde des coupleurs X, utilisés pour diviser et combiner les étages, ainsi que des commutateurs optiques, utilisés pour le routage du signal dans les axones. Dans ce qui suit, le nombre d'axones N est supposé être une puissance de deux, ce qui implique que les étages de séparation et de combinaison sont composés de coupleurs X 3dB en cascade. Néanmoins, toutes les conclusions peuvent être généralisées à un nombre arbitraire d'axones N, en suivant la conception du séparateur/combinateur décrite dans la section 3 du document supplémentaire. Le rapport de division de puissance dépendant de la longueur d'onde du coupleur pour le me canal peut être écrit comme \(\alpha _m = 1/2 + \Delta \alpha _m\), où \(\Delta \alpha _m\) indique l'écart du coefficient par rapport au valeur cible de 1/2. Les trois commutateurs, \(S_\mathrm {X}\), \(S_\mathrm {W}\) et \(S_\mathrm {O}\), sont supposés introduire une pénalité de perte dépendante de la longueur d'onde, de sorte que le quantité de puissance optique transmise au port actif est proportionnelle à \(s_m \le 1\). Selon l'étude détaillée rapportée dans la section 4 du document supplémentaire, nous trouvons le champ électrique de sortie de PPNN sous forme de vecteur colonne

où \(\mathrm {S} = \mathrm {diag} \left[ \sqrt{s_1} , \ldots , \sqrt{s_M} \right]\) désigne la matrice de transfert du commutateur et \(\mathrm {A }_\mathrm {barre/croix} = \mathrm {diag} \left[ \sqrt{1 \mp 2 \Delta \alpha _1} , \ldots , \sqrt{1 \mp 2 \Delta \alpha _M} \right ]\) représente la matrice de transfert barre/croix d'un coupleur X, les deux dépendant de la longueur d'onde. Assurer l'interférence constructive au niveau du coupleur de sortie 3dB et préserver l'intégrité du signe du champ de sortie résultant nécessite une compensation de phase et un équilibrage des pertes par canal dans la branche de polarisation, ce qui est obtenu par une matrice de pondération modifiée \({\widetilde{W}}_ \mathrm {b}\), avec son mème élément

Le coefficient prenant en compte \(w_{\mathrm {b},m}\) dans (4) et celui prenant en compte \(\mathrm {Q}_\mathrm {t}\) dans (3) ne dépendent que des propriétés des interrupteurs et des coupleurs X, et restent inchangés quelle que soit la séquence d'entrée et/ou les poids. En comparant (3) au cas idéal donné par (1)–(2), on peut voir que la condition d'interférence est remplie avec succès par le contrôle individuel de l'amplitude et de la phase de biais selon (4). Différents canaux accumuleront certainement différentes quantités de perte, cependant, ce déséquilibre peut être facilement compensé en utilisant un ensemble d'atténuateurs optiques variables (VOA) à la sortie démultiplexée du PPNN (voir Fig. 1a). Ayant la possibilité de résoudre ce défi en dehors du cœur du PPNN, à partir de maintenant, nous supposons que la dépendance à la longueur d'onde des coupleurs X et des commutateurs n'est pas critique, et nous nous concentrons sur les déficiences qui peuvent entraîner une dégradation de la matrice ciblée \( \mathrm {Q}_\mathrm {t}\).

Pour implémenter les entrées \(x_{n,c}\), nous utilisons des modulateurs Mach-Zehnder (MZM) dans notre étude, c étant l'indice du canal \(\lambda _c\) sur lequel le MZM est centré. Nous supposons que les MZM ont des déphaseurs commandés en tension (PS) dans les deux bras (indexés comme "1/2" pour le bras supérieur/inférieur, respectivement) et fonctionnent en configuration push-pull avec des déphasages induits par CC donnés comme \(\ phi _{\mathrm {DC},1/2} = 2\pi n(V_{\mathrm {DC},1/2}, \lambda ) L_\mathrm {DC}/\lambda\) et RF induit comme \(\phi _{1/2}(\pm V_\mathrm {RF}, \lambda ) = \phi _0 (\lambda ) \pm \Delta \phi (V_\mathrm {RF}, \lambda )\) avec \(\phi _0 = 2\pi n_0(\lambda ) L /\lambda\) et \(\Delta \phi = 2\pi \Delta n(V_\mathrm {RF}, \lambda ) L /\lambda \) où L et \(L_\mathrm {DC}\) désignent les longueurs des régions actives RF et DC et \(n = n_0 + \Delta n\), avec \(n_0\) et \(\Delta n\ ) étant l'indice de réfraction à tension appliquée nulle et sa déviation lorsque la tension est appliquée. La fonction de transfert du MZM est donnée par

et est adapté de telle sorte que \(t_\mathrm {MZM} (\lambda _c) = x_{n,c}\) en choisissant les tensions continues (biais) qui induisent des déphasages séparés par \(\pi\), ce qui implique \ (\phi _{\mathrm {DC},1} = \phi _\mathrm {DC} - \pi\) et \(\phi _{\mathrm {DC},2} = \phi _\mathrm {DC} }\). En supposant que la variation de phase induite par la modulation ne contribue pas de manière significative à la dépendance globale de la longueur d'onde, la fonction de transfert MZM peut être approchée par

Pour les modes de fonctionnement #3 et #4, la fonction de transfert MZM sera centrée sur un certain \(\lambda _c\), c'est-à-dire optimisée pour fournir une entrée ciblée \(x_{n,c}\) sur le canal donné en appliquant \(\Delta \phi (V_\mathrm {RF}, \lambda _c) = \arcsin x_{n,c}\) et en définissant l'argument de la fonction exponentielle dans l'équation. (5) à un multiple de \(2\pi\). Pour tout autre canal m, la valeur imprimée \(x_{n,m,c}\) s'écartera de celle ciblée. Suite à l'analyse détaillée du fonctionnement du modulateur d'entrée donnée à la section 5 du document supplémentaire, en s'appuyant sur le développement de Taylor d'ordre 1\(\mathrm{{st}}\) des phases \(\phi _0 (\lambda)\) et \(\phi _\mathrm {DC} (\lambda )\) autour de \(\lambda _c\), on trouve que le mième canal du nième axone porte la valeur d'entrée donnée par

où \(p_x = n_0(\lambda _c) L/\lambda _c\) et \(q_x = n(V_\mathrm {DC},\lambda _c) L_\mathrm {DC}/\lambda _c\) représentent les longueurs normalisées des déphaseurs RF et CC dans le MZM et sont limitées à \ (p_x, q_x \in {\mathbb {N}}\), \(n_\mathrm {g}\) est l'indice de réfraction du groupe, et \ (\Delta \lambda _1 = \lambda _{m+1} - \lambda _m\) indique l'espacement des canaux (en supposant des canaux équidistants). Le paramètre \(\xi _{m,c}^{(x)}\) représente le déphasage accumulé par le canal m et révèle quatre faits importants : (i) il ne dépend pas du \(x_{n,c} ciblé \) valeur impliquant que l'accumulation de phase ne varie pas avec la séquence d'entrée ; (ii) il ne dépend pas de l'indice d'axone n, ce qui implique que tous les axones introduisent la même quantité d'accumulation de phase qui peut être compensée à l'extérieur de l'OLAU plutôt qu'à l'intérieur de l'OLAU lui-même ; (iii) il dépend de la différence entre m et c impliquant que tous les canaux secondaires du même ordre ont la même accumulation de phase dont l'amplitude augmente avec \(|mc|\); (iv) elle augmente avec l'espacement des canaux \(\Delta \lambda _1\).

Afin d'implémenter les poids \(w_{n,c}\) une combinaison de MZM et d'un PS indépendant peut être utilisée. Selon l'application ciblée, la modulation d'amplitude peut être obtenue soit par le contrôle de l'absorption4,8,23, soit en utilisant des modules interférométriques9,10,22 utilisant des PS T/O ou E/O. Conformément à la majorité des mises en page cohérentes de pointe rapportées ciblant l'inférence, et permettant ainsi des taux de reconfiguration lents, nous choisissons des PS contrôlés thermiquement à la fois dans les bras de MZM et dans le PS qui suit. Nous notons ici que la cointégration des modulateurs E/O (entrée) et T/O (poids) nécessite une planification minutieuse afin d'éviter la diaphonie thermique, mais s'est transformée en un processus bien établi au cours des dernières années, avec d'importantes démonstrations sur puce. de structures E/O et T/O co-intégrées à la fois dans les domaines des émetteurs-récepteurs à base de silicium25, ainsi qu'en photonique neuromorphique22,23. L'adoption de tranchées thermiquement isolantes et/ou de shunts thermiques26,27 ou d'approches plus élaborées telles que la décomposition en modes propres thermiques28 peut également être utilisée, si nécessaire, afin d'assurer un fonctionnement fiable des deux types d'appareils dans diverses plates-formes PIC, y compris celles Si et InP. Contrairement à E/O MZM, le T/O MZM ne peut pas être utilisé en configuration push-pull ; au lieu de cela, il peut être rendu asymétrique en modifiant la longueur du ou des guides d'ondes dans l'un ou les deux de ses bras pour obtenir une différence de phase intégrée de \(2 \theta\) à la température nominale \(T_0\) et \(\lambda _c\), ou, en d'autres termes, il sera biaisé au point \(2\theta\). À tout moment, un seul PS est utilisé pour ajuster l'amplitude du poids en fonction du rapport de \(|w_{n,c}|\) et \(\cos \theta\). Cela se reflète dans la fonction de transfert de champ électrique du système MZM-PS

où \(\phi (T_0, \lambda ) = 2\pi n (T_0, \lambda ) L/\lambda\) est la phase accumulée dans MZM à \(T_0\), \(\Delta \phi (\Delta T, \lambda ) = 2\pi \Delta n (\Delta T, \lambda ) L/\lambda\) est le déphasage dû à la température différentielle appliquée \(\Delta T\), et \(\phi _3 ( T, \lambda ) = 2\pi n (T, \lambda ) L_3/\lambda\) est la phase accumulée dans le PS autonome. Semblable au cas de l'entrée MZM, nous pouvons négliger la contribution de la variation \(\Delta \phi\) avec la longueur d'onde et approximer la fonction de transfert MZM-PS par

en tenant compte du fait qu'il sera centré sur \(\lambda _c\) donnant \(t_\mathrm {MZM-PS} ( \lambda _c ) = w_{n,c}\), impliquant aussi \(\phi (T_0 , \lambda _c) = 2 p_w \pi\) et

où \(p_w, p_s \in {\mathbb {N}}\). Pour tout canal \(m \ne c\), en restant limité à l'approximation du 1er ordre et en supposant \(p_w, p_s \gg 1\) qui est attendu dans tous les cas d'intérêt pratique, en suivant la dérivation détaillée donnée dans la section 6 de Document supplémentaire, nous constatons que le mème canal du nème axone porte le poids

où \(p_w = n(T_0,\lambda _c) L/\lambda _c\) et \(p_s = n(T_0,\lambda _c) L_3/\lambda _c\) représentent les longueurs normalisées des PS dans la MZM et le PS autonome, respectivement, avec L et \(L_3\) étant leurs longueurs. Les mêmes conclusions enrôlées plus tôt pour \(\xi _{m,c}^{(x)}\) valent pour \(\xi _{m,c}^{(w)}\).

Pour le multiplexage et le démultiplexage du signal, des réseaux de guides d'ondes en réseau (AWG) sont utilisés, avec une réponse spectrale plate par canal sur la bande de fréquences d'intérêt. Nous supposons que la fonction de transfert de puissance de l'AWG est donnée sous la forme d'une parabole dans le domaine logarithmique, symétrique et centrée à la longueur d'onde du canal, et qu'elle introduit des pertes globales négligeables. Dans le domaine linéaire, la fonction de transfert correspond à la forme du champ lointain, c'est-à-dire une fonction gaussienne en fonction de la longueur d'onde29. La diaphonie de l'AWG, définie comme le rapport des puissances du premier canal supprimé et du canal de passage, est notée \(r_\mathrm {AWG}\) en termes linéaires, ou \(R_\mathrm {AWG}\) dans le domaine logarithmique (dB). Dans ce qui suit, nous supposons une perte d'insertion (IL) nulle et nous nous limitons à l'approximation d'ordre 1\(\mathrm{{st}}\) où l'on suppose que la diaphonie n'est pertinente qu'entre canaux adjacents. Nous supposons également que la courbure de la région de propagation libre de sortie de l'AWG correspond à la courbure du champ gaussien (sa ligne équiphase dans le plan transversal) produisant une différence de phase nulle entre les guides d'ondes de sortie adjacents.

Lors du passage à travers le DEMUX, le canal m sera distribué non seulement au me port de sortie, mais également aux ports \((m \pm 1)\), le rapport des puissances étant déterminé par \(r_\mathrm {AWG} \). Cela entraînera la modulation du mième canal dans les guides d'ondes adjacents par l'entrée ou le poids ciblé sur les canaux \((m \pm 1)\). Par la suite, lors de la collecte par MUX, un processus inversé suivra, qui rassemblera tous les signaux vers la sortie, conduisant au mélange des entrées ou des poids appartenant aux trois chemins adjacents, avec les coefficients appropriés. Suite à la dérivation détaillée donnée dans la section 7 du document supplémentaire, nous constatons que la valeur réelle imprimée de l'entrée dans les modes de fonctionnement n ° 1 et n ° 2 s'écarte de celle ciblée comme

sous la contrainte \(x_{n,0} = x_{n,M+1} = 0\) et avec le même formalisme appliqué aux poids dans les modes #1 et #3, et aux biais dans tous les modes de fonctionnement. Contrairement à l'écart provenant de l'utilisation d'un seul modulateur pour plusieurs canaux, qui peut être compensé dans une certaine mesure, la diaphonie provenant de l'AWG ne peut pas être facilement compensée en dehors de l'OLAU car elle dépend du modèle et, par conséquent, dépend à la fois de l'indice de l'axone n et indice du canal m.

Après avoir identifié le comportement dépendant de la longueur d'onde des composants constitutifs du PPNN, sa matrice de transfert diagonale expérimentale, \(Q_\mathrm {e}\), peut être dérivée sur la base de la configuration PPNN pour différents modes de fonctionnement, conformément aux tableaux 1 et 2, en suivant le chemin du signal sur la Fig. 1e, en s'appuyant sur l'Eq. (12) pour modéliser la réponse AWG, et Eqs. (5) et (8) pour les fonctions de transfert d'entrée et de modulateur de poids non approchées. Similaire comme dans le cas de \(Q_\mathrm {t}\) dans Eq. (2a), nous ne tenons pas compte du déphasage accumulé dans \(Q_\mathrm {e}\) et restreignons notre attention uniquement à la différence de phase entre la branche de polarisation et l'OLAU et entre les axones de l'OLAU lui-même, car ceux-ci conduisent à détérioration potentielle des performances due à la dégradation des conditions d'interférence. Afin d'effectuer un alignement de phase entre la branche de polarisation et l'OLAU dans des modes de fonctionnement qui supposent l'utilisation d'un seul modulateur pour appliquer des entrées ou des poids à plusieurs canaux (mode n° 3 pour les entrées et n° 2 pour les poids), nous modifions le transfert de branche de polarisation matrice de \({\widetilde{W}}_\mathrm {b}\) à \({\widetilde{W}}_\mathrm {b} \Xi _c^{(w)}\) en mode #2 ou \({\widetilde{W}}_\mathrm {b} \Xi _c^{(x)}\) en mode #3, où

avec \(\xi _{m,c}^{(x)}\) et \(\xi _{m,c}^{(w)}\) étant définis par les équations. (7b) et (11b), respectivement. De cette manière, l'accumulation de phase sélective de canal provenant des Eqs. (7a) et (11a) sont annulés, comme détaillé à la section 8 du document supplémentaire. Il convient de souligner que \(Q_\mathrm {e}\) est dérivé sur la base des équations. (7), (11) et (12) sont approximatifs et, même si la compensation de phase est effectuée via les PS dans la branche de polarisation, un certain écart par rapport à \(Q_\mathrm {t}\) subsistera. Dans l'analyse à venir, ceux-ci seront quantifiés par l'erreur absolue, \(\Delta q_m = q_{\mathrm {e},m} - q_{\mathrm {t},m}\), et l'erreur relative, \(\delta q_m = |\Delta q_m|/q_{\mathrm {t},m}\), entre l'expérimental, \(q_{\mathrm {e},m}\), et le ciblé, \(q_{\mathrm { t},m}\), éléments de matrice diagonaux. Les erreurs peuvent être dérivées sur la base des expressions corrélant \(q_{\mathrm {e},m}\) et \(q_{\mathrm {t},m}\) dans la section 8 du document supplémentaire.

Pour notre étude de cas, nous supposons une plate-forme de silicium, avec la dépendance de l'indice de réfraction à la longueur d'onde à différentes températures tirée de30. A \(\lambda _c = 1,55 \, \mu \mathrm {m}\) et \(T_0 = 293 \, \mathrm {K}\) nous avons \(n = 3,4757\) et \(n_\mathrm { g} = 3,5997\). Dans le cas des modulateurs E/O, à moins que le dopage ne soit sévère et/ou que des matériaux composites ne soient utilisés, les propriétés optiques du silicium non dopé (où la majorité de la lumière est confinée) restent les mêmes que ci-dessus, alors que la dépendance de l'indice de réfraction sur le la tension est supposée être approximativement linéaire pour les plages de tension d'intérêt.

En utilisant la méthode de Monte-Carlo, nous observons \(10^4\) ensembles de valeurs d'entrée et de poids aléatoires, uniformément distribuées, choisies sur le domaine \(x_{n,m} \in [0,1]\) et \( w_{n,m} \in [-1,1]\) et garder le biais fixé à \({\widetilde{w}}_{\mathrm {b},m} = 1\) afin de s'assurer que les informations sur le signe de la somme sont conservées lors de la transition vers le domaine puissance. Lors de l'utilisation de PPNN dans un environnement entraîné, le poids du biais peut prendre n'importe quelle valeur parmi \({\widetilde{w}}_{\mathrm {b},m} \in [-1,1]\) imposée par l'algorithme d'entraînement. Après la simulation, les éléments de matrice diagonaux \(q_{\mathrm {t},m}\) et \(q_{\mathrm {e},m}\) sont agrégés et les nuages ​​de points 2D analysés à l'aide d'une approche statistique multivariée pour déterminer les écarts en termes d'erreur absolue et relative.

Comparaison entre le mode convolutif (#2, côté gauche) et le mode entièrement connecté (#3, côté droit) du fonctionnement PPNN avec des canaux \(M=4\), optimisés pour un fonctionnement sur le canal \( c=2\), et \(N=8\) axones pour \(\Delta \lambda _1 = 0.8 \, \mathrm {nm}\) et \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\). Diagrammes de dispersion 2D à code couleur par canal de l'élément de matrice ciblé \(q_{\mathrm {t},m}\) et (a), (b) l'amplitude et (c), (d) l'argument de l'élément de matrice expérimental \(|q_{\mathrm {e},m}|\) et (e), (f) la grandeur algébrique de l'écart absolu de l'élément de matrice expérimental par rapport à l'élément de matrice ciblé, \(\mathrm {signe} ( {\mathfrak {R}}{\mathfrak {e}} \{ \Delta q_m \} ) |\Delta q_m|\), avec \(\Delta q_m = q_{\mathrm {e},m} - q_ {\ mathrm {t}, m} \), le tout avec des tracés de densité de probabilité de noyau univariés affichés sur les axes horizontal et vertical correspondants des nuages ​​de points.

La figure 4 montre des diagrammes de dispersion 2D pour deux modes de fonctionnement différents, convolutif (côté gauche) et FC (côté droit), pour le point de polarisation T/O MZM \(\theta = \pi /3\ ), longueurs normalisées \(p_x = q_x = 100\) et \(p_w = p_s = 50\), espacement nominal des canaux \(\Delta \lambda _1 = 0,8 \, \mathrm {nm}\), se traduisant par environ \ (100 \, \mathrm {GHz}\) dans le domaine fréquentiel, et \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\). L'alignement de phase entre la branche de polarisation et la sortie de l'OLAU a été effectué en suivant l'Eq. (13).

En termes de magnitude de l'élément de matrice expérimental, \(|q_{\mathrm {e},m}|\), par rapport à l'élément de matrice ciblé, \(q_{\mathrm {t},m}\), les deux modes de fonctionnement montrent des performances similaires, comme le confirment les Fig. 4a, b, lorsqu'ils sont optimisés pour le même canal, \ (c = 2 \), sur \ (M = 4 \) canaux codés par couleur dans le PPNN lorsqu'un seul modulateur est utilisé, ou, optimisé pour m si un modulateur par canal est utilisé. Le coefficient de corrélation de rang de Spearman \(\rho\) dans les deux cas donnés sur la Fig. 4a, b dépasse 0,999 pour les 4 canaux observés, indiquant une relation monotone presque parfaite entre les deux quantités. Les fonctions de densité de probabilité univariées (PDF) de \(q_{\mathrm {t},m}\) et \(|q_{\mathrm {e},m}|\) conservent la forme gaussienne, conformément au théorème central limite (CLT). Néanmoins, on peut observer une légère baisse des moyennes des PDF des canaux de bord (\(m=1\) et \(m=4\)), ou, en d'autres termes, une réduction de la valeur moyenne de l'élément de matrice expérimental comparant à celui ciblé. Le rétrogradage implique que les canaux périphériques subissent une plus grande perte de puissance que les canaux internes lors de la propagation à travers PPNN, ce qui peut être attribué aux paires DEMUX/MUX englobant les modulateurs dans les bancs d'entrée et de pondération. À savoir, lorsque le canal périphérique est démultiplexé, la fraction de sa puissance optique qui est proportionnelle à l'intensité de la diaphonie (\(r_\mathrm {AWG}\)) et est envoyée à un canal adjacent non pris en charge par PPNN (canal 0 pour \ (m=1\) et le canal \(M+1\) pour \(m = M\)) est irréversiblement perdu lors de l'étape de démultiplexage. Cet effet n'est pas observé pour les canaux internes, car ils distribuent leurs signaux de diaphonie aux canaux adjacents qui sont pris en charge par PPNN, et peuvent ensuite être collectés par MUX, comme décrit dans la section 7 du document supplémentaire. Cette pénalité de perte de canal périphérique est capturée par \(x_{n,0} = x_{n,M+1} = 0\) et \(w_{n,0} = w_{n,M+1} = 0 \) dans l'éq. (12) et sa contrepartie pour \(w_{n,m}^\mathrm {AWG}\).

Les diagrammes de dispersion de l'argument de \(q_{\mathrm {e},m}\) par rapport à \(q_{\mathrm {t},m}\), donnés à la Fig. 4c, d, révèlent que l'alignement de phase basé sur l'expression approchée donnée par les Eqs. (7b) et (11b) donnent d'excellents résultats, amenant les déphasages résiduels en dessous de \(0.01\pi \, \mathrm {rad}\). La distribution de \(\mathrm {arg}(q_{\mathrm {e},m})\) est bien approximée par Gaussian grâce à CLT et dépend dans une certaine mesure de l'élément de matrice ciblé \(q_{\mathrm { t},m}\) valeur. On peut également remarquer que les canaux de bord (\(m=1\) et \(m=4\)) subissent un décalage des PDF comme ce fut le cas avec les PDF décrivant la magnitude de \(q_{\mathrm { e},m}\), résultant de déphasages non symétriques vus par les canaux 1\(\mathrm{{st}}\) et \(M\mathrm{{th}}\). Cette fois, cependant, le décalage de la moyenne est de signe différent : positif pour le canal 1\(\mathrm{{st}}\) et négatif pour le canal \(M\mathrm{{th}}\). Dans les deux cas, le décalage provient de la diaphonie dans la branche de polarisation, où la compensation de phase est effectuée. En regardant la contrepartie de biais de (12), le terme de diaphonie est proportionnel à \(r_\mathrm {AWG} ( {\widetilde{w}}_{\mathrm {b},m-1} - 2 {\widetilde{ w}}_{\mathrm {b},m} + {\widetilde{w}}_{\mathrm {b},m+1} )\), et ayant \({\widetilde{w}}_ {\mathrm {b},m} = 1\) pour tous les canaux pris en charge \(m \in [1,M]\), devrait être égal à 0. Pourtant, lorsque \(m = 1\) ou \(m = M\), les signaux ne sont pas contrebalancés puisque \({\widetilde{w}}_{\mathrm {b},0} = {\widetilde{w}}_{\mathrm {b},M+1} = 0\), laissant un terme de diaphonie résiduel proportionnel à \(-r_\mathrm {AWG}\), qui est multiplié par \(\Xi _c^{(x)}\) ou \(\Xi _c^{(w )}\) selon le mode de fonctionnement, comme détaillé dans la section 8 du document supplémentaire. Par contre, les éléments de \(\Xi _c^{(x/w)}\) dépendent de la différence entre le canal observé m et le canal par rapport auquel le modulateur était centré, c, comme (7b) et (11b) montrent. Cela conduit à des déphasages de signes différents pour les canaux 1\(\mathrm{{st}}\) et \(M\mathrm{{st}}\), puisque le choix typique est \(c = \lceil M /2 \rceil\). Indépendamment des moyennes décalées, les écarts-types des PDF quasi-gaussiennes correspondantes restent similaires à ceux des canaux internes (\(m = 2\) et \(m = 3\)).

Enfin, sur la figure 4e, f, nous observons la grandeur algébrique de l'erreur absolue entre les éléments expérimentaux et ciblés de la matrice de transfert, \(\mathrm {sign}( {\mathfrak {R}}{\mathfrak {e}} \{ \Delta q_m \} ) |\Delta q_m|\). L'effet de la dérive moyenne pour les canaux de bord, observé sur les Fig. 4a, b, peut maintenant être quantifié et, pour tous les cas analysés, reste inférieur à \(|\Delta q_m| < 0,06\) ce qui donne l'erreur relative maximale de l'ordre de \(4 \%\) pour les canaux périphériques. Dans le cas des canaux intérieurs, l'erreur est centrée à proximité de 0 et, pour un \(\Delta \lambda _1\) et \(R_\mathrm {AWG}\) donnés reste inférieur à \(2 \%\) dans \(> 90\%\) d'ensembles aléatoires analysés.

Nous étendons notre analyse à tous les modes multicanaux de fonctionnement PPNN selon le tableau 1 pour \(\Delta \lambda _1\) de 0,4 à \(1,6 \, \mathrm {nm}\) (ce qui se traduit par un espacement de grille de 50–\( 200 \, \mathrm {GHz}\)) et \(R_\mathrm {AWG}\) de \(-\,40\) à \(-\,5 \, \mathrm {dB}\), en tenant compte de \(M=8\) voies centrées en \(c = 4\) lorsqu'un seul modulateur pour toutes les voies est utilisé, et en m sinon, visant à déterminer l'influence de divers paramètres système sur l'erreur relative de l'élément de matrice, \(\delta q_m\). La figure 5 montre les valeurs moyennes des erreurs relatives sur la collection d'échantillons analysés \ (10 ​​^ 4 \), ainsi que des limites de confiance de 5 à 95% par rapport à \ (\ Delta \ lambda _1 \) pour la diaphonie AWG de \ (-15 \, \mathrm {dB}\) et par rapport à \(R_\mathrm {AWG}\) pour un espacement des canaux de \(0,8 \, \mathrm {nm}\). Comme observé dans les diagrammes de dispersion donnés à la Fig. 4, nous confirmons à nouveau sur la base de la Fig. 5 que les canaux de bord (\(m=1\) et \(m=8\)) introduisent une quantité d'erreur similaire (les lignes se chevauchent), qui est supérieure à l'erreur rencontrée par les canaux internes (\(2 \le m \le 7\)), se chevauchant également entre eux. La cause sous-jacente est liée à l'asymétrie dans l'amplitude du champ et les déphasages accumulés par les canaux de bord lors du passage à travers AWG, comme expliqué précédemment. La conclusion importante découlant de ce chevauchement est que le nombre de canaux utilisés M ne pose de problème pour aucun des modes de fonctionnement PPNN, tant que la compensation de phase est effectuée dans la branche de polarisation suivant l'Eq. (13).

Erreurs relatives moyennes de l'élément de matrice \(\delta q_m\) (données en pourcentage) avec des bornes de confiance \(5 \%\) à \(95 \%\) pour (a), (b) multi-neurone, ( c), (d) convolutionnel, et (e), (f) mode de fonctionnement FC, en fonction de (a), (c), (e) espacement des canaux pour \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\) et (b), (d), (f) diaphonie AWG pour \(\Delta \lambda _1 = 0,8 \, \mathrm {nm}\).

La comparaison de différents modes de fonctionnement sur la Fig. 5 révèle que l'erreur relative moyenne, qu'elle soit plus élevée pour les canaux de bord ou plus faible pour les canaux intérieurs, reste assez similaire pour différents modes de fonctionnement (à l'exception des très élevés \(R_\mathrm {AWG} \)), ayant une dépendance plus faible à \(\Delta \lambda _1\) qu'à \(R_\mathrm {AWG}\). Pour \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\) il ne dépasse pas \(4 \%\) pour tout \(\Delta \lambda _1\) analysé, cependant, comme la diaphonie augmente, l'erreur moyenne augmente de manière exponentielle, dépassant \(10 \%\) pour les canaux de bord à \(R_\mathrm {AWG} = -10 \, \mathrm {dB}\) et restant dans des valeurs gérables allant jusqu'à \(6\%\) pour les internes même à \(R_\mathrm {AWG} = -5 \, \mathrm {dB}\). En revanche, il existe une différence significative dans l'intervalle de confiance entre les modes de fonctionnement : il est le plus large pour le mode de fonctionnement multi-neurones, donné en Fig. 5a, b, et réduit pour les modes convolutif et FC, donnés en Fig. 5c – f, ce qui implique que, bien que cela ne soit pas courant, de grandes erreurs peuvent survenir dans le cas de plusieurs neurones. La même évolution de l'intervalle de confiance peut être observée en ce qui concerne la diaphonie AWG, Fig. 5b, d, f, révélant que le fait d'avoir plus d'étages DE/MUX en mode n° 1 par rapport aux 2 modes de fonctionnement restants est en fait responsable de sa propagation importante d'erreurs, comme prévu sur la base de l'Eq. (12).

En regardant le mode de fonctionnement convolutif, Fig. 5c, d et FC, Fig. 5e, f, une différence peut être observée dans les intervalles de confiance et, dans une certaine mesure, dans l'erreur relative moyenne pour les canaux internes, indiquant que le mode convolutif de fonctionnement semble présenter de meilleures performances globales. Pourtant, du point de vue architectural, les Figs. 1, 2 et 3, les deux sont presque interchangeables. Dans le même temps, notre analyse montre que les longueurs de modulateur normalisées \(p_x\), \(q_x\), \(p_w\) et \(p_s\) jouent un rôle marginal dans les moyennes d'erreurs relatives et les intervalles de confiance, comme on s'y attendait ayant à l'esprit que la phase accumulée donnée par Eqs. (7b) et (11b) est compensé par les PS dans la banque de modulateurs de polarisation suivant l'Eq. (13). La différence vient donc en réponse à différents domaines d'entrées et de pondérations, c'est-à-dire les quantités appliquées conjointement à tous les canaux et celles appliquées sur des bases par canal. Répéter l'analyse de la Fig. 5 pour les poids limités au même domaine que les entrées, à savoir \(w_{n,m} \in [0,1]\), confirme que les intervalles de confiance diminuent légèrement pour les deux modes de fonctionnement et, plus important encore, devenir similaire en ampleur. Cela peut s'expliquer en réduisant l'ampleur de la diaphonie dans la banque de modulateurs de poids dans le mode de fonctionnement FC en divisant par deux la plage des valeurs que \(w_{n, m \pm 1}\) peut prendre dans l'équivalent de l'équation. (12) pour \(w_{n,m}^\mathrm {AWG}\).

Erreur relative Intervalle de confiance de 5 à 95 % (donné en %) par rapport à l'entrance neuronale N à \(\Delta \lambda _1 = 0,8 \, \mathrm {nm}\) et \(R_\mathrm {AWG} = - 15 \, \mathrm {dB}\) pour (a) le mode convolutif et (b) le mode entièrement connecté.

L'étude des performances PPNN sur le fan-in a été réalisée pour N allant de 2 à 64 et rapportée dans la Fig. 6 pour la configuration convolutive et FC. Une tendance claire peut être observée pour les deux modes de fonctionnement où l'intervalle de confiance diminue avec l'augmentation de N, résultant du rétrécissement du PDF univarié de \(q_{\mathrm {t},m}\) et \(|q_ {\mathrm {e},m}|\), conforme au CLT, où l'écart type diminue avec \(1/\sqrt{N}\). Les valeurs de l'erreur relative moyenne restent similaires à celles de la Fig. 5 pour différentes valeurs N, ce qui implique que, comme pour les autres paramètres analysés, le nombre d'axones ne pose pas de problème au fonctionnement du PPNN.

Nous discutons ici des aspects pratiques de la mise en œuvre du PPNN, en nous concentrant sur les pertes d'insertion (\(\mathrm {IL}_\mathrm {PPNN}\)), la consommation d'énergie (\(P_{\mathrm {PPNN},m}\)) , empreinte (\(A_{\mathrm {PPNN},m}\)) et débit (\(T_{\mathrm {PPNN},m}\)), façonnant conjointement l'efficacité énergétique et l'empreinte, définie comme la rapport du débit et de la consommation d'énergie ou de la zone PPNN, respectivement. Nous reconnaissons les pénalités introduites par une utilisation sous-optimale des ressources, telles que la mise hors tension de certains des LD ou le maintien de certains des axones dans l'obscurité, c'est-à-dire en utilisant moins de canaux (\(M_A \le M\)) ou moins d'axones (\(N_A \le N\)) que le PPNN prend en charge. Sur la base de l'étude détaillée rapportée dans la section 9 du document supplémentaire, nous trouvons les valeurs respectives par nombre de canaux actifs pour les étages de division et de combinaison de puissance de 2

où \(\mathrm {IL}_i\), \(L_i\) et \(P_i\) désignent les pertes d'insertion, la longueur et la consommation électrique par appareil, à l'exception de \(P_\mathrm {LD}\) qui représente la puissance optique du LD par canal. Les indices \(i\in \mathrm {\{MUX,S,C,X,W,R\}}\) font référence, dans l'ordre indiqué, à DE/MUX, commutateur, coupleur X, modulateur d'amplitude d'entrée, poids modulateur d'amplitude et de phase et guides d'onde de routage. De plus, \(\eta _\mathrm {wp}\) est l'efficacité de prise murale du LD, \(L_\mathrm {A}\) est la longueur totale d'un axone, \(L_\Delta\) distance entre les guides d'ondes latéraux, \(B_\mathrm {X}\) est le débit de données du modulateur d'entrée, et \(\mathrm {S}_\mathrm {\{X,W,O\}}\) sont les états de commutation défini dans le tableau 1 en fonction du mode de fonctionnement.

Les deux premiers termes de \(\mathrm {IL}_\mathrm {PPNN}\) dans (14a) dénotent la pénalité introduite par le fonctionnement multicanal (\(\sim \mathrm {IL}_\mathrm {MUX}\)) et la programmabilité (\(\sim \mathrm {IL}_\mathrm {S}\)), tandis que le dernier terme désigne la pénalité sous la forme d'une perte de puissance optique irréversible lorsque des axones \(N_A < N\) sont utilisés. Aucune pénalité IL n'est observée lorsque les canaux \(M_A < M\) sont utilisés.

La consommation d'énergie PPNN par canal, donnée par (14b), est régie par tous ses composants actifs, qui sont, à leur tour, alimentés en fonction des états des commutateurs et des modes de fonctionnement. La consommation électrique de l'amplificateur de transimpédance (TIA) et du contrôleur de température (TEC) en option est exclue de l'analyse car ils contribueraient à la consommation électrique totale de manière similaire, quel que soit le fonctionnement multicanal ou la programmabilité PNN. Par rapport à son prédécesseur, le neurone linéaire cohérent dual-IQ21, la consommation d'énergie du PPNN dans les modes #1 et #4 est similaire à celle du dual-IQ, avec une pénalité mineure \(\sim P_\mathrm {S}\) dans le PPNN cas en raison de sa programmabilité. Cependant, le fonctionnement en mode n ° 2 (convolutionnel) ou n ° 3 (entièrement connecté) permet des économies d'énergie dans le cas PPNN grâce au partage du modulateur de poids (# 2) ou d'entrée (# 3), puisque les coefficients réfléchissent \ (P_ \ mathrm { W}\) et \(P_\mathrm {X}^\mathrm {(DC)/(RF)}\), respectivement, sont divisés par le nombre de canaux actifs, \(M_A\), ce qui implique une efficacité énergétique accrue du PPNN par rapport à l'utilisation de neurones à double QI \(M_A\).

En comparant l'empreinte PPNN par canal, donnée par (14c), à celle du dual-IQ, nous pouvons observer à la fois une pénalité longitudinale et latérale, la première étant due aux DE/MUX et aux commutateurs rendant \(L_\mathrm {A}\) plus long pour PPNN que pour dual-IQ, et ce dernier en raison de l'existence de deux routes alternatives qu'un signal peut emprunter dans les banques d'entrée et/ou de poids. En se concentrant sur deux scénarios de coin, lorsque (i) \(M_A = M \sim N\) et (ii) \(M_A = 1\), la pénalité d'empreinte latérale due au fonctionnement multicanal et à la programmabilité varie de facteurs multiplicatifs de (i) \(\sim (1 + 2/N)\) (scénario le plus favorable) à (ii) \(M (1 + 1/N) + 1 - 1/N\) (scénario le plus défavorable). Le deuxième cas révèle que le mode de fonctionnement à économie d'énergie se traduit par une pénalité d'encombrement proportionnelle au nombre de canaux pour lesquels le PPNN a été conçu.

L'étude approfondie sur la dépendance à la longueur d'onde des composants individuels pourrait être encore étendue pour incorporer le fonctionnement dépendant de la température des dispositifs et les différences statistiques entre les composants employés. Un fonctionnement dépendant de la température fournirait des informations utiles concernant la fiabilité des performances dans des conditions réalistes où des températures sur puce allant jusqu'à 80–100\(^\circ\)C peuvent être rencontrées. Une analyse approfondie où les différences statistiques entre les composants employés sont prises en compte fournirait un aperçu plus clair de ses perspectives pratiques, car les plates-formes photoniques au silicium actuelles ne garantissent pas des performances identiques pour des dispositifs identiques, ce qui nécessite une analyse de la tolérance du système. L'étude peut également être étendue à différents types de modulateurs d'entrée/poids qui sont régis par différentes équations d'amplitude et de phase, dans le but de conclure à des expressions analytiques pour la compensation de déviation.

Au niveau du système, deux directions de mise à l'échelle peuvent être prises. L'un concerne l'interconnexion de plusieurs PPNN et leur utilisation dans une tâche d'inférence afin d'estimer leur précision sous une charge non aléatoire. La seconde repose sur l'impact positif que l'augmentation du nombre d'axones a sur la réduction de l'intervalle de confiance de l'erreur relative rapporté à la Fig. 6. Cela indique que l'architecture PPNN peut être étendue de manière fiable dans un arrangement bidimensionnel, similaire à notre barre transversale photonique récemment proposée31, produisant K sorties de neurones spatialement séparées. Boosté par WDM, le crossbar pourrait prendre en charge un total de sorties logiques \ (K \ fois M \), tout en offrant également la flexibilité de basculer entre les différents modes de fonctionnement, se rapprochant du concept FPGA photonique.

Dans ce manuscrit, nous présentons un PNN cohérent reconfigurable in situ, exploitant le domaine de la longueur d'onde pour obtenir un fonctionnement parallèle de plusieurs neurones avec un graphique d'interconnexion flexible et défini par l'utilisateur, prenant en charge quatre modes de fonctionnement distincts, entre autres une couche convolutive et entièrement connectée. Nous réalisons une étude analytique détaillée de la dépendance en longueur d'onde du modulateur et du DE/MUX, offrant une approche simple pour restaurer la fidélité PNN grâce à l'alignement de phase du signal de polarisation, révélant que la majorité des erreurs résiduelles proviennent de la diaphonie dans le DE/MUX étapes. L'approche analytique est comparée à une simulation de Monte-Carlo montrant que l'erreur relative résiduelle reste généralement dans la plage gérable de 2 % pour une diaphonie AWG allant jusqu'à \(-20 \, \mathrm {dB}\). Plus important encore, les performances du PNN ne se dégradent pas avec l'augmentation du nombre de canaux ou le fan-in des neurones tant que l'alignement de phase dans la branche de polarisation est effectué, prenant en charge une mise à l'échelle transparente du réseau, y compris l'extension aux arrangements multi-colonnes pour le vecteur -multiplication matricielle. La dépendance de l'erreur relative à l'espacement des canaux est faible, ce qui permet au PNN de fonctionner aussi bien dans les systèmes WDM grossiers que denses.

Les ensembles de données générés pendant et/ou analysés pendant l'étude en cours sont disponibles auprès de l'auteur correspondant sur demande raisonnable.

Kitayama, K.-I. et coll. Nouvelle frontière de la photonique pour le traitement de données-accélérateur photonique. Photonique APLhttps://doi.org/10.1063/1.5108912 (2019).

Article Google Scholar

De Marinis, L., Cococcioni, M., Castoldi, P. & Andriolli, N. Réseaux de neurones photoniques : une enquête. Accès IEEE 7 , 175827–175841. https://doi.org/10.1109/ACCESS.2019.2957245 (2019).

Article Google Scholar

Shastri, BJ et al. Photonique pour l'intelligence artificielle et l'informatique neuromorphique. Nat. Photonique 15, 102–114. https://doi.org/10.1038/s41566-020-00754-y (2021).

Article ADS CAS Google Scholar

Feldmann, J. et al. Traitement convolutif parallèle utilisant un noyau de tenseur photonique intégré. Nature 589, 52–58. https://doi.org/10.1038/s41586-020-03070-1 (2021).

Article ADS CAS PubMed Google Scholar

Porte, X. et al. Un réseau de neurones photoniques complet, parallèle et autonome dans un laser multimode à semi-conducteur. J.Phys. Photonique. https://doi.org/10.1088/2515-7647/abf6bd (2021).

Article Google Scholar

Totović, AR, Dabos, G., Passalis, N., Tefas, A. & Pleros, N. Femtojoule par photonique neuromorphique MAC : une feuille de route énergétique et technologique. IEEE J. Sel. Haut. Électron quantique. 26, 1–15. https://doi.org/10.1109/JSTQE.2020.2975579 (2020).

Article Google Scholar

Nahmias, MA et al. Opérations photoniques de multiplication-accumulation pour les réseaux de neurones. IEEE J. Sel. Haut. Électron quantique. 26, 1–18. https://doi.org/10.1109/JSTQE.2019.2941485 (2020).

Article Google Scholar

Miscuglio, M. & Sorger, VJ Noyaux de tenseurs photoniques pour l'apprentissage automatique. Appl. Phys. Rev.https://doi.org/10.1063/5.0001942 (2020).

Article Google Scholar

Zhang, H. et al. Puce neuronale optique pour la mise en œuvre d'un réseau neuronal à valeur complexe. Nat. Commun. 12, 457. https://doi.org/10.1038/s41467-020-20719-7 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Shen, Y. et al. Apprentissage profond avec des circuits nanophotoniques cohérents. Nat. Photonique 11, 441–446. https://doi.org/10.1038/nphoton.2017.93 (2017).

Article ADS CAS Google Scholar

Gu, J. et al. Progrès récents dans les réseaux de neurones convolutifs. Reconnaissance de modèle. 77, 354–377. https://doi.org/10.1016/j.patcog.2017.10.013 (2018).

Annonces d'article Google Scholar

Leijnen, S. & Veen, FV Le zoo du réseau neuronal. Actes https://doi.org/10.3390/proceedings2020047009 (2020).

Article Google Scholar

Shawahna, A., Sait, SM & El-Maleh, A. Accélérateurs basés sur FPGA de réseaux d'apprentissage en profondeur pour l'apprentissage et la classification : une revue. Accès IEEE 7, 7823–7859. https://doi.org/10.1109/ACCESS.2018.2890150 (2019).

Article Google Scholar

Bogaerts, W. et al. Circuits photoniques programmables. Nature 586, 207–216. https://doi.org/10.1038/s41586-020-2764-0 (2020).

Article ADS CAS PubMed Google Scholar

Pai, S. et al. Programmation parallèle d'un réseau photonique à action directe arbitraire. IEEE J. Sel. Haut. Électron quantique. 26, 1–13. https://doi.org/10.1109/JSTQE.2020.2997849 (2020).

Article Google Scholar

Huang, C. et al. Processeur de signal optique non linéaire programmable sur puce et ses applications. IEEE J. Sel. Haut. Électron quantique. 27, 1–11. https://doi.org/10.1109/JSTQE.2020.2998073 (2021).

Article CAS Google Scholar

Bogaerts, W. & Rahim, A. Photonique programmable : une opportunité pour un écosystème PIC à grand volume accessible. IEEE J. Sel. Haut. Électron quantique. 26, 1–17. https://doi.org/10.1109/JSTQE.2020.2982980 (2020).

Article Google Scholar

Fard, MMP et al. Réalisation expérimentale de fonctions d'activation arbitraires pour les réseaux de neurones optiques. Opter. Express 28, 12138–12148. https://doi.org/10.1364/OE.391473 (2020).

Article ADS CAS Google Scholar

Crnjanski, J., Krstić, M., Totović, A., Pleros, N. & Gvozdić, D. Fonctions d'activation adaptatives de type sigmoïde et PReLU pour le perceptron tout optique. Opter. Lett. 46, 2003–2006. https://doi.org/10.1364/OL.422930 (2021).

Article ADS PubMed Google Scholar

Xu, X. et al. Accélérateur convolutif photonique 11 tops pour réseaux de neurones optiques. Nature 589, 44–51. https://doi.org/10.1038/s41586-020-03063-0 (2021).

Article ADS CAS PubMed Google Scholar

Mourgias-Alexandris, G. et al. Photonique neuromorphique avec des neurones linéaires cohérents utilisant des cellules de modulation à double QI. J. Lightwave Technol. 38, 811–819. https://doi.org/10.1109/JLT.2019.2949133 (2020).

Article ADS CAS Google Scholar

Mourgias-Alexandris, G. et al. Un neurone photonique cohérent au silicium avec un débit de ligne de traitement de 10 GMAC/sec. Dans Proc. Conférence sur la communication par fibre optique (OFC) 2021., Tu5H.1 (Conférence virtuelle, 2021).

Giamougiannis, G. et al. Neurones cohérents intégrés au silicium avec 32 débits de ligne de calcul GMAC/sec/axone à l'aide de cellules d'entrée et de pondération basées sur l'EAM. Dans Proc. Conférence européenne sur la communication optique (ECOC) 2021. (Bordeaux, France, 2021).

Passalis, N. et al. Formation de réseaux photoniques récurrents résistants au bruit pour l'analyse de séries chronologiques financières. En 2020, 28e Conférence européenne sur le traitement du signal (EUSIPCO), 1556-1560, https://doi.org/10.23919/Eusipco47968.2020.9287649 (2021).

Pitris, S. et al. Émetteur photonique au silicium 400 Gb/s et technologies WDM de routage pour des interconnexions puce à puce à 8 sockets sans colle. J. Lightwave Technol. 38, 3366–3375. https://doi.org/10.1109/JLT.2020.2977369 (2020).

Article ADS CAS Google Scholar

Gilardi, G. et al. Tranchées profondes pour la réduction de la diaphonie thermique dans les circuits intégrés photoniques à base d'InP. J. Lightwave Technol. 32, 4864–4870. https://doi.org/10.1109/JLT.2014.2366781 (2014).

Article CAS Google Scholar

Krochin-Yepez, P.-A., Scholz, U. & Zimmermann, A. Mesures compatibles Cmos pour la gestion thermique des systèmes photoniques au silicium sensibles à la phase. Photoniquehttps://doi.org/10.3390/photonics7010006 (2020).

Article Google Scholar

Milanizadeh, M., Aguiar, D., Melloni, A. & Morichetti, F. Annulation des effets de diaphonie thermique dans les circuits intégrés photoniques. J. Lightwave Technol. 37, 1325-1332. https://doi.org/10.1109/JLT.2019.2892512 (2019).

Article ADS CAS Google Scholar

Takahashi, H., Oda, K., Toba, H. et Inoue, Y. Caractéristiques de transmission du multiplexeur de longueur d'onde N × N à guide d'ondes en réseau. J. Lightwave Technol. 13, 447–455. https://doi.org/10.1109/50.372441 (1995).

Annonces d'article Google Scholar

Li, HH Indice de réfraction du silicium et du germanium et ses dérivés de longueur d'onde et de température. J.Phys. Chim. Réf. Données 9, 561–658. https://doi.org/10.1063/1.555624 (1980).

Article ADS CAS Google Scholar

Giamougiannis, G. et al. Barre transversale photonique cohérente en tant qu'opérateur linéaire universel. Revues laser et photonique (2021). Soumis pour publication.

Télécharger les références

Ce travail de recherche a été partiellement soutenu par la Fondation hellénique pour la recherche et l'innovation (HFRI) dans le cadre du "Premier appel à projets de recherche HFRI pour soutenir les membres du corps professoral et les chercheurs et l'achat d'une subvention d'équipement de recherche à coût élevé" (DeepLight, numéro de projet : 4233 ).

Département d'informatique, Centre de recherche interdisciplinaire et d'innovation - CIRI, Université Aristote de Thessalonique, Centre des Balkans - Bâtiment A, 10e Km Thessalonikis-Thermis Av, 57001, Thessalonique, Grèce

Angelina Totovic, George Giamougiannis, Apostolos Tsakyridis & Nikos Pleros

Celestial AI, 3001 Tasman Drive, Santa Clara, Californie, 95054, États-Unis

David Lazovski

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Tous les auteurs ont conçu l'idée et conçu le flux de travail. AT a réalisé l'analyse mathématique et GG et AT ont déployé le code pour l'analyse des performances. Tous les auteurs ont contribué à l'analyse des résultats et ont co-écrit l'article.

Correspondance avec Angelina Totovic.

Les auteurs ne déclarent aucun intérêt concurrent.

Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournir un lien vers la licence Creative Commons et indiquer si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Totovic, A., Giamougiannis, G., Tsakyridis, A. et al. Réseaux de neurones photoniques programmables combinant WDM et optique linéaire cohérente. Sci Rep 12, 5605 (2022). https://doi.org/10.1038/s41598-022-09370-y

Télécharger la citation

Reçu : 22 septembre 2021

Accepté : 22 mars 2022

Publié: 04 avril 2022

DOI : https://doi.org/10.1038/s41598-022-09370-y

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.