Les unités récurrentes fermées (GRU) sont un système de porte dans les réseaux de neurones récurrents, introduit en 2014 par Kyunghyun Cho et al[1]. Le GRU est comme une longue mémoire à court terme (LSTM) avec une porte d'oubli[2], mais a moins de paramètres que LSTM, car il n'a pas de porte de sortie[3]. Les performances de GRU sur certaines tâches de modélisation de musique polyphonique, de modélisation de signaux vocaux et de traitement du langage naturel se sont avérées similaires à celles de LSTM[4],[5]. Les GRU ont montré que le déclenchement est en effet utile en général et l'équipe de Bengio a conclu qu'aucune conclusion concrète sur laquelle des deux unités de déclenchement était la meilleure.
Il existe plusieurs variantes de l'unité récurrente fermée dans lesquels l'unité est activé en utilisant diverses combinaisons de l'état caché et du biais précédent, ainsi une forme simplifiée appelée unité fermée minimale.
L'unité fermée minimale est similaire à l'unité entièrement fermée, mais le vecteur d’activation de la porte de mise à jour et de la réinitialisation sont fusionné dans une porte d'oublie. Cela implique également que l'équation du vecteur de sortie doit être modifiée :
variables
: vecteur d'entrée
: vecteur de sortie
: vecteur d'activation candidat
: oublier le vecteur
, et : matrices de paramètres et vecteur
Cadre de recommandation d'algorithme d'apprentissage
Un cadre de recommandation d'algorithme d'apprentissage peut aider à guider la sélection de l'algorithme d'apprentissage et de la discipline scientifique (par exemple RNN, GAN, RL, CNN,. . . ). Le cadre a l'avantage d'avoir été généré à partir d'une analyse approfondie de la littérature et dédié aux réseaux de neurones récurrents et à leurs variations[6].
↑Ravanelli, Brakel, Omologo et Bengio, « Light Gated Recurrent Units for Speech Recognition », IEEE Transactions on Emerging Topics in Computational Intelligence, vol. 2, no 2, , p. 92–102 (DOI10.1109/TETCI.2017.2762739, arXiv1803.10225, S2CID4402991)
↑Feltus, « Learning Algorithm Recommendation Framework for IS and CPS Security: Analysis of the RNN, LSTM, and GRU Contributions », IGI International Journal of Systems and Software Security and Protection (IJSSSP), vol. 13, no 1, (DOI10.4018/IJSSSP.293236, S2CID247143453)