Renforcement de la saisie automatique en utilisant le mécanisme d'attention et l'ingénierie UNet avancée dans les réseaux neuronaux convolutifs à compréhension générative

Renforcement de la saisie automatique en utilisant le mécanisme d'attention et l'ingénierie UNet avancée dans les réseaux neuronaux convolutifs à compréhension générative

 

Cette recherche propose une nouvelle approche pour la saisie automatique en intégrant un mécanisme d'attention et des structures U-Net avancées, spécifiquement UNet etUNet++, dans le réseau de neurones convolutifs pour la compréhension générative (GG-CNN). La méthode proposée, Attention UNet++ GG-CNN, vise à améliorer considérablement la performance et la précision des prédictions de compréhension automatique. Le mécanisme d'attention permet au modèle de se concentrer sur les caractéristiques les plus pertinentes dans l'image profonde, ce qui améliore la qualité des prédictions de compréhension. Les structures UNet etUNet++, connues pour leur efficacité dans les tâches de segmentation sémantique, sont adaptées pour créer une carte de qualité d'absorption par pixel, fournissant un dessin individuel à partir des images profondes. La structure UNet++, avec des chemins de saut imbriqués et denses, améliore la capacité du modèle à capturer et à diffuser les détails de bas niveau vers des caractéristiques de haut niveau. Cette approche surmonte les limitations des techniques d'absorption d'apprentissage profond traditionnelles en évitant de prélever des échantillons séparés des filtres de compréhension et en réduisant les temps de calcul. Les résultats préliminaires indiquent que Attention UNet++ GG-CNN améliore considérablement la précision et la performance de la saisie automatique, atteignant Attention UNet++ GG-CNN des scores d'intersection sur union (IoU) atteignant 95.86%, et des moyennes des mesures de performance à travers 25%, 50%, et 75% de seuils atteignant 88.29%, ce qui confirme sa capacité à manipuler de manière automatique plus efficacement et de manière fiable dans divers environnements, ouvrant la voie à un traitement robotique plus efficace et fiable dans des environnements dynamiques.

 

Meyada Abdel Salam Rashid : Pr. Wissam Mohammed Jassim : Pr. Rabeh Nouri Farhan

Share |