Techniques basées sur le Deep Learning (U-Net, Mask R-CNN)
3.2. Techniques basées sur le Deep Learning (UNet, Mask RCNN)
Les techniques de segmentation basées sur le Deep Learning révolutionnent la manière dont les tâches de segmentation d'images sont abordées. Parmi les architectures les plus influentes et utilisées dans ce domaine, nous trouvons UNet et Mask RCNN. Ces modèles offrent des performances exceptionnelles, réduisant considérablement les erreurs et augmentant la précision des prédictions.
UNet
UNet est une architecture de réseau de neurones convolutifs conçue principalement pour la segmentation biomédicale.
- Architecture en U : L'architecture tire son nom de sa forme en "U". Elle est composée d'une partie contractante (encodeur) qui réduit la dimension spatiale de l'image et d'une partie expansive (décodeur) qui la reconstruit. Entre les deux parties se trouve un goulot d'étranglement où les caractéristiques sont les plus denses.
- Skip Connections : Une des particularités du UNet est l'utilisation de connexions de pontage (skip connections) qui permettent de combiner les informations des couches de l'encodeur avec les couches correspondantes du décodeur. Cela aide à récupérer les détails fins qui auraient pu être perdus durant la phase de contraction.
- Applications : UNet a été utilisé largement dans le domaine médical pour la segmentation d'organes, de tissus ou de cellules, mais ses applications s'étendent aussi à d'autres domaines comme l'agriculture et la surveillance.
Mask RCNN
Mask RCNN est une extension du modèle RCNN (Regionbased Convolutional Neural Networks), spécifiquement conçu pour la segmentation d'instance.
- Détection d'objets et segmentation simultanées : Mask RCNN ajoute une branche de réseau pour prédire un masque pour chaque objet détecté, en plus des boîtes englobantes et des classifications habituelles.
- ROI Align : Une innovation clé de Mask RCNN par rapport à ses prédécesseurs est l'utilisation de l'algorithme ROI Align, qui permet une meilleure localisation des objets en évitant les erreurs d'alignement pixel.
- Flexibilité et précision : Grâce à sa conception, Mask RCNN peut être appliqué à une grande variété de tâches de segmentation, allant de la détection d'objets de manière précise à la segmentation d'images complexes dans des scènes naturelles.
Les deux modèles, UNet et Mask RCNN, exploitent la puissance du deep learning pour fournir des solutions robustes et précises aux challenges de segmentation d'images. Ils ont en commun une architecture convolutive profonde et l'exploitation de caractéristiques multiéchelles pour améliorer les performances de segmentation.