top of page

Windows 11 introduit « Décrire l’image » : une IA locale pour interpréter votre écran

  • Photo du rédacteur: ARKTechNews
    ARKTechNews
  • 15 juil.
  • 2 min de lecture

Une fonction exclusive aux PC Copilot+

Microsoft introduit une nouvelle fonctionnalité baptisée « Décrire l’image » dans Windows 11, exclusivement disponible sur les PC Copilot+. En effectuant un clic tout en maintenant la touche Windows sur n’importe quelle image affichée à l’écran, l’utilisateur déclenche une analyse en temps réel par une intelligence artificielle locale. Cette action permet de générer automatiquement une description textuelle du contenu visuel sélectionné : photos, graphiques, diagrammes ou interfaces logicielles.


Un traitement entièrement hors ligne

Le traitement des données s’effectue intégralement en local, sur l’appareil, sans transfert d’image vers le cloud. Cette approche garantit un niveau de confidentialité élevé, notamment dans des environnements professionnels sensibles. Le texte généré apparaît dans une fenêtre contextuelle avec des options telles que copier, reformuler ou noter la qualité du résultat. L’ensemble est propulsé par les capacités NPU (Neural Processing Unit) intégrées aux PC Copilot+, notamment ceux équipés de puces Snapdragon.

Windows 11 introduit « Décrire l’image » : une IA locale pour interpréter votre écran

Une extension prochaine à plus de matériels

D’abord réservée aux machines avec Snapdragon X, la fonctionnalité sera prochainement déployée sur des PC équipés de puces Intel Lunar Lake et AMD Strix Point, selon le calendrier de compatibilité de Microsoft. L’outil fonctionne indépendamment des applications ouvertes, ce qui le rend utilisable dans des environnements hétérogènes : documents PDF, vidéos, logiciels métiers, interfaces web…


Vers une IA visuelle généralisée dans Windows

Cette nouvelle capacité vient s’ajouter aux autres actions contextuelles de Windows, comme le résumé de texte, la suppression d’arrière-plan ou la reconnaissance visuelle dans Click to Do. Elle préfigure l’arrivée d’interfaces multimodales, où la reconnaissance d’image, le texte et la voix cohabitent pour offrir une navigation plus fluide et plus intelligente dans l’environnement Windows. Microsoft laisse entendre que d’autres fonctions similaires sont en préparation.



Avec « Décrire l’image », Microsoft franchit un pas significatif dans la démocratisation de l’intelligence artificielle locale, axée sur l’accessibilité, la confidentialité et la polyvalence. Cette fonction, simple d’usage mais technologiquement avancée, incarne l’évolution naturelle des systèmes d’exploitation vers une compréhension plus fine de l’environnement visuel de l’utilisateur, en temps réel et sans dépendance au cloud.



Sources :

bottom of page