Par Nathan Reiff
5 min de lecture
La computer vision est une sous-discipline de l'intelligence artificielle (IA) qui consiste à capturer et traiter des informations à partir d'images et de vidéos. Un autre composant clé de la computer vision est qu'elle permet aux systèmes informatiques et à l'IA de prendre des mesures en fonction des informations recueillies. Comme l'IA de manière plus générale, computer vision vise à donner aux ordinateurs une capacité semblable à celle des humains : dans ce cas, la capacité de voir et de traiter des images de toutes sortes.
Les êtres humains ne se rendent peut-être pas compte du nombre de processus différents nécessaires pour traiter les informations visuelles par le sens de la vue. La vue humaine peut rapidement déterminer où commence un objet et où se termine un autre, si les objets sont en mouvement, comment distinguer différents objets, et bien plus encore.
Les ordinateurs peuvent être formés à faire la même chose en utilisant des caméras, des algorithmes et de vastes ensembles de données. La vision par ordinateur repose généralement sur des processus d'IA de réseaux neuronaux ou d'apprentissage automatique, dans lesquels un système d'IA évalue une quantité massive de données pour «apprendre» à les interpréter et à effectuer diverses tâches. Heureusement pour la computer vision, bien que le processus d'apprentissage de «voir» comme un humain soit compliqué, il permet finalement aux ordinateurs d'analyser des milliers d'objets différents par minute, à une vitesse bien plus rapide que tout humain ne pourrait le faire.
Comme d'autres processus d'apprentissage automatique, les systèmes de computer vision s'entraînent en analysant de vastes ensembles de données jusqu'à ce qu'ils apprennent à identifier et à reconnaître des images. Une partie importante du processus d'apprentissage automatique utilisé pour identifier ces informations et apprendre à partir des données est que les algorithmes guident l'ordinateur : il n'est pas nécessaire qu'un programmeur l'aide à reconnaître une image, au-delà de la définition des paramètres initiaux.
Un type spécial de système d'IA appelé réseau neuronal convolutif (CNN) peut également être utilisé en computer vision. Les CNN aident les programmes d'IA dans le processus d'apprentissage en étiquetant les pixels individuels dans les images, ce qui aide les programmes à prédire plus précisément ce que représente l'image complète. C'est un processus d'essais et d'erreurs qui se répète encore et encore jusqu'à ce que le système commence à affiner sa capacité à faire des prédictions.
La technologie moderne offre un laboratoire idéal pour les programmes de computer vision. Les smartphones, les caméras de circulation, les systèmes de sécurité et de nombreux autres dispositifs technologiques courants génèrent d'énormes quantités de données visuelles. Le traitement de ces données prendrait beaucoup plus de temps et d'efforts que toute équipe humaine ne pourrait jamais consacrer à la tâche. C'est l'une des façons dont la computer vision pourrait être appliquée.
Pour l'instant, les applications de computer vision se retrouvent dans de nombreux produits, fonctionnalités et services. Le service de traduction de Google permet par exemple de pointer la caméra d'un smartphone sur des mots imprimés dans une langue et de créer presque instantanément une traduction en temps réel du texte dans une autre langue. Les véhicules autonomes utilisent des systèmes de vision par ordinateur pour traiter les données générées par les caméras et les capteurs des voitures. Les smartphones peuvent reconnaître votre visage pour vous permettre de déverrouiller automatiquement votre téléphone, et les filtres peuvent instantanément améliorer les images et les vidéos en ajoutant des couches ou des effets visuels. Dans les domaines médical et manufacturier, la computer vision peut aider à identifier les symptômes de maladies ou les produits défectueux en traitant des images. Amazon utilise la computer vision dans ses magasins Go Grocery sans caissiers. Et la computer vision peut permettre aux algorithmes de repérer et de supprimer du contenu inapproprié sur les médias sociaux et d'autres sites générés par les utilisateurs.
Certaines des applications répertoriées ci-dessus offrent une commodité ou ajoutent même un peu de fun à un appareil préexistant. Mais certains experts estiment que les applications pratiques et transformationnelles de la computer vision ne font que commencer à être découvertes. Un rapport de Shutterstock, par exemple, estime que le marché de la computer vision a augmenté de près de 8 fois entre 2015 et 2022, pour atteindre 48,6 milliards de dollars. Les analystes de McKinsey estiment que les programmes de parole, d'écriture ou de vision par ordinateur basés sur l'IA augmenteront plus de la moitié de toutes les interactions utilisateur d'ici 2024.
Avec une prolifération considérable des systèmes de computer vision susceptible de se poursuivre, un aspect crucial de l'IA deviendra probablement de plus en plus important : les responsabilités éthiques de ces systèmes et de leurs créateurs. Les systèmes de computer vision sont déjà largement utilisés dans divers outils de reconnaissance faciale, par exemple. Certains de ces outils pourraient être utilisés à des fins de surveillance, constituant une atteinte à la vie privée et pourraient éventuellement être utilisés pour contrôler le comportement humain. Il s'agit là d'une préoccupation parmi de nombreuses autres que soulève une technologie puissante comme la computer vision.
Fiche de référence
Decrypt-a-cookie
This website or its third-party tools use cookies. Cookie policy By clicking the accept button, you agree to the use of cookies.