Cours 5 - Lecture seule - Géométrie Euclidienne et Vision Binoculaire PDF
Document Details
Uploaded by EarnestEmpowerment
Université McGill
Tags
Related
- Cours de Géométrie vectorielle et Applications PDF 2023-2024
- Notions de Géométrie (Parallélisme & perpendicularité) - 1APIC PDF
- Synthèse Chapitre 2 - Figures Géométriques Elémentaires PDF
- Notes de Cours Algèbre Linéaire et Géométrie Vectorielle Automne 2022 - PDF
- Teorie Geometrie pentru Evaluarea Nationala 2012 - Partea a II a PDF
- Cours de Géométrie et Algèbre PDF
Summary
Ce document présente les concepts de géométrie euclidienne et de vision binoculaire. Il explique comment le cerveau traite les informations provenant des deux yeux pour percevoir la profondeur. Il détaille les différents indices de profondeur, tels que la disparité binoculaire, l'occlusion, la taille relative, etc.
Full Transcript
Introduction Géométrie euclidienne : les lignes parallèles restent parallèles lorsqu'elles sont étendues dans l'espace. Les objets conservent la même taille et la même forme lorsqu'ils se déplacent dans l'espace. Les angles internes d'un triangle totalisent toujours 180 degrés, etc. Introduction Not...
Introduction Géométrie euclidienne : les lignes parallèles restent parallèles lorsqu'elles sont étendues dans l'espace. Les objets conservent la même taille et la même forme lorsqu'ils se déplacent dans l'espace. Les angles internes d'un triangle totalisent toujours 180 degrés, etc. Introduction Notez que les images projetées sur la rétine ne sont pas euclidiennes ! Par conséquent, notre cerveau travaille tout le temps avec une géométrie non euclidienne, même si nous n'en sommes pas conscients. Introduction Somme de probabilité : la probabilité accrue de détecter un stimulus à partir de deux échantillons ou plus. L'un des avantages d'avoir deux yeux tournés vers l'avant. Introduction Sommation binoculaire : La combinaison (ou « sommation ») des signaux de chaque œil de manière à améliorer les performances de nombreuses tâches avec les deux yeux qu'avec un seul. Les deux images rétiniennes d'un monde en trois dimensions ne sont pas les mêmes ! Les deux images rétiniennes d'un monde en trois dimensions ne sont pas les mêmes Introduction Disparité binoculaire : Différences entre les deux images rétiniennes d'une même scène. La disparité est à la base de la stéréopsie, une perception vivante de la tridimensionnalité du monde qui n'est pas disponible avec la vision monoculaire. Les champs visuels du lapin et de l’humain Les champs visuels du lapin et de l’humain Les limites de vos champs visuels Introduction Indice de profondeur : informations sur la troisième dimension (profondeur) de l'espace visuel. Indice de profondeur monoculaire : Un indice de profondeur qui est disponible même lorsque le monde est vu d'un seul œil. Indice de profondeur binoculaire : Un indice de profondeur qui s'appuie sur les informations des deux yeux. M. C. Escher Indices monoculaires de l'espace tridimensionnel Occlusion : un indice de l’ordre de profondeur relative dans lequel, par exemple, un objet obstrue partiellement la vue d'un autre objet. Vues accidentelles ou génériques Vues accidentelles ou génériques Vues accidentelles ou génériques Indices monoculaires de l'espace tridimensionnel Indice de profondeur métrique : Un indice de profondeur qui fournit des informations quantitatives sur la distance dans la troisième dimension. Indice de profondeur non métrique : un indice de profondeur qui fournit des informations sur l'ordre de la profondeur (profondeur relative) mais pas sur la magnitude de la profondeur. Indices monoculaires de l'espace tridimensionnel Taille relative : Une comparaison de la taille entre les éléments sans connaître la taille absolue de l'un ou l'autre. Toutes choses étant égales par ailleurs, nous supposons que les objets plus petits sont plus éloignés de nous que les objets plus grands. Profondeur due à la taille relative Profondeur due à la taille relative Indices monoculaires de l'espace tridimensionnel Hauteur relative : pour les objets touchant le sol, ceux situés plus haut dans le champ visuel semblent être plus éloignés. Dans le ciel au-dessus de l'horizon, les objets plus bas dans le champ visuel semblent être plus éloignés. Indices monoculaires de l'espace tridimensionnel Gradients de texture : un indice de profondeur basé sur le fait géométrique que les éléments de même taille forment des images plus petites et plus rapprochées plus ils s'éloignent. Les gradients de texture résultent d'une combinaison des indices de taille relative et de hauteur relative. Profondeur due aux gradients de textures Profondeur due aux gradients de textures Profondeur due aux gradients de textures Indices monoculaires de l'espace tridimensionnel Taille familière : un indice basé sur la connaissance de la taille typique des objets. Lorsque vous connaissez la taille typique d'un objet, vous pouvez deviner à quelle distance il se trouve en fonction de sa taille. L'indice de taille familière fonctionne souvent en conjonction avec l'indice de taille relative. Indice de taille familière Indices monoculaires de l'espace tridimensionnel La taille relative et la hauteur relative fournissent toutes deux des informations métriques. Indice de profondeur métrique relative : un indice de profondeur qui pourrait spécifier, par exemple, que l'objet A est deux fois plus éloigné que l'objet B sans fournir d'informations sur la distance absolue à A ou B. Indice de profondeur métrique Indices monoculaires de l'espace tridimensionnel La taille familière peut fournir des informations métriques précises si votre système visuel connaît la taille réelle de l'objet et l'angle visuel qu'il occupe sur la rétine. Indice de profondeur métrique absolue : un indice de profondeur qui fournit des informations quantifiables sur la distance dans la troisième dimension. Indices monoculaires de l'espace tridimensionnel Perspective atmosphérique : un indice de profondeur basé sur la compréhension implicite que la lumière est diffusée par l'atmosphère. Plus de lumière est diffusée lorsque nous regardons à travers plus d'atmosphère. Ainsi, les objets plus éloignés apparaissent plus pâles, plus bleus et moins distincts. Perspective atmosphérique Perspective atmosphérique Indices monoculaires de l'espace tridimensionnel Perspective linéaire : les lignes parallèles dans le monde tridimensionnel semblent converger dans une image bidimensionnelle à mesure qu'elles s'étendent au loin. Point de fuite : Le point apparent auquel convergent des lignes parallèles s'éloignant en profondeur. Perspective linéaire Perspective linéaire Deux points de fuite Indices monoculaires de l'espace tridimensionnel Indice de profondeur pictural : Un indice de distance ou de profondeur utilisé par les artistes pour représenter la profondeur tridimensionnelle dans des images bidimensionnelles. Anamorphose (ou projection anamorphique): Utilisation des règles de la perspective linéaire pour créer une image bidimensionnelle si déformée qu'elle n'a l'air correcte que lorsqu'elle est vue sous un angle spécial ou avec un miroir qui contrecarre la distorsion. La magie des projections anamorphiques La magie des projections anamorphiques La magie des projections anamorphiques Indices triangulaires de l'espace tridimensionnel Parallaxe de mouvement : Lorsqu’un observateur se déplace (e.g. vous êtes en voiture ou en train), les images les plus proches semblent se déplacer plus rapidement dans le champ visuel que les images plus éloignées (bien que ces objets soient statiques). Le cerveau utilise ces informations pour calculer les distances des objets dans l'environnement. Les mouvements de la tête et tout autre mouvement relatif entre les observateurs et les objets révèlent des indices de parallaxe de mouvement. Parallaxe Pause Indices triangulaires de l'espace tridimensionnel Accommodement : processus par lequel l'œil change de focalisation (dans lequel la lentille grossit lorsque le regard est dirigé vers des objets plus proches). Convergence : La capacité des deux yeux à se tourner vers l'intérieur, souvent utilisée pour se concentrer sur des objets plus proches. Divergence : La capacité des deux yeux à se tourner vers l'extérieur, souvent utilisée pour se concentrer sur des objets plus éloignés. Vision binoculaire et stereopsis Points rétiniens correspondants : un concept géométrique indiquant que les points sur la rétine de chaque œil où les images rétiniennes monoculaires d'un seul objet sont formées sont à la même distance de la fovéa dans chaque œil. Disparité binoculaire Les rétines du spectateur Vision binoculaire et stereopsis Horoptère : L'emplacement des objets dont les images se trouvent sur les points correspondants. La surface de la disparité zéro. Cercle Vieth – Müller : L'emplacement des objets dont les images tombent sur des points géométriquement correspondants dans les deux rétines. Le cercle Vieth-Müller et l'horoptère sont techniquement différents, mais pour nos besoins, vous pouvez les considérer comme identiques. Cercle Vieth-Müller Vision binoculaire et stereopsis Les objets sur l'horoptère sont vus comme des images uniques lorsqu'ils sont vus avec les deux yeux. Zone fusionnelle de Panum (espace de Panum) : La région de l'espace, devant et derrière l'horoptère, dans laquelle la vision unique binoculaire est possible. Vision binoculaire et stereopsis Les objets significativement plus proches ou plus éloignés de l'horoptère tombent sur des points non correspondants dans les deux yeux et sont vus comme deux images. Diplopie : Vision double. S'ils sont visibles dans les deux yeux, les stimuli tombant en dehors de l’espace de Panum apparaîtront diplopiques. Rétines superposées du spectateur Disparité croisée et non-croisée Vision binoculaire et stereopsis Disparité croisée : indice de disparité créé par des objets devant le plan de l'horoptère. Les images devant l'horoptère sont déplacées vers la gauche dans l'œil droit et vers la droite dans l'œil gauche. Vision binoculaire et stereopsis Disparité non croisée : indice de disparité créé par des objets derrière le plan de l'horoptère. Les images derrière l'horoptère sont déplacées vers la droite dans l'œil droit et vers la gauche dans l'œil gauche. Vision binoculaire et stereopsis Stéréoscope : Dispositif permettant de présenter une image à un œil et une autre image à l'autre œil. Les stéréoscopes étaient un objet populaire dans les années 1900. De nombreux enfants des temps modernes avaient un ViewMaster, qui est aussi un stéréoscope. Le casque Oculus Rift est un exemple plus moderne de stéréoscope. Le stéréoscope de Wheatstone Vision binoculaire et stereopsis Fusion libre : Technique consistant à faire converger (croiser) ou diverger (décroiser) les yeux afin de visualiser un stéréogramme sans stéréoscope. Les auto-stéréogrammes reposent sur la fusion libre. Vision binoculaire et stereopsis Stéréocécité : une incapacité à utiliser la disparité binoculaire comme indice de profondeur. Peut résulter d'un trouble visuel de l'enfance, tel que le strabisme, dans lequel les deux yeux sont mal alignés. La plupart des personnes stéréoaveugles ne s'en rendent même pas compte. Fusion libre Vision binoculaire et stereopsis Stéréogramme à points aléatoires (RDS) : stéréogramme composé d'un grand nombre de points placés au hasard. Les RDS ne contiennent pas d'indices monoculaires de profondeur. Les stimuli visibles stéréoscopiquement dans les RDS sont des stimuli cyclopéens. Cyclopéen : Fait référence aux stimuli qui sont définis par la seule disparité binoculaire. Stéréogramme à points aléatoires Auto-Stéréogramme Vision binoculaire et stereopsis Pour que les films apparaissent en 3D, chaque œil doit recevoir une vue légèrement différente de la scène (comme dans la vraie vie). Les premières méthodes pour voir des films en 3D impliquaient des lunettes « anaglyphiques » avec une lentille rouge sur un œil et une lentille bleue sur l'autre. Les méthodes actuelles utilisent la lumière polarisée et des lunettes polarisantes pour s'assurer que chaque œil voit une image légèrement différente. Vision binoculaire et stereopsis Problème de correspondance : en vision binoculaire, problème consistant à déterminer quelle partie de l'image de l'œil gauche doit correspondre à quelle partie de l'œil droit. Les trois cercles violets Les trois cercles violets Vision binoculaire et stereopsis Il existe plusieurs façons de résoudre le problème de correspondance : Brouiller l'image : ne laisser que les informations à basse fréquence spatiale aide. Vision binoculaire et stereopsis Contrainte d'unicité : observation selon laquelle une caractéristique du monde est représentée exactement une fois dans chaque image rétinienne. Contrainte de continuité : observation selon laquelle, à l'exception des bords des objets, des points voisins dans le monde se trouvent à des distances similaires de l'observateur. La fusion libre plus facile en basse fréquence Vision binoculaire et stereopsis Comment la stéréopsie est-elle implémentée dans le cerveau humain ? L'entrée de deux yeux doit converger vers la même cellule. Vision binoculaire et stereopsis De nombreux neurones binoculaires répondent mieux lorsque les images rétiniennes se trouvent sur des points correspondants dans les deux rétines : Base neurale de l'horoptère. Cependant, de nombreux autres neurones binoculaires répondent mieux lorsque des images similaires occupent des positions légèrement différentes sur les rétines des deux yeux (préfèrent une disparité binoculaire particulière). Champs récepteurs sensibles à la disparité Vision binoculaire et stereopsis La stéréopsie peut être utilisée à la fois comme indice de profondeur métrique et non métrique. Certaines cellules codent simplement si une caractéristique se trouve devant ou derrière le plan de fixation (indice de profondeur non métrique). D'autres cellules codent la distance précise d'un élément par rapport au plan de fixation (indice de profondeur métrique). Vision binoculaire et stereopsis Stereopsis chez un insecte chasseur Question : Comment savoir si une mante religieuse a une stéréopsie ? Hypothèse : Les mantes religieuses attrapent des insectes en utilisant la perception stéréoscopique de la profondeur. Test : Les chercheurs ont équipé des mantes avec de petites lunettes anaglyphiques, leur ont montré des films 3D d'insectes à différentes distances et ont enregistré si les mantes frappaient lorsque les insectes se trouvaient à la distance critique de 2 cm. Vision binoculaire et stereopsis Résultats : les mantes n'ont pas réagi aux films 2D d’insectes simulés, mais ont réagi aux films 3D lorsque les insectes se trouvaient à la distance de frappe apparemment correcte. Conclusions : La mante religieuse a une vision stéréoscopique et répond à la profondeur définie par la disparité. Vision binoculaire et stereopsis Combiner les indices de profondeur L'approche bayésienne. Comme la reconnaissance d'objets, la perception de la profondeur résulte de la combinaison de nombreux indices différents. Combiner les indices de profondeur L'approche bayésienne : une façon de formaliser l'idée que notre perception est une combinaison du stimulus actuel et de nos connaissances sur les conditions du monde - ce qui est susceptible de se produire et ce qui n'est pas susceptible de se produire. Ainsi, les connaissances antérieures peuvent influencer nos estimations de la probabilité d'un événement. Deux pièces Deux pièces Combiner les indices de profondeur Illusions et construction de l'espace Nos systèmes visuels tiennent compte des indices de profondeur lors de l'interprétation de la taille des objets. L’illusion de Ponzo L’illusion de Ponzo L’illusion de Zollner Combiner les indices de profondeur Rivalité binoculaire : Compétition entre les deux yeux pour le contrôle de la perception visuelle, qui se manifeste lorsque des stimuli complètement différents sont présentés aux deux yeux. Rivalité binoculaire La dynamique de la rivalité Rivalité binoculaire expliquée https://www.jove.com/t/2030/how-to-create-and-use-binocular-rivalry Réverspective: Patrick Hughes Conclusion Comment est-ce que notre connaissance de la vision binoculaire et de la perception de l’espace peut contribuer à l’avancement de modèles computationnels et des technologies de l’IA? Pouvez-vous penser à des exemples dans la vie de tous les jours, ou des technologies en développement qui bénéficieraient des indices de profondeur?