Percepcja i Uwaga #1: Kognitywistyka i komunikacja PDF
Document Details
Uploaded by HeartfeltPeach2414
Piotr Kozak
Tags
Related
Summary
Dokument omawia mechanizmy percepcji, wizualizację informacji i różne typy danych. Szczególną uwagę poświęcono aspektom wizualizacji danych, a w przykładach zaznaczono, jak wizualizacja może pomóc w odkryciu wzorców i problemów. Teksty omawiają także koncepcje takie jak afordancje i elementy optyki ekologicznej.
Full Transcript
PERCEPCJA I UWAGA #1: Kognitywistyka i komunikacja MECHANIZMY PERCEPCJI Piotr Kozak INFORMACJA I WIZUALIZACJA Jedną z największych zalet wizualizacji danych jest ogromna ilość informacji, które można szybko zinterpretować, jeśli są dobrze przedstawione. INFORMACJA I WIZUALIZACJA Ilustracja n...
PERCEPCJA I UWAGA #1: Kognitywistyka i komunikacja MECHANIZMY PERCEPCJI Piotr Kozak INFORMACJA I WIZUALIZACJA Jedną z największych zalet wizualizacji danych jest ogromna ilość informacji, które można szybko zinterpretować, jeśli są dobrze przedstawione. INFORMACJA I WIZUALIZACJA Ilustracja na poprzednim slajdzie przedstawia wizualizację uzyskaną z wielowiązkowej echosondy skanującej część zatoki Passamaquoddy, między Maine w Stanach Zjednoczonych a Nowym Brunszwikiem w Kanadzie, gdzie pływy są najwyższe na świecie. Wykonano około miliona pomiarów. Tradycyjnie, tego rodzaju dane są prezentowane w postaci mapy morskiej z zaznaczonymi informacjami z pomiarów sondowych. Jednak gdy dane są konwertowane na dane nt. wysokości i wyświetlane przy użyciu standardowych technik grafiki komputerowej, widocznych staje się wiele elementów, które wcześniej były niewidoczne na wykresie. INFORMACJA I WIZUALIZACJA Dostrzec można m.in. wzór zagłębień i łatwo jest zobaczyć, jak tworzą one linie. Widoczne są również różne problemy z danymi. Linie niewyrównane ze śladami zagłębień są błędami w danych, ponieważ przechylenie statku, który dokonał pomiarów, nie zostało prawidłowo uwzględnione. INFORMACJA I WIZUALIZACJA Obraz z Zatoki Passamaquoddy podkreśla szereg zalet wizualizacji: 1. Wizualizacja zapewnia możliwość zrozumienia ogromnych ilości danych. Ważne informacje z ponad miliona pomiarów są natychmiast dostępne. 2. Wizualizacja pozwala dostrzec pojawiające się właściwości, których nie przewidziano. W tej wizualizacji od razu rzuca się w oczy fakt, że ślady pojawiają się w liniach. Postrzeganie wzorca może często być podstawą nowego wglądu. W tym przypadku ślady zagłębień pokrywają się z kierunkiem uskoków geologicznych, co sugeruje przyczynę. Mogą być spowodowane uwolnieniem gazu. INFORMACJA I WIZUALIZACJA 3. Wizualizacja często sprawia, że problemy z danymi stają się natychmiast widoczne. Wizualizacja często ujawnia nie tylko informacje o samych danych, ale także o sposobie ich zbierania. Przy odpowiedniej wizualizacji często rzucają się w oczy błędy i artefakty w danych. Z tego powodu wizualizacje mogą być nieocenione w kontroli jakości. 4. Wizualizacja ułatwia dostrzec wzorce łączące cechy lokalne. 5. Wizualizacja ułatwia formułowanie hipotez. Na przykład, wizualizacja zatoki doprowadziła do pytania o to, w jaki sposób mogły powstać zagłębienia i zmotywowała do napisania pracy badawczej dotyczącej geologicznego znaczenia tych cech (Gray, Mayer i Hughes Clarke, 1997). INFORMACJA I WIZUALIZACJA Proces wizualizacji danych składa się z czterech podstawowych etapów. 1. Gromadzenie i przechowywanie danych. 2. Etap wstępnego przetwarzania mający na celu przekształcenie danych w coś, co jest łatwiejsze do manipulowania. Zazwyczaj dochodzi do jakiejś formy redukcji danych, aby ujawnić wybrane aspekty. 3. Tworzenie reprezentacji wizualnej. 4. Odbiór przez system poznawczy. TYPY DANYCH TYPY DANYCH Jeśli celem badań nad wizualizacją jest przekształcenie danych w percepcyjnie wydajny format wizualny i jeśli mamy formułować stwierdzenia z pewną ogólnością, musimy być w stanie powiedzieć coś o typach danych, które można wizualizować. TYPY DANYCH Bertin (1977) zasugerował, że istnieją dwie podstawowe formy danych: wartości danych i struktury danych. Podobnym pomysłem jest podzielenie danych na jednostkowe dane i relacje. Jednostkowe dane są obiektami, które chcemy wizualizować; relacje definiują struktury i wzorce, które łączą ze sobą jednostki. JEDNOSTKOWE DANE Obiektami zainteresowania są zazwyczaj jednostki. Ludzie mogą być jednostkami; Huragany mogą być jednostkami. Zarówno ryby, jak i stawy rybne mogą być jednostkami. Grupa rzeczy może być uważana za pojedynczą jednostkę, jeśli jest to wygodne – na przykład ławica ryb. Nawet abstrakcyjne pojęcie filozoficzne może być jednostkową daną. RELACJE Relacje tworzą struktury, które łączą jednostki. Rodzajów relacji może być wiele. Koło ma "częściowy" związek z samochodem. Jeden pracownik firmy może pozostawać w stosunku nadzorczym z innym pracownikiem. Relacje mogą być strukturalne i fizyczne, jak w przypadku definiowania sposobu, w jaki dom składa się z wielu jego części składowych, lub mogą być koncepcyjne, jak w przypadku definiowania relacji między sklepem a jego klientami. Relacje mogą być przyczynowe, jak wtedy, gdy jedno zdarzenie powoduje drugie, i mogą być czysto czasowe, określając odstęp między dwoma zdarzeniami. ATRYBUTY Zarówno jednostkowe dane, jak i relacje mogą mieć atrybuty. Ogólnie rzecz biorąc, coś powinno być nazywane atrybutem (w przeciwieństwie do samej jednostki), gdy jest właściwością jakiejś jednostki i nie może być pomyślane niezależnie. Tak więc kolor jabłka jest atrybutem jabłka. Temperatura wody jest atrybutem wody. Czas trwania jest atrybucją podróży. WYMIARY DANYCH Atrybut jednostki może mieć wiele wymiarów. Możemy mieć pojedynczą wielkość skalarną, taką jak waga osoby. Możemy mieć wielkość wektorową, taką jak kierunek, w którym ta osoba podróżuje. Tensory są wielkościami wyższego rzędu, które opisują zarówno siły kierunkowe, jak i tnące, takie jak występujące w materiałach poddawanych naprężeniom. Możemy mieć pole skalarów, wektorów lub tensorów. Pole grawitacyjne Ziemi jest trójwymiarowym atrybutem Ziemi. W rzeczywistości jest to trójwymiarowy atrybut pola wektorowego. Jeśli interesuje nas tylko siła grawitacji na powierzchni Ziemi, to jest to dwuwymiarowy atrybut skalarny. Często termin mapa jest używany do opisania tego rodzaju pola; Mówimy więc o mapie grawitacyjnej lub mapie temperatury. METADANE Metadane to dane o danych – kto je zgromadził, jakim przemianom zostały poddane, jaka jest ich niepewność. Kiedy staramy się zrozumieć dane, pewne produkty z pewnością pojawią się w miarę postępów. Możemy odkryć korelacje między zmiennymi lub klastrami wartości danych. Możemy postulować pewne mechanizmy leżące u podstaw tego zjawiska, które nie są widoczne od razu. SEMIOTYKA REPREZENTACJI WIZUALNYCH CECHY REPREZENTACJI WIZUALNEJ 1. Zrozumienie bez treningu. Kod sensoryczny to taki, którego znaczenie jest postrzegane bez dodatkowego treningu. Na przykład, od razu widać, że obraz obok (reprezentacja struktury chemicznej) ma strukturę spiralną. CECHY REPREZENTACJI WIZUALNEJ 2. Stałość interpretacyjna. Wiele zjawisk zmysłowych, takich jak iluzje, utrzymuje się pomimo wiedzy, że są one iluzoryczne. Możemy powiedzieć komuś, że linie są tej samej długości, ale nadal będą wydawać się tej osobie różne. Alternatywnie, używanie linii łączących do oznaczenia, że dwa obiekty nie są (pojęciowo) połączone, byłoby złym pomysłem. CECHY REPREZENTACJI WIZUALNEJ 3. Natychmiastowość i równoległość przetwarzania informacji. Przetwarzanie niektórych rodzajów informacji sensorycznych jest równolegle i szybkie. Obraz obok pokazuje pięć różnych obszarów teksturowanych. Dwa obszary po lewej stronie są bardzo trudne do rozdzielenia; wyprostowane T i odwrócone T wydają się być pojedynczą plamą. Obszar ukośnego T jest łatwy do odróżnienia od sąsiedniego obszaru odwróconego T. Okręgi są najłatwiejsze do rozróżnieni. Sposób, w jaki system wzrokowy dzieli świat wizualny na regiony, nazywa się segmentacją. CECHY REPREZENTACJI WIZUALNEJ 4. Niewrażliwość na kontekst kulturowy. Ogólnie rzecz biorąc, kod sensoryczny będzie rozumiany ponad granicami kulturowymi. WYTYCZNE DLA PROJEKTOWANIA A. Wizualizuj dane z uwzględnieniem ludzkich zdolności sensorycznych w taki sposób, aby ważne elementy danych i wzorce danych mogły być szybko dostrzeżenie. WYTYCZNE DLA PROJEKTOWANIA A1Ważne dane powinny być reprezentowane przez elementy graficzne, które są bardziej wyróżniające się wizualnie niż te reprezentujące mniej ważne informacje. Ważne informacje powinny być łatwe do znalezienia. WYTYCZNE DLA PROJEKTOWANIA A2 Większe wielkości liczbowe powinny być reprezentowane przez bardziej wyraźne elementy graficzne. Można to osiągnąć na przykład poprzez powiększenie tych elementów, bardziej żywe kolory lub mocniejszą teksturę. REPREZENTACJE ARBITRALNE 1. Trudne do nauczenia. Nauka czytania i pisania zajmuje dziecku setki godzin, nawet jeśli dziecko przyswoiło już język mówiony. Kody graficzne alfabetu i zasady ich łączenia muszą być mozolnie uczone. REPREZENTACJE ARBITRALNE 2. Łatwo je zapomnieć. Arbitralne, konwencjonalne informacje, które nie są nauczone, można łatwo zapomnieć. REPREZENTACJE ARBITRALNE 3. Osadzone w kulturze. Różne kultury stworzyły własne, charakterystyczne zestawy symboli. Np. zielony symbolizuje śmierć w Chinach, podczas gdy czerwony symbolizuje szczęście i powodzenie. W Polsce czerwony symbolizuje ostrzeżenie, a zielony zezwolenie. WYTYCZNE DLA PROJEKTOWANIA A3. Systemy symboli graficznych powinny być zgodne ze standardowym użyciem. OPTYKA EKOLOGICZNA GIBSONA OPTYKA EKOLOGICZNA Użyteczne narzędzia dla opisu środowiska wizualnego daje optyka ekologiczna Gibsona. Zamiast koncentrować się na obrazie na siatkówce, Gibson kładł nacisk na percepcję powierzchni w otoczeniu. POWIERZCHNIA (SURFACE) Powierzchnia jest cielesna; płaszczyzna nie jest. Powierzchnia posiada teksturę; płaszczyzna jej nie posiada. Powierzchnia nigdy nie jest idealnie przezroczysta; płaszczyzna jest. Widać powierzchnię; płaszczyznę można tylko wizualizować. (Gibson, 1979) UKŁAD OPTYCZNY Drugim kluczowym pojęciem w optyce ekologicznej Gibsona jest układ optyczny (Gibson, 1986). Aby zrozumieć otaczający układ optyczny, rozważmy, co dzieje się ze światłem wpadającym do otoczenia z jakiegoś źródła, takiego jak słońce. Jest pochłaniany, odbijany, załamywany i ulegał dyfrakcji, gdy wchodzi w interakcję z różnymi obiektami, takimi jak kamienie, trawa, drzewa i woda. Środowisko, rozpatrywane w ten sposób, jest niezwykle złożoną matrycą z fotonami poruszającymi się we wszystkich kierunkach, składającą się z różnych mieszanin długości fal i spolaryzowaną na różne sposoby. Ta złożoność jest niemożliwa do zasymulowania. Jednak z każdego konkretnego stacjonarnego punktu w otoczeniu krytyczne informacje są zawarte w strukturze światła docierającego do tego punktu. UKŁAD OPTYCZNY PRZEPŁYW OPTYCZNY Układ optyczny otoczenia jest dynamiczny i zmienia się w czasie zarówno wraz z ruchem punktu widzenia, jak i wraz z ruchem obiektów. W miarę jak przechodzimy do statycznego środowiska, rozwija się charakterystyczne pole przepływu wzrokowego. TEKSTURA POWIERZCHNI Gibson zwrócił uwagę, że tekstura powierzchni jest jedną z podstawowych właściwości wizualnych obiektu. Z wizualnego punktu widzenia powierzchnia jest jedynie nieuformowaną plamą światła, chyba że jest teksturowana. Tekstura ma kluczowe znaczenie dla percepcji na wiele sposobów. Tekstura obiektu pomaga nam zobaczyć, gdzie znajduje się obiekt i jaki ma kształt. W większej skali faktura płaszczyzny podłoża, po której chodzimy, biegamy i czołgamy się, jest ważna w ocenie odległości i innych aspektów przestrzeni. ŚWIATŁO Innym źródłem informacji przestrzennych może być ilość światła otoczenia, które dociera do szczelin obiektu. Nazywa się to okluzją otoczenia, ponieważ w głębinach zagłębień część światła otoczenia jest zasłonięta przez inne części obiektu. Tarini, Cingnoni i Claudio Montani (2006) wykorzystali okluzję otoczenia, aby pomóc w ujawnieniu kształtu złożonej cząsteczki. TEORIA AFORDANCJI Gibson twierdził, że postrzegamy po to, aby działać w środowisku. Percepcja jest stworzona do działania. Gibson nazwał dostrzegalne możliwości działania afordancjami, które postrzegane w sposób bezpośredni i natychmiastowy. Nie można ich wywnioskować ze wskazówek sensorycznych. TEORIA AFORDANCJI Gibbson twierdził, że nie postrzegamy punktów świetlnych; dostrzegamy możliwości działania. Postrzegamy powierzchnie do chodzenia, uchwyty do ciągnięcia, przestrzeń do nawigacji, narzędzia do manipulowania itd. TEORIA AFORDANCJI Przekładając koncepcję afordancji na dziedzinę interfejsu, możemy skonstruować następującą zasadę: dobry interfejs ma afordancje, które ułatwiają zadanie użytkownika; na przykład, jeśli mamy za zadanie przesunąć obiekt w przestrzeni 3D, powinien on mieć przezroczyste uchwyty do wykorzystania podczas obracania i podnoszenia obiektu. TEORIA AFORDANCJI Ilustracja przedstawia projekt interfejsu manipulacji obiektami 3D (Houde, 1992). Gdy obiekt jest wybrany, pojawiają się "uchwyty", które umożliwiają podniesienie lub obrócenie obiektu. Funkcja tych uchwytów jest bardziej wyraźna dzięki ilustracjom chwytających się wskazówek, które pokazują afordancje. TEORIA AFORDANCJI GIBSONA Istnieją trzy problemy związane z podejściem Gibsona do bezpośredniej percepcji w rozwijaniu teorii wizualizacji. Pierwszym problemem jest to, że nawet jeśli percepcja otoczenia jest bezpośrednia, wizualizacja danych za pomocą grafiki komputerowej jest bardzo pośrednia. Zazwyczaj między danymi a ich reprezentacją istnieje wiele warstw przetwarzania. W niektórych przypadkach źródło danych może być mikroskopijne lub w inny sposób niewidoczne. Źródło danych może być dość abstrakcyjne, jak na przykład statystyki firmy w bazie danych giełdy. Bezpośrednia percepcja nie jest w tych przypadkach pojęciem istotnym. TEORIA AFORDANCJI GIBSONA Po drugie, w żadnym graficznym interfejsie użytkownika nie ma wyraźnych fizycznych afordancji. Stwierdzenie, że przycisk na ekranie "umożliwia" naciskanie w taki sam sposób, w jaki płaska powierzchnia umożliwia chodzenie, jest niejasne. Po pierwsze, nie jest nawet jasne, czy prawdziwy przycisk pozwala na naciśnięcie. W innej kulturze te małe guzki mogą być postrzegane jako raczej nudne dekoracje architektoniczne. Oczywiście użycie przycisków jest arbitralne; musimy nauczyć się, że przyciski po naciśnięciu robią interesujące rzeczy w prawdziwym świecie. Percepcja i działanie są powiązane w jeszcze bardziej pośredni sposób, gdy korzystamy z komputera; na przykład musimy nauczyć się, że obrazek przycisku może być "wciśnięty" za pomocą myszy, kursora lub jeszcze innego przycisku. Jest to dalekie od bezpośredniej interakcji ze światem fizycznym. TEORIA AFORDANCJI GIBSONA Po trzecie, odrzucenie przez Gibsona mechanizmów wizualnych na rzecz idei percepcji bezpośredniej jest problematyczne. Weźmy następujący przykład: wiele z tego, co wiemy o kolorach, opiera się na latach eksperymentów, analiz i modelowania mechanizmów percepcyjnych. Telewizja kolorowa i wiele innych technologii wyświetlania opiera się na zrozumieniu tych mechanizmów. Odrzucenie znaczenia zrozumienia mechanizmów wzrokowych oznaczałoby odrzucenie większości badań nad wzrokiem jako nieistotnych. PERCEPCJA JAKO PRZETWARZANIE INFORMACJI MODEL PRZETWARZANIA WZROKOWEGO W etapie 1 informacje są przetwarzane równolegle w celu wyodrębnienia podstawowych cech środowiska. W Etapie 2 aktywne procesy percepcji wzorców wyciągają struktury i segmentują scenę wizualną na obszary o różnych kolorach, teksturach i wzorcach ruchu. W Etapie 3 informacja jest redukowana do zaledwie kilku obiektów przechowywanych w wizualnej pamięci roboczej przez aktywne mechanizmy uwagi, które stanowią podstawę myślenia wizualnego. ETAP 1. PRZETWARZANIE RÓWNOLEGŁE W CELU WYODRĘBNIENIA NISKOPOZIOMOWYCH WŁAŚCIWOŚCI SCENY WIZUALNEJ Informacje wizualne są najpierw przetwarzane przez neurony w oku i w pierwszorzędowej korze wzrokowej. Poszczególne neurony są selektywnie dostrojone do pewnych rodzajów informacji, takich jak orientacja krawędzi lub kolor plamy światła. W Etapie 1 przetwarzania miliardy neuronów pracują równolegle, wydobywając cechy z każdej części pola widzenia jednocześnie. ETAP 1. PRZETWARZANIE RÓWNOLEGŁE W CELU WYODRĘBNIENIA NISKOPOZIOMOWYCH WŁAŚCIWOŚCI SCENY WIZUALNEJ Do ważnych cech przetwarzania w Etapie 1 należą: l Szybkie przetwarzanie równoległe l Ekstrakcja cech, orientacji, koloru, tekstury i wzorców ruchu l Ulotny charakter informacji, która jest krótko przechowywana w magazynie wzrokowym l Oddolne przetwarzanie oparte na danych wzrokowych l Dostrajanie mechanizmów ekstrakcji cech w oparciu o wymagania zadania wizualnego ETAP 2. PERCEPCJA WZORCA W drugim etapie analizy wizualnej szybkie procesy aktywne dzielą pole widzenia na obszary i proste wzory, takie jak ciągłe kontury, obszary tego samego koloru i obszary o tej samej teksturze. Wzorce ruchu są również bardzo ważne, chociaż użycie ruchu jako kodu informacyjnego jest stosunkowo zaniedbane w wizualizacji. Etap znajdowania wzorców w przetwarzaniu wizualnym jest niezwykle elastyczny, na co wpływa zarówno ogromna ilość informacji dostępnych w ramach przetwarzania równoległego Etapu 1, jak i odgórne działanie uwagi napędzane przez zadania wizualne. Marr (1982) nazwał ten etap obróbki szkicem 2-1/2D. ETAP 2. PERCEPCJA WZORCA Do ważnych cech przetwarzania w Etapie 2 należą: l Wolniejsze przetwarzanie szeregowe l Uwaga odgórna ma kluczowe znaczenie dla tworzenia obiektów i dostrzegania wzorców l Niewielka liczba (od jednego do trzech) wzorców, które stają się "związane" i utrzymywane przez sekundę lub dwie w ramach odgórnych procesów uwagi l Różne ścieżki rozpoznawania obiektów i wizualnie kierowanych ruchów dłoni (kanały percepcji i działania) ETAP 2. PERCEPCJA WZORCA Istnieje główne rozwidlenie w ścieżce przetwarzania wzorców, z jedną gałęzią prowadzącą do percepcji obiektów, a drugą gałęzią prowadzącą do części mózgu zaangażowanych w kontrolę działań. Jest to podstawa teorii dwóch systemów wzrokowych: jednego zwanego systemem działania, a drugiego systemu identyfikacji obiektów, zwanego systemem co. ETAP 3. POZNANIE WZROKOWE Na wyższych poziomach to, co postrzegamy, jest bardziej właściwością tego, co robimy i jakie problemy staramy się rozwiązać, niż tym, co faktycznie dociera do nas naszymi oczami. ETAP 3. POZNANIE WZROKOWE Aby skorzystać z wizualizacji zewnętrznej, konstruujemy sekwencję zapytań wizualnych, na które odpowiadamy za pomocą strategii wyszukiwania wizualnego. Na tym poziomie tylko kilka obiektów może być jednocześnie trzymanych w wizualnej pamięci roboczej; Są one konstruowane z dostępnych wzorców, które mogą dostarczyć odpowiedzi na zapytanie wizualne oraz z informacji przechowywanych w pamięci długotrwałej związanych z zadaniem. Na przykład, jeśli użyjemy mapy drogowej do wyszukania trasy, zapytanie wizualne wyzwoli wyszukiwanie połączonych czerwonych konturów (reprezentujących główne autostrady) między dwoma symbolami wizualnymi (reprezentującymi miasta). ETAP 3. POZNANIE WZROKOWE Opisywanie systemu wzrokowego jako zestawu etapów przetwarzania oznacza, że informacja wizualna przepływa od etapu 1 przez etap 2 do etapu 3. Kiedy przed naszymi oczami na ekranie nowy obraz lub wykonujemy ruch gałek ocznych w kierunku części świata, której wcześniej nie widzieliśmy, jest to jedyny sposób, w jaki może przepływać informacja. Ale bezpośrednio po przepływie informacji w górę pojawia się odgórny sygnał, który konsoliduje i wzmacnia to, co dzieje się na wcześniejszych etapach. Cały system jest nieustannie dostrajany od góry do dołu. Co więcej, to, gdzie skierujemy nasz wzrok na następną fiksację, zależy od naszego aktualnego zapytania wzrokowego i tego, co właśnie przyswoiliśmy. ETAP 3. POZNANIE WZROKOWE Ogólna nazwa tego procesu to uwaga. Uwaga to wieloaspektowy zestaw procesów obejmujących cały układ wzrokowy. Nawet procesy Etapu 1 są poddawane dostrojeniu, aby były bardziej wrażliwe na to, co musimy znaleźć. Wzorce Etapu 2 są pochodną procesów uwagi, a miejsce, w które kierujemy nasze oczy, decyduje o tym, co stanie się przedmiotem naszej uwagi w następnej chwili. Ruchy gałek ocznych są dosłownie aktami realokacji uwagi. ETAP 3. POZNANIE WZROKOWE Jednym z głównych celów projektowania jest kierowanie uwagą. Poprzez interaktywne realizacje wizualne, informacje, które nas interesują, mogą być skutecznie przekazywane dalej. MECHANIZMY PERCEPCJI OKO Ludzkie oko, podobnie jak aparat fotograficzny, zawiera soczewkę o zmiennej ostrości, aperturę (źrenicę) i układ czujników (siatkówkę). Soczewka skupia mały, odwrócony obraz świata na siatkówce. Przysłona pomaga oku dostosować się do różnych warunków oświetleniowych. OKO Ważne cechy obejmują dołek centralny, w którym widzenie jest najostrzejsze; źrenica, okrągły otwór, przez który światło wpada do oka; dwa główne elementy optyczne, soczewka i rogówka; oraz mięśnie oczu, które kontrolują ruchy gałek ocznych. Martwy punkt jest spowodowany brakiem receptorów, w których tętnice siatkówki wchodzą do gałki ocznej. ABERRACJA CHROMATYCZNA Ludzkie oko nie jest korygowane pod kątem aberracji chromatycznej. Aberracja chromatyczna oznacza, że różne długości fal światła są skupiane w różnych odległościach w oku. Światło niebieskie o krótkiej długości fali jest załamywane bardziej niż światło czerwone o długiej fali. ABERRACJA CHROMATYCZNA Jeśli skupimy się na plamie światła wytwarzanej przez czerwony luminofor, sąsiednia niebieska plama będzie nieostra. Ze względu na aberrację chromatyczną niewskazane jest tworzenie drobnych wzorów wykorzystujących nierozcieńczony niebieski luminofor na czarnym tle. Czysty niebieski tekst na czarnym tle może być prawie nieczytelny, zwłaszcza jeśli w pobliżu znajduje się biały lub czerwony tekst, który przyciąga mechanizm ostrości. Dodanie nawet niewielkiej ilości czerwieni i zieleni złagodzi problem, ponieważ kolory te zapewnią krawędzie luminancji, które percepcyjnie określą granicę kolorów. ABERRACJA CHROMATYCZNA Aberracja chromatyczna oka może powodować silne efekty iluzorycznej głębi (Jackson, MacDonald i Freeman, 1994). Na ilustracji zarówno niebieski, jak i czerwony tekst są nałożone na czarne tło. Dla około 60% obserwatorów czerwień wydaje się bliższa, ale 30% widzi odwrotnie, a pozostałe 10% widzi kolory leżące w tej samej płaszczyźnie. Często wykorzystuje się to w prezentacjach slajdów, zmieniając tło na ciemnoniebieskie, co sprawia, że białe lub czerwone litery wydają się wyróżniać dla większości ludzi. RECEPTORY Soczewka skupia obraz na komórkach fotoreceptorowych, które wyściełają tylną część oka w warstwie zwanej siatkówką. Istnieją dwa rodzaje takich ogniw: pręciki, które są niezwykle czułe przy słabym oświetleniu, oraz czopki, które są wrażliwe przy normalnym poziomie światła roboczego. Jest około 100 milionów pręcików i tylko 6 milionów czopków. Pręciki są zoptymalizowane pod kątem widzenia w nocy i znacznie mniej przyczyniają się do normalnego widzenia w ciągu dnia niż czopki. Dane wejściowe z pręcików są gromadzone na dużych obszarach, a tysiące pręcików przyczyniają się do sygnału, który przechodzi przez pojedyncze włókno w nerwie wzrokowym. Pręciki są tak wrażliwe, że są przeciążone w świetle dziennym i skutecznie się wyłączają. RECEPTORY Dołek centralny to niewielki obszar w środku siatkówki, który jest gęsto upakowany tylko czopkami i to tutaj widzenie jest najostrzejsze. Czopki w dołku centralnym są upakowane w odległości około 20-30 sekund kątowych od siebie. W tym centralnym małym obszarze znajduje się ponad 100 000 czopków, które nadają kąt widzenia 1,5-2 stopni. Chociaż zwykle mówi się o dołku centralnym jako o polu 2 stopni, największą rozdzielczość szczegółów uzyskuje się tylko w centralnym 1/2 stopnia tego obszaru. POLE WZROKOWE Jeśli patrzymy prosto przed siebie trzymając ręce wyciągnięte prostopadle do kierunki widzenia, to możemy zobaczyć obie ręce, kiedy poruszamy palcami. Oznacza to, że oba oczy razem zapewniają pole widzenia nieco większe niż 180°. Fakt, że nie widzimy naszych palców, dopóki się nie poruszą, mówi nam również, że wrażliwość na ruch na peryferiach jest lepsza niż wrażliwość statyczna. POLE WZROKOWE Ostrość wzroku rozkłada się w bardzo niejednorodny sposób. Ostrość na zewnątrz dołka centralnego gwałtownie spada, tak że możemy rozpoznać tylko około jednej dziesiątej szczegółów w odległości 10 stopni od dołka. POLE WZROKOWE Wykres oka opracowany przez Anstis (1974). Każdy znak jest około pięć razy większy niż mniejszy dostrzegalny rozmiar, gdy środek jest zafiksowany. POLE WZROKOWE Komórki zwojowe siatkówki to neurony, które wysyłają informacje z gałki ocznej w górę nerwu wzrokowego do kory. Każdy z nich gromadzi informacje z wielu receptorów pręcików i czopków. W dołku centralnym pojedyncza komórka zwojowa może być poświęcona pojedynczemu stożkowi, podczas gdy na odległych peryferiach każda komórka zwojowa otrzymuje informacje z tysięcy pręcików i czopków. Każdy neuron ma jedno włókno nerwowe zwane aksonem, które przenosi sygnał z każdej komórki zwojowej, a w każdym nerwie wzrokowym znajduje się około miliona aksonów. Obszar wzrokowy, który zasila komórkę zwojową, nazywany jest jej polem recepcyjnym. POLE WZROKOWE Środek pola widzenia jest nawet ważniejszy dla wielu zadań, niż sugerowałaby to koncentracja receptorów. Naturalnym sposobem poszukiwania informacji jest wykorzystanie ruchów gałek ocznych do przeniesienia informacji do środka pola widzenia, gdzie widzimy to, co najlepsze. Sfera przydołkowa siatkówki może być optymalna do postrzegania wzorców. Jest to obszar o średnicy około 6°, wyśrodkowany na dołku środkowym. Peryferia są niewątpliwie ważne w świadomości sytuacyjnej, ale gdy wymagane jest znalezienie wzorca wizualnego do podejmowania decyzji, obszar przydołkowy jest najbardziej istotny. WYTYCZNE DLA PROJEKTOWANIA B. Do analizy danych używaj wyświetlacza o wysokiej rozdzielczości i umiarkowanym kącie widzenia (np. 40 stopni). Dotyczy to zarówno indywidualnej analizy danych, gdy ekran może znajdować się na pulpicie i blisko użytkownika, jak i wspólnej analizy danych, gdy ekran musi być większy i bardziej oddalony. WZROKOWY STRES 17 grudnia 1997 roku japońska sieć telewizyjna anulowała emisję kreskówki, ponieważ jej jaskrawo sceny powodowały konwulsje, a nawet wymioty krwią u ponad 700 dzieci. Ustalono, że główną przyczyną były powtarzalne światła wytwarzane przez grafikę generowaną komputerowo. Szkodliwe skutki nasilała się ze względu na tendencję dzieci do siedzenia bardzo blisko ekranu. Wiadomo, że żywe, powtarzające się, duże błyski pola są niezwykle stresujące dla niektórych osób. WZROKOWY STRES Zaburzenie znane jako padaczka wywołana wzorcem jest zgłaszane i badane od dziesięcioleci. Niektóre z najwcześniejszych zgłoszonych przypadków były spowodowane migotaniem łopat wirnika helikoptera; Spowodowało to wstępne badania przesiewowe pilotów pod kątem tego zaburzenia. Złe skutki nasilają się również wraz z ogólnym rozmiarem wzoru. Stres wzrokowy może jednak nie ograniczać się do osób z określonym zaburzeniem. WYTYCZNE DLA PROJEKTOWANIA C. Unikaj używania wzorów siatki o wysokim kontraście w wyświetlaczach wizualnych. W szczególności należy unikać używania migoczących wzorów siatki o wysokim kontraście PERCEPCJA I UWAGA #2: Kognitywistyka i Komunikacja KOLOR Piotr Kozak JASNOŚĆ I KONTRAST Sygnały z siatkówki są przekazywane wzdłuż nerwu wzrokowego do jądra kolankowatego bocznego. Stamtąd są rozprowadzane do wielu obszarów, ale głównie do obszaru wzrokowego 1 kory mózgowej, znajdującego się z tyłu głowy. JASNOŚĆ I KONTRAST Pole recepcyjne komórki to obszar widzenia, w którym komórka reaguje na światło. Oznacza to, że wzorce światła padającego na siatkówkę wpływają na sposób, w jaki neuron reaguje. Komórki zwojowe siatkówki są zorganizowane wokół pola recepcyjnego i mogą znajdować się w środku lub poza jego środkiem. JASNOŚĆ I KONTRAST Kiedy receptor jest stymulowany w środku swojego pola recepcyjnego, komórka nerwowa emituje impulsy z większą szybkością. Kiedy komórka jest stymulowana poza środkiem swojego pola, emituje impulsy w tempie niższym niż normalnie. Proces, w którym aktywność jednego receptora jest hamowana przez aktywność drugiego to hamowanie oboczne. JASNOŚĆ I KONTRAST Wynikiem działania systemu jest wzmocniona odpowiedź po jasnej stronie krawędzi i obniżona odpowiedź po ciemnej stronie krawędzi, z pośrednią reakcją na jednolite obszary po obu stronach. Komórka aktywuje się mocniej po jasnej stronie, ponieważ w obszarze hamującym jest mniej światła, a zatem obszar jest mniej zahamowany. JASNOŚĆ I KONTRAST W iluzji Hermanna czarne plamy pojawiają się na przecięciach jasnych linii. Wyjaśnienie jest takie, że w przestrzeniach między dwoma kwadratami występuje więcej hamowania, więc wydają się one jaśniejsze niż obszary na skrzyżowaniach. JASNOŚĆ I KONTRAST Kontrast jednoczesnej jasności wyjaśnia ogólny efekt, w którym szara plama umieszczona na ciemnym tle wygląda na jaśniejszą niż ta sama szara plama na jasnym tle. JASNOŚĆ I KONTRAST Ilustracja pasma Macha. a, b) Ciemne i jasne pasma Macha są widoczne na granicach między wewnętrznymi trójkątami. JASNOŚĆ I KONTRAST Gdy generowana jest sekwencja szarych pasków, pasma wydają się ciemniejsze na jednej krawędzi niż na drugiej, mimo że są jednolite. JASNOŚĆ I KONTRAST Jednoczesne efekty kontrastu mogą powodować błędy podczas odczytywania informacji ilościowych (wartości) wyświetlanych za pomocą skali szarości (Cleveland i McGill, 1983). JASNOŚĆ I KONTRAST Ilustracja pokazuje mapę części północnego Oceanu Atlantyckiego, gdzie lokalne natężenie pola grawitacyjnego jest zakodowane w odcieniach szarości. W eksperymencie mającym na celu zmierzenie wpływu kontrastu na dane zakodowane w ten sposób, percepcja wartości była odchylona o średnio 20% (Ware, 1988). JASNOŚĆ I KONTRAST Innym czynnikiem percepcyjnym, który zniekształca wartości szarości, jest tzw. wyostrzanie kontrastu (zob. Wyszecki i Stiles, 1982). Ogólnie rzecz biorąc, różnice są postrzegane jako większe, gdy próbki są podobne do koloru tła. JASNOŚĆ I KONTRAST (a) Wszystkie szare paski są takie same. Dostrzegalne różnice między wartościami skali szarości są uwydatniane, gdy wartości są zbliżone do wartości szarości tła. (b), c, d) Różnice w odcieniach szarości szarej siatki są bardziej widoczne (c) niż w przypadku białego (b) lub czarnego (d) tła. WYTYCZNE DLA PROJEKTOWANIA A. Unikaj używania skali szarości jako metody przedstawiania więcej niż kilku wartości liczbowych. JASNOŚĆ I KONTRAST Jedną z konsekwencji efektów kontrastu jest to, że mają one tendencję do podkreślania braków w algorytmach cieniowania stosowanych w grafice komputerowej. Gładkie powierzchnie są często wyświetlane za pomocą wielokątów, zarówno dla uproszczenia, jak i przyspieszenia procesu renderowania grafiki komputerowej, im mniej wielokątów, tym szybciej można narysować obiekt. Prowadzi to do artefaktów wizualnych ze względu na sposób, w jaki układ wzrokowy uwydatnia granice na krawędziach wielokątów. JASNOŚĆ I KONTRAST Trzy różne metody cieniowania stosowane w grafice komputerowej. Płaskie cieniowanie po lewej stronie podlega iluzji Chevreula. Cieniowanie Gourauda w środku powoduje powstanie pasm Macha. Cieniowanie Phonga po prawej stronie tworzy coś, co wygląda na gładkie, mimo że opiera się na tej samej liczbie faset. JASNOŚĆ I KONTRAST Hamowanie oboczne można uznać za pierwszy etap procesu wykrywania krawędzi, który sygnalizuje położenie i kontrasty krawędzi w otoczeniu. Jedną z konsekwencji jest to, że można tworzyć pseudokrawędzie. Dwa obszary, które fizycznie mają tę samą jasność, można zmienić tak, aby wyglądały inaczej, dzięki krawędzi między nimi, która stopniowo odcieniowuje się na dwie strony, JASNOŚĆ I KONTRAST Cały obszar centralny wydaje się jaśniejszy niż otaczające go obszary. Nazywa się to efektem Cornsweeta. Obszary w środku okręgów wydają się wyglądać na jaśniejsze niż otaczające je obszary, mimo że w rzeczywistości mają ten sam odcień, ponieważ mózg konstruuje kolor powierzchni w oparciu o informacje o kontraście krawędzi. JASNOŚĆ I KONTRAST Kontury w stylu Cornsweeta mają wyraźne wnętrze i zewnętrze, w przeciwieństwie do zwykłych linii. W niektórych wizualizacjach to, co znajduje się wewnątrz i na zewnątrz ograniczonego obszaru, może być yniejasne, zwłaszcza jeśli granica jest zawiła. Ilustracja pokazuje, że kontury Cornsweet mogą rozwiązać ten problem. JASNOŚĆ I KONTRAST Seurat celowo zwiększył kontrast krawędzi, aby wyróżnić swoje postacie. JASNOŚĆ I KONTRAST Ten sam pomysł można wykorzystać w wizualizacji, aby wyróżnić obszary zainteresowania. Ilustracja przedstawia diagram łącza węzłowego, w którym tło zostało dostosowane, aby krytyczne podgrafy były bardziej wyraźne (metoda nazywana haloingiem). JASNOŚĆ I KONTRAST Dwie metody wyróżniania diagramu łącza węzłowego. (a) Kontrast jest zmniejszony w przypadku mniej ważnych części sieci. (b) Kontrast tła jest zwiększany za pomocą aureoli w celu podkreślenia ważnych części. Warto podkreślić, że to nie ilość światła decyduje o wyrazistości wizualnej, ale stopień kontrastu luminancji, który występuje z tłem. Czerń na białym tle jest tak samo charakterystyczna jak biel na czarnym tle. WYTYCZNE DLA PROJEKTOWANIA B. Rozważ użycie konturów Cornsweeta zamiast prostych linii dla wyróżnienia informacji. C. Rozważ użycie dopasowań kontrastu luminancji jako metody podświetlania. Można go zastosować, zmniejszając kontrast nieistotnych elementów lub lokalnie dostosowując tło w celu zwiększenia kontrastu luminancji w krytycznych obszarach. STAŁOŚĆ JASNOŚCI STAŁOŚĆ JASNOŚCI Stałość percepcyjna zachodzi, gdy twoja percepcja jakiegoś obiektu pozostaje taka sama wtedy, gdy bezpośrednie wrażenia zmieniają się. Kiedy mówimy o pozornym ogólnym współczynniku odbicia powierzchni, nazywa się to stałością jasności. STAŁOŚĆ JASNOŚCI Pierwszym etapem mechanizmu stałości jasności jest adaptacja. Drugim etapem stałości jest hamowanie oboczne. STAŁOŚĆ JASNOŚCI Rola adaptacji polega na zmieniającej się wrażliwości receptorów i neuronów w oku pomagająca określić ogólny poziom oświetlenia. Jednym z mechanizmów jest jaśnięcie fotopigmentu w receptorach. Przy wysokim poziomie światła więcej fotopigmentu jest jaśniejsze, a receptory stają się mniej wrażliwe. Przy słabym oświetleniu fotopigment ulega regeneracji, a oczy odzyskują wrażliwość. Ta regeneracja może zająć trochę czasu, dlatego jesteśmy na chwilę oślepieni, gdy wchodzimy do zaciemnionego pomieszczenia poza jasnym światłem słonecznym. STAŁOŚĆ JASNOŚCI Mechanizmy jednoczesnego kontrastu pomagają nam osiągnąć stałość poprzez sygnalizowanie różnic w poziomach światła, zwłaszcza na krawędziach obiektów. Rozważmy proste środowisko graficzne zilustrowane obok. Lampa biurkowa, znajdująca się po prawej stronie obrazu, stworzyła nierównomierne oświetlenie nad drewnianym biurkiem, na którym leżą dwie kartki papieru. Element znajdujący się bliżej lampy jest średnio szary. Ponieważ otrzymuje więcej światła, odbija mniej więcej taką samą ilość światła jak biały papier, który jest dalej od światła. W oryginalnym środowisku ludziom łatwo jest stwierdzić, który kawałek papieru jest szary, a który biały. Mechanizm jednoczesnego kontrastu powoduje, że widzimy oba odcienie jako podobne. STAŁOŚĆ JASNOŚCI Te dwie kartki papieru są oświetlone przez lampę biurkową po prawej stronie obrazu. To sprawia, że ilość światła odbitego od szarego papieru jest mniej więcej taka sama, jak światło odbite od białego papieru. UWAGA! Uwaga! Papierowe reprodukcje efektów kontrastu i stałości są często mniej przekonujące niż te efekty w laboratorium. Dlaczego tak się dzieje? Odpowiedź tkwi w dwoistej naturze obrazów. Fotografia sama w sobie ma powierzchnię i do pewnego stopnia postrzegamy rzeczywiste poziomy szarości pigmentu fotograficznego w przeciwieństwie do poziomów szarości tego, co jest przedstawione. Im uboższa reprodukcja, tym bardziej widzimy rzeczywisty kolor wydrukowany na papierze. Podobny efekt występuje w przypadku obrazów z percepcją głębi i perspektywy. STAŁOŚĆ JASNOŚCI Chociaż zarówno adaptacja, jak i kontrast mogą być postrzegane jako mechanizmy percepcji stałości, nie są one wystarczające. Szczególnie ważne wydają się trzy dodatkowe czynniki. Pierwszym z nich jest to, że mózg musi w jakiś sposób brać pod uwagę kierunek oświetlenia i orientację powierzchni w ocenach jasności. Płaska biała powierzchnia odwrócona od światła będzie odbijać mniej światła niż ta zwrócona w stronę światła. W tych okolicznościach ludzie nadal mogą dokonywać dość dokładnych ocen jasności, co pokazuje, że nasze mózgi mogą brać pod uwagę zarówno kierunek oświetlenia, jak i układ przestrzenny. STAŁOŚĆ JASNOŚCI Drugim ważnym czynnikiem jest to, że mózg wydaje się używać najjaśniejszego obiektu w scenie jako swego rodzaju odniesienia bieli do określania wartości szarości wszystkich innych obiektów (Cataliotti i Gilchrist, 1995). Dwie fotografie obok pokazują scenę w której wszystko jest czarne (a) oraz drugą w której wszystko jest białe (b). KOLOR KOLOR Percepcja kolorów pozwala nam odróżnić obiekty, dowiedzieć się czegoś na temat percypowanych obiektów (np. czy jabłko jest zgniłe, czy nie), itd. W kontekście wizualizacji kolor doskonale nadaje się do etykietowania i kategoryzacji, ale słabo nadaje się do wyróżniania kształtu, szczegółów lub układu przestrzennego. ŚLEPOTA NA KOLORY Niefortunnym skutkiem używania kolorów do kodowania informacji jest stworzenie nowej klasy osób niepełnosprawnych. Daltonizm już dyskwalifikuje kandydatów na niektóre stanowiska, takie jak pracownicy obsługi linii telefonicznych, ze względu na niezliczoną ilość kolorowych przewodów, a piloci ze względu na potrzebę rozróżniania świateł oznaczonych kolorami. Około 10% populacji mężczyzn i około 1% populacji kobiet ma jakąś formę niedoboru widzenia kolorów. TEORIA TRÓJCHROMATYCZNA Najważniejszym faktem dotyczącym widzenia kolorów jest to, że mamy trzy odrębne receptory kolorów w naszych siatkówkach, zwane czopkami, które są aktywne przy normalnym poziomie światła - stąd trójchromatyzm. TEORIA TRÓJCHROMATYCZNA Funkcje czułości czopka. Kolory są tylko przybliżonymi przybliżeniami odcieni widma. Skróty: S, czułość czopka o krótkiej długości fali; M, czułość czopka o średniej długości fali; L, czułość czopka o dużej długości fali. TEORIA TRÓJCHROMATYCZNA Po połączeniu światła z trzech projektorów wyniki są takie, jak pokazano. Światło żółte jest mieszanką czerwieni i zieleni. Fioletowe światło jest mieszanką czerwieni i błękitu. Białe światło jest mieszanką czerwonego, zielonego i niebieskiego. Każdy inny kolor można dopasować, dostosowując proporcje światła czerwonego, zielonego i niebieskiego. TEORIA PROCESU PRZECIWSTAWNEGO Pod koniec XIX wieku niemiecki psycholog Ewald Hering zaproponował teorię, że istnieje sześć podstawowych kolorów i że kolory te są ułożone percepcyjnie jako przeciwstawne pary wzdłuż trzech osi: czarno-białej, czerwono-zielonej i żółto- niebieskiej (Hering, 1920). W ostatnich latach zasada ta stała się kamieniem węgielnym nowoczesnej teorii kolorów. TEORIA PROCESU PRZECIWSTAWNEGO Dane wejściowe ze stożków są przetwarzane przez trzy odrębne kanały. Kanał luminancji (czarno- biały) jest oparty na danych wejściowych ze wszystkich stożków. Kanał czerwono-zielony opiera się na różnicy sygnatur stożków o długiej i średniej długości fali. Kanał żółto-niebieski opiera się na różnicy między stożkami o krótkiej długości fali a sumą pozostałych dwóch. TEORIA PROCESU PRZECIWSTAWNEGO Teoria przewiduje, że niektóre kolory nie powinny występować w kombinacji. Często opisujemy kolory za pomocą kombinacji terminów kolorystycznych, takich jak żółtawo-zielony lub zielonkawo-niebieski. Teoria przewiduje, że ludzie nigdy nie będą używać czerwonawo-zielonego lub żółtawego niebieskiego, ponieważ te kolory są biegunowymi przeciwieństwami w teorii kolorów przeciwstawnych (Hurvich, 1981). TEORIA PROCESU PRZECIWSTAWNEGO Teoria trójchromatyczna nie wyjaśnia, co dzieje się po aktywacji receptorów czopków. Nie uwzględnia również negatywnych powidoków. Jeśli przez kilka sekund wpatrujesz się w kwadrat danego koloru, a następnie przenosisz wzrok na białą powierzchnię, widzisz negatywny powidok w kolorze dopełniającym (kolory dopełniające dają biel po połączeniu). Na przykład zielony kwadrat tworzy czerwony powidok, podczas gdy niebieski kwadrat tworzy żółty powidok. Brązowy tekst na niebieskim gradiencie. Zwróć uwagę, jak trudno jest odczytać tekst, w którym luminancja jest równa, pomimo dużej różnicy chromatycznej. Brązowy jest ciemnożółty, więc te kolory różnią się na kanale niebiesko-żółtym. TEORIA PROCESU PRZECIWSTAWNEGO TEORIA PROCESU Nawet duże kształty są lepiej widoczne, jeśli zapewniona jest PRZECIWSTAWNEGO granica kontrastu oświetlenia. Iluzja kontrastu kolorów. Elipsy są tego samego koloru, ale wydają się bardziej różowe po prawej i bardziej niebieskie po lewej. Im dłużej patrzysz, tym większe będą się pojawiać różnice. TEORIA PROCESU PRZECIWSTAWNEGO KOLOR W WIZUALIZACJI INFORMACJI PROBLEM PRÓBKI Ponieważ informacja na temat luminancji różni się od informacji chromatycznych (czerwono-zielonych, żółto-niebieskich), dobrym pomysłem jest oddzielenie wymiaru jasności od wymiarów chromatycznych w interfejsie specyfikacji kolorów. PROBLEM PRÓBKI Kolejnym cennym dodatkiem do interfejsu projektowania kolorów jest metoda wyświetlania próbki koloru na różnokolorowym tle. Dzięki temu projektant może zrozumieć, w jaki sposób efekty kontrastu mogą wpływać na wygląd poszczególnych próbek kolorów. PROBLEM PRÓBKI Problem najlepszego interfejsu wyboru kolorów nie został rozwiązany. Badania nie wykazały, że jeden sposób kontrolowania koloru jest istotnie lepszy od innego (Douglas i Kirkpatrick, 1996; Schwarz, Cowan i Beatty, 1987). Douglas i Kirkpatrick dostarczyli jednak dowodów na to, że dobre informacje zwrotne na temat lokalizacji dostosowywanego koloru w przestrzeni kolorów mogą pomóc w tym procesie. PROBLEM PRÓBKI Fakt, że istnieje tak niewiele powszechnie uzgodnionych nazw kolorów i że pamięć kolorów jest tak słaba, sugeruje, że wybieranie kolorów według nazwy nie będzie przydatne, z wyjątkiem najprostszych zastosowań. Ludzie zgadzają się co do tego, że etykiety są czerwone, zielone, żółte, niebieskie, czarne i białe, ale niewiele więcej; Niemniej jednak możliwe jest zapamiętanie dość dużej liczby nazw kolorów i dokładne ich użycie w kontrolowanych warunkach. Wyświetlacze w sklepach z farbami mają zazwyczaj standardowe oświetlenie i standardowe tło dla pasków próbek zawierających kilkaset próbek. W takich okolicznościach specjalista może zapamiętać i użyć nawet 1000 nazw kolorów, ale wiele z nich jest idiosynkratycznych. KOLOR DLA KODÓW NOMINALNYCH Załóżmy, że potrzebna jest wizualizacja, w której kolorowe symbole reprezentują firmy z różnych sektorów przemysłu — czerwony oznacza produkcję, zielony finanse, niebieski handel detaliczny i tak dalej. Techniczna nazwa tego rodzaju etykietowania to kodowanie informacji nominalnych. Kod nominalny musi zostać zapamiętany i rozpoznany lub dopasowany do etykiety w legendzie. KOLOR DLA KODÓW NOMINALNYCH Jesteśmy o wiele bardziej wrażliwi na różnice między dużymi próbkami koloru niż małymi próbkami koloru. Ogólnie rzecz biorąc, im większy obszar jest oznaczony kolorem, tym łatwiej można odróżnić kolory, więc gdy używane są duże obszary kodowania kolorami (na przykład obszary mapy), kolory powinny mieć niską nasycenie (nasycenie) i różnić się od siebie tylko nieznacznie. Małe znaki, które są oznaczone kolorami, powinny mieć mocne, mocno nasycone kolory, aby zapewnić ich maksymalną rozróżnialność. KOLOR DLA KODÓW NOMINALNYCH Kolory na dużych obszarach, takie jak te, które mogą być używane na mapach w tle, mogą mieć bardzo niskie nasycenie i nadal być rozróżnialne. Jeżeli jednak używamy kolorów dla oznaczenia elementów mapy, powinniśmy użyć mocno nasyconych, wyraźnie odróżnialnych kolorów. KOLOR DLA KODÓW NOMINALNYCH Po lewej stronie znajduje się mapa wykorzystująca jasne kolory o niskiej nasyceniu do kodowania obszaru i ciemne kolory o wysokim nasyceniu dla symboli miast i obiektów liniowych. Po prawej stronie znacznie gorsze rozwiązanie pokazuje kodowanie o wysokim nasyceniu dla obszarów oraz symbole o niskiej nasyceniu i cechy liniowe. KOLOR DLA KODÓW NOMINALNYCH Na wielu wyświetlaczach można się spodziewać, że obiekty oznaczone kolorami pojawią się na różnych tłach. Jednoczesny kontrast z kolorami tła może radykalnie zmienić wygląd kolorów, sprawiając, że jeden kolor wygląda jak inny. Jest to jeden z powodów, dla których zaleca się posiadanie tylko niewielkiego zestawu kodów kolorystycznych. KOLOR DLA KODÓW NOMINALNYCH Czasami znaczenie kolorów musi być brane pod uwagę przy kodowaniu symboli kolorami. Niektóre popularne konwencje nazewnictwa to zielony={idź, bezpieczeństwo, zysk, wegetacja}; czerwony = {gorąco, złość, niebezpieczeństwo, strata finansowa}; niebieski = {zimno, woda, melancholia, spokój}. Należy jednak pamiętać, że konwencje te niekoniecznie przekraczają granice międzykulturowe. Na przykład w Chinach czerwony oznacza życie i dobry dla, a zielony czasami oznacza śmierć. KOLOR DLA KODÓW NOMINALNYCH Kombinacje kolorów mogą mieć również właściwości afektywne. Bartram, Patra i Stone (2017) stwierdzili, że niektóre palety były wiarygodnie oceniane jako spokojne, poważne, zabawne lub godne zaufania. KOLOR DLA KODÓW NOMINALNYCH Ponieważ istnieje znaczna populacja daltonistów, pożądane może być używanie kolorów, które mogą być rozróżniane nawet przez osoby ze ślepotą na kolory. Większość daltonistów nie potrafi rozróżnić kolorów, które różnią się w kierunku czerwono-zielonym. Prawie każdy potrafi rozróżnić kolory, które różnią się w kierunku żółto-niebieskim. Ogranicza to jednak liczbę dostępnych kolorów w procesie projektowania. KOLOR DLA KODÓW NOMINALNYCH Rodziny kolorów mogą być czasami używane do wyróżniania elementów w ramach szerszej kategorii. PSEUDOKOLORY W prawie każdej gazecie i na każdej stronie internetowej poświęconej pogodzie znajduje się mapa, na której regiony są pokolorowane inaczej, aby pokazać prognozowane temperatury. Czerwony służy do pokazania upałów, niebieski służy do pokazania zimnej pogody, a inne kolory są ułożone pomiędzy, często przy użyciu kolorów tęczy. PSEUDOKOLORY Pseudokolorowanie to technika przedstawiania stale zmieniających się wartości mapy za pomocą sekwencji kolorów. Wynik jest czasami nazywany kartogramem. Pseudobarwienie jest szeroko stosowane w astronomicznych wykresach promieniowania, obrazowaniu medycznym i wielu innych zastosowaniach naukowych. PSEUDOKOLORY Niskie naprężenie jest skorelowane z miażdżycą. Po lewej stronie wszechobecna tęczowa mapa kolorów jest stosowana do danych naprężeń w rozgałęziających się tętnicach. Większość osób, które na to patrzą, błędnie kojarzy czerwony obszar jako problematyczny. Również różne charakterystyczne pasma widoczne na zdjęciu w rzeczywistości nie mają żadnego znaczenia. Obraz po prawej stronie przedstawia znacznie wyraźniejszy obraz. Czerwone obszary mają problemy, im ciemniejszy kolor, tym gorszy stan. PSEUDOKOLORY Ta kolorowa mapa ma na celu podkreślenie regionów północnego Atlantyku, w których temperatury sprzyjały rozwojowi huraganów o określonej porze roku. PERCEPCJA I UWAGA #3: Kognitywistyka i Komunikacja Piotr Kozak UWAGA RUCHY OKA Poruszanie oczami powoduje, że różne części środowiska wzrokowego są obrazowane na dołku centralnym o wysokiej rozdzielczości. Ruchy gałek ocznych są częste. Na przykład, gdy czytasz ten slajd, twoje oko wykonuje od dwóch do pięciu gwałtownych ruchów, zwanych sakkadami, na sekundę, a każdy z tych ruchów można traktować jako podstawowy akt przeszukiwania wzrokowego. RUCHY SAKKADOWE Istnieją trzy najważniejsze rodzaje ruchów oczu (1) Ruchy sakkadowe: W zadaniu przeszukiwania wzrokowego oko szybko przechodzi od fiksacji do fiksacji. Okres fiksacji wynosi zwykle od 200 do 400 ms. Ruch sakkadowy trwa od 20 do 180 ms i zależy od poruszanego kąta. W przypadku ruchów gałek ocznych o więcej niż 20° następują ruchy głowy, które mogą trwać pół sekundy lub dłużej. RUCHY SAKKADOWE Podczas ruchów sakkadowych jesteśmy mniej wrażliwi na bodźce wzrokowe. Nazywa się to supresją sakkadyczną. Oznacza to, że zdarzenia mogą umknąć naszej uwadze, jeżeli występują wtedy, gdy dokonujemy ruchu naszych oczu. RUCHY PŁYNNE (2) Ruchy płynne. Kiedy obiekt porusza się płynnie w polu widzenia, oko ma możliwość skupienia się na nim i śledzenia go. Nazywa się to płynnym ruchem gałek ocznych. Ta zdolność umożliwia nam również wykonywanie ruchów głowy i ciała, jednocześnie utrzymując fiksację na interesującym nas obiekcie. RUCHY ZBIEŻNE (3) Ruchy zbieżne (zwane również ruchami wergencyjnymi). Kiedy jakiś obiekt zbliża się do nas, nasze oczy się zbiegają. Kiedy się oddala, rozchodzą się. Ruchy zbieżne mogą być sakkadowe lub płynne. AKOMODACJA Kiedy oko przesuwa się na nowy cel w innej odległości od obserwatora, musi ponownie ustawić ostrość lub dostosować się tak, aby nowy cel był wyraźnie zobrazowany na siatkówce. Odpowiedź akomodacyjna trwa zwykle około 200 ms. Jednak wraz z wiekiem zdolność do dostosowywania się do spadków i ponownego ustawiania ostrości oczu musi być osiągana poprzez zmianę okularów lub, w przypadku użytkowników soczewek dwuogniskowych lub progresywnych, poprzez przesuwanie głowy tak, aby między źrenicą a fiksowanym obiektem znajdowała się inna soczewka. PRZESZUKIWANIE WZROKOWE Przeszukiwanie wzrokowe polega na przeszukiwaniu pola wzrokowego w celu odnalezienia poszukiwanej cechy lub obiektu. PRZESZUKIWANIE WZROKOWE Ale w jaki sposób mózg może przygotować się na ruch gałek ocznych, nie wiedząc, co znajduje się w miejscu docelowym? Zgodnie z teorią Wolfe'a (1996) stosuje się strategię heurystyczną. Po pierwsze, zestaw map cech całego pola widzenia jest tworzony w operacji przetwarzania równoległego, która odbywa się głównie w obszarze V1 pierwszorzędowej kory wzrokowej. Każda mapa obiektów jest poświęcona określonemu rodzajowi obiektu, na przykład konturom pionowym, plamom o określonym rozmiarze lub kolorowi. Każda mapa jest ważona zgodnie z bieżącym zadaniem. Jeśli skanujemy tłum w poszukiwaniu kogoś, kogo znamy, kto ma żółty płaszcz przeciwdeszczowy, mapy obiektów podkreślą żółte plamy. PRZESZUKIWANIE WZROKOWE Następnie ruchy gałek ocznych są wykonywane w sekwencji, odwiedzając najpierw najsilniejszy możliwy obszar docelowy (zgodnie z mapami obiektów) i przechodząc do następnego najsilniejszego. PRZESZUKIWANIE WZROKOWE Trzy rzeczy decydują o tym, co jest łatwe do znalezienia: 1. Istotność a priori. Niektóre wzorce wzbudzają większą aktywność neuronalną na mapach obiektów niż inne. 2. Modyfikacja istotności od góry do dołu. W zależności od tego, czego szukamy, mechanizmy odgórne dostrajają mapy funkcji, aby zwiększyć ich czułość na określone funkcje. Na przykład, możemy chcieć znaleźć przeważnie pionowy, wydłużony symbol. Mapa obiektów orientacji pionowej zyska większą czułość. 3. Istota sceny. Mózg bardzo szybko rozpoznaje rodzaj oglądanej sceny (wnętrze sklepu, otwarty krajobraz, ulica miasta), co pozwala mu aktywować strategie wyszukiwania wizualnego odpowiednie dla sceny wizualnej (Oliva, Torralba, Castelhano i Henderson, 2003). PRZETWARZANIE INFORMACJI WZROKOWEJ Po wstępnym przetworzeniu w siatkówce oka, informacja wzrokowa przechodzi w górę nerwu wzrokowego przez połączenie nerwowe w jądrze kolankowatym bocznym (LGN) i przez kilka etapów przetwarzania w korze. Pierwsze obszary w korze mózgowej, które otrzymują bodźce wzrokowe, nazywane są V1 i V2. DOSTROJONE POLE RECEPCYJNE W pierwszorzędowej korze wzrokowej niektóre komórki reagują tylko na wydłużone plamy o określonej pozycji i orientacji, inne najsilniej reagują na plamy o określonej pozycji, poruszające się w określonym kierunku z określoną prędkością, a jeszcze inne reagują selektywnie na kolor. DOSTROJONE POLE RECEPCYJNE W V1 i V2 istnieją komórki, które są różnie dostrojone do każdej z następujących właściwości: l Lokalne elementy formy: orientacja i rozmiar (z luminancją). l Kolor. l Elementy głębi stereoskopowej. l Elementy ruchu. DOSTROJONE POLE RECEPCYJNE Obszary wizualne V1 i V2 przetwarzają te obiekty jako zestaw "map" przestrzennych. Cechy są przetwarzane równolegle, dzięki czemu każda część przestrzeni wizualnej jest jednocześnie rozkładana na czynniki pierwsze pod względem jej właściwości wizualnych. Mapy te są jednak mocno zniekształcone, ponieważ dołek centralny ma znacznie więcej miejsca w korze mózgowej niż w regionach na peryferiach widzenia. W obszarach korowych poświęconych dołkowi centralnemu pola recepcyjne są znacznie mniejsze. Jest to system, w którym dla każdego punktu w przestrzeni wizualnej neurony są dostrojone do wielu różnych orientacji, wielu różnych rodzajów informacji o kolorze, wielu różnych kierunków i prędkości ruchu oraz wielu różnych głębokości stereoskopowych. TEORIA KANAŁÓW WIZUALNYCH Różne rodzaje informacji, które są przetwarzane w V1 i V2, można traktować jako składające się na zestaw wizualnych "kanałów". Na najwyższym poziomie informacje są przetwarzane za pośrednictwem kanału wzrokowego lub słuchowego. Gałąź wizualna dzieli się na elementy formy, koloru i ruchu. Każdy z nich jest dalej podzielony. TEORIA KANAŁÓW WIZUALNYCH Znaczenie kanałów z punktu widzenia projektowania polega na tym, że informacje w różnych kanałach są łatwe do wizualnego oddzielenia - za pomocą aktu uwagi możemy skupić się na informacjach w jednym lub drugim kanale; podczas gdy informacje na tym samym kanale są łatwe do połączenia, ale trudne do rozdzielenia. Mniejsze są również zakłócenia między informacjami wyświetlanymi na oddzielnych kanałach. WYTYCZNE DLA PROJEKTOWANIA A. Korzystaj z różnych kanałów wizualnych, aby wyświetlać aspekty danych, które są koncepcyjnie różne. TEORIA KANAŁÓW WIZUALNYCH Wrażliwość wzroku na kontrast jest zależna od częstotliwości przestrzennej fragmentów obrazu. W psychofizjologii częstotliwość przestrzenna to własność wyrażona przez liczbę zmian luminancji występujących w określonym kierunku na pewnej długości fragmentu pola wzrokowego. Dla przykładu, obraz o wysokiej wartości częstotliwości przestrzennej zawiera wiele elementów różniących się luminancją, a w obrazie o niskiej wartości częstotliwości przestrzennej dominować będą obszary o homogenicznej luminancji. TEORIA KANAŁÓW WIZUALNYCH Ponieważ wszystkie informacje przechodzą przez przestrzenne kanały częstotliwości, ważne jest, aby różne rodzaje informacji były jak najbardziej od siebie oddzielone pod względem ich składowych częstotliwości i orientacji. Ilustracja przedstawia litery alfabetu na losowym wzorze szumu wizualnego, który ma zakres częstotliwości przestrzennych od niskich do wysokich (Solomon i Pelli, 1994). Litery są trudne do dostrzeżenia, gdzie tło ma składowe częstotliwości przestrzennej podobne do liter. Jest to przykład interferencji wizualnej między podkanałami częstotliwości przestrzennej. MAPY OBIEKTÓW Ponieważ różne rodzaje właściwości wizualnych są przetwarzane oddzielnie, można je traktować jako tworzące zestaw map obiektów, mniej więcej na poziomie V1. Mapy te obejmują całe pole widzenia i jest ich wiele, a każda z nich opiera się na innym rodzaju obiektu. Jest mapa dla czerwieni, mapa dla zieleni, mapa dla orientacji pionowej, mapa dla orientacji poziomej, mapa dla ruchu pionowego, ruchu poziomego i tak dalej. MAPY OBIEKTÓW Kiedy czegoś szukamy, definiowany jest docelowy zestaw właściwości cech, składający się z rodzajów cech, które znajdują się na mapach obiektów (Eckstein et al., 2007). Ruchy gałek ocznych są kierowane do obszarów mapy obiektów, które najlepiej pasują do właściwości docelowych. WYTYCZNE DLA PROJEKTOWANIA B. Aby uzyskać maksymalną widoczność, należy rozróżniać symbole między sobą i od tła pod względem składowych częstotliwości przestrzennej, składowych orientacji i koloru. WYTYCZNE DLA PROJEKTOWANIA Kanały funkcji mogą być używane do lepszego odróżniania symboli od siebie. PRZETWARZANIE PRZEDUWAGOWE Przetwarzanie przeduwagowe określa, jakie obiekty wizualne są oferowane naszej uwadze i łatwe do znalezienia w następnej fiksacji (Findlay i Gilchrist, 2005). PRZETWARZANIE PRZEDUWAGOWE Dlaczego jest to ważne? Podczas wyświetlania informacji często przydatna jest możliwość pokazania rzeczy "na pierwszy rzut oka". Jeśli chcesz, aby ludzie byli w stanie natychmiast zidentyfikować jakiś znak na mapie jako typ A, powinien on być odróżniany od wszystkich innych znaków. Są to właściwości, które mogą kierować rozmieszczeniem uwagi (Wolfe i Horowitz, 2004). Innymi słowy, są to właściwości, które nasz mózg może wykorzystać, aby zdecydować, na co spojrzeć dalej. PRZETWARZANIE PRZEDUWAGOWE (a) Aby policzyć liczby 3 w tej tabeli cyfr, konieczne jest skanowanie liczb sekwencyjnie. (b) Aby policzyć 3 w tej tabeli, konieczne jest tylko zeskanowanie czerwonych 3, ponieważ wyskakują one z otoczenia. PRZETWARZANIE PRZEDUWAGOWE Większość podanych tutaj przykładów przetwarzania przeduwagowego można wytłumaczyć charakterystyką przetwarzania neuronów w pierwszorzędowej korze wzrokowej. PRZETWARZANIE PRZEDUWAGOWE Nie wszystkie efekty przeduwagowe są równie silne. Ogólnie rzecz biorąc, najsilniejsze efekty opierają się na kolorze, orientacji, rozmiarze, kontraście i ruchu lub mruganiu. Efekty takie jak krzywizna linii są zwykle słabsze. Istnieją również stopnie różnicy. Duże różnice kolorystyczne mają więcej wyskakujących okienek niż małe. PRZETWARZANIE PRZEDUWAGOWE Badania wykazały, że dwa czynniki są ważne w określaniu, czy coś się wyróżnia: stopień różnicy między obiektem docelowym a pozostałymi obiektami oraz stopień różnicy pomiędzy samymi obiektami (Duncan i Humphreys, 1989; Quinlan & Humphreys, 1987). Na przykład żółte zaznaczenie tekstu działa dobrze, jeśli żółty jest jedynym kolorem na wyświetlaczu oprócz czarnego i białego, ale jeśli jest wiele kolorów, zaznaczenie będzie mniej skuteczne. PRZETWARZANIE PRZEDUWAGOWE Po lewej stronie mamy silniejszy efekt pop-outu pochylonej kreski. Jednak większość dystraktorów po prawej stronie ma orientację, która bardziej różni się od orientacji docelowej niż dystraktory po lewej. WYTYCZNE DLA PROJEKTOWANIA C. Aby uzyskać maksymalne efekt pop-out, symbol powinien być jedynym obiektem na ekranie, który jest charakterystyczny dla określonego kanału funkcji. Na przykład może to być jedyny element, który jest kolorowy na wyświetlaczu, na którym wszystko inne jest czarno-białe. WYTYCZNE DLA PROJEKTOWANIA D. Kiedy projekt wizualny jest złożony, zastosowanie koloru, tekstury, kształtu do problemu z podkreśleniem informacji staje się trudniejsze. Jeśli na przykład wszystkie czcionki na wyświetlaczu mają ten sam rozmiar, do wyróżnienia można użyć zwiększenia rozmiaru. Ogólnie rzecz biorąc do podkreślenia informacji należy użyć dowolnego wymiaru elementu, który jest najrzadziej używany w innych częściach projektu. WYTYCZNE DLA PROJEKTOWANIA E. Gdy kanały kolorów i kształtów są już w pełni wykorzystane, rozważ użycie zaznaczenie ruchem lub mrugnięciem. Możliwe jest też zastosowanie efektu blaknięcia. PRZESZUKIWANIE POŁĄCZONE Co się dzieje, na przykład, jeśli chcemy poszukać czerwonego kwadratu, a nie tylko czegoś, co jest czerwone, lub czegoś, co jest kwadratowe? Okazuje się, że tego rodzaju wyszukiwanie jest powolne, jeśli otaczające obiekty są kwadratami (ale nie czerwonymi) i innymi czerwonymi kształtami. Jesteśmy zmuszeni do seryjnego przeszukiwania albo czerwonych kształtów, albo kwadratowych obiektów. Nazywa się to przeszukiwaniem połączonym (conjunction search), ponieważ polega na poszukiwaniu specyficznej koniunkcji atrybutów czerwieni i kształtu (Treisman i Gelade, 1980). WYTYCZNE DLA PROJEKTOWANIA F. Jeśli symbole mają być z góry wyraźnie rozróżniane, należy unikać projektów, które opierają się na połączeniach podstawowych właściwości graficznych. PRZESZUKIWANIE POŁĄCZONE Chociaż wczesne badania sugerowały, że przeszukiwanie połączone nie jest przeduwagowe, okazało się, że istnieje wiele wyjątków. PRZESZUKIWANIE POŁĄCZONE Treisman i Gormican (1988) argumentowali, że uwaga może być kierowana przez identyfikację klastrów przestrzennych. Doprowadziło to do odkrycia, że koniunkcja przestrzeni i koloru może być poszukiwana uwagowo. PRZESZUKIWANIE POŁĄCZONE (a) Ze względu na połączenie kształtu i koloru, wyszukiwanie jest powolne. (b) Jeśli przeszukamy dolną grupę w poszukiwaniu zielonego obiektu, wyszukiwanie jest szybkie. To też jest koniunkcja. PRZESZUKIWANIE POŁĄCZONE Driver, McLeod i Dienes (1992) ustalili, że ruch i kształt celu mogą być przeszukiwane przeduwagowo. Tak więc, jeśli cały zestaw celów jest w ruchu, nie musimy szukać celów nieruchomych. Możemy z wyprzedzeniem odnaleźć np. czerwony ruchomy cel. PRZESZUKIWANIE POŁĄCZONE Theeuwes i Kooi (1994) wykazali, że polaryzacja luminancji z obiektami jaśniejszymi i ciemniejszymi niż szare tło może wspierać przeduwagowe wyszukiwanie koniunkcji cech. PRZETWARZANIE POZAUWAGOWE Selektywność uwagi w żadnym wypadku nie jest doskonała. Nawet jeśli chcemy skupić się na jednym aspekcie wyświetlacza, inne informacje są również przetwarzane. Ilustruje to dobrze znany efekt Stroopa (Stroop, 1935). Ogólnie rzecz biorąc, słowa, które są powiązane z informacją werbalną i cechami wizualnymi, reprezentują odrębne kanały informacji. Efekt Stroopa wykazuje interferencję między tymi kanałami. PRZETWARZANIE POZAUWAGOWE Tak szybko, jak to możliwe, spróbuj nazwać kolory w zestawie słów u góry, a następnie spróbuj nazwać kolory w zestawie słów poniżej. Nawet jeśli są pytani, aby zignorować znaczenie słów, ludzie są spowalniani przez niedopasowanie w drugim zestawie. Nazywa się to efektem Stroopa, który pokazuje, że niektóre procesy przetwarzania są automatyczne. MAPA PRIORYTETÓW Przeszukiwanie wzrokowe kierowane jest ogólną wiedzą na temat ogólnego sensu sceny oraz kontekstu przeszukiwania. Tworzy to tzw. mapę priorytetów. MAPA PRIOTYTETÓW Ilustracja mapy priorytetów. W których skrzynkach może kryć się owca? Ograniczenia sceny jasno wskazują, że "C" jest prawdopodobną lokalizacją. Wskazówki dotyczące układu przestrzennego wskazują, że każda owca za "B" byłaby bardzo mała, a "A", "D" i "E" są nieprawdopodobne. SZABLON WYSZUKIWANIA Kiedy informacje o cechach są używane do kierowania wyszukiwaniem, są one często opisywane jako "szablon uwagi" lub "szablon wyszukiwania": wewnętrzna reprezentacja odpowiednich cech przechowywanych w pamięci roboczej lub długotrwałej, która ustala priorytet uwagi i kieruje uwagę w kierunku odpowiednich obiektów ("szablon wyboru") lub odwraca uwagę od pasujących elementów. KIEROWANIE UWAGĄ Szablon wyszukiwania jest dynamicznie dostrajany do "wystarczająco dobrych" informacji. UFOV Proces uwagi koncentruje się wokół dołka centralnego, gdzie widzenie jest najbardziej szczegółowe. Możemy jednak do pewnego stopnia przekierować uwagę na obiekty z dala od dołka centralnego. Obszar przestrzeni wizualnej, na który zwracamy uwagę, rozszerza się i kurczy w zależności od zadania, informacji na wyświetlaczu i poziomu stresu u obserwatora. Metaforą pola uwagi skoncentrowanego na dołku centralnym jest reflektor uwagi. Kiedy czytamy drobnym drukiem, wiązka reflektora jest wielkości dołka centralnego. Jeśli patrzymy na większy wzór, promień reflektora rozszerza się. Pojęcie użytecznego pola widzenia (UFOV) wskazuje na wielkość obszaru, z którego możemy szybko pobrać informacje. PERCEPCJA TUNELOWA Zjawisko znane jako widzenie tunelowe jest związane z operatorami pracującymi w ekstremalnym stresie. W widzeniu tunelowym UFOV jest tak zwężone, że przetwarzane są tylko najważniejsze informacje, zwykle znajdujące się w środku pola widzenia. Zjawisko to jest szczególnie związane z różnego rodzaju zachowaniami niefunkcjonalnymi, które występują podczas podejmowania decyzji w sytuacjach trudnych. WYTYCZNE DLA PROJEKTOWANIA G. Podczas projektowania sygnały ostrzegawcze urządzeń peryferyjnych muszą być silniejsze, jeśli oczekuje się, że obciążenie poznawcze będzie wysokie. WYTYCZNE DLA PROJEKTOWANIA H. Ostrzeżenia kolorystyczne są nieskuteczne, ponieważ widzenie peryferyjne jest ślepe na kolory. Skuteczniejsze są sygnały ruchome (również pojawienie się nowych sygnałów) i mrugające. ŚLEPOTA NA ZMIANĘ Zaburzenia uwagowe mogą być również spowodowane ograniczoną pojemnością pamięci wzrokowej. Możemy przechowywać ok. 3-4 elementów w roboczej pamięci wzrokowej. Jedną z konsekwencji małej ilości informacji przechowywanej w pamięci wzrokowej jest zjawisko znane jako ślepota na zmiany (Rensink, 2000). Jeśli zmiana zostanie wprowadzona w trakcie fiksacji, szybkie przejście wizualne zwróci na nią uwagę. Jeśli jednak zmiany zostaną wprowadzone w ruchu gałki środkowej, w połowie mrugnięcia lub po krótkim wygaszeniu ekranu, zmiana na ogół nie będzie widoczna (Rensink, 2002). ŚLEPOTA NA ZMIANĘ Przykładem ślepoty na zmiany jest niemożność wykrycia zmiany z jednej osoby na drugą w trakcie rozmowy. Simons i Levin (1998) przeprowadzili badanie, w którym do niczego niepodejrzewającej osoby podszedł nieznajomy trzymający mapę i pytający o drogę. Rozmowa, która się wywiązała, została przerwana przez dwóch robotników niosących drzwi, a w tym czasie inny aktor, ubrany w inne ubrania, został zastąpiony do kontynuowania rozmowy. Co ciekawe, większość ludzi nie zauważyła, że rozmawia z inną osobą. ŚLEPOTA POZAUWAGOWA Mack i Rock (1998) prosili badanych, aby zwrócili uwagę na wzór w kształcie litery X i obserwowali zmiany w długości jednego z ramion. Następnie naukowcy zaprezentowali wzorzec, o którego szukanie nie poproszono badanego. Okazało się, że nawet jeśli nieoczekiwany wzór znajdował się blisko lub nawet w punkcie fiksacji, przez większość czasu nie był widoczny dla osób badanych. PERCEPCJA I UWAGA #4: Kognitywistyka i Komunikacja TEORIE ROZPOZNAWANIA Piotr Kozak ROZPOZNAWANIE WZORCÓW Percepcja wzorców to zestaw procesów zachodzących między analizą cech a percepcją pełnego obiektu. Obiekty i znaczące wzorce są wyciągane przez procesy uwagi, aby zaspokoić potrzeby zapytania wizualnego skonstruowanego dla aktualnie aktywnego zadania poznawczego. ROZPOZNAWANIE WZORCÓW Ullman (1984) zasugerował, że procesy niskiego poziomu przebiegają w mózgu w celu wydobycia abstrakcyjnych wzorców. Kluczowym punktem teorii Ullmana jest to, że tylko niewielka liczba wzorców może zostać rozpoznana jednocześnie. Przykładowo możemy prześledzić tylko bardzo małą liczbę konturów, prawdopodobnie mniej niż pięć jednocześnie, jeśli są proste, i tylko jeden, który jest nieco bardziej złożony. ROZPOZNAWANIE WZORCÓW W eksploracji danych wymagania dotyczące zadań poznawczych prowadzą do tworzenia zapytań wizualnych. Zrozumienie zapytań wizualnych wymaganych do wykonania zadania poznawczego oznacza odkrycie odpowiednich wzorców zadania w danych, a to jest kluczem do krytycznej analizy i projektowania. ROZPOZNAWANIE WZORCÓW a) Czterowymiarowe dane dyskretne wyświetlane za pomocą macierzy b) Te same dane wyświetlane przy użyciu współrzędnych równoległych PSYCHOLOGIA GESTALT Psychologia Gestalt/psychologia postaci: szkoła psychologiczna założona w Niemczech w początkach XX wieku przez Wertheimera, Kohlera i Kofkę skupiająca się m.in. na badania zasad organizacji doświadczenia percepcyjnego (tzw. zasady Gestalt) BLISKOŚĆ Rzeczy, które są blisko siebie, są percepcyjnie zgrupowane razem. BLISKOŚĆ Macierz punktów jest postrzegana jako wiersze po lewej stronie (a) i kolumny po prawej stronie (b). W (c) postrzegamy dwie grupy kropek ze względu na relacje bliskości. BLISKOŚĆ Zasada koncentracji przestrzennej (Slocum, 1983). Kropka oznaczona jako x jest postrzegana jako część klastra a, a nie klastra b. PODOBIEŃSTWO Kształty poszczególnych elementów wzoru mogą decydować o sposobie ich grupowania. Elementy podobne są grupowane razem. PODOBIEŃSTWO (a, b) Podobieństwo między elementami w naprzemiennych rzędach powoduje, że postrzegamy wzory poziome. (c) Różne kolory służą do wyznaczania wierszy i kolumn. (d) Gdy używane są wymiary rozłączne (kolor i tekstura), łatwiej jest zająć się oddzielnie wierszami lub kolumnami. POŁĄCZENIE Palmer i Rock (1994) argumentowali, że połączenie jest fundamentalną zasadą organizacyjną Gestalt, którą psychologowie Gestalt przeoczyli. POŁĄCZENIE Zasada połączenia jest silniejsza niż (a) bliskość, (b) kolor, (c) rozmiar lub (d) kształt. CIĄGŁOŚĆ Bardziej prawdopodobne jest, że dostrzeżemy wzór z elementów wizualnych, które są gładkie i ciągłe, a nie takich, które zawierają nagłe zmiany kierunku. CIĄGŁOŚĆ Wzór po lewej stronie (a) jest postrzegany jako gładko zakrzywiona linia nakładająca się na prostokąt (b), a nie jako bardziej kanciaste elementy pokazane w (c). CIĄGŁOŚĆ W (a) gładkie ciągłe kontury są używane do łączenia węzłów na diagramie. W (b) stosuje się linie z nagłymi zmianami kierunku. O wiele łatwiej jest dostrzec połączenia z gładkimi konturami. SYMETRIA (a) Wzór po lewej stronie składa się z dwóch identycznych równoległych konturów. (b) Symetria lustrzana daje większe poczucie całej figury. W (d) symetria równoległa krawędzi i odwrócona polaryzacja krawędzi utrudniają dostrzeżenie symetrii względem (c). SYMETRIA Ponieważ symetrie wokół osi pionowych i poziomych są łatwiej dostrzegalne, (a) jest postrzegany jako kwadrat, a (b) jest postrzegany jako romb. (c), (d) Większy wzorzec może stanowić układ odniesienia, który definiuje osie symetrii; (c) jest postrzegana jako linia rombu, a (d) jako linia kwadratów. DOMKNIĘCIE Psychologowie Gestalt twierdzili, że istnieje percepcyjna tendencja do zamykania konturów, które mają w sobie luki. DOMKNIĘCIE W (a) widzimy okrąg za prostokątem, a nie przerwany pierścień, jak w (b). DOMKNIĘCIE Wszędzie tam, gdzie obserwuje się zamknięty kontur, istnieje bardzo silna percepcyjna tendencja do dzielenia obszarów przestrzeni na "wewnątrz" lub "na zewnątrz" konturu. Diagram Eulera mówi nam (między innymi), że jednostki mogą być jednocześnie elementami zbiorów A i C, ale nie A, B i C. Również wszystko, co jest członkiem zarówno B, jak i C, jest również członkiem D. DOMKNIĘCIE Gdy granica obszaru zdefiniowanego przez kontur jest złożona, to, co znajduje się wewnątrz lub na zewnątrz, może stać się niejasne. W takich przypadkach użycie koloru, tekstury będzie bardziej skuteczne. Diagram Eulera wzbogacony za pomocą tekstury i koloru może przekazać bardziej złożony zestaw relacji niż konwencjonalny diagram Eulera wykorzystujący tylko domknięte kontury. FIGURA I TŁO Ogólnie rzecz biorąc, mniejsze elementy wzorca są zwykle postrzegane jako oddzielne obiekty, jednak wszystkie zasady Gestalt przyczyniają się do wyodrębnienia figury z tła. FIGURA I TŁO (a) Czarne obszary są mniejsze i dlatego istnieje większe prawdopodobieństwo, że będą postrzegane jako obiekt. Łatwiej jest również dostrzec wzorce, które są zorientowane poziomo i pionowo jako obiekty. (b) Zielone obszary są postrzegane jako figury ze względu na kilka czynników Gestalt, w tym rozmiar i formę zamkniętą. Obszar pomiędzy zielonymi kształtami w (c) na ogół nie jest postrzegany jako figura. FIGURA I TŁO Większość ludzi widzi słaby, iluzoryczny kontur otaczający klockowaty kształt w centrum tej figury. FIGURA I TŁO Wazon Rubina. Wskazówki dotyczące figury i tła są mniej więcej równo rozłożone, co skutkuje figurą bistabilną dwóch ścian lub wazonu. NEUROPSYCHOLOGIA Hubel i Wiesel (1963, 1968, 1979) wykazali, że specyficzne neurony kory wzrokowej reagują na zmieniającą się stymulację prezentowaną do specyficznych obszarów siatkówki odpowiadającym tym neuronom. Każdy pojedynczy neuron korowy może być przypisany do specyficznego pola recepcyjnego na siatkówce. NEUROPSYCHOLOGIA Większość komórek korowych nie reaguje wprost na plamę światła, ale raczej na „specyficznie ukierunkowane segmenty linii” (Hubel i Wiesel, 1979, s. 9). Co więcej, komórki te mają strukturę hierarchiczną ze względu na poziom złożoności bodźców, na które reagują. Stąd Hubel i Wiesel wyodrębniają dwa rodzaje neuronów kory wzrokowej: komórki proste i złożone. NEUROPSYCHOLOGIA Komórki proste otrzymują dane z neuronów projektujących ze wzgórza, następnie dochodzi w nich do wyładowania w reakcji na linie o określonym ukierunkowaniu i pozycji w polu recepcyjnym, przy czym specyficznie stymulujące ukierunkowanie czy pozycja różni się w odniesieniu do poszczególnych komórek. Określona komórka może także chętniej reagować na dane jasne/ciemne granice, jasne linie na ciemnym tle lub na odwrót. Nawet grubość linii może wpływać na to, czy komórka zareaguje na bodziec. Komórki proste to tzw. „detektory cech”. NEUROPSYCHOLOGIA Komórki złożone zasilane są przez komórki proste. W każdej złożonej komórce dochodzi do wyładowania w reakcji na linie o określonym ukierunkowaniu, będące gdziekolwiek w polu recepcyjnym grupy prostych komórek, które zasilają daną złożoną komórkę. Złożone komórki mogą otrzymywać dane wejściowe albo tylko od jednego oka, albo od dwóch i wydają się niewrażliwe na określony rodzaj kontrastów jasne/ciemne segmentów linii dopóty, dopóki ten segment ma odpowiednie ukierunkowanie. W niektórych złożonych komórkach dochodzi do wyładowania tylko w reakcji na segmenty linii o określonym ukierunkowaniu i długości w polu recepcyjnym. NEUROPSYCHOLOGIA W niektórych obszarach kory pewne bardzo złożone komórki, zwane niekiedy superzłożonymi, wykazują najsilniejsze wyładowanie tylko w reakcji na bardzo specyficzne kształty, np. ręki lub twarzy, niezależnie od rozmiaru danego bodźca. W miarę jak bodziec staje się coraz mniej podobny do optymalnego kształtu, w komórkach tych jest coraz mniej prawdopodobne wyładowanie (DeValois i DeValois, 1980; Shapley i Lennie, 1985). GRAMATYKA WIZUALNA Badania w paradygmacie gramatyki wizualnej (np. Kennedy, 1974) koncentrują się na wyodrębnieniu podstawowych elementów, z których komponowane są całości, oraz zasady łączenia komponentów. GRAMATYKA WIZUALNA Przykład gramatyki wizualnej dotyczącej relacji pomiędzy obiektami. GRAMATYKA WIZUALNA Przykład gramatyki wizualnej dla map. ROZPOZNAWANIE OBIEKTÓW ROZPOZNAWANIE OBIEKTÓW W jaki sposób łączymy to, co spostrzegamy, z tym, co zapamiętane (tzw. funkcja Hoffdinga)? ROZPOZNAWANIA I PRZYPOMINANIE Ważne jest, aby dokonać rozróżnienia między rozpoznawaniem a przypominaniem. Mamy zdolność rozpoznawania informacji, z którymi zetknęliśmy się wcześniej. Jeśli jednak poproszono nas o zrekonstruowanie scen wizualnych – na przykład o przypomnienie sobie, co wydarzyło się na miejscu zbrodni – nasze wyniki są znacznie gorsze. Rozpoznawanie jest znacznie lepsze niż przypominanie. ROZPOZNAWANIA I PRZYPOMINANIE Hoffding (1891) percepcja nie może być zredukowana do prostego wiązania tego, co widziane, z tym, co zapamiętane. ROZPOZNAWANIE OBIEKTÓW W eksperymencie Standing, Conezio i Haber (1970) zaprezentowano badanym 2560 zdjęć w tempie jednego na 10 sekund. Pokazanie ich wszystkich zajęło ponad 7 godzin rozłożonych na 4 dni. Podczas kolejnych testów, badani byli w stanie odróżnić obrazy od innych, których wcześniej nie widziano, z dokładnością lepszą niż 90%. ROZPOZNAWANIE OBIEKTÓW Obiekty trójwymiarowe są najłatwiej rozpoznawane, jeśli napotka się je z tego samego kierunku, w którym były widziane po raz pierwszy. Johnson (2001) badał zdolności badanych do rozpoznawania wygiętych struktur rurowych. Badani radzili sobie dobrze, jeśli ta sama orientacja oglądania była używana w początkowym oglądaniu i w fazie testu. Działały słabo, jeśli w fazie testowej użyto innego kierunku patrzenia, ale były również całkiem dobre w identyfikacji z dokładnie przeciwnego kierunku widoku. Johnson przypisał to niezwykłe odkrycie znaczeniu informacji o sylwetce. Sylwetki byłyby podobne, choć odwrócone od lewej do prawej w stosunku do początkowego widoku. ROZPOZNAWANIE OBIEKTÓW Ludzie mogą również rozpoznawać obiekty na obrazach, które są prezentowane bardzo szybko. Załóżmy, że zapytałeś grupę ludzi: "Czy na jednym z poniższych zdjęć jest pies?", a następnie pokazałeś im zestaw obrazów, szybko, wszystkie w tym samym miejscu, w tempie 10 na sekundę. Co ciekawe, będą w stanie wykryć obecność lub brak psa gdzieś w sekwencji obrazów przez większość czasu. Ta eksperymentalna technika nazywa się szybką seryjną prezentacją wizualną (RSVP). Eksperymenty wykazały, że maksymalna szybkość wykrywania typowych obiektów na obrazach wynosi około 10 obrazów na sekundę (Potter, 1976; Potter i Levy, 1969). ROZPOZNAWANIE OBIEKTÓW Lawson, Humphreys i Watson (1994) opracowali serię eksperymentów, w których uczestnicy musieli zidentyfikować określony obiekt w serii krótko przedstawionych zdjęć. Rozpoznanie było znacznie łatwiejsze, jeśli badani byli przygotowani do wizualnie podobnych obrazów, które nie były reprezentacjami semantycznie powiązanych obiektów. OBRAZKOWE TEORIE ROZPOZNAWANIA Według obrazkowych teorii rozpoznawanie obiektów polega na posiadaniu osobistego banku danych pamięciowych zawierającego dane wzrokowe i audio zebrane w każdej chwili czuwania przez całe życie człowieka. Rozpoznawanie polega na porównaniu wizualnego obiektu z obrazem mentalnym zachowanym w pamięci. TEORIA WZORCA Przechowujemy w umyśle zestawy wzorców, stanowiących modele wzorów, które możemy potencjalnie rozpoznać. Rozpoznanie polega na porównaniu bodźca z odpowiednim zapamiętanym wzorem (Selfridge i Neisser, 1960). ALE… Problem magazynowania informacji – w jaki sposób magazynujemy obrazkowe informacje. Jeżeli każdy rozpoznany obiekt wymagałby posiadania zmagazynowanego wzorca, to prowadziłoby to do problemu tzw. eksplozji obliczeniowej. TEORIE PROTOTYPU Rozpoznajemy na podstawie dopasowania obiektu do prototypu. Prototyp to nie konkretny model, ale przykład najlepszego reprezentowania klasy powiązanych obiektów (Posner i Keele, 1968). TEORIE PROTOTYPU Palmer, Rosch i Chase (1981) wykazali, że nie wszystkie widoki obiektu są równie łatwe do rozpoznania. Odkryli, że wiele różnych obiektów ma coś w rodzaju widoku kanonicznego, na podstawie którego najłatwiej je zidentyfikować. Mózg przechowuje szereg kluczowych widoków każdego obiektu (Edelman, 1995; Edelman & Buelthoff, 1992). TEORIE PROTOTYPU Istnieją ścisłe ograniczenia co do zakresu, w jakim możemy zmienić obraz, zanim wystąpią problemy z rozpoznawaniem. Palmer i in. (1981) poprosili obserwatorów o ocenę, jak dobrze zdjęcia wykonane z różnych perspektyw przypominają przedstawiony obiekt. Wyniki pokazały wyraźnie, że niektóre poglądy były oceniane jako bardziej typowe niż inne. Co więcej, miało to duży wpływ na ilość czasu, jaki badani potrzebowali na nazwanie pokazanego obiektu. Inne badania wykazały, że obiekty są nazywane szybciej, gdy są w pozycji pionowej (Jolicoer, 1985), ale zmiana rozmiaru reprezentowanego obiektu ma stosunkowo niewielki wpływ. Ponadto liczne badania wskazują na upośledzone rozpoznawanie twarzy, jeśli twarze są pokazane do góry nogami (Rhodes, 1995). TEORIE PROTOTYPU Niekanoniczne i kanoniczne widoki konia i samochodu. WYTYCZNE DLA PROJEKTOWANIA Aby stworzyć wizualny obraz, który reprezentuje klasę rzeczy, użyj przykładu kanonicznego w jego normalnej orientacji wyświetlanego z typowego punktu widzenia, ale tylko wtedy, gdy istnieje odpowiedni wzór. ALE… Istnieje wiele przypadków, w których proste obrazy nie mogą być używane do reprezentowania kategorii obiektów. Jednym z powodów jest to, że większość rzeczy należy do wielu nakładających się na siebie zestawów kategorii, a wiele kategorii nie ma kanonicznych reprezentacji obiektów. Weźmy pod uwagę kategorię zwierzęcia domowego. Zwierzęciem domowym może być złota rybka, owad lub wąż, a także bardziej typowe psy i koty. Żaden prosty szkic nie jest w stanie przedstawić wszystkich tych elementów, ponieważ nie mają one wspólnego kanonicznego zestawu cech wizualnych. ALE… Chociaż większość obiektów można łatwo rozpoznać niezależnie od rozmiaru obrazu na siatkówce, rozmiar obrazu ma pewien wpływ. Gdy obraz ogląda się z daleka, dominuje twarz, ale gdy patrzy się na niego z 30 cm, wyłania się gremlin, ukrywający się w cieniu ust i nosa. Wydaje się więc, że rozpoznawanie polega nie tylko na dopasowaniu do wzorca, ale również na rozpoznawaniu elementów wzorca. TEORIE CECH Według teorii dopasowania cech dostosowujemy cechy danego bodźca do cech przechowywanego wzoru (Selfridge, 1959). CECHY LOKALNE I CECHY GLOBALNE Cechy lokalne – stanowią uszczegółowione aspekty danego wzoru Cechy globalne – cechy nadające obiektowi jego ogólny kształt. ALE… Kluczową kwestią jest sposób rekonstrukcji danych. Jeśli chcemy przypomnieć sobie spotkanie, o którym wiemy, że miało miejsce gdzieś w 2004 roku, to oczywiście nie możemy odtworzyć danych z całego roku, aby znaleźć to wydarzenie. Odtworzenie jakiegoś zapomnianego wydarzenia, takiego jak spotkanie, będzie bardziej zbliżone do ponownego doświadczenia danego zdarzenia. Kiedy ludzie przeglądają własne filmy, nie pamiętają spontanicznie, co się wydarzyło; zamiast tego muszą go mentalnie zrekonstruować (Sellen i in., 2007). ALE… Badania przeprowadzone przez Borkina i in. (2013, 2016) dotyczyły kwestii, co sprawia, że wizualizacja zapada w pamięć po krótkiej ekspozycji. Pierwszy z nich miał ekspozycję wynoszącą zaledwie 1 sekundę, co pokazało, że posiadanie rozpoznawalnych obrazów w wizualizacji prowadzi do wzrostu wyników rozpoznawania. W drugim eksperymencie uczestnicy mieli dłuższą, 10-sekundową ekspozycję, a następnie zadawano pytania dotyczące zarówno tego, czy ludzie rozpoznali, że widzieli wizualizację wcześniej, jak i stopnia, w jakim przypomnieli sobie znaczącą treść. Test przypominania został przeprowadzony z uczestnikami badania oglądającymi rozmazany obraz, tak aby nie mogli odczytać tekstu, osi danych i innych szczegółowych informacji. Wyniki pokazały, że posiadanie obrazów w wizualizacji znacznie zwiększyło prawdopodobieństwo rozpoznania i jakość zapamiętania. Istotne były również informacje tekstowe, zwłaszcza tytuły. ALE… Po lewej stronie pokazana jest bardzo zapadająca w pamięć infografika, podczas gdy ta po prawej jest znacznie mniej zapadająca w pamięć. Nakładające się kolory pokazują, że ludzie kierują swój wzrok podczas krótkiej inspekcji. ALE… Obiekt pokazany w (a) wydaje się najbardziej podobny do obiektu pokazanego w (c), pomimo że obrazy (a) i (b) są do siebie najbardziej podobne. Żadna teoria obrazkowa nie jest w stanie wyjaśnić tego wyniku. TEORIE STRUKTURALNE Rozpoznawanie obiektów dokonuje się na podstawie dopasowania bodźca do zestawu trójwymiarowych geonów (geometrycznych ikon), takich jak sześciany, walce, kliny itp. Według teorii rozpoznawania za pośrednictwem komponentów (RBC – recognition by components) szybko rozpoznajemy obiekty rozkładające je na geony, które mogą być złożone w nowym układzie. Geony są proste i niezmiennicze na punkt widzenia. TEORIE STRUKTURALNE Zgodnie z teorią geonów Biedermana, system wzrokowy interpretuje obiekty 3D, identyfikując części składowe 3D zwane geonami. (a) Próbka geonów. (b) Figura ludzka zbudowana z geonów. TEORIE STRUKTURALNE Uproszczony model percepcji Hummela i Biedermana (1992). TEORIE STRUKTURALNE Jedną z konsekwencji strukturalnych teorii percepcji jest to, że pewne uproszczone obrazy powinny być łatwiejsze do odczytania. Ma to praktyczne zalety. Na przykład diagram może być czasami bardziej skuteczny niż zdjęcie. To jest dokładnie to, co wykazali Ryan i Schwartz (1956), kiedy odkryli, że ręka może być postrzegana szybciej w formie uproszczonego rysunku niż w formie fotografii.