Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Princípios Básicos da Percepção Visual: Codificação e Transmissão Multimídia, Notas de estudo de Fisiologia

Informações sobre a codificação e transmissão de múltiplas mídias relacionadas à percepção visual. Aborda funcções como convergência binocular, exploração do campo visual, acompanhamento de objetos em movimento e a estrutura do olho. Além disso, discute a sensibilidade para variações de luminância, a capacidade de resolução de detalhes espaciais e a sensibilidade à cintilação de detalhes.

Tipologia: Notas de estudo

2022

Compartilhado em 07/11/2022

Andre_85
Andre_85 🇧🇷

4.5

(124)

218 documentos

1 / 15

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
PERCEPÇÃO VISUAL HUMANA
PTC3547 CODIFICÃO E TRANSMISO MULTIMÍDIA
Guido Stolfi EPUSP 03/2018
1. Estrut ura do Ol ho Hum ano
À primeira vista, a estrutura básica do olho é semelhante a um instrumento óptico simples: como
acontece em uma câmara fotográfica, a imagem real de um objeto observado é projetada por
uma lente convergente sobre uma superfície, constituída de células sensíveis à luz. Fibras
nervosas levariam então a imagem ao cérebro através de impulsos elétricos.
Esta é uma descrição simplista, baseada nas descobertas de Kepler e Descartes, relativas à
fisiologia do globo ocular, e que está muito distante da real dimensão do fenômeno. A percepção
visual é na verdade um processo de reconstrução da realidade exterior, realizado pelo córtex
cerebral, a partir de informações fragmentadas captadas pelos olhos.
O estudo deste processo de
percepção deve então considerar, em
primeiro lugar, as características e
limitações do olho, na qualidade de
um sensor óptico peculiar.
A figura 1.1 ao lado apresenta uma
seção horizontal do olho humano.
A córnea e o cristalino formam um
conjunto de lentes que projetam sobre
a retina uma imagem real dos objetos
visualizados.
Os músculos ciliares ajustam a
distância focal equivalente, através da
deformação do cristalino. A íris serve
de diafragma, ajustando a quantidade
de luz que entra pela abertura da
pupila. Além disso, ao reduzir a
abertura, diminui as aberrações de
esfericidade e aumenta a nitidez da
imagem.
O humor vítreo é uma solução aquosa
de proteínas, que, além de prover nutrientes para o cristalino, atua como um filtro protetor,
absorvendo a luz ultravioleta e infravermelha.
Os olhos são mantidos em constante movimento por meio de um conjunto de músculos (fig.
1.2). Algumas funções destes movimentos são:
Convergência binocular: focalizar ambos os olhos sobre um mesmo objeto, compondo
uma imagem estereoscópica (com percepção de profundidade);
Exploração do campo visual: a observação de detalhes de um ambiente ou imagem é
feita pela região central da visão (fóvea); a imagem projetada na retina é deslocada pelos
2
Fig. 1.1 Estrutura do Olho
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Pré-visualização parcial do texto

Baixe Princípios Básicos da Percepção Visual: Codificação e Transmissão Multimídia e outras Notas de estudo em PDF para Fisiologia, somente na Docsity!

PERCEPÇÃO VISUAL HUMANA

PTC3547 – CODIFICAÇÃO E TRANSMISSÃO MULTIMÍDIA

Guido Stolfi – EPUSP – 03/

1. Estrutura do Olho Humano

À primeira vista, a estrutura básica do olho é semelhante a um instrumento óptico simples: como acontece em uma câmara fotográfica, a imagem real de um objeto observado é projetada por uma lente convergente sobre uma superfície, constituída de células sensíveis à luz. Fibras nervosas levariam então a imagem ao cérebro através de impulsos elétricos. Esta é uma descrição simplista, baseada nas descobertas de Kepler e Descartes, relativas à fisiologia do globo ocular, e que está muito distante da real dimensão do fenômeno. A percepção visual é na verdade um processo de reconstrução da realidade exterior, realizado pelo córtex cerebral , a partir de informações fragmentadas captadas pelos olhos. O estudo deste processo de percepção deve então considerar, em primeiro lugar, as características e limitações do olho, na qualidade de um sensor óptico peculiar. A figura 1.1 ao lado apresenta uma seção horizontal do olho humano. A córnea e o cristalino formam um conjunto de lentes que projetam sobre a retina uma imagem real dos objetos visualizados. Os músculos ciliares ajustam a distância focal equivalente, através da deformação do cristalino. A íris serve de diafragma, ajustando a quantidade de luz que entra pela abertura da pupila. Além disso, ao reduzir a abertura, diminui as aberrações de esfericidade e aumenta a nitidez da imagem. O humor vítreo é uma solução aquosa de proteínas, que, além de prover nutrientes para o cristalino, atua como um filtro protetor, absorvendo a luz ultravioleta e infravermelha. Os olhos são mantidos em constante movimento por meio de um conjunto de músculos (fig. 1.2). Algumas funções destes movimentos são:  Convergência binocular : focalizar ambos os olhos sobre um mesmo objeto, compondo uma imagem estereoscópica (com percepção de profundidade);  Exploração do campo visual : a observação de detalhes de um ambiente ou imagem é feita pela região central da visão (fóvea); a imagem projetada na retina é deslocada pelos

Fig. 1.1 – Estrutura do Olho

movimentos da cabeça e dos globos oculares, de modo que os pontos de interesse da imagem são explorados pela fóvea;  Acompanhamento de objetos em movimento : a percepção de movimento envolve tanto a detecção de deslocamentos da imagem projetada sobre a retina (movimento retinal) quanto o acompanhamento ocular de um objeto, procurando manter a sua imagem estática em relação à retina (movimento ocular);  Transformação de variações espaciais em variações temporais : sabe-se que uma imagem permanentemente projetada sobre a retina, na mesma posição, desaparece da nossa percepção em pouco tempo. O nosso mecanismo de visão mantém os olhos em constante movimento, de forma a renovar continuamente os estímulos luminosos.

A maioria das fibras do nervo óptico transmite impulsos que são disparados apenas por variações temporais de luminosidade. Através de pequenos movimentos exploratórios (denominados movimentos sacádicos ), o processo visual transforma diferenças espaciais de luminância em variações temporais de iluminamento retinal, que provocam o disparo de informações para o cérebro. O cérebro reconstrói a imagem observada a partir dessas informações, cancelando nesse processo todas as irregularidades estáticas do campo visual ocular, como por exemplo, o Ponto Cego e as sombras projetadas pelos nervos e vasos sanguíneos na retina. Assim sendo, a composição da cena, ou percepção visual propriamente dita, dá-se efetivamente no cérebro, a partir dessas informações elementares fornecidas pelo olho.

1.1 Retina

A retina é uma película constituída de células nervosas interligadas; pela sua estrutura e constituição, podemos dizer que é uma extensão do córtex cerebral. Na parte externa da retina encontram-se as células receptoras de luz, que contêm pigmentos específicos ( rodopsina e iodopsina ) os quais, ao absorverem a luz, sofrem uma alteração química que dispara impulsos nervosos. Na retina temos duas classes de células sensíveis à luz:  Cones : São células sensíveis à intensidade e à cor (compreendem três sub-tipos: L, M e S , sensíveis respectivamente ao amarelo, verde e azul); são responsáveis pela Visão Fotópica, ou visão de luz intensa. Dos cerca de 7.000.000 de cones existentes na retina, cerca de 50% estão situados na Fóvea. Muitos cones, cujos diâmetros variam de 1 a 5  m, são ligados individualmente a terminações nervosas.  Bastonetes : Células sensíveis apenas à intensidade, responsáveis pela Visão Escotópica, ou visão em condições de pouca luz. Há cerca de 75 a 150 milhões de bastonetes na retina, mas são praticamente inexistentes na Fóvea. Por serem ligados em grupos às terminações nervosas, formam conjuntos mais sensíveis à luz do que os Cones, porém

Fig. 1.2 - Musculatura do Globo Ocular

O ponto cego ocupa uma região de até 4 graus de extensão no nosso campo visual. O fato de que não percebemos sua existência, em situações normais, mostra que o cérebro constrói a percepção do campo visual através do processamento de informações ativas (impulsos nervosos) enviadas pela retina. A ausência de informação não significa ausência de luz na imagem.

Fig. 1.5 - Distribuição dos Cones e Bastonetes

2. Adaptação à Luminosidade e Faixa Dinâmica

O olho humano pode adaptar-se a uma faixa extensa de níveis de iluminamento, desde sol a pino até a luz das estrelas (Vide figura 2.1). Desde o limite inferior da visão escotópica até o limite de ofuscamento, a nossa visão tolera variações de luminância da ordem de 10^10 a 10^11. O controle da área de entrada de luz na pupila pela atuação da íris (variando de 3 a 50 mm^2 no máximo) não é suficiente para explicar a extensão desta faixa dinâmica. Na realidade, quando há iluminação suficiente, a pupila contrai-se de forma a utilizar apenas a área central do sistema óptico (córnea + cristalino), onde as aberrações ópticas são menores; ela se abre totalmente apenas em condições de baixa luminosidade. O diâmetro mínimo de abertura (cerca de 2 mm) limita a difração da luz num grau consistente com a resolução limite na fóvea.

Fig. 2.1 - Faixa Dinâmica da Percepção Subjetiva da Luminosidade

0

20

40

60

80

100

120

140

160

180

-80 -60 -40 -20 0 20 40 60 80 Ângulo em relação à Fóvea

Bastonetes

Cones

Ponto Cego

Células por mm

x 1000

A maior parte da capacidade de acomodação da visão provém da mudança de sensibilidade das próprias células, e deve-se à variação da velocidade de recomposição do pigmento conforme a intensidade do estímulo. Este processo de acomodação não é instantâneo, e podemos dizer que, uma vez que o olho esteja adaptado a um determinado nível de intensidade média (por exemplo, no ponto A na fig. 2.1), a faixa dinâmica local reduz-se para algo em torno de 100 a 200 vezes. Isto significa que, dentro de um ambiente com luminância média A , um objeto com luminância cerca de 20 vezes menor que A é percebido como preto (ponto B na fig. 2.1), enquanto que um objeto 5 a 10 vezes mais luminoso que A chega a provocar ofuscamento (ponto C ). Devido a esta característica, os sistemas artificiais de reprodução de imagem (fotografia, TV, cinema etc.) conseguem reproduzir satisfatoriamente as sensações subjetivas de claro / escuro, mesmo com relações de contraste de apenas 100:1.

3. Percepção de Luminosidade

A capacidade da visão humana de distinguir diferenças de luminosidade pode ser aproximada pela Lei de Weber, que se baseia em um modelo logarítmico da percepção subjetiva de estímulos. Com relação a dois estímulos de luminância Y e Y+Y, para os quais a diferença de brilho é apenas perceptível, temos:

Diferença Apenas Perceptível de Brilho

 Y

Y

0 02. ( Lei de Weber )

A figura 3.1 mostra um gráfico da amplitude relativa de luminância correspondente a uma diferença apenas perceptível de brilho (denominada Fração de Weber) em função do nível médio de luminância Y. Dentro de uma faixa apreciável da visão fotópica, esta fração vale aproximadamente 0,02. Por outro lado, para um sistema de reprodução de imagens vale a situação restrita da curva B- A- C da figura 2.1, uma vez que não é objetivo de nenhum processo reproduzir a luminosidade absoluta de uma cena, e sim apenas a faixa dinâmica perceptível em torno do ponto de acomodação. Para essa situação restrita, a resposta subjetiva de brilho  luminância (denominada “ Ligtness ”), determinada experimentalmente pela CIE ( Comission Internationale de l'Eclairage ), pode ser aproximada pela expressão abaixo (vide gráfico na fig. 3.2):

116 ( / )^316 / 0. 008856

1

n n

n n

Y Y seY Y

Y Y seY Y

BrilhoAparente

Onde Yn = Referência de Branco (Brilho máximo)

Y Y+ Y

visualização. Nestes casos, é necessário simular esta característica artificialmente para manter a proporcionalidade entre o sinal transmitido e a luminosidade aparente. A figura 3.5 compara o efeito de ruído aditivo sobre uma imagem transmitida com  = 1 e com  = 2,2. Pode-se observar que o efeito do ruído na parte escura da imagem é muito menor no caso de  = 2,2. Já o consequente aumento do ruído na parte clara, nesta situação, é insignificante, comparado com a redução da visibilidade do ruído nas demais partes da imagem.

Câmera (^) Corretor Gama T.R.C

Brilho Aparente Canal de Transmissão Fig. 3.4 - Correção Gama em um Sistema de TV

Fig. 3.5 – Imagem com Ruído Aditivo,  = 1 (esq.) e  = 2,2 (dir.)

4. Resolução Visual

A capacidade de resolução de detalhes espaciais da visão humana pode ser medida por experimentos que avaliam a percepção de contraste (claro/escuro) na visualização de padrões de linhas alternadas. Um destes experimentos é a Carta de Campbell (fig. 4.3). Consiste de um padrão com variações senoidais da luminância. Estas variações representam estímulos com uma determinada frequência espacial (que pode ser expressa em ciclos por grau ), variando no sentido vertical, e com um determinado contraste , variando de 0 a 100% no sentido horizontal. Conforme a distância do observador à imagem, certas regiões são percebidas como áreas uniformes, quando a percepção de contraste cai abaixo do limiar de resolução para uma dada frequência espacial. A percepção relativa de contraste em função da frequência espacial caracteriza a “resposta em frequência” da visão; a curva correspondente para um observador padrão pode ser vista na figura 4.1. Podemos constatar que a resolução de crominância (distinção entre tonalidades de cor com mesma luminosidade aparente) é muito menor que a resolução de luminância (contraste claro/escuro). O "pico" na resposta em frequência da luminância, em torno de 3 a 4 ciclos por grau, evidencia uma maior sensibilidade da visão para variações locais de luminosidade. Dois mecanismos de processamento neuronal, realizados pela retina, explicam certas características da resposta em frequência da visão:

Inibição lateral : uma célula receptora que estiver fortemente iluminada provoca a inibição da resposta das células vizinhas, através das interconexões horizontais entre os gânglios. Este efeito corresponde a um filtro passa-altas, que amplifica a percepção de contornos nas imagens;  Campos receptivos : as mesmas interconexões podem atuar, em níveis de luminosidade reduzidos, de forma a agrupar os estímulos provenientes de vários receptores, aumentando a sensibilidade e a relação sinal/ruído, porém reduzindo a resolução (equivalente a um filtro passa-baixas).

O efeito da inibição lateral pode ser relacionado com o fenômeno das "Bandas de Mach" (figura 4.2), pelo qual a visão humana parece exagerar a amplitude de transições de luminosidade entre regiões homogêneas adjacentes (equivalente a um sobressalto no brilho aparente).

Fig. 4.1 - Resolução espacial da visão humana

1

10

100

1000

0,01 0,1 1 10 100 Freqüência Espacial (Ciclos/grau)

Luminância

Vermelho-Verde

Azul-Amarelo

Contraste

5. Resolução Temporal e Cintilação

Outro aspecto importante da visão, relevante para Televisão, Cinema e Iluminação, refere-se à Frequência Crítica de Cintilação, definida como aquela acima da qual não é mais perceptível a presença de modulação na luminância de uma imagem. Dependendo das condições de iluminação, do campo da visão (periférica ou central), do ângulo aparente do objeto sujeito à cintilação, e do próprio indivíduo, esta frequência varia de 15 a 100 Hz aproximadamente. Lembramos que lâmpadas de descarga a gás, como fluorescentes e vapores metálicos, quando alimentadas pela rede elétrica de corrente alternada, emitem luz de forma pulsada, com frequência igual ao dobro daquela da rede elétrica (120 Hz para os locais alimentados por 60 Hz). Mesmo lâmpadas incandescentes apresentam leve oscilação da intensidade luminosa em 120 Hz. Na figura 5.1 temos a frequência crítica apresentada em função da luminância média, para objetos pequenos (1 grau) e grandes (20 graus), para visão central e periférica. Na figura 5.2, vemos a sensibilidade à cintilação de texturas em função da dimensão dos detalhes (frequência espacial).

Fig. 5.1 - Percepção de Cintilação Fig. 5.2 - Sensibilidade à Cintilação de Detalhes

Fig. 5.3 – Diâmetro da Pupila em função da luminância ambiente

A tabela 5.1 apresenta a relação entre a luminância da tela de monitores de vídeo e as correspondentes frequências críticas de cintilação, válidas para 95% da população (ISO/TC159/1987), para campos de visão de 10 e 70 graus. Para os níveis de luminância típicos de telas de TV, a frequência crítica chega a ser da ordem de 70 Hz. As variações nos limites devem-se ao fato de que o diâmetro da pupila varia de um indivíduo para outro, especialmente para níveis de luminância abaixo de 1000 nits (vide figura 5.3). A frequência crítica de cintilação está relacionada com o tempo necessário para que o cérebro avalie a quantidade média de impulsos nervosos disparados pelas células da retina, de forma a medir a luminosidade da imagem observada.

Luminância da Tela (Nits)

Área da Pupila (mm^2 )

Iluminamento Retinal (Trolands)

Frequência Crítica p/ 10o^ (Hz)

Frequência Crítica p/ 70o^ (Hz) 10 10.75  19.63 215  392 48.4  54.4 60.6  66. 30 9.08  15.21 544  912 57.6  62.8 70.2  75. (^100) 8.04  11.34 1608  2268 68.9  71.9 81.8  84. (^300) 7.07  9.62 4242  5772 78.2  81.3 91.4  94. 1000 6.16 12320 88.9 102. 3000 4.52 27120 96.7 110. 10000 3.14 62800 105.1 119.

Tabela 5.1 - Relação entre Luminância da Tela de Monitores de Vídeo e Frequências Críticas de Cintilação, para 95% da População (ISO/TC159/1987) - Campos de Visão de 10 e 70 graus

6. Percepção de Movimento

Dois mecanismos independentes são responsáveis pela percepção de movimento:  Movimento retinal : um objeto em movimento em relação ao ponto de visão projeta uma imagem que se desloca sobre a retina (Fig. 6.1 a). Os receptores sensíveis a variações de

0

1

2

3

4

5

6

7

8

0,001 0,1 10 1k 100k

Diâmetro da Pupila (mm)

Luminância (nits)

A consistência das informações proporcionadas por todos esses mecanismos, simultaneamente, determina a intensidade da ilusão de realidade que pode ser produzida por um sistema de visualização. Por exemplo, objetos distantes representados em uma fotografia, examinada a curta distância, não são aceitos como “reais”, uma vez que a convergência, focalização e paralaxe identificam claramente os objetos como sendo próximos, enquanto que o fator de escala e as texturas representadas correspondem a objetos distantes. Essas informações conflitantes levam o cérebro a rejeitar a percepção da existência de objetos “distantes” na fotografia, destruindo a ilusão de realidade. A mesma imagem, porém, ampliada e observada a uma distância maior, pode dar melhor impressão de realidade, mesmo que os objetos subentendam o mesmo ângulo visual (figura 7.1), já que os mecanismos de foco ocular e paralaxe atuam com menor intensidade. Percebe-se então que é necessária uma tela de grandes dimensões para proporcionar ilusão convincente de profundidade para o observador. O conflito entre esses mecanismos é um dos fatores que inibem a popularização da TV em 3 dimensões, uma vez que, em geral, apenas o mecanismo de disparidade é explorado pelos sistemas de visualização em 3D.

8. Ilusões Ópticas

Algumas imagens são interpretadas de forma paradoxal pela nossa visão; são as chamadas ilusões ópticas. Mais do que simples curiosidades, elas nos dão pistas sobre o funcionamento dos processos de percepção visual que ocorrem no cérebro. A ilusão de Muller-Lyers (fig. 8.1) pode ser explicada pelo fato de que a nossa visão interpreta a figura da esquerda como a aresta interior formada por duas paredes, chão e teto; enquanto a figura da direita seria a aresta frontal de um paralelepípedo. A nossa visão procura corrigir a dimensão percebida, considerando que a proximidade afeta a dimensão aparente de um objeto ( ab = cd na figura 8.4). O mesmo efeito ocorre na ilusão das Mesas de Shepard (fig. 8.2). Fig. 8.1 – Ilusão de Muller-Lyers (as duas linhas verticais são iguais)

Fig. 7.1 – Diferenças de Percepção de Distâncias

Fig. 8.2 – Mesas de Shepard (os dois tampos são iguais)

O padrão de linhas paralelas da Fig. 8.3 parece estimular a sensação de movimento, e evidencia a irregularidade da distribuição dos elementos sensores na retina.

Fig. 8.3 – Ilusões de Movimento e Irregularidade do Campo de Visão