• Aucun résultat trouvé

Chapitre 7 Identification aveugle par l’algorithme de Schur 79

7.3 Complexité

Figura 2.1: Estrutura do olho (Hoffman, 2000)

Esta estrutura é conhecida desde antes de Galeno (aproximadamente 129 – 199 d.C.). Sua função não era bem compreendida até Kepler publicar em 1604, sua teoria da imagem retiniana. O olho e sua função provocaram muitos debates e muitos livros ao longo de dois milênios. Finalmente Kepler em sua teoria sobre a refração por lentes esféricas, aplicando sua nova teoria ao olho, mostrou que o olho tem uma função clara: focalizar uma imagem na retina.

A descoberta de Kepler permanece válida até nossos dias. Podemos conceber o olho como uma câmera fotográfica. Tal como as lentes de uma câmera focam uma imagem em um filme, a córnea e as lentes de um olho focam uma imagem em sua retina. Mas sua retina, diferentemente do filme, não é um receptor passivo de imagens. Em vez disso, ela os transforma ativamente, utilizando centenas de bilhões de células, chamadas neurônios, todas trabalhando em conjunto. O poder de computação de sua retina é extraordinariamente maior que o dos mais avançados supercomputadores (HOFFMAN, 2000).

Sua retina transforma primeiramente a imagem, capturando-a com uma série discreta de células sensíveis à luz, denominadas fotorreceptores. Perto da fóvea central, a parte de sua retina de maior resolução, essas células estão dispostas de maneira estreitamente próxima, como pode ser visto nesta foto micrografia, de Christiane Curcio e colaboradores segundo Hoffman (2000).

Figura 2.2: Fotomicrografia (Hoffman,2000)

As células menores, denominadas bastonetes, trabalham melhor em menor intensidade de luz. À noite, no escuro vemos com os bastonetes. As células maiores denominadas cones, intermediam a visão das cores e trabalham melhor em maior intensidade de luz. Durante o dia, quando há luz intensa vemos com os cones. Cada bastonete e cada cone modifica sua atividade elétrica quando é exposto a luz. Quanto mais exposto mais se modifica. A própria luz vêm em aglomerações discretas denominadas fótons. Cada bastonete e cada cone têm a

capacidade de captar zero, um, dois, três, ou mais fótons de luz de cada vez, mas não podem captar, digamos, um e meio fótons, ou dois fótons e um terço de fóton. Se apenas um de seus cones captar somente dez fótons, você verá luz. Eficiência admirável.

Sua retina tem cerca de 120 milhões de bastonetes e sete milhões de cones. Primeiramente, os cones agrupam-se na fóvea e os bastonetes fora dela. Quando dirigimos o olhar diretamente a um objeto, mexemos nosso olho de maneira que a imagem daquele objeto recaia sobre a fóvea e seus cones, porque são células que trabalham quando há maior intensidade de luz. Notamos as vezes que, à noite se olharmos diretamente para uma estrela de luz tênue, não conseguimos vê-la, mas, se desviarmos ligeiramente o olhar, então a vemos. Isso se deve a localização de seus bastonetes e cones. Ao olhar diretamente a estrela captamos sua imagem nos cones na fóvea. Porém os cones não funcionam bem sob uma intensidade baixa de luz, logo não veremos a estrela. Se desviarmos, ligeiramente o olhar, então captaremos a imagem da estrela em nossos bastonetes, pois os mesmos trabalham melhor numa intensidade baixa de luz. Com esses dados, construímos tudo o que vemos. Isso se deve em decorrência da aglomeração discreta de cones e bastonetes em nossa retina. Eis, por exemplo, o melhor que podem fazer para capturar uma linha reta.

Na figura esquerda, temos um trecho da retina com cones concebidos como hexágonos. Há uma linha imaginaria, sobrepostas a estes cones. À direita, as respostas dos cones a esta linha estão inclinadas com cor, a mais escura significando mais resposta. Como vemos, o resultado não é uma linha. Em vez disso, é uma coleção de diferentes respostas de cones. No entanto é possível, se quisermos construir uma linha a partir dessas respostas.

É isso que fazemos toda vez que vemos uma linha. Nós a construímos a partir de respostas de receptores. Isso não é tão fácil quanto possamos imaginar. Pergunte aos pesquisadores em visão computacional. Há décadas eles vêm trabalhando em ‘detecção de limite’ ou ‘identificação de linha’, um problema aparentemente simples. Fizeram progressos, mas suas soluções atuais requerem muita computação – da ordem de dezenas de milhões de multiplicações e adições, apenas para construir linhas numa pequena imagem. Mesmo assim, o desempenho não é páreo para o sistema humano.

Nossa compreensão atual da anatomia e da fisiologia visual sugere que nós também, da mesma maneira, colocamos bastante esforço para construir linhas. Pode parecer sem esforço, mas, na verdade, empregamos milhões de neurônios. Nossa retina é apenas um estágio do processo. Quando ela acaba de processar uma imagem, envia seus resultados para o cérebro através do nervo óptico, um cabo elétrico composto por um milhão de fios denominados axônios. Muitos desses fios chegam primeiramente a uma estrutura no seu mesencéfalo denominada núcleo geniculado lateral ou, abreviadamente, NGL.

Figura 2.4: NGL (Hoffman, 2000, p.68)

Depois de mais processamento no NGL, os resultados saem por um novo grupo de axônios e chegam ao córtex visual primário, também conhecido como V1. Aqui, como sugere a fisiologia, começamos a construir linhas. Devemos enfatizar a palavra “sugere” porque, como assinalam fisiologistas como Alan Cowey, a fisiologia de um neurônio não aponta infalivelmente para sua função na percepção. Há, entretanto, consenso entre os fisiologistas de que as linhas começam a ser feitas em V1.

A evidência vem, inicialmente, de eletrodos colocados perto de neurônios isolados do córtex de macacos, que os fisiologistas utilizam para medir campos receptivos. O campo receptivo de um neurônio é aquela parte do campo visual à qual o neurônio responde mudando sua taxa de descarga elétrica. Por exemplo, muitos neurônios no NGL, têm campos receptivos como este mostrado na figura 5.

Figura 2.5: Potenciais de ação de um neurônio 1 (Hoffman, 2000)

À direita, um eletrodo registra sinais elétricos, denominados piscos ou potenciais de ação, de um neurônio do NGL. Cada pico é uma flutuação de potencial elétrico que percorre o longo axônio do neurônio. Todos os picos têm o mesmo tamanho, logo, o grau de atividade elétrica do neurônio é medido não pelo tamanho de cada pico, mas sim pelo número de picos por segundo que percorre o axônio.

À esquerda, há uma tela com um estímulo luminoso do tipo que melhor estimula vários neurônios do NGL e da retina: um disco central brilhante, circulando por um anel escuro. Se este estímulo for do tamanho correto (usualmente muito menor do que ilustrado aqui), e estiver na posição correta da tela, os picos percorrem os neurônios rapidamente. Se o estímulo for do tamanho errado, ou ligeiramente deslocado para fora da melhor posição, os picos percorrem os neurônios lentamente. Em resumo, cada célula é excitada eletricamente pela luz na região central, inibida eletricamente no anel circundante e indiferente à luz em qualquer outro lugar do campo da visão. Outros neurônios no NGL e na retina preferem um estímulo exatamente oposto a esse: escuro no disco central e brilhante no anel circundante. Aqueles que preferem um disco brilhante são denominados

‘direcionados ao centro’, e os que preferem disco escuros são denominados ‘afastados do centro’. Há, grosso modo, quantidades iguais dos dois tipos. Para cada ponto do campo visual, há neurônios de ambos tipos ‘procurando’ por seu estímulo ótimo naquele ponto. Esse processo ocupa muitos neurônios, literalmente um milhão em cada retina e em cada NGL.

Agora deslocamos o eletrodo para V1.

Figura 2.6: Potenciais de um neurônio 2 (Hoffmam, 2000)

Encontraremos, mais uma vez, muitas células com campos receptivos dirigidos ao centro e afastados do centro. Mas, como David Hubel e Torsten Wiesel foram os primeiros a descobrir, encontramos também algo novo: células exercitadas por linhas. Um estímulo típico é mostrado a esquerda da figura. Para excitar de modo ótimo uma dada célula, a linha precisa estar na posição e orientação certas. Movimentar ou fazer uma rotação na linha faz com que a célula capte pouco ou nada. Encurtar a linha faz com a célula capte menos; encompridá-la resulta em que a célula mantém sua alta taxa de captação. Em suma, a célula é excitada pela luz na região da barra brilhante, inibida pela luz, nas regiões laterais, escuras e

indiferente à luz, em todos os outros lugares. Tais células são denominadas de células simples.

Para cada ponto do seu campo de visão, há células simples em V1 ‘procurando’ sua linha ótima. Uma célula demanda uma linha vertical, outra uma linha horizontal e uma outra, oblíqua. Todas as orientações de linha são representadas em cada ponto do seu campo de visão. Novamente, são necessários, para isso, vários neurônios, literalmente, centenas de milhões, em V1.

As células simples não estão sozinhas. Células complexas, tais como as simples, buscam linhas orientadas, mas possuem campos receptivos mais amplos e não apresentam uma divisão nítida entre: sub-regiões excitadoras e inibidas. Células hipercomplexas também procuram linhas orientadas, mas se importam com seu comprimento. Se uma linha for comprida demais, a célula hipercomplexa reduz sua taxa de captação. E mesmo algumas células mais simples apresentam, nelas próprias, seletividade de direção: elas são excitadas de forma melhor se uma linha se mover numa dada direção (HOFFMAN, 2000, P. 70).

O que acontece se nós mostrarmos um limite subjetivo ou mais precisamente um arranjo em que vemos um limite subjetivo, para as células em V1?Isso foi verificado em macacos-reso: cerca da metade das células são excitadas se o limite estiver em posição e orientação certas. Na área V2, que é vizinha a V1, cerca de um terço das células são excitadas por limites subjetivos. Obtém-se resultados similares em gatos.

Esses são apenas alguns dos aspectos importantes, mas, suficientes, no que precisávamos esclarecer neste trabalho. Espero, para convencê-los de que nós fazemos grandes esforços para construir linhas.

Em resumo, o argumento é simples. Sua imagem retiniana é discreta e contínua. Logo, se vemos linhas e superfícies contínuas, e fazemos, então precisa construí-

la a partir de informações discretas. E se às construímos, então deveríamos constatar evidências desse fato na atividade do cérebro. Em cada uma das espécies, encontramos evidências claras de grandes recursos neuronais empregados na construção de linhas. Logo, não são apenas os limites subjetivos das figuras de Kanizsa que construímos, mas, também, cada linha e mancha de seu desenho. Se nós às vemos, é porque às construímos.

Esse argumento implica uma conclusão interessante sobre os próprios neurônios. Podemos ver neurônios com a ajuda de colorações e microscópios.

Figura 2.7: Neurônios (Hoffman, 2000)